Utilizarea formulei Bayes pentru inferențe statistice

Universitatea de Stat din Rusia

Să luăm în considerare două exemple.

EXEMPLUL N 1. Este cunoscut faptul că în cazul tuberculozei, razele X pot fi diagnosticate în 95% din cazuri (sensibilitatea metodei = 95%). Dacă pacientul este sănătos, se face un diagnostic fals de tuberculoză în 1% din cazuri (specificitatea metodei = 100 - 1 = 99%). Proporția pacienților din populație este de 0,5%. Care este probabilitatea ca pacientul examinat care a fost diagnosticat cu tuberculoză să fie într-adevăr bolnav?

Exemplul 2. În urnă există 5 bile despre care se știe că culoarea lor poate fi albă sau neagră. Din urna cu revenirea a 4 bile extrase. Toți s-au dovedit a fi negri. Cum rămâne cu numărul de bile albe?

Există o mare diferență între cele două exemple: prima este o problemă corectă și simplă în teoria probabilităților. Al doilea este formulat ca o problemă perenă de practică în teorie: cum să tragem concluzii pe parametrul necunoscut al modelului (numărul de bile albe) pe baza rezultatelor experimentului. Aici trebuie să clarificăm atât sensul întrebării, cât și forma răspunsului.

1. Formula Bayes este simplă și ușor de îndepărtat.

Să presupunem că există un grup complet de evenimente pereche incompatibile cu probabilități cunoscute. Un eveniment valabil este uniunea lor :. . Se ia în considerare un eveniment. pentru care sunt cunoscute probabilitățile condiționale. Este necesar să se găsească probabilitatea =? Rețineți că starea și evenimentul sunt inversate aici. În manualele vechi, astfel de probabilități au fost numite "inverse".

Prin definirea probabilității condiționale, obținem:

unde pentru probabilitatea evenimentului se folosește formula de probabilitate totală:

Dacă adăugați totul. atunci se obține o unitate, deci factorul. nu depinde de. poate fi privită ca o constantă, care poate fi găsită chiar la sfârșitul condiției de normalizare.

2. Interpretarea frecvent utilizată.

Există n ipoteze care exclud reciproc modul în care este construit un obiect și sunt cunoscute probabilitățile cu care aceste variante apar. Se produce un eveniment. care este cunoscut, cu ce probabilitate apare în fiecare dintre opțiuni. Este necesar să se estimeze probabilitatea ca un obiect să fie aranjat într-un anumit mod.

Dacă denotăm factorul constant

apoi formula lui Bayes este utilă să ne amintim în această formă:

Un caz special important este o probabilitate constantă a priori care poate fi inclusă într-o constantă și se obține:

Ca o identitate matematică, formula Bayes este fără îndoială. Problemele în care sunt cunoscute toate probabilitățile necesare sunt ușor de rezolvat.

Exemplul N 1. Sunt cunoscute probabilități a priori că un pacient ales aleatoriu este sănătos. = 0,995 sau care suferă de tuberculoză, = 0,005, a existat un eveniment - cu diagnostic cu raze X a tuberculozei, cunoscută probabilitatea condițională = 0,95 (sensibilitate) = 0,01 (specificitate). Prin urmare, probabilitatea a posteriori ca pacientul să fie bolnav:


Deci, vedem că, după studiu, probabilitatea de îmbolnăvire a pacientului a crescut de la 0,005 la 0,32. Cu toate acestea, probabilitatea a posteriori ca pacientul să fie sănătoasă este încă mai mare:

Care este motivul pentru care se face un diagnostic eronat în două cazuri din trei? Creșterea sensibilității metodei la 100% nu va ajuta la rezolvarea problemei: proporția pacienților este prea mică și chiar și o specificitate suficient de mare (99%) a metodei nu salvează cazul. Acest lucru devine clar după calcularea așa-numitului factor Bayesian - raportul probabilităților a posteriori. Răspunsul este egal cu produsul a doi factori - rapoartele de probabilitate și raportul probabilităților a priori:

Totul este complicat, de îndată ce din problemele formale ale teoriei probabilității ne confruntăm cu probleme statistice, încercăm să aplicăm formula Bayesiană în problemele alegerii unuia sau a altui model al obiectului (identificarea parametrilor săi). Două întrebări ridică dubii:

1. Parametrii necunoscuți ai unui model pot fi considerați variabile aleatorii?

2. Dacă da, atunci cum să știți probabilitățile a priori?

Am rezolvat-o în două moduri - standard, construind un interval de încredere pentru parametrul N și Bayesian construind un interval credibil pentru N.

Numărul de ipoteze este de 6 și corespunde numărului posibil de bile albe N:

Evenimentul. unde este numărul de bile negre extrase.

Este important de menționat că calculul "probabilităților" nu depinde de faptul dacă considerăm că parametrul N necunoscut este o variabilă aleatoare (aderând la abordarea Bayesiană) sau o constantă necunoscută:

Soluție în mod standard.

Dacă numărul de bile albe a fost mai mare de 2, probabilitatea de observare a evenimentului - apariția la selectarea cu revenirea a 4 bile negre, ar fi mai mică decât

Derivarea este un parametru necunoscut (numărul de bile albe N) aparține intervalului [0..2] cu probabilitatea 0.95: P (0≤N≤2) ≥0.95 = 1-α. Limitele acestui "interval de încredere" sunt determinate de rezultatele experimentului (eveniment). Regula este aleasă astfel încât într-o serie mare de experimente intervalul acoperă numărul N în (1-α) 100% din cazuri. Aici limitele intervalului sunt aleatorii, însă parametrul în sine nu este accidental.

Explicație. Cum de a construi un interval de încredere în cazul general? Pe planul (N. X), unde N - parametrul de model necunoscut (numărul de bile albe în cutie), iar X este magnitudinea măsurată într-un experiment aleator (a apărut numărul de bile negre), este necesar să se construiască o zonă în care punctul (N. X) este cu o probabilitate mare (de exemplu P> 0,95). Este convenabil să se facă acest lucru prin stabilirea unor valori diferite ale N = n și definirea limitelor pentru X, astfel încât să fie îndeplinită următoarea condiție :. Intervalele rezultate "verticale" (paralele cu axa de ordonate) se numesc intervale de scalare. Limitele lor nu sunt aleatoare și depind de n și α. Acum, pentru orice fix X găsim un interval "orizontal" care intersectează regiunea construită. Limitele sale vor fi aleatoare dacă ordinul X este aleatoriu. Acesta este intervalul de încredere. Se consideră corect să nu spunem că "valoarea parametrului N intră în intervalul" și "intervalul acoperă punctul corespunzător valorii parametrului N". Statisticienii americani vorbește despre o potcoavă (imaginea intervalului), care este aruncată pe un unghi fix (parametru). Pentru a realiza ideea unui interval de încredere, a durat mai mult de 100 de ani.

Soluția este Bayesiană.

Presupunem că numărul de bile albe N este aleator și are o distribuție uniformă înainte de experiment. De fapt, există o arbitrare totală - tipul de distribuție poate fi oricare altul.

Astfel, ca rezultat al experimentului, distribuția uniformă a priori a trecut într-o succesiune descrescătoare rapidă. . Definim intervalul (interval credibil), în care se găsește o probabilitate aleatorie (în cadrul abordării bayesiene) cu probabilitatea> 0,95. Se dovedește a fi aceeași: 0≤N ≤2. Cu toate acestea, o altă alegere a probabilităților a priori poate schimba substanțial răspunsul. Deci, o cunoaștere a priori extrem de specifică poate rezista oricăror fapte nefavorabile. Dacă, de exemplu, înainte de experiment am fost practic siguri că există patru bile albe în urnă, atunci probabilitățile posterioare vor fi, deși deplasate spre o scădere a numărului N, dar cu toate acestea

Arbitrajul în alegerea distribuției a priori face ca succesul sau eșecul aplicării abordării Bayesiene să fie aleatorii. Nu este surprinzător faptul că Bayes însuși nu a îndrăznit să-și publice lucrările.

Contextul problemei.

Cunoașterea istoriei este esențială pentru înțelegerea rolului formulei Bayes. Thomas Bayes (Bayes) a studiat problema fundamentală a statisticilor - o estimare a probabilității evenimentului p de frecvența apariției lui v. În cazul în care dintr-o cutie imensă în care sunt bile ( „populația generală“), am extras aleator n bile ( „fetch“), iar printre ei K bile erau albe, ce se poate spune despre o proporție necunoscută de bile albe p în întreaga populație ? Fie n = 100, iar K = 24. Ar fi nerezonabil să se evalueze pur și simplu variabila aleatoare ν = K / n cu cantitatea necunoscută p și să presupunem că p = 0,24 (?). După extragerea următoarelor 100 de bile, valoarea lui ν va deveni diferită. Bayes a propus să ia în considerare valoarea p ca aleatorie și toate ipotezele a priori cu privire la valoarea lui p sunt la fel de probabile (p este distribuită uniform între 0 și 1). Prin urmare, pentru probabilitatea a posteriori că valoarea lui p este de la p 1 la p 2, el a obținut următoarea formulă:

Cu alte cuvinte, densitatea de probabilitate p:

unde constanta C este determinata din conditia de normalizare. Dacă mărimea eșantionului n crește (vA ≠ 0, vB ≠ 1, n → ∞), atunci distribuția p se apropie de o distribuție normală cu o m valoare medie = deviația ν standard și σ = (ν (1- ν)) 1/2 / n 1/2. Aceasta înseamnă că, cu probabilitate valoarea p se situează în intervalul 0,95 (m-2σ, m + 2σ), adică .: ν - 2 (ν (1- ν)) 1/2 / n 1/2

1 / n. În practică, acesta este același răspuns ca și teoria frecvenței moderne, dar aici se consideră că valoarea p este neordonată, iar intervalul (ν - 2 (ν (1 - ν)) 1/2 / n 1/2. - ν)) 1/2 / n 1/2) se numește un interval de încredere. Deci, prima aplicare practică a formulei Bayes asupra problemei statistice sa dovedit a fi de succes! Laplace a popularizat formula Bayes și ia dat o imagine modernă. Cu toate acestea, în cazul general, înlocuirea distribuției a priori necunoscute printr-o distribuție uniformă nu este justificată - incertitudinea nu înseamnă echiprobabilitate! Prin urmare, utilizarea practică a bayesiană a fost discreditat, iar activitatea Student, Fisher și Neumann, în prima treime a secolului XX a pus bazele pentru frecvența școlară modernă.

O Sferele principale de aplicare a formulei Bayes

1) Un instrument matematic în teoria probabilităților.

2) În statistici - ca o generalizare a experienței anterioare. Se presupune că am acumulat experiență care face posibilă estimarea experimentală (!) Distribuția probabilității a priori. Mai mult, credem că noul obiect pe care îl gândim aparține aceluiași grup. Acest lucru ne permite să construim clasificatori bazați pe formula Bayesiană.

3) În statistici, pentru compararea diferitelor modele în cazul în care distribuțiile a priori sunt atât de neclar, încât ele sunt, în general, neimportante. Foarte des se utilizează BIC (criteriul de informare Bayesian).

4) Descrierea mentalității. Susținătorii interpretării probabilității unui eveniment ca măsură a încrederii subiective în posibilitățile sale pot recalcula aceste cantități în procesul de apariție a unor noi date. Evident, matematica aici poate fi o moară de măcinat ca o moară de măcinat: arbitraritatea în determinarea probabilităților a priori poate fi periculoasă.

Articole similare