„Sensul fizic“ și terminologia
Formula lui Bayes vă permite să «rearanja cauza si efect»: bine-cunoscut faptul evenimentului pentru a calcula probabilitatea ca aceasta sa datorat acest motiv.
Evenimentele care reflectă acțiunea „cauze“, în acest caz, este de obicei numit ipoteze. deoarece acestea sunt - pretinsele evenimente care au cauzat acest lucru. Probabilitatea necondiționată de valabilitate a ipotezei este numită a priori (așa cum este probabil motivul pentru care, la toate), și condiționată - bazată pe faptul unui eveniment trecut - a posteriori (cum probabil motivul pentru care sa bazat pe datele de eveniment).
O consecință importantă a formulei lui Bayes este formula evenimentului total de probabilitate, în funcție de mai multe ipoteze care se exclud reciproc (și numai ei!).
- probabilitatea evenimentului B. depinde de o serie de ipoteze Ai. dacă știm gradul de fiabilitate a acestor ipoteze (de exemplu, măsurate experimental);
În cazul în care un eveniment este de până la motive Ai. că, dacă sa întâmplat, atunci, să fie sigur că a existat un motiv oarecare, care este
Prin formula Bayes
Transferul P (B) dreptul de a obține expresia dorită.
Metoda de filtrare spam,
O metodă bazată pe teorema lui Bayes, și-a găsit aplicarea cu succes în procesul de filtrare anti-spam.
Atunci când formarea filtrului pentru fiecare întâlnite în literele cuvântului este calculat și stocat de „greutate“ - probabilitatea ca scrisoarea cu acest cuvânt - de spam (în cel mai simplu caz - prin definiția clasică a probabilității „apariții în spam / apariții numai“ [1]).
Când verificarea scrisorile de probabilitate nou venit calculat că - spam-ul, formula de mai sus pentru mai multe ipoteze. În acest caz, „ipoteza“ - acesta este cuvântul, pentru fiecare cuvânt, „precizia ipotezei“ -% din acest cuvânt într-o scrisoare, și „dependența de evenimente ipoteza» P (B | Ai) - vychislennny înainte de «greutate» al cuvântului. Aceasta este „greutatea“ scrisoarea, în acest caz - nu celălalt, ca medie „greutatea“ toate cuvintele lui.
Atribuirea de scrisori la „spam“ sau „nu este spam“, bazat pe faptul decât cele specificate de către utilizator în cazul în care „greutatea“ lui de un anumit bar (luând de obicei 60-80%). După ce decide cu privire la scrisoarea în baza de date actualizată „greutatea“ a cuvintelor incluse în ea.
trăsătură
Această metodă este simplă (algoritmi elementare), convenabil (elimină necesitatea „liste negre“ și workarounds similare), eficient (după formarea pe reduceri suficient de mari de probă de până la 95-97% din spam-ul, și în caz de orice eroare poate fi doobuchat). În general, există indicii pentru utilizarea sa pe scară largă, așa cum este cazul în practică - bazată pe ea sunt construite aproape toate filtrele moderne de spam.
Cu toate acestea, metoda are și viciu fundamental: ea se bazează pe ipoteza. că unele cuvinte sunt mai frecvente în spam-ul, în timp ce altele - cu litere normale. și ineficientă în cazul în care această presupunere este incorectă. Cu toate acestea, după cum arată practica, acest tip de spam chiar și o persoană care nu este în măsură să determine „ochi“ - numai după ce a citit scrisoarea și a înțeles semnificația.
notițe
- ↑ În cazurile mai complexe, posibil de pre-tratare a textului: aducerea cuvinte în forma inițială, eliminarea cuvintelor funcției, calculul „greutatea“ pentru întreaga fraze, transliterație, etc ..
Vezi ce „formula Bayes„în alte dicționare:
FORMULA ipoteze probabile (formula Bayes) - formula având forma: unde A1, A2. Un evenimente incompatibile model general de utilizare în AF. de cazul în care evenimentul poate avea loc în decembrie condițiile în care a făcut n ipoteze A1, A2. O sunt cunoscute de a experimenta o probabilitate P (A1), ... ... Encyclopedia geologică
Formula totală probabilitate - vă permite să se calculeze probabilitatea unui eveniment de interes de probabilităților condiționate de asumarea unor ipoteze și probabilități ale acestor ipoteze evenimentului. Formularea Având în vedere un spațiu de probabilitate. și de grup complet în perechi ... ... Wikipedia
Formula totală probabilitate - vă permite să se calculeze probabilitatea unui eveniment de interes de probabilităților condiționate de asumarea unor ipoteze și probabilități ale acestor ipoteze evenimentului. Formularea Având în vedere un spațiu de probabilitate. și evenimente în mod colectiv exhaustive. din ... ... Wikipedia
"Teorema - (sau Bayes Bayes formula) este una dintre teoremele fundamentale ale teoriei probabilității, care permite să se determine probabilitatea ca a avut loc un anumit eveniment (ipoteza), în cazul în care există doar o dovadă indirectă a faptului (date), care pot fi inexacte ... Wikipedia
Bayes formula - teorema lui Bayes este una dintre teoremele de bază în teoria probabilității elementare, care determină probabilitatea de apariție a unui eveniment într-un mediu în care numai unele informații parțiale despre evenimentele cunoscute din observații. Conform formulei lui Bayes poate fi ... ... Wikipedia
Bayes - Bayes Thomas Tomas Bayes reverendul Thomas Bayes Data nașterii: 1702 (1702) Locul nașterii ... Wikipedia
Bayes, Thomas - Thomas Bayes reverendul Thomas Bayes Data nașterii: 1702 (1702) Locul nașterii: London ... Wikipedia
inferență Bayesian - inferență Bayesian una dintre metodele de inferență statistică, în care estimările de probabilitate de a actualiza pe adevărul probelor ipoteze de admitere folosește formula lui Bayes. Folosind actualizarea bayesiană este deosebit de important în ... ... Wikipedia
Dilema prizonierului - dacă prizonierii trădează reciproc, în conformitate cu auto-interesul lor, sau vor fi tăcut, reducând astfel la minim timpul total? Dilema prizonierului (Ing. Deținut dilema, numele folosit mai puțin frecvent „dilema ... Wikipedia
- Teorema lui Bayes. Dzhessi Rassel. Această carte va fi făcută în conformitate cu comanda pe tehnologia de imprimare Tehnologie-on-Demand. Conținutul de calitate înaltă prin articole wikipedia! "Teorema lui Bayes Bayes cu formula - una dintre principalele ... Citește mai mult Cumpărați 870 de ruble
- Teoria probabilităților și statistica matematică în probleme. Peste 360 de sarcini și exerciții. ogari DA Manualul propus conține sarcini de diferite niveluri de complexitate. Cu toate acestea, accentul principal este pe complexitatea medie a sarcinilor. Acest lucru se face în mod deliberat pentru a încuraja studenții să ... Citește mai mult Cumpărați 676 ruble
- Teoria probabilităților și statistica matematică în probleme. Peste 360 de sarcini și exerciții. ogari DA Manualul propus conține sarcini de diferite niveluri de complexitate. Cu toate acestea, accentul principal este pe complexitatea medie a sarcinilor. Acest lucru se face în mod deliberat pentru a încuraja studenții să ... Citește mai mult Cumpărați 383 de ruble