formula Bayes - o

„Sensul fizic“ și terminologia

Formula lui Bayes vă permite să «rearanja cauza si efect»: bine-cunoscut faptul evenimentului pentru a calcula probabilitatea ca aceasta sa datorat acest motiv.

Evenimentele care reflectă acțiunea „cauze“, în acest caz, este de obicei numit ipoteze. deoarece acestea sunt - pretinsele evenimente care au cauzat acest lucru. Probabilitatea necondiționată de valabilitate a ipotezei este numită a priori (așa cum este probabil motivul pentru care, la toate), și condiționată - bazată pe faptul unui eveniment trecut - a posteriori (cum probabil motivul pentru care sa bazat pe datele de eveniment).

O consecință importantă a formulei lui Bayes este formula evenimentului total de probabilitate, în funcție de mai multe ipoteze care se exclud reciproc (și numai ei!).

- probabilitatea evenimentului B. depinde de o serie de ipoteze Ai. dacă știm gradul de fiabilitate a acestor ipoteze (de exemplu, măsurate experimental);

În cazul în care un eveniment este de până la motive Ai. că, dacă sa întâmplat, atunci, să fie sigur că a existat un motiv oarecare, care este


Prin formula Bayes


Transferul P (B) dreptul de a obține expresia dorită.

Metoda de filtrare spam,

O metodă bazată pe teorema lui Bayes, și-a găsit aplicarea cu succes în procesul de filtrare anti-spam.

Atunci când formarea filtrului pentru fiecare întâlnite în literele cuvântului este calculat și stocat de „greutate“ - probabilitatea ca scrisoarea cu acest cuvânt - de spam (în cel mai simplu caz - prin definiția clasică a probabilității „apariții în spam / apariții numai“ [1]).

Când verificarea scrisorile de probabilitate nou venit calculat că - spam-ul, formula de mai sus pentru mai multe ipoteze. În acest caz, „ipoteza“ - acesta este cuvântul, pentru fiecare cuvânt, „precizia ipotezei“ -% din acest cuvânt într-o scrisoare, și „dependența de evenimente ipoteza» P (B | Ai) - vychislennny înainte de «greutate» al cuvântului. Aceasta este „greutatea“ scrisoarea, în acest caz - nu celălalt, ca medie „greutatea“ toate cuvintele lui.

Atribuirea de scrisori la „spam“ sau „nu este spam“, bazat pe faptul decât cele specificate de către utilizator în cazul în care „greutatea“ lui de un anumit bar (luând de obicei 60-80%). După ce decide cu privire la scrisoarea în baza de date actualizată „greutatea“ a cuvintelor incluse în ea.

trăsătură

Această metodă este simplă (algoritmi elementare), convenabil (elimină necesitatea „liste negre“ și workarounds similare), eficient (după formarea pe reduceri suficient de mari de probă de până la 95-97% din spam-ul, și în caz de orice eroare poate fi doobuchat). În general, există indicii pentru utilizarea sa pe scară largă, așa cum este cazul în practică - bazată pe ea sunt construite aproape toate filtrele moderne de spam.

Cu toate acestea, metoda are și viciu fundamental: ea se bazează pe ipoteza. că unele cuvinte sunt mai frecvente în spam-ul, în timp ce altele - cu litere normale. și ineficientă în cazul în care această presupunere este incorectă. Cu toate acestea, după cum arată practica, acest tip de spam chiar și o persoană care nu este în măsură să determine „ochi“ - numai după ce a citit scrisoarea și a înțeles semnificația.

notițe

  1. ↑ În cazurile mai complexe, posibil de pre-tratare a textului: aducerea cuvinte în forma inițială, eliminarea cuvintelor funcției, calculul „greutatea“ pentru întreaga fraze, transliterație, etc ..

Vezi ce „formula Bayes„în alte dicționare:

"Formulă - Bayes Teorema lui Bayes este una dintre teoremele de bază în teoria probabilității elementare, care determină probabilitatea de apariție a unui eveniment într-un mediu în care, pe baza observației cunoscute doar câteva informații parțiale despre evenimentele. Conform formulei lui Bayes poate fi ... ... Wikipedia

"Teorema - (sau Bayes Bayes formula) este una dintre teoremele fundamentale ale teoriei probabilității, care permite să se determine probabilitatea ca a avut loc un anumit eveniment (ipoteza), în cazul în care există doar o dovadă indirectă a faptului (date), care pot fi inexacte ... Wikipedia

CONSILIERE GENETICA - sau consiliere genetică, îngrijire medicală tip pentru cei care sunt îngrijorați de faptul că boala sau malformații congenitale în mod explicit sau natura ereditară suspectată pot apărea în orice membru al familiei este. Sarcina genetică ... ... Collier Enciclopedia

entropie Informații - informații entropia de incertitudine sau de imprevizibilitate a informațiilor, incertitudinea cu privire la apariția oricăruia dintre simbolul primar al alfabetului. În absența pierderii de informații este numeric egală cu cantitatea de informații privind caracterul ... ... Wikipedia

Condiționat entropie - entropie (informație) măsurarea randomness informațiilor, incertitudinea apariției oricăruia dintre simbolul primar al alfabetului. În absența pierderii de informații este numeric egală cu cantitatea de informații cu privire la caracterul mesajului transmis. De exemplu, în ... ... Wikipedia

Entropie (teoria informației) - entropie (informații) măsura intamplarea informațiilor, incertitudinea apariției oricăruia dintre simbolul primar al alfabetului. În absența pierderii de informații este numeric egală cu cantitatea de informații cu privire la caracterul mesajului transmis. De exemplu, în ... ... Wikipedia

  • Teoria probabilităților și statistică matematică în exemple și probleme. Nikitina NS Acest manual conține sarcini și exemple referitoare la următoarele secțiuni ale teoriei statisticii matematice și de probabilitate: algebra de evenimente, definiția clasică a probabilității, ... Citește mai mult Cumpărați 544 ruble
  • Teoria probabilităților și statistică matematică în exemple și probleme. Manualelor. N. S. Nikitina, AV Stepanov. Acest manual conține sarcini și exemple referitoare la următoarele secțiuni ale teoriei statisticii matematice și de probabilitate: algebra de evenimente, definiția clasică a probabilității, ... Citește mai mult Vand pentru 494 UAH (Ucraina numai)
  • Cartea de probleme în teoria probabilității. paly IA Cartea cuprinde 700 de sarcini, care acoperă următoarele subiecte de curs: combinatorica; evenimente și operațiuni asupra acestora; spațiu de probabilitate clasic; probabilitate geometrică; ... Citește mai mult Vand pentru 190 de ruble
Alte cartea "Formula lui Bayes la cerere >>

articole similare