De învățare automată.
Cu eșantioane mari în această situație, testul chi-pătrat poate fi utilizat. Cu toate acestea, acest test nu este adecvat când valorile așteptările matematice în oricare din celulele din tabel, cu limite predeterminate este sub 10: distribuția selectivă calculată statistica de încercare este doar aproximativ egal cu distribuția teoretică a chi pătrat, iar apropierea este inadecvată în aceste condiții (care apar atunci când dimensiunea eșantionului este mică sau datele sunt distribuite foarte inegal între celulele din tabel). testul Fischer după cum sugerează și numele, este exactă, și, prin urmare, pot fi utilizate independent de caracteristicile eșantionului. Testul devine calculabil dificil pentru eșantioane mari sau mese echilibrate, dar din fericire este pentru aceste condiții chi-pătrat este bine aplicabil.
Pentru a efectua testul calcule manual numai în cazul în care dimensiunea tabelelor factorului 2 x 2. Cu toate acestea, principiul de testare poate fi extins la cazul general n tabele m x, iar unele pachete statistice furnizează astfel de calcule (uneori folosind metoda Monte Carlo. Pentru a primi apropierea).
Acestea ar putea fi similară cu următoarea:
Pentru a evalua semnificația statistică a datelor observate, și anume probabilitatea totală de aceeași sau mai pronunțată „oblic“, în direcția de a găsi fetele sunt pe o dieta, presupunând că ipoteza nulă, avem nevoie pentru a calcula valorile p probabilitate pentru ambele tabele și le-a pus împreună. Acest lucru oferă așa-numitul test unilateral; pentru testul cu două fețe, trebuie să luăm în considerare, de asemenea, masa, care, de asemenea înclinat în direcția opusă (de exemplu, ia în considerare cazul preferențial dieta băieți Uzat).
Din păcate, tabelele de clasificare în funcție de faptul dacă sunt „foarte denaturate„problematice. Abordarea utilizată limbajul de programare R, se calculează valoarea lui p prevede criteriul prin însumarea probabilităților pentru toate tabelele cu probabilități mai mici sau egale cu tabela de probabilitate observată. Pentru tabele cu un număr mic de celule din criteriul estimare două fețe poate diferi în mod semnificativ de estimările duble față de mărime, spre deosebire de cazul cu date statistice, care au o distribuție simetrică a eșantionului.
Cele mai multe pachete statistice moderne calculează teste exacte ale lui Fisher, în unele cazuri, chiar și în cazul în care apropierea chi-pătrat ar fi, de asemenea, acceptabile. Calculele reale efectuate pachete de programe statistice vor fi diferite, de obicei, de cele descrise. În special, problemele numerice pot rezulta din cantități mari de factorialele. abordări simple, dar chiar și mai eficiente de calcul bazate pe utilizarea gamma sau funcția logaritmică a funcției gamma, dar calculul exact al probabilității hipergeometrica și binomială - un domeniu de cercetare curente.
literatură
- [1] testul exact al lui Fisher, calculator
- [2] On-line testul exact al lui Fisher, cu exemple
- [3] On-line testul exact al lui Fisher, de lucru cu celule mari
- [4] mathworld.wolfram.com Considerarea m x n expansiune testul exact al lui Fisher