Erori în testarea ipotezelor statistice. Criterii statistice și regiunea critică
Ca urmare a testării ipotezelor statistice pe baza datelor de la o dimensiune limitată a eșantionului, putem respinge ipoteza nulă și să accepte (sau mostre de date contrazic în concordanță cu H0). Acest lucru arată că testarea ipotezelor statistice este asociată cu riscul de a lua decizii greșite.
Decizia greșită poate fi luată în două cazuri. În acest sens disting două tipuri de erori.
Eroare de primul tip este faptul că H0 ipoteza nulă este respinsă, deși, în realitate, este corect.
Eroare de al doilea tip este faptul că H0 ipoteza nulă este acceptată, dar de fapt este ipoteza alternativă corectă.
Dacă, de exemplu, a constatat că un pesticid nou este cel mai bun, dar, de fapt, efectul său nu este diferită de cea veche, este o eroare a primului tip; dacă ne-am decis ca ambele tipuri de pesticide sunt aceleași, atunci când, de fapt, noua specie este cel mai bun, apoi a permis o eroare de ordinul al doilea.
soluții corecte și incorecte pot fi preparate în două cazuri care ilustrează Tabelul 7.1.
Tabelul 7.1. Rezultate posibile ale testarea ipotezei nule
Rezultatul verificării Ka
Eroare de al doilea tip de p
Probabilitatea unei greșeli a primului tip (deviere nejustificată H0) se numește nivelul de semnificație, și este notată. Probabilitatea de a face o greșeală de-al doilea tip (presupunând că ipoteza H0 false) este indicat, așa putem spune că un număr mare de probe este egal cu proporția de concluzii eronate și, în cazul în care H0 este corectă, și este egală cu p, dacă este corect.
Am eroare și de tip II, în consecințele sale sunt inadecvate și să conducă la o varietate de pierderi financiare. Prin urmare, importanța nivelului de alegere trebuie să se bazeze pe contul de pierderi posibile: o mai mare pierdere, mai mici ar trebui să fie nivelul de semnificație. Cu toate acestea, în cazul în care nivelul redus de semnificație, crescând probabilitatea de al doilea tip de erori. În acest sens, greșelile I si II, sunt concurente.
Deoarece erorile de tip II și I este aproape imposibil să se excludă, în fiecare caz, trebuie să încerce să reducă pierderile cauzate de aceste erori. În practica ipoteze de testare încearcă să se asigure că, pentru greșeala și să accepte eventualele erori, cuplate cu consecințe mai grave în practică.
Nivelul de semnificație este stabilit de către cercetător în funcție de natura și importanța sarcinilor, le rezolva (așa-numitul principiu al încrederii practice). Nivelul de semnificație este probabilitatea minimă, de la care poate recunoaște evenimentul practic imposibil. Se poate folosi valorile standard ale unui = 0,10; 0,05; 0,01; 0,001; 0,0001 și colab., A, cel mai adesea setat la 0,05 și 0,01. Atunci când soluții mai solicitante și a crescut la 0.001. Nivelul de semnificație, de exemplu, a = 0,05, ceea ce înseamnă că, în medie, de 5 ori din 100, există riscul de a face o greșeală și natură, adică respinge ipoteza corectă (Ho).
Prin stabilirea unui anumit nivel de semnificație, cercetătorul controlează probabilitatea de erori și natură: cea mai mică este, cu atât mai mult H0 vor fi recunoscute ca fiind corecte. Cu toate acestea, așa cum este indicat mai sus, reducând nivelul de semnificație conduce la apariția unui al doilea tip de eroare. În cele mai multe cazuri, singura modalitate de a reduce probabilitatea de apariție simultană a două tipuri de erori este de a crește dimensiunea eșantionului.
Pentru a testa ipoteza nulă și adoptarea concluziilor privind datele eșantion compatibile cu ipoteza prezentate pe baza unor criterii statistice speciale, care este un set de reguli prin care ipoteza testabile este fie acceptată sau respinsă. Cu alte cuvinte, criteriul definește proprietățile cerute datele selectate ipoteza ar putea fi acceptată sau respinsă.
Pentru fiecare tip de ipoteze scanate elaborate criterii speciale, printre care cele mai frecvent utilizate criterii și normale de distribuție și distribuția Student, testare Fischer-Snedecor,% 2 (chi-pătrat) și Pearson de distribuție al.
Testele statistice utilizate pentru testarea ipotezelor statistice, sunt de două tipuri: parametrice și neparametrice.
Criterii de parametrice Chemat care se bazează pe ipoteza că distribuția variabilei aleatoare în mod colectiv subordonat unele cunoscute drept (de exemplu, normal, bіnomіnalnomu Poisson). Aceste criterii includ criterii. B,% 2, etc ..
(ordinale) Criterii de neparametrice apel, a căror utilizare nu este asociată cu cunoașterea legii distribuției valorilor aleatorii și poate fi aplicată în cazul în care distribuția analizată diferă în mod considerabil de la normal. Aceste criterii includ, în special, semne Wilcoxon, alb, Mann-Whitney și colab.
criterii parametrice sunt mai eficiente în comparație cu neparametrice. Cu toate acestea, ele pot fi utilizate pentru agregate, care au o distribuție normală sau aproape normală. Criterii de neparametrice pot fi utilizate în orice formă de distribuție. Singura condiție pentru utilizarea acestora este monitorizarea datelor reciproc independente.
În setul de valori posibile pentru criteriile selectate pot distinge două subseturi nu se intersectează, dintre care unul conține valoarea criteriului, iar al doilea - nr. Primul subset este numit regiunea critică,. iar al doilea domeniu de valori admisibile.
O zonă critică se numește valorile criteriile pe baza cărora ipoteza nulă este respinsă. Intervalul de toleranță (decizie-H0) este setul de valori ale criteriilor utilizate, la care se acceptă ipoteza nulă.
Punctul de separare regiunea critică a intervalului de toleranță, numit un punct critic.
Distinge regiunea critică o față și cu două fețe.
Chemat o singură parte sau regiunea critică din dreapta. Aceste zone sunt determinate de astfel de nereguli: pentru dreptul regiunii critice la> acre unde acre - un număr pozitiv, stânga pentru <акр - где акр - отрицательное число.
Regiunea critică față-verso este determinată de nereguli <аь к> a2, unde a2> ai sau scurt | a |> acru acru unde> 0.
Alegerea unei regiuni critice cu o singură față sau pe ambele fețe depinde de condițiile specifice și obiectivele problemelor care trebuie rezolvate. De exemplu, în cazul în care ipoteza alternativă Ha. xi F x2 ar trebui să utilizeze regiunea față-verso critică, în timp ce ipoteze. xi> x2 și On: Xi <х2 - односторонней (в соответствии правосторонним и левосторонним) критической областью.
Zona critică este mai bine pentru a construi, astfel încât este bine distins de ipoteza alternativă nulă.
Criteriul pentru testarea ipotezei trebuie selectate astfel încât riscul de a face greșeli este redusă la minimum. Este foarte important să se determine probabilitatea ca va exista o eroare de tip II. Această probabilitate caracterizează sensibilitatea erorii de încercare de tip II și a fost numit putere test.
Criteriul de putere este probabilitatea de respingere a testului de ipoteza H0, atunci când ipoteza alternativă este chiar pe (1- | 3). În consecință, criteriul puterii este probabilitatea ca va exista o eroare de tip II. Desigur, este de dorit să aibă un test de puternic, deoarece va oferi o probabilitate minimă de tip II ipoteze de eroare. Prin urmare, din toate criteriile posibile ar trebui să fie ales cel mai puternic.
test de putere (sensibilitate) poate fi îmbunătățită în două moduri: a) o creștere a nivelului de semnificație. Cu toate acestea, această abordare nu este în întregime acceptabilă, deoarece în mod nejustificat crește probabilitatea de erori și natură; b) creșterea numărului de probe.
În formularea de concluzii pe baza rezultatelor testării ipotezei sunt ghidate de acest principiu (regula): în cazul în care valoarea reală a criteriului cade în regiunea critică, atunci H0 este respinsă dacă valoarea reală aparține gamei de criterii valori acceptabile, atunci H0 este acceptat.
Pentru fiecare dintre criteriile elaborate tabele speciale, care sunt valoarea de masă (punctul critic), care separă regiunea critică a intervalului de toleranță. S-au găsit valoare criterii de masă este comparată cu valoarea reală. În cazul în care valoarea reală a criteriilor definite de datele eșantion va fi o valoare mai mare de masă, ipoteza nulă ar trebui să fie respinsă și să accepte ipoteza alternativă. În cazul în care valoarea reală a testului este mai mică sau egală cu o masă, se concluzionează că acordul de supraveghere a datelor cu ipoteza nulă, adică un motiv de respingere a H0, și, prin urmare, nu este necesar să se ia.
În cazul în care, de exemplu, într-un experiment de verificare efectul oricărui factor privind indicarea scorului prin intermediul X - criteriul Student, concluziile sunt formulate astfel. În cazul în care X ^> Ha, ipoteza nulă (H0. Factorul nu afectează semnul efectiv) deflect și influența factorilor asupra unui semn productiv al semnificative probabile. Dacă vom verifica corectitudinea diferenței dintre media a două sau mai multe mici mostre, în acest caz (Hfsch> Ha) spun că diferențele dintre mediile sunt atât de semnificative încât acestea nu pot fi rezultatul unei variații aleatorii de mostre de date, astfel încât acestea trebuie să fie recunoscute ca fiind esențiale, esențiale.
într-o situație în care se pare că Hfsch ^ <Ха. делают обратные выводы: нулевая гипотеза (Н0: фактор не влияет на результативный признак) принимается, влияние фактора на результативный признак, несущественный, недостоверен, а сама разница между средними лежит в границах возможных случайных колебаний, а поэтому она несущественна, невірогідна.
Trebuie avut în vedere faptul că acceptarea ipotezei nule nu dovedește dreptatea absolută. Aceasta este doar o dovada in plus de necesitatea de a verifica, inclusiv prin creșterea dimensiunii eșantionului sau până când mai multe studii concludente nu li se va permite să facă concluzia opusă. Prin urmare, în formularea concluziilor finale, în acest caz, este mai corect să spunem că aceste observații nu contrazic ipoteza nulă și, prin urmare, nu dă motive de respingere a acesteia.