Testarea ipotezelor statistice 1

§ 1. Ipoteza statistică. Concepte de bază.

problema de testare a ipotezelor într-un mod care amintește de problema estimării parametrilor populației generale cu privire la datele eșantionului: face enunțurile și pe baza datelor de eșantionare este evaluată pe validitatea acestei afirmații.

Ipoteza statistică susțin că orice evenimente durabile statistic (evenimente care pot apărea de mai multe ori în condiții identice).

1. Populația generală are o distribuție normală;

2. Dispersiile ale celor două distribuții normale sunt egale;

3. Dispersie caracteristică distribuită în populație

· Dacă ipoteza afirmă ceva despre semnificația unui parametru, atunci ipoteza este numit parametrice.

Dacă ipoteza sugerează că ceva nu se măsoară cantitativ (de exemplu, atributul „are o distribuție normală“), ipoteza este numit non-parametric.

· Principalul (nul) ipoteza se numește ipoteza.

· O alternativă (concurentă) se numește o ipoteză care contrazice extinsă.

· Ipoteza este numit simplu, în cazul în care răspunsul la acesta este lipsit de ambiguitate ( „un semn al unei distribuții normale, variația distribuției este egal cu 2“)

În cazul în care răspunsul este ambiguu, ipoteza este numit complex.

§ 2. De tip I și tip II erori.

Ipoteza poate fi corecte sau incorecte, de aceea este necesar să se verifice de la datele empirice (din eșantion). Deoarece conținutul probei din întâmplare, atunci declarațiile făcute pe baza unor studii de eșantionare aleatorii, adică Ele pot fi corecte și incorecte.

Ca urmare testarea ipotezei unor decizii greșite din cele două cazuri pot fi luate, de exemplu, greșelile pot fi de două tipuri:

1. Eroarea de tip I - numit eroarea admisibilă în cazul în care ipoteza principală a respins corect (respinsă, deși este adevărat);

2. Eroarea de al doilea tip - numite greșelile făcute în cazul incorecte, ipoteza de bază (acceptată, deși nu este adevărat);

Rezultatul testului Ipoteza de bază

Nu testarea negativ ipotezelor statistice nu înseamnă că ipoteza noastră este cea mai bună și numai potrivit, nu este doar contrar cele mai bune noastre de date eșantion, dar aceleași proprietăți pot avea și alte ipoteze.

Decide cu privire la ipoteza corecta sau falsitatea acestuia se bazează pe criterii statistice.

§ 3. Testul statistic. Regiunea critică. Zona de acceptare a ipotezei. Puncte critice.

Pentru a testa această ipoteză, folosind variabile aleatoare alese special, distribuția exactă sau aproximativă este cunoscută.

Q. Variabila aleatoare este folosită pentru a verifica o ipoteză numită criteriul statistic sau un criteriu. Valoarea observată se numește valoarea criteriu calculat pentru proba.

După selectarea criteriilor stabilite a tuturor valorilor posibile este împărțit în două subseturi disjuncte:

· Unul dintre ele conține valoarea criteriului, în care a respins - este numit regiunea critică S.

· Alte conține valoarea criteriului, în care este acceptată ipoteza - este numită regiunea de acceptare a ipotezei. (Zona admisă).

Punctul critic se numește punctul de determinare a zonei critice a deciziei unor ipoteze, distinge;

1. o față și cu două fețe regiunea critică.

Unilaterala împărțit în:

· Dreapta fata-verso regiunea critică;

· Stanga fata-verso regiunea critică;

În special, în cazul în care punctele critice sunt simetrice în raport cu zero, atunci două sensuri zona este definită modulo | Q |>.

În general, criteriul este multidimensional variabile aleatoare, cu toate acestea, considerăm că cele mai simple criterii dimensionale în viitor.

Regiunea critică și fezabilă are seturi numerice cu o singură dimensiune. Tipul de regiune critică depinde de tipul principalelor alternative și ipoteze.

§ 4. Nivelul de semnificație și puterea testului.

1. Probabilitatea de a face o greșeală a primului tip este numit nivel de criterii de semnificație și reprezintă.

Probabilitatea de tip II reprezintă erori.

2. Puterea testului se numește probabilitatea de a lovi un criteriu critic în zonă, cu condiția ca ipoteza alternativă este adevărată. (Adică, puterea testului -. Este probabilitatea inadmisibilității celui de al doilea tip de eroare.)

De obicei, utilizați valoarea implicită: # 945; = 0,05, # 945; = 0,01.

Nu contează cât de mică cantitate. intrând în regiunea critică doar puțin probabil, dar nu eveniment cu totul imposibil.

Cu cât mai puțin. este mai puțin probabil o eroare a primului tip. Odată cu scăderea în regiunea critică este redusă.

Când = 0, ipoteza - va fi întotdeauna luate indiferent de rezultatele eșantionului. Micșorați. atrage după sine o creștere a probabilității de eroare de al doilea tip.

Reducerea simultană a erorilor din primul si al doilea fel este posibilă doar prin mărirea dimensiunii eșantionului.

De obicei, atunci când testarea unei ipoteze a stabilit un anumit nivel de importanță și probei dimensiune n. Criteriul este ales pentru a testa capacitatea maximă a fost.

§ 5. Tipuri de zone critice.

Să testa ipoteza de egalitate a unui parametru al distribuției generale, cum ar fi media generală. și pentru a testa ipoteza că distribuția criteriului Q. este după cum urmează:

1. În cazul în care ipoteza alternativă este pusă înainte. . regiunea critică este firesc să se definească. adică selectați-mâna stângă regiunea critică.

Presupunând că un nivel de semnificație a ecuației. Am găsit zona din stânga.

2. În ipoteza alternativă. Regiunea critică este determinată din ecuația. Se numește regiunea critică dreapta față-verso.

3. Dacă ipoteza alternativă este formulată în formă. regiunea critică built-fețe.

Puncte critice se găsesc din ecuație.

Cel mai adesea două sensuri regiunea critică este construită simetric:

§6. Metode de testare a ipotezei.

Există mai multe teste statistice diferite pentru o varietate de probleme statistice. Cu toate acestea, putem descrie schema generală.

Metode de testarea ipotezelor statistice este redusă la următoarele etape:

Pasul 1. Formulați ipoteza principală care urmează să fie testate; ambele indicate cu privire la care trebuie să se facă alternative de verificare, și anume formulat o ipoteză alternativă.

Etapa 2. Criteriul statistic selectat - o valoare aleatorie, calculată pe baza rezultatelor eșantionului.

Etapa 3. regula de validare Formulată determinat volumul eșantionului corespunzător pe criterii sau condiții de date și de reducere la minimum n predeterminate nivel de semnificație și putere.

Pasul 4. În funcție de ipoteza care urmează să fie testate și alternativele sale este ales de verificare unilaterală sau bilaterală.

Alegerea ipoteza alternativă este dictată de către entitatea de verificare.

Etapa 5. Conform distribuției cunoscută a criteriului calculat punctele critice.

Pasul 6. Este eșantionate și proba obținută se calculează punerea în aplicare a observat criteriul valorii. Dacă această valoare se situează în regiunea critică, ipoteza nu este recunoscută de datele de observare relevante și, prin urmare, respinse. Dacă ingerate în intervalul admisibil, atunci ipoteza nu este considerat contrar eșantionarea datelor și pot fi considerate plauzibile.

Pentru fiecare tip de ipoteze testabile elaborate criterii adecvate. variabile aleatoare cel mai frecvent utilizate având distribuția normală, distribuția (pătrat Pearson), distribuția t, F- Fischer distributie - Snedecor.

Schema de mai sus de investigații sugerează că legea de distribuție a populației este cunoscută și evaluarea sunt supuse uneia sau mai multor parametri de distribuție.

Astfel de ipoteze se numesc parametri.

Alături de aceste ipoteze trebuie efectuate teste statistice și legea de distribuție necunoscută pentru populația generală. ipoteze relevante sunt numite neparametrice.

Criterii de neparametrice au putere semnificativ mai mici decât parametrice, adică pentru a menține aceleași valori au nevoie de mai multe date experimentale.

Pe de altă parte, criteriile de bază non-parametrice pot folosi orice lege de distribuție a populației și sunt utili ca cantitative sau calitative a atributelor.

§ 7. Unele sarcini tipice de testare a ipotezelor parametrice.

Luați în considerare unele probleme comune rezolvate cu ajutorul unor ipoteze de testare. Este mai presus de toate:

· Compararea Probleme (caracteristici de probă comparație cu proprietăți de reglementare)

· Compararea caracteristicilor celor două eșantioane unul cu celălalt (pentru a testa ipoteza că aceste probe aparținând aceleiași populații generale).

Tipic problema neparametrică:

· Testarea unei Ipoteză de distribuție selectivă;

· Verificați semnificație Caracteristicile eșantionului diferență.

7.1 Testarea ipoteze referitoare la valoarea medie.

a) compararea valorii medii cu valoarea standard de.

Asemenea probleme sunt întâlnite în timp ce testarea produsului, care se caracterizează printr-o medie:

1. Timpul mediu al dispozitivului;

2. Mărimea medie a pieselor, etc.

b) Compararea valorilor medii ale celor două seturi.

Să presupunem că există două seturi, caracterizate prin valori medii și. diferențe și.

Se presupune că aceste medii sunt egale. t. e

Pentru a testa ipotezele folosind criteriul principal

Din moment. în ipoteza nulă va fi.

Folosind proprietățile de dispersie și presupunând probe independente, obținem:

Presupunand suplimentar că varianțele celor două populații sunt egale, adică, obținem:

Ipoteza egalității varianțelor care are nevoie de o inspecție specială, care va fi discutat în secțiunea următoare.

Substituind acest lucru în formula pentru criteriile sunt:

În cazul în care atât volumul eșantionului suficient de mare, valoarea aleatoare și variabila aleatoare normal distribuită, cu toate acestea, și în mod normal vor fi distribuite criteriu.

Înlocuirea varianța necunoscute din totalul populației de pe estimarea sa eșantion imparțială.

Am ajuns la criteriile normale de alocare:

Testarea ulterioară se efectuează într-un mod convențional folosind tabele de funcții de distribuție Laplace.

În cazul în care prelevarea de probe și aplicarea unui volum mic de o distribuție normală poate duce la erori, pentru același criteriu Z folosind distribuția Student cu un număr de grade de libertate.

7.2 dispersiile Compararea 2-seturi.

Să presupunem că există două populații normal distribuite, care sunt egale cu variația; ipoteza nulă.

Deoarece dispersia populațiilor necunoscute pentru a testa ipoteza se bazează pe compararea probelor și dispersii. În cazul în care raportul. aproape de 1, nu există nici un motiv pentru a respinge ipoteza nulă în cazul în care în mod semnificativ diferită - ipoteza este respinsă. Pentru a rezolva problema, cât de mult mai mare trebuie să fie diferența dintre eșantion varianțe la respingerea ipotezei nule a fost întemeiată, raportul utilizat

Distribuirea acestui raport se numește F-distribuția Fisher - Snedecor, depinde de doi parametri - numărul de grade de libertate ale numărătorul și numitorul și. în cazul în care - dimensiunea eșantioanelor. Iar numărul specificat în acolade de lângă valoarea F calculată:

Regiunea critică este construită în funcție de tipul de ipoteze alternative:

1. Ipoteza nulă. O ipoteză alternativă. if ().

pentru o anumită # 945; și cunoscut și tabelul de alocare Fischer - Snedecor găsi critice. H Ipoteză testarea 0svoditsya la următoarea regulă: dacă raportul dintre proba varianțe. 0otklonyaetsya ipoteza H; în cazul în care. 0ne ipoteza H este respinsă.

2. Ipoteza alternativă.

În acest caz, construirea unei regiuni critice cu două fețe simetrice cu punctele critice și. determinată din inegalitățile

punct critic dreapta este direct pe masa de distribuție punct critic Fisher - Snedecor pentru nivelul de semnificație și grade de libertate. Stânga tabelul punctelor critice nu conține, dar cu metoda simetrică selectată pentru construirea regiunii critice, realizat criteriul F de penetrare în regiunea critică, cu o probabilitate de nivel de semnificație .tak atât determina nivelul de semnificație. alegerea. ajungem în același timp și. H Ipoteză Testarea 0proizvoditsya prin aceeași regulă ca și în cazul regiunii critice o singură față, dar valorile criteriilor intabulate sunt căutate valoare. jumătate mai scurt decât un nivel predeterminat de semnificație: dacă raportul dintre proba varianțe. ipoteza nulă H 0 este respins dacă ipoteza H 0 este respinsă.

§ 8. ipoteze non-parametrice. Pearson și Kolmogorov consimțământ.

discutat anterior metode pentru testarea ipotezelor cu privire la parametrii individuali ai distribuției generale.

Un loc aparte este ocupat cu ipoteze despre consistența distribuției de eșantionare a distribuției teoretice (general).

Testele se potrivesc răspunde la întrebarea dacă diferența dintre eșantion și distribuția teoretică este atât de mică încât acestea să poată fi atribuite influenței factorilor accidentali sau nu.

Să legea de distribuție a populației este necunoscută, dar există motive să se creadă că are un anumit tip.

1) În cazul în care condițiile teoremei limită centrală, există motive să ne așteptăm ca distribuția generală - normală;

2) În cazul în care proba medie și varianța eșantionului sunt egale, atunci se poate presupune că populația generală de distribuție Poisson, etc.

Aceste afirmații sunt ipoteze și ar trebui să fie supuse unor teste statistice.

Pentru a testa ipoteza. dreptul de distribuție are acest tip (normal, uniformă, exponențială), folosind special selectată o variabilă aleatoare, care se numește criteriul consimțământului.

Bunătatea Fit este un criteriu pentru testarea ipotezei legii propuse necunoscute de distribuție.

Există mai multe criterii pentru aprobare:

- (Chi-pătrat) Pearson, Kolmogorov criteriu Mises - Smirnova și colab.

8.1 Criteriul Pearson.

Luați în considerare în cazul în care eșantionul a fost aproape de intervalul statistic. Pentru a studia variabila aleatoare X, n- efectuat experimente, intervalul de valori observate ale variabilei X este împărțit în intervale q. Numărul de distribuție este:

articole similare