5. Principalele probleme ale statisticii aplicate - descrierea evaluării datelor și a ipotezelor de testare
rating Coerența, unbiasedness și eficiență
Cum se compară metodele de evaluare între ele? Comparația este realizată pe baza valorilor de calitate astfel metode de estimare, cum ar fi consistența, unbiasedness, eficiență, etc.
Luați în considerare evaluarea # 952; n parametru numeric # 952;, este definit pentru n = 1, 2, ... Evaluare # 952; n este numit bogați. în cazul în care converge la valoarea parametrului de probabilitate estimată # 952; la probă infinit crește dimensiunea. Ne exprimăm cele de mai sus mai detaliat. statistică # 952; n este o estimare consistentă a parametrului # 952; dacă și numai dacă pentru orice număr pozitiv # 949; relația limită
Exemplul 3. Legea numerelor mari implică faptul că # 952; n = o estimare consistentă # 952; = M (X) (în teorema de mai sus Cebîșev presupune existența dispersiei D (X), cu toate acestea, a demonstrat AY Khinchin [6], este suficient pentru a efectua condiție mai slabă - existența speranța matematică a M (X)).
Exemplul 4. Toți parametrii de evaluare de mai sus ale unei distribuții normale sunt consistente.
În general, toate estimare a parametrilor (cu rare excepții) utilizate în metodele de luare a deciziilor probabilistice și statistice, sunt coerente.
Exemplul 5. Astfel, conform teoremei VI Glivenko, Fn empirică (x) funcția de distribuție este o estimare consistentă a rezultatelor observațiilor funcției de distribuție F (x).
Dezvoltarea unor noi metode de estimare ar trebui să verifice mai întâi coerența metodelor propuse.
A doua evaluări de proprietate importante - echidistantă. nepărtinire # 952; n - este parametrul estimare # 952, care este egală cu valoarea așteptată a estimat parametrul M (# 952; n) = # 952;.
Exemplul 6. Din rezultatele de mai sus rezultă că estimările parametrilor sunt imparțiale și m # 963; 2 a distribuției normale. Deoarece M () = M (m **) = m. mediana eșantionului, și jumătate din suma extreme statistici de ordin m ** - ca pe niște estimări imparțială a așteptărilor m distribuția normală. totuși
Prin urmare, evaluarea și s 2 (963 # 2) ** sunt estimări ale variației nu bogați # 963; 2 a distribuției normale.
Calificative pentru care raportul dintre M (# 952; n) = # 952; incorect numit părtinitoare. Diferența dintre evaluarea așteptărilor # 952; n și parametrii estimați # 952;, adică M (# 952; n) - # 952;, numit Bias.
Exemplul 7. Pentru a evalua s 2. După cum reiese din cele de mai sus, offsetul este
Offset Estimarea s 2 tinde la 0 ca n → ∞.
Evaluare, pentru care deplasarea tinde spre 0 ca mărimea eșantionului tinde la infinit, se numește asimptotic imparțială. Exemplul 7 arată că estimarea s 2 este asimptotic imparțială.
Practic, toți parametrii de evaluare utilizate în metodele probabilistice și statistice de luare a deciziilor sunt fie imparțiale sau asimptotic imparțial. Pentru indicatorul de evaluare imparțială a preciziei estimărilor este dispersia - dispersia este mai mică, scorul mai bine. Pentru a compensa count este un indicator al preciziei așteptării matematice a pătratului de evaluare M (# 952; n - # 952;) 2. Rezultă din proprietățile de bază ale așteptărilor și varianță,
și anume speranța de pătrat suma de eroare a estimărilor variației și pătratul părtinire sale.
Pentru marea majoritate a estimărilor parametrilor utilizați în metodele probabilistice și statistice de luare a deciziilor, dispersia ordinul 1 / n. si offset - nu mai mult de 1 / n. în care n - mărimea eșantionului. Pentru astfel de estimări pe termen mare n al doilea de pe partea dreapta (3) este neglijabil în comparație cu primul, și pentru ei următoarea egalitate aproximativă
unde c - numărul determinat prin calcul estimări # 952; n și valoarea reală a parametrului estimat # 952;.
La estimarea asociată metodei de evaluare a treia proprietate importantă variația - eficiență. Evaluarea eficientă - este o estimare imparțială având cea mai mică dispersie a tuturor posibile estimatori imparțiale ale parametrului.
Dovedit [11], care sunt estimări ale parametrilor eficace și m # 963; 2 a distribuției normale. În același timp, pentru mediana probei, relația limită
Cu alte cuvinte, eficiența mediană eșantionului, adică raportul de dispersie parametru de evaluare efectivă m la varianța estimare imparțială a acestui parametru pentru mare n este aproape de 0,637. Acest lucru se datorează eficienței relativ scăzută a eșantionului median ca o estimare a speranța matematică a distribuției normale este, în general, utilizat în mod selectiv medie aritmetică.
Conceptul este introdus eficienta pentru estimativi impartiale pentru care M (# 952; n) = # 952; pentru toate valorile posibile # 952;. Dacă nu aveți nevoie imparțial, este posibil să se specifice evaluării, în anumite # 952; având mai varianței și eroarea medie la pătrat decât eficientă.
Exemplul 8. Luați în considerare așteptările 'estimarea' m1 ≡ 0. Atunci D (m1) = 0; întotdeauna mai mică dispersie D () evaluarea eficientă. Așteptarea medie de eroare pătrat dn (m1) = m2. și anume au la dn (m1) Exemplul 9. Un exemplu mai interesant este considerat matematician american J. Hodges .: În mod evident, TN - bogat, estimare asimptotic imparțială a așteptărilor m. în același timp este ușor de calculat, Cea mai recentă formulă arată că atunci când m ≠ 0 scor mai bun decât Tn (prin compararea mediei pătratice eroare dn), iar când m = 0 - de patru ori mai bine. Marea majoritate a evaluărilor # 952; n. utilizate în metode probabilistice și statistice sunt asimptotic normale, adică pentru ei relațiile limită: pentru orice x. în cazul în care F (x) - funcție de distribuția normală standard cu media 0 și varianța 1. Acest lucru înseamnă că volumul mare de probe (în practică - câteva zeci sau sute de observații) ale distribuției de COUNT descris pe deplin de așteptările și varianțelor lor, și evaluări de calitate - valoare înseamnă dn eroare pătrat (# 952; n).articole similare