1. Evaluarea în funcție de variabilele aleatorii - rezultatele observațiilor.
Să analizăm întrebarea de a determina caracteristicile numerice ale unei variabile aleatoare X din rezultatele n unor experimente independente. Indicăm valorile observate ale variabilei aleatoare
Ele pot fi considerate n "copii" ale variabilelor aleatoare X, adică n variabile aleatoare independente. Fiecare dintre ele este distribuită în conformitate cu aceeași lege ca variabila aleatoare X.
Semnificăm prin ã o estimare a parametrului a. Orice estimare pe baza materialului X1. X2. ..., Xn trebuie să fie o funcție a acestor cantități:
și, prin urmare, ea însăși este o variabilă aleatoare. O astfel de estimare se numește "punct". Legea distribuției ã depinde în primul rând de legea distribuției cantității X (și, în special, de cel mai necunoscut parametru a): în al doilea rând, de numărul de experimente n. În principiu, această lege de distribuție poate fi găsită prin metode cunoscute de teorie a probabilității.
2. Criterii de evaluare.
Dacă, cu o creștere a numărului de studii, n estimarea ã converge probabilitatea la parametrul a, atunci o astfel de estimare se numește consecventă.
Dacă se așteaptă estimarea ã este egal cu parametrul estimat a, adică,
atunci se spune că o asemenea estimare este imparțială.
Dacă estimarea ã în comparație cu alte estimări, are cea mai mică variație, adică,
atunci se va numi eficace.
În practică, nu este întotdeauna posibilă îndeplinirea tuturor acestor cerințe. De exemplu, se poate constata că, chiar dacă există o estimare efectivă, formulele de calcul al acesteia sunt prea complicate și trebuie îndeplinită o altă estimare, varianța căreia este mai mare. Uneori sunt utilizate estimări puțin părtinitoare. Cu toate acestea, alegerea evaluării trebuie întotdeauna precedată de examinarea sa critică din toate punctele de vedere enumerate mai sus.
3. Estimări pentru așteptările matematice și varianța.
Fie o variabilă aleatoare X cu așteptarea matematică m și varianța D; ambele nu sunt cunoscute. Peste valoarea lui X, n s-au efectuat experimente independente, obținându-se rezultatele lui X1. X2. Xn.
Ca o estimare a așteptărilor matematice, este normal să luăm media statistică m *:
Se poate dovedi că această estimare este consecventă și imparțială. Dacă valoarea lui X este distribuită conform legii normale, dispersia va fi minim posibilă, adică estimarea este eficientă. Pentru alte legi de distribuție, acest lucru nu poate fi cazul.
Dacă luăm ca estimare a varianței variația statistică D *
atunci acesta va fi verificat prin verificarea faptului că această estimare este consecventă, dar nu imparțială. Asteptarile sale matematice sunt:
Folosind estimarea D * în loc de dispersia lui D, vom face o eroare sistematică într-o direcție mai mică. Pentru a elimina această deplasare, este suficientă introducerea unei corecții, înmulțind valoarea lui D * cu n / (n-1).
se numește varianță statistică "corectată". Această evaluare este consecventă și imparțială, dar nu este eficientă. Cu toate acestea, în cazul unei distribuții normale, este "asimptotic eficace", atunci, cu creșterea n, raportul varianței sale la cel mai mic posibil se apropie pe termen nelimitat de unitate.
4. Metodă de momente pentru estimarea punctelor parametrilor de distribuție.
Această metodă se bazează pe faptul că momentele statistice inițiale și centrale sunt estimări consecvente ale momentelor teoretice inițiale și centrale ale aceleiași ordini. Metoda a fost propusă de K. Pearson și constă în echivalarea momentelor teoretice ale distribuției luate în considerație cu momentele statice corespunzătoare aceleiași ordini.
Fie forma densității de distribuție f (x, # 952;) dată de un parametru necunoscut # 952; Este necesar să se găsească o estimare punct a parametrului # 952;
Urmând metoda momentelor, echivalăm momentul inițial teoretic al primei ordini cu momentul statistic inițial al primei ordini:
Asteptarile matematice, asa cum se poate vedea din relatie
există o funcție de # 952; prin urmare expresie
poate fi privită ca o ecuație cu una necunoscută # 952; Rezolvarea acestei ecuații în raport cu parametrul # 952; astfel, găsim estimarea punctului.
Se dă densitatea de distribuție f (x; # 952; 1, # 952; 2) determinată prin parametri necunoscuți # 952; 1 și # 952; 2. Pentru a găsi doi parametri, sunt necesare două ecuații în raport cu acești parametri. În urma metodei momentelor, echivalăm momentul inițial teoretic al primei ordini cu momentul statistic inițial al primei ordini și momentul teoretic central al celei de-a doua ordine cu momentul statistic central al ordinului doi:
putem forma un sistem de două ecuații cu două necunoscute
Rezolvarea acestui sistem cu privire la parametrii necunoscuți # 952; 1 și # 952; 2, obținându-și astfel estimările punctuale.
5. Metoda de probabilitate maximă.
Propusă de R. Fisher.
Variabile aleatoare discrete. Fie X o variabilă aleatoare discretă, care, ca urmare a încercărilor n, presupune valorile x1. x2. xn. Să presupunem că este dată forma legii distribuției lui X, ci parametrul # 952; care definește această lege. Este necesar să se găsească estimarea punctului.
Indicăm probabilitatea ca, ca rezultat al testului, valoarea lui X să fie xi (i = 1, 2. n) și p (xi; # 952;).
Funcția de probabilitate a unei variabile aleatoare discrete X este funcția argument # 952;:
Ca valoare estimativă a parametrului # 952; ia valoarea # 952; *, la care funcția de probabilitate atinge valoarea maximă. Evaluarea # 952; * se numește estimarea probabilității maxime.
Funcțiile L și ln L ajung la maximum la aceeași valoare, deci, în loc să găsească maximul funcției L, se caută maximul funcției lnL (care este mai convenabil). Funcția Ln se numește funcția log-probabilitate.
Variabile aleatorii continue. Fie X o variabilă aleatorie continuă care, ca urmare a testelor n, ia valorile x1. x2. xn. Presupunem că forma densității de distribuție f (x; # 952;) este dat, dar parametrul # 952; care definește această funcție.
Funcția de probabilitate a unei variabile aleatorii continue X este denumită funcția argument # 952;
Se caută cea mai mare estimare a probabilității pentru parametrul de distribuție necunoscut al unei variabile aleatorii continue în același mod ca și în cazul unei cantități discrete.
6. Intervalul de încredere. Probabilitatea de încredere.
Pentru a da o idee despre acuratețea și fiabilitatea estimării ã, în statisticile matematice se folosesc așa-numitele intervale de încredere și probabilități de încredere. Aceste concepte sunt relevante în special pentru un număr mic de observații, atunci când se estimează un punct ã Într-o măsură semnificativă, înlocuirea aproximativă a lui o ã poate duce la erori grave.
Fie ca parametrul să fie o estimare imparțială ã. Vrem să evaluăm posibila eroare. Atribuiți o probabilitate suficient de mare (de exemplu, # 946; = 0.9, 0.95 sau 0.99) astfel încât evenimentul cu probabilitate # 946; pot fi considerate practic fiabile și găsim o astfel de valoare # 949; pentru care
Apoi, intervalul de valori practic posibile ale erorii care apar atunci când a este înlocuit cu ã, va; Erori mari cu magnitudine absolută vor apărea doar cu probabilitate mică.
Respingem egalitatea de mai sus în forma:
Înseamnă. cu probabilitate # 946; Valoarea necunoscută a parametrului a intră în interval
Se numește un interval de încredere care acoperă un parametru necunoscut cu o anumită probabilitate (fiabilitate).
Probabilitatea (fiabilitatea) de încredere este probabilitatea cu care se realizează inegalitatea.
Valoarea lui a nu este aleator, dar intervalul este aleator. În mod aleator, poziția sa pe axa abscisa, determinată de centrul său ã; și lungimea intervalului 2 # 949; deoarece cantitatea # 949; Calculat, de regulă, din datele experimentale. Prin urmare, este mai bine să interpretăm valoarea # 946; nu ca probabilitatea de "lovire" a punctului a în intervalul I # 946; dar ca probabilitatea ca intervalul aleatoriu I # 946; va acoperi punctul a.
Am considerat intervalul de încredere simetric relativ la ã, în general nu este necesar.
Pentru a evalua acuratețea și fiabilitatea estimării, trebuie să cunoașteți legea distribuției. Dacă știm legea distribuției unei cantități ã, problema găsirii unui interval de încredere ar fi foarte simplă: ar fi suficient să găsim o astfel de valoare # 949; pentru care
Dificultatea este că legea distribuției estimării ã depinde de legea distribuției cantității X și, în consecință, de parametrii ei necunoscuți (în special de parametrul a).
7. Interval de încredere pentru așteptarea unei variabile aleatoare distribuite în mod normal, cu varianță cunoscută.
Să presupunem fără dovezi că dacă variabila aleatoare X este în mod normal distribuită, atunci media statistică luată ca o estimare a așteptărilor matematice
există o cantitate aleatorie distribuită în mod normal, iar parametrii acestei legi sunt după cum urmează:
unde m, D și # 963; parametrii corespunzători ai legii distribuției variabilei aleatoare X.
Luați în considerare o variabilă aleatorie. Legea distribuției # 916; va fi, de asemenea, normal, și parametrii săi:
Să determinăm probabilitatea unei variabile aleatorii # 916; pe segmentul [- # 945 ;, # 945;]
Stabilirea probabilității de încredere În conformitate cu tabelul de valori al funcției integrale Laplace, este ușor de determinat valoarea u, ținând seama de aceasta. Atunci determina # 945;
Acum putem scrie
Astfel, acesta este intervalul de încredere pentru așteptarea matematică a unei variabile aleatoare X, cu o lege de distribuție normală, pentru o anumită probabilitate de încredere # 946;