Cifrele estimative ale parametrilor de distribuție
Orice funcție a rezultatelor observațiilor x 1. x 2. x n investigate aleatoare X variabilă se numește statistică (evaluare statistică).
De exemplu, notate cu Q necunoscut parametru de distribuție variabilă aleatoare. Apoi, statisticile Q n. utilizată ca valoare aproximativă a parametrului necunoscut numit evaluare statistică punctul Q. a acestui parametru. De exemplu, în funcție de valorile x 1. x 2. x n poate calcula media lor, varianța, etc. - toate aceste numere pot fi considerate ca estimările punctuale ale parametrilor corespunzători variabile aleatoare necunoscute.
Pentru estimări statistice au fost date „bună“ aproximare a parametrilor estimați, acestea trebuie să îndeplinească anumite cerințe: evaluarea trebuie să fie imparțială, eficientă și consecventă.
35. Determinarea evaluării statistice imparțiale numită Q *. speranța matematică este egal cu parametrul Q evaluat pentru fiecare mărime a eșantionului, t. e. M (Q *) = Q. numit compensate estima speranța, care nu este egal cu parametrul estimat.
36. Determinarea efectivă numită evaluarea statistică, care (pentru o mărime a eșantionului dată) are varianța cât mai puțin posibil.
Atunci când se analizează volumul mare de probe (n mare!) Estimărilor statistice sunt necesare de solvabilitate.
37. Determinarea de solvabilitate numita evaluare statistică, care, când n → ∞ tinde la parametrul de probabilitate estimată.
De exemplu, în cazul în care variația de estimare imparțială tinde la zero, iar această estimare este consecventă.
Luați în considerare estimările punctuale ale parametrilor de distribuție, adică estimări care sunt determinate de numărul de Q * = f (x 1 x n). în care - (x 1. x n) eșantion din populația generală caracteristicile de distribuție X K descriu structura și cantitativ structura includ:
- caracteristici ale situației;
- dispersie;
- skewness și kurtosis.
dispoziții Caracteristici
Caracteristicile poziției includ următoarele estimări, numite estimări ale tendinței centrale: moda Mo. Median Me. media aritmetică sau media eșantionului și cuantile.
modă
De mare importanță este o astfel de valoare caracteristică care apare cel mai des în seria de studiu, în total. Această cantitate se numește modul (Mo). Într-un număr discret de Mo este determinată fără a calcula ca valoare caracteristică cu cea mai mare frecvență.
De exemplu, să presupunem că se dă un număr de variație: 9, 10, 13, 13, 13, 13, 15, 18, 20, 25. Apoi, moda lui Mo = 13.
Când modul de calcul poate fi de mai multe situații:
1. Două valori caracteristice, partea în picioare lângă alta, sunt la fel de des. În acest caz, moda este egal cu media aritmetică a acestor două valori. De exemplu, în rândul următor de date:
12, 13, 14, 14, 14, 16, 16, 16, 18, 19
Mo = (14 + 16) / 2 = 15.
2. Două valori sunt, de asemenea, găsite la fel de multe ori, dar nu sta în apropiere. În acest caz, se spune că seria de date are două moduri, și anume, el bimodală.
3. În cazul în care toate valorile de date apar cu o frecvență egală, atunci spunem că seria nu este de moda.
Cele mai frecvente date care o valoare de atribut modal. În cazul în care numărul de date are loc două sau mai multe valori egale caracteristice, vorbim de eterogenitate a populației.
Median.
A doua caracteristică numerică a unui număr de date numit mediana (Me) - este
Valoarea caracteristică, care împarte numărul doi. În caz contrar, mediana are proprietatea că jumătate din valorile caracteristice de probă coborâți, jumătate mai mult. Atunci când un număr impar de elemente din seria de date, mediana este un membru central al seriei, și chiar și pentru media aritmetică a două valori centrale ale seriei.
În acest exemplu, 9, 10, 13, 13, 13, 13, 15, 18, 20, 25 obține Me = (13 + 13) / 2 = 13. Calculul mediana este semnificativ numai pentru o caracteristică de secvență.
Valoarea mediei aritmetice a drapelul.
Să presupunem că avem o variabilă aleatoare X, valorile (vânzări) unde x 1. x 2. x n orice mod am învățat. Cu alte cuvinte, pentru studiul populației în ceea ce privește X trăsătură cantitativă extrasă proba x 1. x 2. x n volum n. media eșantionului este valoarea medie a probei caracteristică.
Dacă toate eșantionul diferit de funcții, proba medie
x n # 175; = X + 1. + X n n.
Pentru probe cu valori duplicate x n # 175; = 1 n Σ i x i n i se numește medie aritmetică ponderată. Media eșantionului poate fi scrisă ca:
x n # 175; = Σ i x i k i.
unde k i = n i n frecvența relativă corespunzătoare. Pentru a desemna proba medie utiliza, de asemenea simboluri: x # 175;. M * (X). m x *.
Dacă proba prezintă seria interval de variație, apoi ia mijlocul intervalelor parțiale și - frecvențele corespunzătoare.
operațiunile au fost identificate pe variabile aleatoare, și anume, suma variabilelor aleatoare și multiplicarea variabilei aleatoare cu o constantă. Fiecare dintre valorile x i este o variabilă aleatoare care are aceeași distribuție cu X. necunoscută Să considerăm media eșantionului x # 175; n ca o funcție compusă din variabile aleatoare identice, adică având aceeași distribuție cu X:
x # 175; n = x 1 + x 2 +. + X n n.
Este o nouă valoare aleatorie. Calculăm așteptările sale
M (x # 175; n) = M (1 n (x 1 + x 2 +. + x n)) = 1 n (M x 1 + M x 2 +. + M x n) = M X.
Astfel, am arătat că proba medie x n # 175; Este o estimare imparțială a speranța matematică M X.
Luați în considerare o variație a variabilei aleatoare x # 175; n. reprezintă o probă medie ca funcție compusă din variabile aleatoare identice, adică având aceeași distribuție cu X:
D (x # 175; n) = D (1 n (x + 1. + x n)) = 1 2 n (D x 1 + D x 2 +. + D x n) = D X n.
Este evident că odată cu creșterea n obținem D x # 175; n → 0.
Prin urmare, o medie a eșantionului este estimarea consecventă a M X.
Cuantila - este o valoare caracteristică care împarte un raport de distribuție predeterminat: 0,5% din stânga, la dreapta de 99,5%; Stânga 2,5%, 97,5% din dreapta, etc. De obicei, există următoarele varietăți ale quantile:
1) Q 1. segmențială Q 2. Q 3 - ei împart distribuția în patru părți de câte 25%;
2) Quintile K 1. K 2. K 4 K 3. - ei împart distribuția în cinci părți de câte 20%;
3) decili D D 1. 9. lor nouă, și ei împart distribuția în zece părți de câte 10%;
4) Percentile 1. P P P 2. 99. le nouăzeci și nouă, și ei împart repartizarea pe o sută de părți de 1% în fiecare parte.
Deoarece percentila - divizia cea mai fină, toate celelalte cuantile pot fi prezentate prin percentila. Deci, prima cuartilă - aceasta este a douăzeci și cincea percentila a primei chintile - a doua decile, sau percentila XX, etc.
caracteristici de dispersie
Utilizarea pentru a descrie un număr de valori caracteristice, doar măsura tendinței centrale poate fi în mare măsură greșită în evaluarea naturii populației studiate.
Exemplul 39. De exemplu, studiem vârsta medie în cele două grupuri, fiecare constând din 6 persoane. Valorile caracteristice au fost următoarele:
Grupul 1 - 10, 10, 10, 50, 50, 50
Grupul 2-30, 30, 30, 30, 30, 30
Prin calcularea valorii medii din fiecare grup, constatăm că acestea sunt egale, în timp ce este clar că probele prelevate din diferite seturi. Eroarea a apărut din cauza răspândirii valorilor în aceste grupe de vârstă.
Există mai multe modalități de măsurare a gradului de dispersie a datelor sau de dispersie. Principalele caracteristici ale dispersiei sunt: domeniul de aplicare R. proba varianță s 2 (n). rms (standard) Abaterea s (n). coeficientul de variație V.
mătura
Cea mai simpla a parametrilor de distribuție, mărimea - diferența dintre valorile minime și maxime caracteristice: R = x max # 8289; - x min # 8289;.
varianța eșantionului
varianța eșantionului este numită media aritmetică a abaterilor pătratele valorilor observate ale trăsăturii de la valoarea medie. Dacă toate proba trăsătură distinctă,
s 2 (n) = 1 n Σ i = 1 n (x i - x # 175; n) 2.
Pentru probe cu variație valori multiple ponderate determinate
s 2 (n) = 1 n Σ i = 1 n (x i - x # 175; n) 2 n i.
Se poate demonstra că varianța poate fi calculată prin formula
s 2 (n) = 1 n Σ i = 1 n x i 2 n i - (x # 175; n) 2.
Pentru caracterizarea eșantionului de dispersie a valorilor caracteristicilor în jurul valorii medii sunt caracteristice consolidate - deviația standard. Deviația standard a eșantionului este numită rădăcina pătrată a eșantionului varianței s (n).
Dacă vom calcula așteptarea s 2 (n). este ușor pentru a obține raportul dintre M (s 2 (n)) = (1 - 1 n) X. D din care rezultă că estimarea eșantionului variație este deplasată la D X.
Prin urmare, în calculele practice folosesc așa-numitul „corectata“ dispersia probei satisface formula
s 2 (n) = 1 (n - 1) Σ i = 1 n (x i - x # 175; n) 2.
Această estimare a varianței este imparțială și consecventă.
Notă: Formula pentru calculul eșantionului varianța și diferă doar de dispersie corectate numitori. Pentru n suficient de mare, dispersia eșantionului și corectat un pic diferit, astfel încât în practică a varianței corectate sunt, dacă n <30.
Dispersia arată intervalul de valori caracteristice în raport cu media lor aritmetică, adică cât de strâns grupate în jurul valorii caracteristice; cu atât mai mare răspândire, cu atât mai mare gama de subiecți din grup, cu atât mai mare diferența dintre subiecții individuali.
Coeficientul de variație
varianță Sample și deviație standard sunt exprimate în unități de facilitate luate în considerare și nu sunt potrivite pentru compararea gradelor de imprastiere a două probe de natură diferită. Pentru compararea gradelor coeficientului de împrăștiere de variație este utilizat. Coeficientul de variație nu are nici o dimensiune, care ne permite să compare variabilitatea variabilelor aleatoare, având o natură diferită:
V = s (n) x # 175; n # 8901; 100%.
Factorii selectate de skewness și aplatizării
Pentru calculul asimetriei eșantionului există mai multe tipuri de coeficienți. Cea mai exactă a ceea ce este coeficientul de asimetrie selectivă A (n). numărate de formula
A (n) = 1 n # 8901; s 3 (n) Σ i = 1 n (x i - x # 175; n) 3.
Asimetria caracterizează gradul de asimetrie a distribuției. factor
asimetrie se schimbă de la minus la plus infinit - ∞ asimetrie metrice pot fi folosite pentru a interpreta conținutul datelor primite. În cazul în care atributul observat este influențată de mai mulți factori, dintre care fiecare face o mică contribuție la valoarea acestui atribut, atunci ne putem aștepta la o distribuție simetrică. Cu toate acestea, în cazul în care valoarea obținută asimetrie semnificativă (mai mare în valoare absolută decât 0,4 - 0,5), putem presupune că există o influență semnificativă a unuia sau a unui grup de factori.
Pentru distribuția unică utilizare o altă caracteristică a acestui eșantion raportul aplatizării E (n). Kurtotica caracterizează distribuția peakedness. măsură kurtosis indică gradul de concentrare a observațiilor cu privire la valorile medii ale lui x eșantion # 175; n. Astfel, cantitatea în exces pentru curba de distribuție normală (Gauss) este egal cu 3. Pe baza unui număr de motive, claritate a acestei curbe este luată drept standard, astfel încât indicele de valoare aplatizării folosind E x - 3. De fapt, coeficientul de boltire poate fi calculat prin formula:
E (n) = E x - 1, n = 3 # 8901; s 4 (n) Σ i = 1 n (x i - x # 175; n) 4 - 3.
Coeficientul de kurtotica se schimbă, de asemenea, de la minus la plus infinit - ∞ Exemplul 40. Procedura de calculare a caracteristicilor eșantionului. Numărul de grade de libertate este numărul de unități în mod liber schimbătoare din eșantion. Astfel, în cazul în care eșantionul este compus din n elemente și x are o medie # 175; n. atunci orice membru al acestui set poate fi obținut ca diferența dintre valoarea lui n # 8901; x # 175; n și suma tuturor celorlalte elemente, cu excepția acest articol. De exemplu, ia în considerare o reducere din carton triunghi. Poziția sa în spațiul definit în întregime prin specificarea coordonatelor trei noduri sale (x 1 y 1. z 1). (X 2. y 2. z 2). (X 3. y 3. z 3). Dar, în cazul în care este specificat un nod, apoi a doua nu poate fi scos din ea cu mai mult decât lungimea de conectare partea lor. Apoi, pentru a seta al doilea suficient de vârf deja două coordonate. Pentru al treilea summit, după primele două, este suficient pentru a stabili un set de coordonate. Exemplu de psihologie NA Bernshtein aparține. Să presupunem că este necesar să se atingă vârful degetului la soneria de la intrare. Apoi, poziția mâinii, oferind actul are cel puțin șapte grade de libertate. Într-adevăr, ia în considerare poziția articulației umărului fix, fiecare dintre celelalte cinci articulații adaugă două grade de libertate minus trei grade, având în vedere relația „vârful degetului arătător este pe apel.“ Să considerăm cazul evaluării dispersiei. Cunoscută proprietate de dispersie: s 2 (x) = 1 n - 1 ((x 1 - x # 175; ) 2+. + (X n - x # 175; ) 2) când n este coordonatele independente n - 1 grade de libertate. va avea n grade de libertate.grade de libertate
Astfel, poziția triunghiului în spațiu poate fi definit prin șase coordonate sau are șase grade de libertate.
Numărul de grade de libertate egal cu numărul de grade de libertate minus numărul elementelor sale conexiuni suprapuse.
s 2 (x + 1 x 2) = s 2 (x + 1 C. x 2 + C).
Datorită acestei proprietăți sume (din cauza)
Dacă formula estimărilor eșantionului variatiei îl cunoaște speranța reală a unei variabile aleatoare X egal o. suma articole similare