Dispersia este ponderată de frecvența opțiunilor. este
Deviația medie pătrată este:
coeficientul de variație este
Sarcina 2. La întreprindere, 64% dintre lucrători au studii superioare și superioare. Determinați varianța proporției lucrătorilor cu studii medii și superioare.
Soluția. Dispersia este definit ca atribut alternativ = pq, unde p - proporția unităților de populație având trăsătura și q = 1-p - proporția unităților de populație care nu au trăsătura astfel: = 0,64 · 0,36 = 0,2304.
Sarcina 3. Următoarele date sunt disponibile (Tabelul 5.6):
Grupuri de muncitori prin profesie
Salariul mediu pentru fiecare grup și pentru toți lucrătorii este determinat de formula simplei aritmetice medii:
Variațiile intragrup sunt calculate prin formula:
Media variațiilor intragrup este:
Intermedierea dispersiei este definită ca:
Conform regulii de adăugare a varianțelor, varianța totală este egală cu suma varianței medii intragrup și inter-grup: s 2 = 2 + d 2 = 1140 + 496 = 1636.
Problema 4. Performanța medie a studenților la Facultatea de Științe Economice = 4 puncte, Mo = 4,8 puncte, Me = 4,2 puncte. Pentru a specifica, simetric sau asimetric este distribuția elevilor pe progrese. Dacă este asimetrică, atunci cu ce asimetrie (pe partea stângă sau pe partea dreaptă).
Soluția. În distribuția simetrică = Mo = Me. În problema noastră, nu există o asemenea egalitate. În consecință, distribuția este asimetrică și din moment ce <Ме<Мо, то разности между –Ме и –Мо отрицательные и асимметрия левосторонняя.
Problema 5. Randamentul de sfeclă de zahăr în domeniul agricol este următoarea: = 300 kg / ha, = 120 kg / ha, Mo = 240 kg / ha, iar producția de boabe - = 30ts / ha; = 10 q / ha, Mo = 27 q / ha. Calculați indicatorii de asimetrie și indicați unde este mai mare. Care este direcția asimetriei?
Asimetria este dreaptă, deoarece> 0 și mai mult în primul caz.
Problema 6. Momentul central al ordinii a treia este de 34.56 la = 12. Calculați coeficientul de asimetrie și trageți concluziile; momentul central al ordinului patru este 64,32 pentru = 2. Calculați coeficientul kurtosis și trageți concluziile.
Asimetria este dreaptă, deoarece A> 0, și nesemnificativă
Excesul este mai mare decât în mod normal, deoarece E> 3.
SECȚIUNEA 6. OBSERVAREA PROBELOR
6.1. Informații generale privind observarea selectivă
Datorită faptului că statisticile se referă la agregatele de masă, cercetarea statistică este foarte laborioasă. Prin urmare, ideea de a înlocui o observație continuă cu una selectivă pentru o lungă perioadă de timp a apărut.
Exemplu de sondaj - este modul cel mai perfect de observare discontinuă, la care a examinat nu totalitatea, ci doar o parte din ea, selectate în conformitate cu anumite reguli și furnizează exemple de date ce caracterizează totalitatea întregului.
Atunci când se efectuează o anchetă prin sondaj, este imposibil să se obțină date exacte. Ca și în cazul unui proces continuu, ca și în cazul observării selective, greșelile sunt inevitabile, care sunt împărțite în erori de înregistrare și erori de reprezentativitate. La rândul său, erorile de reprezentativitate sunt aleatorii și sistematice.
Cea mai importantă condiție pentru aplicarea metodei de eșantionare este selectarea corectă a unităților agregate, și anume:
a) selectarea strict obiectivă a unităților agregate, în cadrul cărora fiecare dintre aceștia ar primi o șansă absolut identică de a intra în eșantion;
b) un număr suficient de unități selectate ale populației. Dacă aceste condiții sunt îndeplinite, eșantionul va fi reprezentativ sau reprezentativ.
Întregul ansamblu de unități din care se face selecția se numește populația generală și este notat cu litera N. Partea populației generale care se află în eșantion este numită setul de eșantionare și este notată cu n.
Generalizarea indicatorilor populației generale - media, dispersia și proporția - se numesc generici și, în consecință, sunt denotați # 963; p. unde p este proporția sau raportul dintre numărul de unități din agregatul lui M. care posedă acest atribut pentru întreaga populație a populației generale, adică . Sunt desemnate aceleași caracteristici de generalizare într-o probă. 2. # 969;
Baza teoretică a teoremei de eșantionare este o metodă Cebîșev, care se precizează următoarele: probabilitatea arbitrar aproape de unitate (fiabilitate), se poate argumenta că, atunci când o dimensiune suficient de mare eșantion și diferența populație între mediul de dispersie limitată și selectiv mediu general vor fi arbitrar mici:
În utilizarea practică a teoremei lui Chebyshev, varianța generală. care este necunoscut, este înlocuit de o variație a eșantionului.
6.2. Tipuri și scheme de selecție
Formarea unei populații selective de la general poate fi realizată în moduri diferite. Există următoarele tipuri de selecție: strict aleatoare; mecanice; un tipic; serial; combinate.
5. Selecție, de fapt, aleatorie. Se adresează unităților de eșantionare din populația generală fără a fi dezmembrate în anumite părți sau grupuri. Se utilizează fie o aruncare, fie se utilizează tabele cu numere aleatorii.
6. Selectarea mecanică. Acesta constă în faptul că selecția unităților din eșantion se face din populația generală, repartizate la intervale regulate (de grup), precum și toate unitățile din totalul populației trebuie să fie plasate într-o anumită ordine. Mărimea intervalului sau a grupului este egală cu reciprocitatea fracției de eșantion (sau a numărului de unități selectate). Din fiecare grup (interval) se ia o singură unitate. Astfel, atunci când un eșantion de 2%, se ia fiecare element 50 (1: 0,02 sau 50, formate prin fante sau grupuri), la proba de 20% - fiecare element a 5 (1: 0,2) și t . d.
7. Selecție tipică. Atunci când este pusă în aplicare, întreaga populație este împărțită în grupuri în funcție de o trăsătură tipică și apoi una sau alta este efectuată în fiecare grup. Cel mai adesea din fiecare grup este ales numărul de unități, proporțional cu gravitatea specifică a grupului în totalul populației și, de regulă, prin selecție mecanică. O astfel de selecție este adesea denumită eșantionare tipică proporțională cu o probă mecanică.
8. Selecția seriei cu serii egale constă în prelevarea de probe nu a unităților individuale ale populației generale, ci a întregii serii (cuiburi). Seria eșantionată este supusă monitorizării continue. Seria însăși poate fi formată prin diverse metode și metode.
9. Selecție combinată. Toate tipurile de selecție de mai sus sunt combinate între ele.
Folosind diferite tipuri de selecție, pot fi aplicate diferite scheme de selecție: recrutarea (schema mingii nerecuperate) - după alegerea oricărei unități, nu se încadrează în populația generală și nu poate fi selectată din nou; repetarea selecției (schema mingii returnate) - după selectarea oricărei unități, ea revine din nou la populația generală și poate fi selectată din nou.
6.3. Determinarea erorilor medii și limită la
diferite tipuri de selecție
Eroarea de eșantionare este diferența dintre caracteristicile eșantionului și populația generală.
Dacă este o limită care nu depășește valoarea absolută, atunci
Eroarea de eșantionare depinde de mulți factori și dacă din aceeași populație poate forma un set infinit de colecții de mostre, fiecare dintre ele va da și propria eroare. Prin urmare, în cazul observării selective, media erorilor posibile (eroarea de eșantionare medie sau standard) este notată ca.
Cantitatea este direct proporțională cu rădăcina pătrată a varianței și este invers proporțională cu rădăcina pătrată a volumului setului de mostre;
Aceste formule sunt valabile pentru o schemă de re-selecție. În cazul neselecției, se introduce un factor de corecție egal cu
În cazurile în care eșantionul este mic, acest factor poate fi neglijat, deoarece valoarea sa este aproape de unitate (de obicei când).
Pentru a rezolva problemele practice, nu este o eroare medie de eșantionare importantă, ci limitele dincolo de care nu va funcționa; vorbiți despre eroarea de eșantionare maximă.
Eroarea maximă de eșantionare se referă la eroarea medie de raport. unde coeficientul de încredere, ort - statisticile; t preia valorile 1, 2 sau 3 și este legată de probabilitatea de a atinge limita specificată. Dacă t = 1 aceasta înseamnă că probabilitatea ca eroarea de eșantionare să nu depășească o valoare dată este de 0,683 sau de 68,3%. Pentru t = 2 - P = 0,954 sau 95,4%, t = 3 - P = 0,997 sau 99,7%.
Astfel, eroarea maximă de eșantionare depinde de trei factori: varianța. din mărimea eșantionului n. și coeficientul de încredere. Formulele pentru determinarea erorilor de limitare pentru diferite tipuri și scheme de selecție sunt prezentate în Tabelul. 6.1.
Determinarea erorii maxime de eșantionare pentru diferite tipuri de eșantionare
6.4. Determinarea dimensiunii probelor necesare
La elaborarea unei anchete prin sondaj, dimensiunea erorii de eșantionare admisibilă și probabilitatea unui răspuns (și t) sunt presetate. Prin urmare, necunoscutul rămâne dimensiunea minimă a eșantionului care trebuie să furnizeze precizia necesară. Din formula și din formulele pentru eroarea maximă de eșantionare, am setat dimensiunea eșantionului necesar. Formulele pentru determinarea mărimii eșantionului n depind de metoda de selecție (Tabelul 6.2).
Formule pentru calcularea mărimii eșantionului pentru o selecție aleatorie corespunzătoare
Pentru o cotă, chiar dacă este aproximativ necunoscută
Dimensiunea eșantionului poate fi exprimată în raport cu raportul. și anume Eroarea maximă de eșantionare este exprimată în unități ale deviației standard. Astfel, de exemplu, formula pentru numărul unei eșantioane auto-aleatoare fără repetiție pentru media la t = 3 ia forma.
Pentru selectarea tipică și serioasă, mărimea eșantionului este determinată de formule speciale.