În statistici, pot fi folosite diferite metode pentru a forma un set de eșantion, ținând cont de sarcinile de cercetare și de specificul obiectului de studiu.
Condiția principală pentru efectuarea unei anchete prin sondaj este de a preveni apariția unor erori sistematice (părtinitoare). Pentru aceasta, este necesar să se asigure realizarea principiului egalității de șanse pentru eșantionarea fiecărei unități a populației generale.
Practica aplicării metodei de eșantionare în cercetarea economică și statistică distinge următoarele principale căi de selectare a unităților din populația generală:
1. Selecția individuală - în eșantion selectate unități individuale ale populației generale;
2. Selectarea grupului - grupuri omogene calitativ sau o serie de unități studiate intră în eșantion
3. Combinate - ca o combinație de selecție individuală și de grup.
După cum sa arătat mai sus, metodele de selecție sunt determinate de regulile pentru formarea unei populații de eșantion. În acest sens, este necesar să reamintim principalele tipuri de eșantioane:
Eșantionul real aleator se formează ca rezultat al selecției aleatoare (neintenționată) a unităților din populația generală. În acest caz, numărul de unități selectate într-un eșantion este de obicei determinat pe baza procentului acceptat (procentual) al eșantionului.
Proporția eșantionului este raportul dintre numărul de unități din populația eșantionului n și numărul de unități din populația generală N
Un exemplu de utilizare a unei eșantioane auto-aleatoare este deținerea unei loterie cu premiu în numerar, care oferă o șansă egală de a intra în circulație a oricărui număr de bilet de loterie.
Formarea unei eșantionări aleatorii poate fi efectuată utilizând chips-uri speciale (cu numerele unităților populației generale) de aceeași formă sau un tabel cu numere aleatorii.
Selecția aleatorie reală poate fi efectuată în conformitate cu schemele de selecție repetată și nereproductivă.
La selectarea repetată, fiecare unitate care se află în eșantion după fixarea sa (inclusă în eșantion) trebuie să revină la populația generală.
De exemplu, atunci când se studiază cererea consumatorilor de către populație, este posibilă re-înregistrarea cererii aceleiași persoane în mai multe magazine din oraș. Cu toate acestea, atunci când se testează calitatea becului, aceeași lampă nu poate fi supusă încercărilor repetate pe durata arderii. Revenirea la setul general de becuri cu fire arse nu are sens. Prin urmare, în practică, sunt adesea folosite scheme de eșantionare.
În cazul neeșantionării, unitatea care face parte din eșantion este exclusă din populația generală și se efectuează o selecție suplimentară. din unitățile rămase.
Eșantionul mecanic constă în faptul că selectarea unităților din eșantion se face din populația generală, împărțită în grupuri egale (intervale).
Dimensiunea intervalului este egală cu reciprocitatea fracțiunii din eșantion. Deci la o probă de 2%, la fiecare 50 de unități (1: 0,02) este selectată, etc.
Astfel, în conformitate cu fracțiunea acceptată a selecției genei, agregatul este împărțit mecanic în grupuri egale și din fiecare grupă este selectată în eșantion o singură unitate.
Se pune întrebarea: cum să aranjăm unitățile în populația generală? La urma urmei, aceasta va determina reprezentativitatea eșantionului. După cum arată practica, în raport cu indicatorul studiat, unitățile populației generale pot fi ordonate în funcție de un semn esențial, secundar sau neutru.
Atunci când se comandă în funcție de o caracteristică esențială (care determină complet comportamentul indicatorului studiat), unitatea care se află în mijlocul fiecărui grup trebuie selectată în setul de eșantioane.
Atunci când se comandă în funcție de un criteriu neutru (nu afectează comportamentul elementului studiat), orice unitate din fiecare grup poate fi luată în eșantion. Pentru a observa principiul selecției aleatorii în toate grupurile unui eșantion mecanic, luați numărul de unități selectate în primul grup.
Atunci când se comandă unități ale generalului în agregarea caracteristicilor secundare (numai parțial poate afecta caracteristica studiată), este de preferat să selectați unitățile situate în mijlocul grupului pentru a exclude eroarea de eșantionare sistematică.
O caracteristică importantă a unei probe mecanice este aceea că formarea unei probe poate fi făcută fără a se recurge la compilarea listelor. De exemplu, folosim procedura pentru plasarea efectivă a unităților populației generale (secvența de ieșire a produselor finite din convertor, ordinea plasării lotului de mărfuri în timpul depozitării etc.).
Valoarea erorii medii a unui eșantion mecanic ar trebui să fie determinată teoretic luând în considerare indicele variațiilor intragrup. Cu toate acestea, sa demonstrat din practică că o probă mecanică cu privire la precizia rezultatului este foarte apropiată de metoda de selectare aleatorie efectivă. Prin urmare, pentru a determina eroarea medie într-o probă mecanică, se utilizează în mod obișnuit formule cu o eșantionare corectă, fără eșantionare.
Într-un eșantion tipic, populația generală este mai întâi împărțită în grupuri tipice omogene. Apoi, din fiecare grup tipic, într-un mod accidental sau mecanic, se face selecția individuală a unităților într-un set de mostre.
O probă tipică este de obicei folosită pentru studierea agregatelor complexe. De exemplu, atunci când studiați productivitatea muncii unui angajat, ținând cont de nivelul de calificare sau de profesie.
După cum arată practica, un eșantion tipic oferă rezultate mai precise decât alte metode de selecție a unităților.
Gruparea poate fi făcută pe baza rezultatelor cercetării din esența fenomenului studiat sau folosind clasificările și grupările existente. La urma urmei, este clar că cu cât este mai omogenă compoziția grupurilor tipice educate, cu atât mai bine eșantionul tipic va reproduce caracterizarea trăsăturilor studiate în populația generală.
La determinarea erorii unui eșantion tipic, media variațiilor intragrup este utilizată ca indice de variație.
Pentru fracțiunea din caracteristica alternativă, se calculează prin formula
și pentru valoarea medie a caracteristicilor cantitative, formula
În practică, se formează un eșantion tipic proporțional cu numărul de unități care alcătuiesc grupurile tipice. Prin urmare, pentru a determina eroarea medie a unui eșantion tipic, formulele
a) pentru ponderea caracteristicii alternative
b) pentru valoarea medie a caracteristicilor cantitative
(**) Eșantionarea așa-numită serie sau cluster este destul de larg răspândită. Prin această metodă, populația generală este divizată în serii și cuiburi întregi alese în mod aleatoriu, în care se efectuează o anchetă continuă.
De exemplu, atunci când verificăm calitatea mărfurilor, este mai rațional să verificăm mai multe pachete individuale decât să scoatem numărul necesar de unități de mărfuri din toate pachetele.
Selectarea seriilor individuale se efectuează fie prin prelevare aleatorie, fie prin prelevare mecanică. În mod tipic, se efectuează o probă serială în conformitate cu o schemă de eșantionare.
Pentru a determina eroarea medie a eșantionului seriat, se utilizează următoarele formule
a) pentru o indicație cantitativă,
unde variația inter-serie a eșantionului; R și r - numărul de serii din eșantion și din populație;
b) pentru o caracteristică alternativă,
unde este variația inter-serie a cotei eșantionului.
(***) În comparație cu un eșantion tipic, eșantionul seriat generează erori de reprezentare mai mari, deoarece un număr relativ mic de serii este chestionat.
După cum se vede în metodele de prelevare a probelor, se efectuează:
1. Selecția individuală - în eșantion selectate unități individuale ale populației generale (cu cele reale și accidentale și mecanice)
2. Selecția de grup - grupuri omogene calitativ intră în eșantion ca o serie de unități studiate (0 în selecția serială
3. în practică, totuși, aceste metode sunt aplicate în combinație în diferite combinații și cu secvențe diferite. De exemplu, într-un eșantion serios:
· Serii individuale sunt selectate aleator sau mecanic;
· Eșantionul include toate unitățile seriei selectate sau aceleași fracțiuni de unități din fiecare serie.
Eroarea medie a eșantionului combinat constă în erorile medii corespunzătoare ale metodelor utilizate.
De exemplu, distrugem întregul set în grupuri și apoi efectuăm selecția cuiburilor.
Eroarea medie pentru un astfel de eșantion combinat este determinată de formulele:
a) la re-selecție;
b) în cazul selecției non-recurente.
În statistici, se disting, de asemenea, metodele de selectare a unităților în mai multe etape.
Cu o eșantionare într-o singură etapă, fiecare unitate selectată este examinată imediat pentru o anumită caracteristică dată.
Cu un eșantion în mai multe etape, se face o selecție a populației generale a grupurilor individuale, iar unitățile individuale sunt selectate din grupuri. De exemplu, un eșantion tipic cu o metodă mecanică de selectare a unităților dintr-un set de eșantioane.
Eșantionul combinat poate fi o etapă în două etape (gruparea, selecția grupurilor și din ultima selecție a unităților individuale) și mai multe etape (selectarea grupurilor, apoi selectarea celor mijlocii și cele mici și selectarea unităților individuale din acestea). De exemplu, pentru anchetele bugetare ale familiilor, se utilizează o selecție în trei etape (selectarea districtelor, selectarea zonelor populate, selectarea familiilor). În același timp, tipurile de eșantionare se pot schimba în etape separate. Trebuie avut în vedere faptul că, cu o eșantionare în mai multe etape, grupurile însele sunt selectate, deci nu toate sunt incluse în eșantion.
Eroarea medie de eșantionare pentru eșantionarea în mai multe etape este determinată de formula
unde eroarea de eșantionare la offseturi este mărimea eșantionului prin etapa de eșantionare
După cum se vede din paragrafele anterioare, în funcție de sarcinile de cercetare, în eșantioane poate fi inclus un număr diferit de unități ale populației studiate. Dacă n> 100, observarea selectivă este considerată o dimensiune a eșantionului relativ mare. Și dacă n<100. то стат. Обследование принято называть малой выборкой.
O probă mică este înțeleasă ca stat. examinare. în care proba este formată dintr-un număr relativ mic de unități din populația generală.
Volumul unei mostre mici, de obicei, nu depășește 30 de unități și poate ajunge până la 4-5 unități
În practică, recurgerea la un eșantion mic, atunci când fosta selecția nu este adecvată (de exemplu, în cazul în care studiul se datorează distrugerea sau deteriorarea probele examinate) sau imposibil (pentru o examinare rapidă)
Din cauza mărimii mici a eșantionului, valoarea erorii unei probe mici este determinată de spec. formulă
unde variația unei probe mici.
Amintiți-vă de relația dintre variațiile genei. agregat () și colecție de mostre ():
Într-o probă mică este esențială, se calculează varianța unui eșantion mic luându-se în considerare numărul așa numit de grade de libertate. Numărul de grade de libertate este înțeles ca numărul de opțiuni care pot lua valori arbitrare. fără a schimba valoarea mijlocului.
Când se determină variația numărului de grade de libertate este (n-1)
Eroarea marginală a unei probe mici (DCC) este determinată de formula
În același timp, valoarea coeficientului de încredere (t) depinde nu numai de probabilitatea de încredere dată. dar și pe numărul de eșantioane mici (n). În aceste scopuri. O masă specială (tabelele studenților). Aceste tabele oferă distribuțiile abaterilor standardizate
Tabelul studenților este dat în manuale cu privire la statisticile matematice sau colecții de tabele matematice speciale.
Iată un fragment al acestui tabel
0,861 0,898 0,914 0,923 0,936 0,940
0,942 0,970 0,980 0,983 0,991 0,993
După cum se poate observa din aceste tabele, cu o mărire a mărimii eșantionului, distribuția Studentului se apropie de distribuția normală și, chiar la n = 20, diferă puțin de distribuția normală. De aici este vizibil. că cu cât dimensiunea eșantionului este mai mică, cu atât este mai mare această diferență și de exemplu. pentru n = 4 această diferență este foarte semnificativă. În consecință, precizia rezultatelor unui mic eșantion scade.
Un exemplu. Să presupunem că 10 lucrători sunt selectați pentru a determina când efectuează o anumită operațiune. Timpul mediu pentru aceștia sa dovedit a fi egal cu 10,4 minute și dispersia eșantionului 4. Să luăm probabilitatea de încredere p = 0,984.
Din tabelul de distribuție al Studentului t = 3, definim din acest. Intervalul de încredere 6.4 Să verificăm corectitudinea concluziilor prin înlocuire. Controlați întrebările pe tema 12 1. Care sunt avantajele metodei de eșantionare în comparație cu alte tipuri de observații discontinue? 2. Care sunt avantajele și dezavantajele metodei de observare selectivă în comparație cu observarea statistică continuă? 3. Ce metode de formare a eșantionului pe care le cunoașteți Oferiți o scurtă descriere a acestora. 4. Care este eroarea reprezentativității și ce factori determină amploarea acesteia? 5. Ce determină corectitudinea evaluării parametrilor populației generale (media generală și cea generală)? 6. Care este diferența dintre eroarea medie a unei eșantioane simple aleatorii în eșantionarea repetată și non-repetabilă? Care dintre aceste erori este mai mare? 7. Care este diferența dintre o simplă eroare de eșantionare aleatorie pentru eșantioane mari și mici? 8. Cum se determină eroarea maximă la efectuarea unei mostre mari și mici? 9. Care este diferența dintre metoda de selecție mecanică raport cu aleatoare (selecție simplă de fapt,-aleatoare Cum valoare standard, determinată (medie) eroare de eșantionare mecanică? 10. Care este specificitatea organizării selecției mecanice în sistematizarea unităților populației în termeni de caracteristici semnificative, secundare și neutre? 11. Ce tip de eșantionare ar trebui să fie utilizat în cazul în care populația nu este omogenă? 12. Care sunt avantajele unei mostre de serie înainte de o probă aleatoare simplă? 13. Cum ar trebui să se formeze o mostră într-un eșantion tipic? 14. Cum este determinată eroarea medie a eșantioanelor tipice și seriale? 15. Ce metode de distribuire a caracteristicilor eșantionului vă sunt cunoscute? Prezentați o scurtă descriere și denumiți domeniile cele mai potrivite ale aplicației. 16. Înregistrați intervalele de încredere ale mediei generale cu o probabilitate de 0,95 și 0,99. 17. Care este problema determinării dimensiunii optime a eșantionului? 18. Pentru a decide care dintre întrebările privind organizarea supravegherii selective și estimarea rezultatelor sale poate fi utilizată formula de eroare medie a eșantionului? 19. Care este diferența dintre dimensiunea relativă a unui eșantion dintr-o mostră aleatorie simplă într-o selecție repetată și irevocabilă? Care dintre aceste cantități este mai mare? 20. Care sunt domeniile cele mai importante de aplicare a metodei elective în practica statisticilor de stat. TOPICUL 13. RELAȚIA DE CORELAȚIE ȘI 13.1. Cerințe preliminare pentru studierea corelației corelației. 13.2. Metode statistice pentru detectarea relației de corelație. 13.3. Măsurarea statistică a stării relației de corelație. Indicatori de etanșeitate a relației de corelație. 13.4. Corelarea rangurilor. 13.5 Corelație multiplă și parțială. 13.6. Studii statistice privind forma relației de corelație. Linia de regresie și ecuația de regresie. 13.7. Studiul statistic al relației dintre caracteristicile calitative. 13.8. Studiul dependenței de corelație între seria dinamică. Controlați întrebările pe această temă 13.
Studiul său STATISTIC