Selecția observată se referă la un fel de observație discontinuă. Acesta acoperă partea selectată a unităților populației generale. Scopul observării selective este de a oferi o caracteristică a întregului agregat de unități pentru partea selectată de unități. Pentru ca partea selectată să fie reprezentativă (reprezentând întregul set de unități), observarea selectivă ar trebui organizată special. În consecință, spre deosebire de populația generală reprezentând întregul set de unități studiate, eșantionul reprezintă o parte din unitățile populației generale care fac obiectul observării directe.
Din motive evidente, metoda de eșantionare poate fi utilizată pe scară largă de către organismele de statistică de stat. Vă permite să obțineți informațiile fiabile necesare, cu economii considerabile de costuri și cheltuieli. Garantarea reprezentativității este asigurată prin aplicarea unor metode științifice de selecție a unităților care fac obiectul inspecției.
Ar trebui să se țină cont imediat de faptul că, atunci când se compară indicatorii bazați pe rezultatele unui sondaj de sondaj cu caracteristici pentru întreaga populație, pot să apară abateri. Mărimea acestor abateri se numește o eroare de observare, care poate fi fie o eroare de înregistrare (imperfecțiunea condițiilor tehnice), fie o eroare de reprezentare (încălcarea accidentală sau sistematică a regulilor atunci când se selectează unități).
Următoarele simboluri sunt utilizate în statistici:
N - volumul populației generale;
n - volumul probei;
- medie în populația generală;
- media în eșantion;
p este fracțiunea de unități din populația generală;
w este fracțiunea de unități din eșantion;
S2 este variația eșantionului;
- deviația medie pătrată a trăsăturii în populația generală;
S este abaterea standard a caracteristicii din setul de eșantioane.
Următoarele tipuri de observare a eșantioanelor sunt comune pentru metoda de selecție (metoda de formare) a unui eșantion de unități din populația generală:
eșantionare aleatorie simplă (strict aleatorie);
Un simplu eșantion aleatoriu (de fapt, aleatoriu) este selecția unităților populației generale prin selecție aleatorie, dar sub rezerva probabilității de a selecta orice unitate din populația generală. Selecția este efectuată prin tragere la sorți sau printr-un tabel cu numere aleatorii.
Tipic de eșantionare (stratificat) implică divizarea populației generale neomogene de grupe tipologice sau regionalizati pe orice caracteristică esențială, după care din fiecare grupă sunt unități selectate aleatoriu.
Pentru proba de serie (feminin), caracterizată prin faptul că populația generală împărțit inițial în unele dintre serii egale sau neravnovelikie (unități conectate în serie cu un anumit semn), din care sunt selectate prin seria de eșantionare aleatorie, și apoi a avut loc în interiorul seriei selectate de observare continuă.
Eșantionarea mecanică este selecția unităților la intervale regulate (în ordine alfabetică, prin intervale de timp, metoda spațială etc.). Atunci când se efectuează selecția mecanică, populația generală este împărțită în grupuri egale, dintre care una este apoi selectată.
Proba combinată se bazează pe o combinație a mai multor metode de eșantionare.
O probă în mai multe etape este formarea unor grupuri mari de unități la începutul populației generale, din care se formează grupe de volume mai mici și așa mai departe, până când se selectează acele grupuri sau unități individuale care trebuie examinate.
Selecția selectivă poate fi repetată și repetată. La alegerea repetată, probabilitatea de alegere a oricărei unități nu este limitată. În cazul neeșantionării, unitatea selectată nu este returnată populației inițiale.
Pentru unitățile selectate, se calculează indicatori generalizați (media sau relativi) și în viitor rezultatele sondajului se vor extinde la întreaga populație.
Principala sarcină într-un studiu selectiv este de a determina erorile de eșantionare. Este obișnuit să se facă distincția între erorile de eșantionare medii și marginale. De exemplu, este posibil să se propună un calcul al erorii de eșantionare prin exemplul unei selecții simple aleatorii.
Calculul erorii medii a unei eșantioane simple aleatorii repetate se face după cum urmează:
eroare medie pentru medie
eroare medie pentru acțiune
Calculul erorii medii a unei eșantioane aleatorii non-aleatoare:
eroare medie pentru medie
eroare medie pentru acțiune
Calcularea erorii limita de eșantionare repetată aleatorie:
marginal eroare pentru medie
eroare marginală pentru acțiune
unde t este factorul de multiplicitate;
Calculul erorii maxime a unui eșantion aleatoriu ne-aleator:
marginal eroare pentru medie
eroare marginală pentru acțiune
Ar trebui să fim atenți la faptul că sub semnul radicalului în formulele de selecție fără repetiție apare un factor în care N este numărul populației populației generale.
În ceea ce privește calculul erorilor de eșantionare în alte tipuri de eșantionare (de exemplu, tipic și serios), trebuie menționate următoarele.
Pentru un eșantion tipic, valoarea erorii standard depinde de precizia definiției mediei de grup. Astfel, în formula erorii marginale a unui eșantion tipic, se ia în considerare media variațiilor de grup, adică
Pentru un eșantion serios, eroarea de eșantionare a eșantionului depinde nu de numărul de unități studiate, ci de numărul seriei (elor) analizate și de valoarea dispersiei intergrupurilor:
Eșantionul serial este de obicei efectuat ca repetiție, iar formula de eroare de eșantionare în acest caz are forma unde este varianta inter-serie; s este numărul de serii selectate; S este numărul de serii din populația generală.
Toate formulele de mai sus sunt aplicabile unui eșantion mare. Pe lângă proba mare, așa-numitele eșantioane mici (n <30), которые могут иметь место в случаях нецелесообразности использования больших выборок.
La calcularea erorilor unui eșantion mic, trebuie luate în considerare două puncte:
1) formula de eroare medie are forma
2) determinarea intervalelor de încredere ale indicatorului de testare în populația generală, sau când probabilitatea unei anumite erori de toleranță trebuie să utilizeze probabilitatea tabel Student, unde P = S (t, n), în care P este determinată în funcție de mărimea eșantionului și t.
În studiile statistice, utilizând formula de eroare limită, pot fi rezolvate o serie de probleme.
1. Determinarea limitelor posibile de identificare a caracteristicilor populației generale pe baza datelor eșantionului.
Intervalele de încredere pentru media generală pot fi stabilite pe baza relațiilor
unde - mijloacele generale și eșantioanele, respectiv; - limitarea erorii mediei eșantionului.
Intervalele de încredere pentru cota generală se stabilesc pe baza rapoartelor
2. Determinați probabilitatea de încredere, ceea ce înseamnă că caracteristica populației generale este diferită de eșantionarea cu o anumită sumă.
Probabilitatea de încredere este o funcție a lui t, unde
Probabilitatea de încredere pentru valoarea lui t este determinată de un tabel special.
3. Determinați dimensiunea eșantionului necesar utilizând valoarea erorii admise:
Pentru a calcula numărul n de eșantionare aleatorie simplă repetată și repetitivă, se pot utiliza următoarele formule:
(pentru media cu metoda repetată);
(pentru metoda medie cu metoda de repetare);
(pentru o fracțiune cu o metodă repetată);
(pentru o acțiune cu o metodă care nu poate fi repetată).
Principalele metode de distribuire a observației selective la populația generală sunt recalcularea directă și metoda coeficienților.
Convertirea directă este rezultatul valorii medii a caracteristicii în funcție de volumul populației generale. Cu toate acestea, un număr mare de factori nu permit utilizarea deplină a estimării punctuale a conversiei directe la distribuirea rezultatelor eșantionului la populația generală. În practică, estimarea intervalului este mai frecvent utilizată, ceea ce face posibilă luarea în considerare a mărimii erorii de eșantionare a eșantionului, care este calculată pentru media sau pentru fracțiunea trăsăturii.
Metoda de utilizare a coeficienților este utilizată în acele cazuri în care se efectuează observații selective pentru a verifica și rafina datele de observare continuă.
Se recomandă utilizarea formulei
unde Y1 - numărul populației cu corecția pentru sub-contabilitate; Y0 este numărul populației fără această corecție; y0 - numărul populației în punctele de control conform datelor inițiale; y1 - numărul populației din aceleași puncte conform măsurilor de control.
Un exemplu. în contabilitatea continuă a garajelor în oraș, au fost înregistrate în zona sudică (U) 1000 de garaje; pe malul nordic (C) - 750; est (B) - 400. Pe baza măsurilor de eșantionare de control, a fost stabilit următorul număr de garaje:
Folosind metoda formula a coeficienților (sau folosind coeficientul calculat pentru contabilitate selectivă), obținem numărul de garaje după control (Y), ajustat pentru subcounting:
Y (10) = 1000 210. 200 = 1050; Y (C) = 750 160. 150 = 800; Y (B) = 400 110. 100 = 440.
[1] Cel mai frecvent utilizat, adică eroarea medie va fi dublă