Cel mai adesea este eroarea de sistem în măsurare, care se numește eroarea de eșantionare. Deci, pentru a determina eroarea de eșantionare, trebuie să determinați eroarea de măsurare a sistemului. În ultimii ani, am aplicat o tehnică destul de simplă pentru a determina eroarea sistematică de măsurare obținută în timpul unui sondaj sociologic.
De fapt, determinarea erorii de eșantionare nu este banală. Pentru a determina eroarea de eșantionare, este necesar să se compare o anumită valoare a populației generale (de exemplu, un rating) cu aceeași valoare în eșantion. Dar facem cercetări selective pentru a judeca datele întregii populații din eșantionul dat și în acest caz eroarea trebuie să precizeze cât de mult poate fi diferită întreaga valoare a populației față de eșantion. Obținem o ecuație cu două necunoscute.
Să facem față situației.
Vorbind despre eroarea de eșantionare pentru întreaga anchetă nu este complet corectă. Eroare este înțeleasă ca diferența dintre indicatorul unei caracteristici în populația generală și în eșantion. Astfel, pentru fiecare caracteristică este necesar să vorbim despre eroarea ei. Declarația "eroare de interogatoriu" este adesea lipsită de sens, este mai bine să vorbim despre "eroarea întrebării". Dar tehnica mea este potrivită pentru aproape întreaga cercetare.
În studiile politice și în cele comerciale, de multe ori ne confruntăm cu probleme binare, adică cu întrebări la care răspunsul este "da" sau "nu". Întrebarea clasică privind ratingul "Cui ați vota dacă alegerile ar avea loc în acest weekend?" Este un caz special al unei probleme binare. Acesta poate fi prezentat ca mai multe întrebări despre sprijinul fiecărui candidat sau parte: "Dacă alegerile ar avea loc în acest weekend, ați vota pentru candidat N ***?" Și două opțiuni "Da, am votat" și "Nu, nu am votat".
În statistici, următoarea formulă este utilizată pentru a estima eroarea distribuției binomiale:
unde Sbin este eroarea de distribuție binomică
p - procentaj de observații (evaluare)
n este mărimea eșantionului.
Eroarea maximă este atinsă atunci când p = 50%, adică jumătate și jumătate a răspuns "da, aș vota" și "nu, nu, nu aș vota". În toate celelalte cazuri, eroarea este mai mică. Putem estima eroarea luând valoarea maximă.
În următorul pas vom folosi regula "Two Sigma" (sau, dacă se dorește, regula "Three Sigma"). Regula spune că 95% din toate valorile de distribuție se încadrează în interval
În acest caz, eroarea, conform regulii "două sigma", cu un interval de încredere de 95% este ± 2 * Sbin. Ca rezultat, obținem o formulă cu care putem estima eroarea de eșantionare la un interval de încredere de 95%, iar eroarea va depinde doar de dimensiunea eșantionului:
Unde ε este eroarea de eșantionare, n este mărimea eșantionului.
Obținem asta pentru un eșantion de 1000 de persoane, eroarea de măsurare fiind de 3%, cu un interval de încredere de 95%.