Să presupunem că avem o mare colecție de obiecte similare (boabe în grămada de cereale, copaci în pădure, locuitorii țării, obiecte de producție în masă, și așa mai departe. D.) Trebuie să fie studiate. În acest caz, obiectul de studiu sunt orice parametri calitativi sau cantitativi ai obiectelor care alcătuiesc un set dat (de exemplu, caracterul adecvat al instalațiilor de utilizare a greutății lor, gradul, dimensiunea, și așa mai departe. D.), Legile distribuției acestor parametri, și mult mai mult (despre asta mai precis Acesta va fi discutat mai târziu).
Setul inițial de obiecte se numește populație. iar numărul N al multitudinii de obiecte (de obicei, foarte mari și care nu sunt cunoscute cu exactitate) se numește volum din totalul populației.
Pentru a produce un studiu continuu (sondaj al tuturor obiectelor) populația generală, din cauza volumului imens, nu este posibil. Și dacă această examinare se datorează daune sau chiar distrugerea obiectelor studiate (de exemplu, suntem interesați de forța, sub acțiunea care obiectul este rupt), atunci este lipsit de sens (pentru a explora toate obiectele din totalul populației - lucru înseamnă că toate dintre ele pauză). (Locuitori o mână de cereale din grămada, o mică parte din copaci de pădure, selectate aleatoriu din țară, un lot mic de elemente de producție în masă, și așa mai departe. D.) Prin urmare, studiul doar o mică, o parte selectate în mod aleatoriu din populație.
Setul selectat de obiecte se numește un cadru de eșantionare sau, pe scurt, a eșantionului. Obiect Numărul N în eșantion se numește volume ale probelor. De obicei, cantitatea de N eșantioane sunt mult mai mici decât volumul populației N (N «N). facilități de eșantionare să fie verificate, iar apoi, pe baza rezultatelor acestui studiu, a făcut anumite concluzii cu privire la întreaga populație generală.
Firește, eșantionul de cercetare a obiectelor nu oferă informații complete și exacte cu privire la întreaga populație (examinată, deoarece numai o parte din obiectele din acest set). Prin urmare, orice concluzii cu privire la populația generală, la care vom veni pe baza investigațiilor de probă sunt pline de inexactități și chiar greșeli. Dar aceste erori sunt, desigur, va fi mult mai puțin probabil să apară, și dimensiuni mai mici, cu atât mai mult N - dimensiunea eșantionului. Cum este mărimea eșantionului depinde de acuratețea și fiabilitatea concluziilor populației generale - aceste aspecte sunt, de asemenea, luate în considerare în statistica matematică.
Pe lângă un volum mare, pentru a obține un concluzii suficient de fiabile și exacte cu privire la eșantionul general, populația trebuie să fie în continuare populația generală în mod adecvat. Sau, cum se spune, ar trebui să fie reprezentativ. Acest lucru înseamnă că este imposibil de a selecta cel mai bun sau în principal, din contră, cele mai grave obiecte. Correct (reprezentant) la o astfel de selecție, în care șansele de a fi selectate din populația tuturor obiectelor sunt identice. Acest lucru va avea loc numai în cazul în care un eșantion dintr-o populație de obiecte se efectuează în mod accidental.
De exemplu, pentru a selecta cereale departe de grămada de cereale a fost făcută în mod reprezentativ ar trebui să ia un vârf de cuțit de granule din diferite locații ale stâlpilor (cu diferite margini, cu suprafața cu adâncimea, și t. D.). Și dacă gramada este o lungă perioadă de timp și deja închegat (omogenitate heap rupt), înainte de prelevarea de probe un morman, care ar fi bine și se amestecă bine.
În cazurile în care obiectele din totalul populației numerotate (de exemplu, este de automobile produse uzina de automobile, sau părți ale acestor mașini - .. Motors, caroserie etc.), pentru o selecție aleatorie a unor N obiecte astfel încât populația poate utiliza așa-numitele tabel de numere aleatoare. Numărul Ie de obiecte selectate pot fi luate din tabel, deschizând tabelele de pagini la întâmplare. Acest tabel este pregătit de un calculator, și se găsește în multe manuale privind statisticile matematice. De altfel, numerele conținute într-un tabel de numere aleatoare - se stabilește pur și simplu cifre fracționare ale X. variabilei aleatoare uniform distribuite în intervalul [0; 1].
Vom presupune că obiectele populației studiate, doar un singur semn de X, iar această caracteristică - cantitativ (de exemplu, poate fi exprimată printr-un număr). Acest lucru poate fi de greutate, de calitate, mărime, și așa mai departe. D. De altfel, în cazul în care obiectele caracteristice de calitate necesare, și (de exemplu, compatibilitatea lor conform destinației sale) poate fi făcută cantitativ, în cazul în care se presupune că această caracteristică X = 1 dacă treci obiect, și presupunem X = 0 dacă obiectul nu se potrivește.
Deci, lăsați din populația țintă se face mărimea eșantionului aleatoriu N. Fie sa dovedit că obiectele N1 din eșantion, valoarea testului sa dovedit a fi caracteristică X X1. în obiectul N2 - valoarea X2. ... Nm la obiecte - valoarea Xm. Apoi masa
Grăitor statistică de eșantionare distribuția formei (1.3) nu este reprezentată poligon, o așa-numită histogramele frecvență (Figura 3.2.):
Rețineți că, de multe ori pe axa ordonatelor de poligoane și nu histograme pune frecvențe și frecvențe relative
Să ne întoarcem acum la caracteristicile numerice de bază ale distribuției statistice a eșantionului. Acestea sunt:
1. Valoarea medie a pavilionului X în eșantion. se face referire la și numit înseamnă proba.
2. Cantitatea ce caracterizează valoarea medie a pătratul deviațiilor întruchipări mediu selectiv. Se numește varianța eșantionului.
3. Cantitatea care caracterizează valoarea medie a abaterilor întruchipări mediu selectiv fără a ține cont semnul acestei abateri. Se numește deviația standard a mediei eșantionului.
4. O valoare numita variație a coeficientului selectiv. Acest coeficient descrie procentul, care este abaterea medie de la medie în ceea ce privește foarte mijloc.
Toate aceste caracteristici numerice de bază ale eșantionului sunt determinate prin formulele:
Aceste formule pot fi utilizate, dacă distribuția statistică a eșantionului este dat de (1.1), adică este discret. Și dacă aceasta are forma (1.3), adică un continuu (interval), acesta este mai întâi transformată într-o discret, a acceptat noile sale opțiuni binare, în care mijlocul intervalelor.
Rețineți că proba caracteristici numerică introdusă introdus mai sus pentru același scop și au în esență același înțeles ca și caracteristicile numerice ale variabilelor aleatoare - medii (valoare medie), varianța, abaterea standard, coeficientul de variație, care au fost discutate în cursul teoria probabilității. Și numele acestor caracteristici sunt foarte asemănătoare.
De altfel, formula de calcul eșantionului varianța poate fi simplificată pentru a dezvălui în ea suma pătrat diferență împărțită în trei cantități și apoi aduce altele. Ca rezultat, vom obține următoarea formulă simplificată pentru varianța eșantionului (calcule face singur):
Adică, obținem: varianță probă egală cu media pătratelor eșantionului varianta minus media eșantionului la pătrat. aici
Exemplul 1. Având în vedere distribuția statistică a eșantionului
Decizie. Folosind formulele de mai sus obținem:
Numerică de eșantionare caracteristici (,,,), în cazul în care se găsesc, sunt utilizate pentru a evalua parametrii numerici corespunzătoare (,,,) în populație.
Rețineți că caracteristicile numerice ale populației - fixe, deși necunoscute, număr. A caracteristici numerice eșantion depinde evident de ce obiecte a lovit populația din eșantion. De la o proba la aceste obiecte sunt modificate. Deoarece obiectele eșantion aleatoriu, precum și caracteristicile numerice de probă - variabile aleatoare. Deci, există întrebări firești cu privire la legile de distribuire a acestor variabile aleatoare și caracteristicile lor numerice, și așa mai departe. D. Despre toate acestea vor fi discutate în secțiunea următoare.
1. Care sunt avantajele și dezavantajele ce cerceta întreaga populație, și studiul eșantion de ea?
2. Fie X - salariul lunar într-o singură piesă de lucru într-o instalație de lucru. Ea a studiat în situațiile contabile selectiv. Care este punctul în acest caz, va avea o valoare de (,,,)? Și ce rost va fi (,,,)?
3. Eșantionarea statistică distribuția este după cum urmează: