Serii statistice, histograme și ordinea construcției sale

Să presupunem că, ca urmare a măsurătorilor parametrilor obiectelor studiate, există un agregat statistic reprezentând un set de valori ale CB X, obținut ca urmare a măsurătorilor (observațiilor).

Histograma este construită în ordinea următoare.

1. Întregul interval de măsurare a CB () este împărțit în intervale și se calculează numărul de valori. care se încadrează în fiecare interval. Acest număr este împărțit la numărul total de măsurători (produse) și se determină frecvența corespunzătoare intervalului dat.

Suma frecvențelor tuturor biților trebuie să fie, evident, unitate.

2. Se elaborează tabelul 1.1. în care sunt date intervalele în ordinea localizării lor pe axa absciselor și frecvențele corespunzătoare. Acest tabel este numit seria statistică.

Serii statistice ale valorilor CB

Aici este notația intervalului i; - limitele sale; k este numărul de intervale.

Atunci când grupați valorile observate ale CB pe intervale, poate apărea o situație în care valoarea intră pe limita intervalului. În acest caz, se pune întrebarea în ce categorie să se includă această valoare. Se recomandă ca această valoare să fie considerată ca aparținând în mod egal ambelor intervale și să se adauge la numerele ambelor intervale la 0,5.

3. Determinarea numărului de intervale.

Numărul de intervale la care seria statistică ar trebui să fie grupat nu trebuie să fie prea mare, deoarece în acest caz seria de distribuție devine inexpresivă, iar frecvențele din ea dezvăluie oscilații neregulate. Pe de altă parte, nu ar trebui să fie prea mică, deoarece pentru un număr mic de intervale proprietățile de distribuție sunt descrise prea brutal de seriile statistice.

Practica arată că, în majoritatea cazurilor, este rațional să alegeți numărul de intervale în termen de 10¸20. Cu cât materialul statistic este din ce în ce mai uniform, cu atât mai mare este numărul de intervale care pot fi selectate în compilarea seriilor statistice.

Aceste expresii sunt obținute pentru distribuțiile cele mai des întâlnite în practică, cu excese variind de la 1,8 la 6, adică de la distribuția uniformă la distribuția Laplace.

Lungimile intervalelor pot fi aceleași sau diferite. Evident, este mai ușor să le luați la fel. Cu toate acestea, atunci când se pregătesc date despre CB distribuite prea neuniform, uneori este convenabil să se aleagă intervale în regiunea cu cea mai mare densitate de distribuție care este mai îngustă decât în ​​regiunea cu densitate scăzută.

4. Desenati grafic histograma.

Seria statistică este desenată grafic sub forma unei histograme așa-numite (Fig.1.1). Este construit după cum urmează. Pe abscisă se introduc intervale și la fiecare interval se formează dreptunghi un dreptunghi, a cărui suprafață este egală cu frecvența intervalului dat. Pentru a construi o histogramă, trebuie să împărțiți frecvența fiecărui interval după lungimea sa și să luați numărul rezultat ca înălțime a dreptunghiului. În cazul intervalelor de lungime egale, înălțimea dreptunghiurilor este proporțională cu frecvențele corespunzătoare. Din metoda de construire a histogramei rezultă că suprafața totală a acesteia este egală cu unitatea.

Evident, pe măsura creșterii numărului de studii, este posibil să se aleagă intervale tot mai mici, iar în același timp vârful histogramei se va apropia de curbă, mărginind o zonă egală cu unitatea tot mai mare. Această curbă este un grafic al funcției de densitate a probabilității f (x) (funcție de distribuție diferențială pentru CB continuă).

5. Funcția de distribuție statistică.

Folosind datele seriei statistice, este posibilă construirea unei funcții de distribuție statistică (empirică) CB X. Pentru aceasta, punctele xi ale limitelor intervalelor și sumele corespunzătoare de frecvențe pi sunt luate din serie. Histogramele situate pe dreptunghiurile situate în partea stângă a acestor puncte. Aceste frecvențe și sumele lor sunt notate ca F (xi). Apoi, obținem un sistem de expresii care determină punctele funcției de distribuție statistică. Conectându-le cu o linie întreruptă sau cu o curbă netedă, obținem un grafic aproximativ al funcției de distribuție statistică (funcția integrală de distribuție pentru CB continuu) F (x) (figura 1.2).