Media aritmetică, modul și mediana

Probabil, știi foarte bine ce înseamnă aritmetică. Dacă avem o mulțime de cantități și toate sunt de aceeași natură (nu putem în mod normal kilograme cu kilometri, desigur), trebuie să calculam suma și apoi, împărțind-o cu numărul de termeni, să găsim media aritmetică. Se pare că este o acțiune simplă și bine-cunoscută, dar aici există mai multe probleme de discuție. Când se familiarizează cu unii dintre "indicatorii", o aminteste involuntar faimoasa glumă despre "temperatura medie în spital".

Un exemplu. Să presupunem că o firmă are două corturi care vând produse de patiserie fierbinți, pe care le coace pe loc din produse semifinite. Tabelul oferă un rezumat aproximativ al veniturilor zilnice ale fiecărui cort pentru o săptămână (în ruble).


Diferența dintre veniturile zilnice se datorează, în principal, amplasării corturilor. Cortul 1 este situat într-un parc de agrement, în timp ce cortul 2 este situat vizavi de școală și lângă intrarea unui institut de cercetare mare.

Proprietarul companiei a decis să plătească o primă lunară vânzătorilor cortului, care vor oferi în această lună multe venituri. La distribuirea premiului a fost descoperit un lucru uimitor: victoria în acest "concurs" depinde doar de numărul de zile libere într-o lună.

N-aș vrea să provoace un număr mare de cifre pentru întreaga lună ca un întreg, dar chiar și fără ca acest lucru este evident că în cazul în care proprietarul companiei a venit cu ideea de a câștigătorului bonus de zi cu zi o anumită sumă fixă, „weekend pentru cort“ ar putea conta pe atribuirea de doi ani și de o jumătate de ori mai puține ori, deși un câștig săptămânal din acesta este mai mare.

În astfel de condiții, o concurență mai rezonabilă ar putea fi bazată pe o medie a indicatorilor săptămânii. Să spunem că cifrele săptămânale au coincis aproape. Cum să evaluați care dintre corturi este mai util pentru firmă, dacă dintr-un anumit motiv firma trebuie să vândă una dintre ele?

În cazul în care veniturile sunt aproape la fel, proprietarul, aparent, va fi interesat de stabilitatea lucrărilor de la ghișeul. vânzătorii nu vina, dar, în cazul în care echipamentul este de lucru de două zile pe săptămână de uzură, și alte ori mai mult întreruperile, eșecul unor astfel de echipamente este mult mai probabil. Să unul (a scăzut la intamplare) zi o ploaie grea săptămână, și în stradă un pic scădere a veniturilor trecătorilor deosebit brusc vizibile atunci când o zi ploioasă coincide cu un week-end. Pentru comparație, vă puteți imagina sportivii care au șanse egale de a câștiga, dar unul dintre ei se comportă mai bine. Cel mai probabil, el va fi acceptat în echipă.

Dar iată o altă întrebare: face acest cort cel mai instabil face ca lucrarea firmei să fie mai stabilă, completând perfect munca din cortul 2? Să prezentăm această declarație ca pe o ipoteză și să încercăm să o dovedim sau să o respingem. Pentru a evalua această problemă cantitativ, este în primul rând necesar să rezumăm veniturile zilnice ale ambelor corturi.

Ceea ce am descris în cuvinte comune ca "instabilitatea muncii" este referit în statistici ca o caracteristică a dispersiei. Acestea includ indicatori precum varianța și abaterea standard. Arătăm în exemplul anterior cum sunt definite aceste concepte. Vom calcula mai întâi venitul mediu aritmetic pentru fiecare cort separat, iar pentru ambele corturi împreună (medierea se efectuează timp de șapte zile):

Pentru a compara varianța valorilor, calculăm pentru ambele corturi deviațiile zilnice ale veniturilor din media proprie.


Pentru a măsura cât de mult un cort este "mai instabil" decât celălalt, vreau să adaug întreaga linie într-o săptămână și să obțin o abatere totală pentru întreaga perioadă de raportare. Dar nu putem face acest lucru, am construit acești indicatori noi înșine, astfel încât, după ce am adunat, ajungem la zero (exact la eroarea de rotunjire - media aritmetică nu este neapărat un întreg). Pentru a evita această zeroare, trebuie să ne asigurăm că orice abatere de la aritmetica medie este "pierdută" de semn. Pentru a face acest lucru, fiecare pătrat este pătrat, și numai atunci se completează întreaga serie de valori.

Pentru a nu depinde de perioada de mediere, împărțiți suma de pătrate rezultată după numărul de termeni (în cazul nostru, ca și înainte, cu șapte). O astfel de cantitate se numește varianță.


Vedem că variația este într-adevăr foarte indicatoare. În "cortul de weekend" este mai mare decât. decât de zece ori. Dispersia poate fi calculată automat în Excel, chiar și fără a lua în considerare media aritmetică, programul vă va face singur. Pentru a face acest lucru, în fișierul Excel, faceți clic pe butonul fx din meniul de sus. Apoi, selectați între tipurile de funcții "STATISTIC" și din lista furnizată în fereastra - DISPRA. Apoi, la prompt, puneți cursorul în câmpul "Număr 1", trageți de-a lungul liniei cu valorile introduse. Acest tip de număr este numit "calcularea varianței schimbate de populație".

Dispersia este adesea folosit, dar o caracteristică mai convenabil este numit abaterea standard (de obicei, notate cu litera omega Deviere standard greacă -. Este rădăcina pătrată a varianței, este convenabil ca are aceeași dimensiune ca și valoarea inițială Deci, în cazul nostru. , variația ar avea dimensiunea "ruble pe pătrat", în timp ce abaterea standard este obținută simplu și obișnuit, în ruble.

În exemplul nostru, se observă că variația totală și deviația standard a două corturi cu încă mai mare decât cea a primei de cort, și deviația standard de mai sus mai mult. decât de două ori. Prin urmare, ipoteza noastră de "stabilitate sporită a sumei" datorată prezenței celui de-al doilea cort este incontestabilă.

Uneori, în loc de media aritmetică, se folosesc alte valori caracteristice, dacă acest lucru, din anumite motive, descrie mai bine eșantionul.

Deci, dacă aranjați eșantionul în ordinea ascendentă (sau descendentă) a valorii care ne interesează, atunci mediana este ceea ce va fi exact în mijlocul "ordinului". De exemplu, dacă aranjăm intervalele de timp în ordinea timpului: al doilea, minutul, ora, ziua și săptămâna - atunci mediana va fi o oră.

Un alt concept pentru înlocuirea mediei este moda. Numele în sine ușurează amintirea acestei definiții. Dacă aranjăm toate perechile de pantofi în stoc în ordinea dimensiunilor, cea mai populară dimensiune va fi moda. Moda - aceasta este ceva care trebuie să ia în considerare cu siguranță producătorii de ambalaje și ambalatori. Dacă majoritatea oamenilor au cumpărat un pahar de lapte la un moment dat, sacii de lapte nu ar fi litri.

În secțiunea următoare începem să lucrăm cu cantități aleatorii având o distribuție normală. iar aceste concepte se vor întâlni din nou.

Widget pentru calcularea mediei, modului și median.

Introduceți detaliile, setați ceea ce trebuie să găsiți și faceți clic pe butonul Equals.