Eroarea statistică a rezultatelor culturii și reprezentarea datelor în marketing, de laborator

Marketing pentru România - o relativ nouă știință aplicată. Aici, în principiu, conduse de reprezentanții profesiilor „aliate“ - sociologi, psihologi, economiști etc.

Amestecarea culturi profesionale împiedică dezvoltarea propriei lor de cercetare de marketing de cultură (în continuare - MI) și prezentarea rezultatelor, pe baza cărora cercetarea de client pentru a lua decizii și de a alerga afacerea lor.

Luați în considerare problema specială a erorii statistice MI cantitative și modul în care datorită prezenței acestei erori, este recomandabil să se prezinte rezultatele.

Prin cantitative (sau statistice) măsurarea diferiților parametri ai cercetătorului de piață obține rezultate exprimate în numere, - procent, evaluări etc. Aceste cifre, emise sub formă de tabele ale sistemului, orare, etc. însoțită de concluziile și recomandările sunt prezentate clientului.

Există o problemă nu este probabil cunoscut de client, dar pentru care cercetătorul trebuie să știe.

Toate cifrele prezentate în raport - există doar o estimare a parametrului măsurat de către cercetători pe baza acestor măsurători statistice. Evaluarea principiului nu este exactă, dacă numai pentru că este așa-numitul „Eroare statistică“ (în principiu, datele pot avea și alte tipuri de erori, cum ar fi cele asociate cu erorile cercetător în proiectarea și organizarea procesului de studiu, declarația incorectă a problemei, așa că nu le vezi aici).

Cu alte cuvinte, având în vedere cifrele au lor%.

În mod firesc, cele mai multe valori eșantion de măsurători statistice, cea mai mică eroare statistică.

Cercetătorul este un profesionist, astfel încât cel mai probabil conștienți de valoarea de eroare statistică în datele transmise de către client. Raportul cercetător indică, în general o valoare de eroare statistică.

Dar clientul poate să nu fie conștient, ceea ce înseamnă că acești cercetători raportează eroare statistică, și cel mai important, că această eroare face ca ea luate în considerare la proiectarea activităților sale viitoare.

Mai jos avem în vedere două întrebări de bază:

  1. Eroare de măsurare statistică. (În principal pentru profesioniști).
  2. În ceea ce reprezintă în mod corect datele clienților în eroare statistică cantitative disponibile.

Exemplu. Fragment unui raport privind statisticile privind morbiditatea populației din Moscova.

Întrebare: „Ai avut gripa recent?“

În realizarea eșantionului răspunsurile sondajului au fost după cum urmează (în cifre absolute):

gripa III pentru trecut.

Amploarea erorilor statistice

Să presupunem că dorim să estimăm o p piață parametru. În acest scop, vom efectua măsurarea statistică pe eșantion n.

Rețineți că numărul p este valoarea absolut exactă a parametrului dorit, pe care noi nu știm și nu poate fi cunoscut în principiu, dar că trebuie să fie estimată prin măsurători statistice.

Nivel de încredere și intervalul corespunzător

Prin măsurarea statistică, putem obține o estimare a p * parametru nostru necunoscut p.

Estimarea noastra p * va fi undeva aproape de valoarea reală a parametrului p. și, cel mai probabil, nu va fi exact egal cu p.

Distribuția valorilor posibile ale valorilor de evaluare ale parametrului necunoscut f (p *). Aceasta susține, în general, o lege normală (Gauss) - Fig.1.

Fig.1.

Aici = 3.14159.

- așa-numitul valoarea deviației standard (RMS), în funcție de mărimea eșantionului n. cu atât mai mare proba, cea mai mică abaterea.

Zona delimitată de o curbă Gauss și o axă orizontală, este egal cu 1.

Să considerăm o suprafață% procent de sub curbă în apropierea p în intervalul de la x la + x p-p. (Fig. 2)

Cu probabilitate% A rezultat estimare p * va fi cuprinsă în intervalul de la x la + x p-p.

Iar probabilitatea% se numește un nivel de încredere de. Ei spun, cu probabilitate A% estimarea noastră p * va fi în intervalul cuprins între limita inferioară a p-X și o limită superioară în apropierea p + x p.

Sau în formă prescurtată - "p% x".

Adoptat valoare standard, nivel de încredere de A = 95%. în acest caz, limitele noastre interval va fi aproape de p% 2. Sau - p% 2 (Fig.3).

credibilitate

În secțiunea precedentă, întrebarea a fost de aproximativ în cazul în care aproape de valoarea reală a parametrului p poate fi estimarea noastră p *.

În viață - dimpotrivă. Nu știm adevărata valoare a p. dar, având în măsurători statistice, vom găsi estimarea p *.

Problema erorii de estimare noastre este formulată după cum urmează: ceea ce este intervalul în jurul valorii p *. care poate fi (O probabilitate%), valoarea reală a parametrului p?

Cu alte cuvinte, p% este cât de mult? pentru o probă dată n.

Luați în considerare această întrebare.

Deci, avem estimare p *. Avem dreptul să prezinte o ipoteză: „valoarea reală a parametrului p este p1 (Figura 4).“ O ipoteză: „valoarea reală a parametrului p este p2“ sau „valoarea reală a parametrului p este p3“, a se vedea figura 4.

ipoteze despre CREDIBILITATE valoarea reală a parametrului p este probabilitatea condiționată ca obținem o estimare a p *. în cazul în care, de fapt, valoarea reală a parametrului este egal cu p.

Cu alte cuvinte, presupunem că știm parametrul p (condiție). Și ne uităm la ceea ce este probabilitatea condiționată a evaluării * p:

Valoarea reală a p noi nu știm. Presupunem (ipoteza) că, de exemplu, este egal cu p1. Permiteți-mi să vă reamintesc, am efectuat măsurători statistice, a primit un număr p * ca o estimare a parametrului p.

Probabilitatea condiționată a p1 valoarea ipotetică a vizita noastre estimări p *. Cu alte cuvinte, plauzibilitatea p1 ipoteza. Cu alte cuvinte, W (p * | p), este - Figura 5.

Strict vorbind, probabilitatea este aria de sub curba din figura 5. astfel încât probabilitatea de a obține această evaluare special în ipoteza p * p1 este un număr infinit de mic.

Dar acest număr este în continuare mai mică decât probabilitatea de a obține noastre estimări p *. dacă vom accepta ipoteza p3 = p *. (Fig.6)

Convenabil pentru a utiliza raportul risc.

Cu condiția ca în numărătorul și numitorul în cantități infime, raportul probabilitate are o valoare nenulă specifică, ceea ce face ca raportul probabilitate este foarte practic in mai multe scopuri.

În cazul nostru, ipoteza cea mai plauzibilă este că valoarea reală a parametrului p este egal cu valoarea estimată de noi p *. Cu toate acestea, o ipoteză foarte plauzibilă că adevărat, dar necunoscut pentru noi, valoarea parametrului p un pic mai mult sau mai puțin decât p *.

  1. Găsiți valoarea numerică a raportului risc de frontieră. În cazul în care raportul risc pentru această ipoteză este mai mică decât acest număr, ipoteza este considerat a fi destul de plauzibil, în cazul în care mai mult - improbabil.
  2. Pe baza raportului risc pentru a determina statistic de evaluare eroare intervalul p * pentru o probă dată.
  3. Noi definim valorile limită ale ratelor probabilității de probabilitate standard de încredere A = 95%. (Fig.2)

al ratei de probabilitate limită limită interval de aproape p * corespunzătoare. (Să le numim RGR), superior și inferior, care determină intervalul de acuratețea statistică a estimării noastre p *.

Raportul probabilitate limită

Credibilitatea la RGR. W (p * | p = RGR)

Raportul probabilitate de delimitare (pentru A = 95%):

Deci, pentru un interval, în care, în apropierea p *. sub încredere probabilitate A = 95%. Acesta poate fi adevărata valoare a parametrului p. cu alte cuvinte - pentru intervalul erorilor de măsurare statistică caracterizată prin următoarea regulă:
La limitele acestui interval este egal cu raportul dintre likelihoods 7.4; în intervalul - mai este - mai mult de 7,4.

Eroare intervalul de calcul

Dimensiunea eșantionului, rechemare, n.

Să presupunem, r dintre ele sunt potrivite pentru stabilirea condițiilor.

Dacă parametrul de test p este o valoare suficient de mare, adică în intervalul de 5-95%, valorile posibile ale estimărilor p * sunt supuse legii binomială. Limitele intervalului de eroare statistică se găsește din ecuația:

Rezolvarea metode numerice, vom calcula limitele intervalului de eroare statistică pentru fiecare valoare a lui p *. situată în intervalul 5-95%, pentru diferite valori ale lui n.

Dacă parametrul de testare p este mic, în intervalul de până la 5%, legea Poisson se aplică:

Rezultatele calculelor inferioare și limitele superioare ale intervalelor pentru estimări de eroare valori statistice p * la n probe diferite sunt prezentate mai jos în graficele din fig. 8.

1. Graficul prezinta gama de valori posibile ale p * de la 0% la 50%, pentru a economisi spațiu. Graficele sunt simetrice în raport cu linia de 50%.

Estimarea de eroare (limitele superioare și inferioare ale intervalelor), de exemplu, pentru p = 60% este eroarea (respectiv, limite inferioare și superioare ale intervalelor) estimează p = 40%.

2.Chem mai mică decât estimarea p *. cea mai mică eroare de măsurători. Eroarea maximă de măsurare în estimările vor fi în regiunea de 50%. Odată cu creșterea în continuare a valorii de evaluare de eroare de măsurare statistică scade din nou.

3. Intervalul de eroare asimetrică. De exemplu, când n = ecran de 100 de eșantionare și o estimare a parametrului p = 30% intervalul de eroare va fi 8.30-30% + 9%.

Exemplu. (Continuare)

În tabelul de mai sus, se adaugă coloane, în care:

  1. Rezultatele de calcul al răspunsurilor de frecvențe relative reductibile exprimate în% prin formula (1), rotunjită la prima zecimală.
  2. Limitele intervalului de incertitudine pentru fiecare cifră (bazată pe figura 8 grafice.).
  3. Valorile intervalului de incertitudine.

gripa III pentru trecut.

Menționăm următoarele fapte:

  1. Eroarea statistică a acestor măsurători (eșantionate 401) astfel încât să poată identifica în mod unic diferențele între frecvențele răspunsurilor „2 săptămâni“, „1 luna“ și „2 luni“. Limite interval de eroare pentru aceste răspunsuri nu se suprapun.
  2. Eroarea statistică a măsurătorilor nu se pot identifica în mod unic diferențele în răspunsurile de frecvență „1 lună“, „3 luni“ și „șase luni“.

Cu alte cuvinte, pe baza datelor prezentate, se poate concluziona că „cei care au avut gripa in ultimele 3 luni mai mult decat cei care au avut gripa în ultimele 1 lună.“ Dar această concluzie este de încredere.

Incertitudinea de măsurare și prezentarea rezultatelor

În practică, se întâmplă de multe ori că mărimea eșantionului - numărul nu rotunde, calculul estimării unui parametru p * cu formula:

aceasta poate fi foarte bine că estimarea p * nu va fi prea „confortabil“:

Cum se corect rotund rezultatul?

Luați în considerare modul în care rezultatele de rotunjire a rezolva problema inginerilor.

Să presupunem că, la o anumită tensiune măsurată la o anumită rețea este disponibil rezultatul voltmetru arătat: în 36,3

Cu toate acestea, orice dispozitiv nu este perfect, adică, citirile sale sunt inexacte, au o marjă de eroare. Valoarea unității de eroare este de obicei indicat pe pașaportul său și pe panou.

Dacă voltmetru nostru are o eroare de ± 1 V, apoi inginerul de protocol de măsurare scrie o cifră: 36

Astfel, un inginer lecturi rotunjește la cel mai apropiat de 1, în conformitate cu un rating de precizie a dispozitivului.

Cu alte cuvinte, protocolul stocate în rezultatul măsurătorii este rotunjit până la ultima cifră validă.

Instrument Precizie -1 + B, prin urmare, zeci de cifre din 36.3, unități de încredere - sunt autentice și zecimi de volți - nesigure. eroare a instrumentului nu este posibil să se măsoare zecimi de.

Prin urmare zecimi de rotunjite la cel mai apropiat de 1 -, în conformitate cu regulile de rotunjire aritmetică.

Dacă voltmetrul are erori de măsurare + -0.5, apoi, după ce a primit rezultatul 36,3 V în protocolul de măsurare, trebuie să aducem 36,5 V.

Trimite la protocolul de măsurare doar cifre fiabile - atât a înțeles corectitudinea datelor cantitative de orice tip.

„Instrument“ nostru - măsurători statistice cantitative. Precizia dispozitivului nostru depinde de mărimea eșantionului - vezi Fig .. 8.

Cultura profesională impune ca rezultate numai de încredere prezentate în raport:

Exemplu. (Continuare)

Forma finală a tabelului în raport, cu ideea de rezultate matematic corecte:

gripa III pentru trecut.

Atenție! Atunci când rotunjirea rezultatele trebuie să se țină seama de faptul că se poate întâmpla ca suma tuturor numerelor nu va fi egal cu 100,0% (ultimul rând din tabel).

constatări Grupul 1

Concluziile Grupului 2

  1. Dacă în timpul măsurătorilor cantitative sunteți mulțumit cu precizia de + -10%, folosiți o dimensiune eșantion de 100: crește proba de două ori nimic nou testament, cu excepția, poate, creșterea bugetului.
  2. In mod similar, pentru precizia necesară de + -5% este suficientă proba de aproximativ 350. Un eșantion dublu crescut nu va aduce rezultate semnificative.
  3. Pentru a realiza o precizie (în special precise) măsurători statistice - până la 0,1% - probă necesare cel puțin 15-20 mii.
  4. În cazul în care un cercetător în situația de măsurători statistice cantitative indică un număr cu zecimi de%, iar pe baza zecimi de% face unele concluzii, atunci, cel mai probabil, el le falsifică.

Matematic reprezentare corectă a datelor din raport nu elimină necesitatea de a se indica separat eroarea statistică a măsurătorilor statistice.

Referințe:

a se vedea, de asemenea,

articole similare