Parametrii de normalizare, prepararea și prelucrarea, analiza și prezentarea datelor

1. De ce un indice de normalizare

De obicei, severitatea o anumită calitate a încerca să descrie un număr. Cel mai adesea, un astfel de număr x este format ca suma punctelor. Este legitim - este o altă întrebare. Presupunem că x este numărul de primit și inteligent.

De obicei, x variază de la o anumită valoare minimă xmin (absența calității reflectorizante) până la o valoare maximă xmax (manifestare extremă, prezența, severitatea, ...).

pregătirea acestuia rezolvă problema de a compara două obiecte, dar numai pe acest indicator. Cu toate acestea, și aici nu este foarte bun. Noi trebuie să aibă întotdeauna în minte, în măsura în care indicatorul de schimbare. Și aceste benzi - o mare varietate de ... Da, și să evalueze cât de aproape de o valoare deosebită pentru marginile intervalului sau la mijloc. În întuneric general, pur.

Dacă vorbim despre compararea a două măsuri diferite - a pus la cusături. Desigur, nu se poate compara calitatea în sine. Pentru a face acest lucru, compara numărul trebuie să fie adimensionale. Și a fost cifra este de obicei interpretată ca gradul de severitate de o anumită calitate. Și aici este de a compara posibil. Dar pentru aceasta, ei trebuie să conducă la aceeași scară, astfel încât începutul și sfârșitul celor două scale coincid.

Dar de ce doar aceste două? Hai să facem această conversie pentru toți parametrii! Este numit normalizare (a nu se confunda cu normalizarea!). Apoi, putem compara o varietate de indicatori, obținute prin diferite metode.

2. Tipuri de indicatori

Pentru toate varietatea caracteristicilor numerice ale obiectelor (sau respondenți) sunt două categorii mari pot fi identificate:

  • unipolar. exprimând numai gradul de prezență (intensitate, severitate, ...) de calitate;
  • bipolară. reflectând nu numai gradul de disponibilitate a calității, dar, de asemenea, sa „orientare“.

3. Normalizarea indicele unipolară

Lung format în știință, astfel încât valorile sunt normalizate la intervalul 0 - 1.

Pentru această funcție de conversie y = f (x) trebuie să aibă următoarele proprietăți:

Orice funcție cu astfel de proprietăți pot fi utilizat pentru normalizare. De exemplu, în cazul în care XMAX, este posibil să se selecteze o funcție

Este ușor de observat că, din cauza alegerii funcției corespunzătoare pot fi luate în considerare diferite efecte ale estimărilor distorsiuni. De exemplu, tendința unui respondent la scoruri extreme. Astfel, acesta poate fi aplicat la diferite respondenți și funcții de conversie ridicate care iau în considerare particularitățile de identitatea lor, statutul, etc. grafice de propoziții ale acestor funcții - în Fig. 1.

Fig. 1. Funcția normalizare Grafice

Cele mai frecvent utilizate transformare liniară:

Dacă presupunem că o creștere x descrie ca o creștere a severității calității A și reducerea gradului de altă calitate B, normalizată măsura calitatea B poate fi doar diferența y '= 1-y. Acestea sunt, de exemplu, un sens de calitate, legate de „proximitate“ și „Distanța“. metrization lor identifică percepute rău înainte, dar este o complementaritate clară și chiar opus.

4. Normalizarea indicator bipolar

De obicei, un astfel de indicator este „lipirea“ a două presupunând reciproc antonimic unipolară și calitățile A și B.

Ori de cîte ori este pur și simplu negarea A, și vice-versa. Conform acestui principiu sunt construite, de exemplu, scala diferențială semantică. Cu toate acestea, o astfel de pereche diferențială care urmează să fie verificat un dicționar de antonime (de exemplu, două antonimul cuvântului „fun“ - „trist“ și „întuneric“ - nu sunt deloc sinonime).

Normalizarea implică selectarea cantităților de direcție „pozitivă“ a axei y corespunzătoare. Ca atare selectat arbitrar unul dintre polii scalei, creșterea intensității care se adoptă ca o creștere y. Polul opus este în mod automat un „negativ“. Subliniem că nici o modalitate (evaluare axiologică) pentru a nu acest lucru - joacă un rol poate fi stabilit doar stereotipuri semantice, dar nu mai mult.

Lăsați cantitatea x evalueaza severitatea ambelor calitati (cu denumirea corespunzătoare, de exemplu, „foarte mult“ sau „ura mica“). Normalizarea poate fi realizată folosind orice funcție care îndeplinește condițiile (1). În special, ar putea fi și o transformare liniară:

Evident, y [-1; 1].

Ambele formula (2) și (3) descriu o transformare liniară a formei y = k · x + b. Prin urmare, toate concluziile statistice cu privire la valorile x și y sunt aceleași.

5. Caracteristici de scară

Atunci când se utilizează o scară de punct există unele subtilități care sunt adesea trecute cu vederea:

  • Uneori nu răspunde la toate întrebările legate de acest indicator. Motivele sunt diferite - doar răspunsul nu este dat, eroarea în a face un răspuns sau o codificare, ... Pe scurt - există răspunsuri omisiuni.
  • Aproape întotdeauna scor echivaleaza cu un număr de răspuns, printre altele. Și cel mai de jos punct este egal cu 1.
  • Aș dori să utilizați pentru a răspunde la câteva întrebări cu numărul de gradații, diferit de restul. Dar atunci contribuția sa ar trebui să fie considerate ca fiind ceva diferit.

Cu scala de normalizare doar preiei x = S, unde S este suma punctelor răspunsurilor primite (și nu pune întrebări!). În consecință, valoarea Smin și Smax - valoarea minimă și maximă de puncte pe care le puteți înscrie cu răspunsurile primite.

În cazul în care notele pentru toate întrebările sunt aceleași, numărul N - acesta este numărul exact de astfel de răspunsuri, pentru care punctele acumulate. Apoi, cu formula (2) ia forma simplă:

Aici bmin si Bmax - cele mai mici și cele mai mari valori ale punctelor. În care y variază în intervalul de la 0 la 1. Limitele „0“ când atinge toate răspunsurile bmin egale. și '1' - egal cu Bmax.

Pentru normalizarea indicatorului GMAT pe intervalul [-1; 1] este necesar să se utilizeze formula:

Ca aceasta: