coeficienții de corelație Rank

coeficienții de corelație Rank - este mai puțin precisă, dar mai ușor cu privire la calculul indicatorilor non-parametrice pentru a măsura gradul de apropiere a legăturii dintre cele două caracteristici correlatable. Acestea includ factori Spearman (p) și Kendal (T), pe baza corelației valori în sine nu sunt corelate trăsături, iar rândurile lor - un număr de ordine atribuit fiecărei valori individuale a x și y (separat) în lista clasate. Ambele dispun trebuie rang (numerotate), în aceeași ordine de la mai mici la valori mai mari și invers. Dacă va fi găsit unele valori ale lui x (sau y), atunci fiecare dintre ele este atribuit un rang egal cu raportul dintre suma rangurilor (locuri la rând), care pot fi atribuite acestor valori, numărul de valori egale. Calitatile semne x si y indica simbolurile Rx și Ry (uneori Nx și Ny). Raționamentul privind relația dintre schimbările în valorile x și y, bazate pe compararea comportamentului rangurilor în două moduri simultan. Dacă fiecare pereche de x și y sunt aceleași rândurile, ea descrie relația cea mai intimă. Dacă există un rang opus plin, și anume într-un rând pe locul crește de la 1 la n. și într-o altă - scădere de la n la 1, este feedback-ul maxim posibil. Abordări pentru a evalua gradul de apropiere a conexiunii de Spearman și Kendal sunt ușor diferite. Pentru calcularea coeficientului Spearman valorile caracteristice ale lui x și y sunt numerotate (separat), în ordine crescătoare de la 1 la n. și anume acestea sunt date un anumit rang (Rx și Ry) - numărul de ordine în lista clasate. Apoi, pentru fiecare pereche de ranguri diferența lor (notată cu d = Rx - Ry) și pătrate ale diferențelor sunt însumate.

unde d - diferența în rândurile de x și y;

n - numărul de perechi de valori observate ale lui x și y.

Coeficientul de care p poate lua valori de la 0 la ± 1. Se va aprecia că, deoarece coeficientul Spearman ia în considerare numai diferența în rândurile, și nu pentru valorile lui x și y este mai puțin precisă în raport cu coeficientul liniar. Prin urmare, valorile sale extreme (1 sau 0) nu poate fi considerată în mod necondiționat ca dovadă a unei legături funcționale sau lipsa totală de dependență între x și y. În toate celelalte cazuri, și anume, în cazul în care ρ nu ia valori extreme, este destul de aproape de r.

Formula (147) este aplicabil în mod teoretic strict numai atunci când valorile individuale ale lui x (și y) și, în consecință, rândurile lor nu se repetă. În cazul repetate (legate) clasează există o altă formulă mai complexă, ajustată pentru numărul de note repetitive. Cu toate acestea, experiența arată că rezultatele calculelor de formula corectate pentru rândurile asociate difera putin de cele obținute utilizând formula pentru rândurile non-recurente. Prin urmare, în practică, cu formula (147) a fost utilizat cu succes pentru ambele non-recurente și recurent la rândurile.

Coeficientul de corelație ocupă locul Kendal τ este construit oarecum diferit, deși calculul său, de asemenea, începe cu un clasament al valorilor caracteristice ale lui x și y. Ranguri x (Rx) are o ordine strict ascendentă și scrie în paralel corespunzătoare fiecărei valori Rx Ry. Deoarece Rx scris strict ascendent, se urmărește să se determine gradul de secvențe potrivite Ry «corect» Rx aderenta. Astfel, pentru fiecare Ry determină secvențial numărul următor se clasează mai mare decât valoarea sa, iar numărul rangurilor de valoare mai mică. Primul ( „dreptul“ de a urma) sunt considerate ca puncte cu semnul „+“, iar suma indicată prin litera R. Acesta din urmă (a „greșit“ să urmeze) sunt considerate ca puncte cu semnul „-“, iar suma desemnată de litera Q. Este evident că maximul P-valoare este atins dacă rangul y (Ry) coincid cu rândurile x (Rx) și fiecare rând reprezintă numărul de numere naturale de la 1 la n. Apoi, după prima pereche de valori Rx = 1 și Ry = 1 număr rang care depășește valoarea de date suma (n - 1), după a doua pereche, în care Rx = Ry = 2 și respectiv 2 (n - 2) etc. Astfel, în cazul în care rândurile de x și y sunt același și egal numărul de perechi de rang n.

Dacă secvența de ranguri x și y este o tendință inversă în ceea ce privește secvența de ranguri x. atunci Q va fi aceeași modulo valoarea maximă:

În cazul în care clasele nu au coincide cu rangul de x. atunci toate însumate punctele pozitive și negative (S = P + Q); raportul dintre această sumă S la o valoare maximă a uneia dintre componentele și reprezintă coeficientul de corelație Kendal rang t și anume.:

Formula Kendal coeficient de corelație rang (148) este utilizat pentru cazurile în care valorile caracteristice individuale (atât x și y) nu sunt repetate, și, prin urmare, rândurile lor nu sunt combinate. Dacă se constată mai multe valori identice ale lui x (sau y), adică, gradele repetate, devin asociate. Kendal coeficientul de corelație rang este dată de:

unde S - punctajul total efectiv în evaluarea 1 din fiecare pereche având aceleași modificări de ordin rang și -1 din fiecare pereche cu opus schimbării ordine rang;

- numărul de puncte, de reglare (reducere) cantitatea maximă de puncte pentru contorul de repetiție (asociații) t clasează în fiecare rând.

Rețineți că următoarele cazuri sunt ranguri repetitive identice (în orice număr) scor estimat de 0, adică, acestea nu sunt luate în considerare atunci când se calculează fie cu „+“ sau semnul „-“.

Avantajele de rang coeficienților de corelație Spearman și Kendal: ele pot fi ușor de calculat, ele pot fi folosite pentru a studia și măsura link-uri nu numai cantitativ, ci și între semnele calitative (descriptive) clasate într-un anumit fel. În plus, atunci când se utilizează gradul de coeficienți de corelație nu trebuie să cunoască forma de conectare a fenomenelor studiate.

Dacă numărul de caracteristici fiind clasate (factori) mai mare de două, pentru măsurarea apropierii legăturii dintre ele poate fi utilizată Kendal propusă de M. B. Smith și coeficientul de concordanță (multiplu rang coeficient de corelație):

unde S - suma pătratelor abaterilor de la suma m ocupă locul medie a acestora;

m - numărul de caracteristici fiind clasate;

n - numărul de unități fiind clasată (număr de observații).

Formula (150) este utilizat pentru cazul clasează pentru fiecare caracteristică de cod nu se repetă. Dacă există o rândurile asociate, rata de concordanță se calculează pe baza numărului de repetitive rang (legate) pentru fiecare factor:

unde t - numărul de același rang pentru fiecare caracteristică.

Coeficientul de concordanță W poate avea valori de la 0 la 1. Cu toate acestea, este necesar să se verifice semnificație (semnificație) prin testul χ2 fără rândurile asociate cu formula (152), și, dacă este cazul - cu formula (153):

Χ2 valoarea reală este comparată cu tabelul corespunzător primit nivelul de semnificație a (0,05 sau 0,01) și numărul de grade de libertate v = n - 1. Dacă χ2fakt> χ2tabl atunci W - este semnificativ (semnificativ).

Coeficientul de concordanță este utilizat în special în evaluările experților, de exemplu, pentru a determina gradul de coerență a opiniei experților cu privire la importanța unui punct final sau de a face o evaluare a unităților individuale de orice formă. În formula (150), în aceste cazuri m este numărul de experți, și n - numărul de unități fiind clasate (sau atribute).

statistici practice

articole similare