Corelația este gradul de conectare între două sau mai multe fenomene independente.
Corelația este pozitivă și negativă.
Corelația pozitivă (directă) apare atunci când două variabile se modifică simultan în aceeași direcție (pozitivă sau negativă). De exemplu, relația dintre numărul de utilizatori care vin pe site din SERP și încărcarea pe server: cu cât mai mulți utilizatori, cu atât este mai mare încărcarea.
Corelația este negativă (inversă). dacă o schimbare a unei valori duce la schimbarea opusă în cealaltă. De exemplu, odată cu creșterea taxelor fiscale asupra companiilor, profiturile lor sunt reduse. Cele mai multe impozite, cu atât mai puțini bani pentru dezvoltare.
Tipuri tipice de corelareEficacitatea corelației ca instrument statistic constă în posibilitatea de a exprima relația dintre două variabile utilizând coeficientul de corelație.
Coeficientul de corelare (KK) este în intervalul de numere de la -1 la 1.
Cu o valoare KK egală cu 1, trebuie să se înțeleagă că, la fiecare schimbare a primei variabile, se produce o schimbare echivalentă a celei de-a doua variabile în aceeași direcție.
Corelația pozitivă a concentrațiilor de etanol în sânge și sângeDacă valoarea CC este -1, atunci cu fiecare schimbare apare schimbarea echivalentă a celei de-a doua variabile în direcția opusă.
Corelație negativă între rezultatele din cursa de 100 m cu obstacole și sare lungăCu cât corelația este mai apropiată cu -1 sau cu 1, cu atât mai puternică este relația dintre variabile. Dacă valoarea este zero (sau aproape de 0), nu există o relație semnificativă între cele două variabile sau este foarte minimă.
Interpretarea valorilor coeficientului de corelație
Corespondență foarte mare
Dependența de corelație reflectă numai relația dintre variabile și nu se referă la relația cauză-efect: o corelație pozitivă sau negativă între două variabile nu înseamnă neapărat că schimbarea unei variabile provoacă o schimbare în cealaltă.
Poate că există oa treia variabilă care afectează motivul prezenței sau absenței corelației.
Coeficientul de corelație nu este calculat:
- Atunci când relația dintre cele două variabile nu este liniară, de exemplu, patratică;
- în date există mai multe observații pentru fiecare caz;
- există observații anormale (emisii, "renegați");
- datele conțin subgrupuri de observații bine definite.