Și coeficientul multiplu de determinare - stadopedia

Coeficient de corelație multiplu

Coeficientul de corelație multiplu este utilizat ca măsură a gradului de etanșeitate a relației statistice dintre indicatorul rezultat (variabila dependentă) y și setul de variabile explicative (independente) sau, cu alte cuvinte, estimează strânsa influența articulară a factorilor asupra rezultatului.

Coeficientul de corelare multiplu poate fi calculat dintr-un număr de formule [5], incluzând:

¨ utilizând o matrice de coeficienți de corelație pereche

unde Dr este determinantul matricei coeficienților de corelație a perechilor y ,,

Dr11 - determinant al matricei de corelație între factori;

¨ coeficienți de regresie standardizați și coeficienți de corelare perechi

Pentru un model în care există două variabile independente, formula (3.18) este simplificată

Pătratul coeficientului de corelație multiplu este egal cu coeficientul de determinare R 2. Ca și în cazul regresiei perechilor, R 2 indică calitatea modelului de regresie și reflectă fracțiunea din variația totală a semnului rezultat de y. explicată de schimbarea funcției de regresie f (x) (a se vedea 2.4). În plus, coeficientul de determinare poate fi găsit prin formula

Cu toate acestea, utilizarea R 2 în cazul regresiei multiple nu este complet corectă, deoarece coeficientul de determinare crește cu adăugarea de regresori la model. Acest lucru se datorează faptului că variația reziduală scade atunci când se introduc variabile suplimentare. Și în cazul în care numărul de factori mai aproape de numărul de observații, dispersia reziduală este zero, iar coeficientul de corelație multiplă, și, prin urmare, coeficientul de determinare, se apropie de unitate, cu toate că, în realitate, relația dintre factorii și rezultatul și puterea explicativă a ecuației de regresie poate fi semnificativ mai mică.

Pentru a obține o estimare adecvată a modului în care variația trăsăturii rezultante se datorează variației mai multor trăsături de factor, coeficientul de determinare ajustat

Coeficientul de determinare ajustat este întotdeauna mai mic decât R 2. În plus, spre deosebire de R 2. care este întotdeauna pozitiv, poate avea și o valoare negativă.

Exemplu (continuarea exemplului 1). Calculăm coeficientul de corelație multiplu, conform formulei (3.20):

Amploarea coeficientului de corelație multiplu, egală cu 0,8601, indică o relație puternică între costul transportului și greutatea mărfurilor și distanța la care este transportată.

Coeficientul de determinare este: R 2 = 0,7399.

Coeficientul de determinare ajustat este calculat prin formula (3.22):

Rețineți că valoarea coeficientului de determinare ajustat diferă de valoarea coeficientului de determinare.

Astfel, 70,9% din variația variabilei dependente (costul transportului) se explică prin variația variabilelor independente (greutatea încărcăturii și distanța de transport). Restul de 29,1% din variația variabilei dependente se explică prin factori neprevăzuți în model.

Valoarea coeficientului de determinare ajustat este destul de mare, prin urmare, am putut lua în considerare în model cei mai importanți factori care determină costul transportului. Ñ

Articole similare