Coeficient de corelație multiplu
Coeficientul de corelație multiplă este utilizată ca o măsură a gradului de apropiere a relației statistice dintre indicele rezultant ?? cm (variabila dependentă) y și un set de motive variabile (independente) sau, cu alte cuvinte, se evaluează gradul de apropiere a factorilor de influență în comun asupra rezultatului.
Coeficientul de corelare multiplu trebuie calculat dintr-un număr de formule [5], inclusiv:
¨ utilizând o matrice de coeficienți de corelație pereche
unde Dr este determinantul matricei coeficienților de corelație a perechilor y ,,
Dr11 - determinant al matricei de corelație între factori;
¨ coeficienți de regresie standardizați și coeficienți de corelare perechi
Pentru un model în care există două variabile independente, formula (3.18) este simplificată
Pătratul coeficientului de corelație multiplă egal cu coeficientul determinatsiiR 2. Ca și în cazul regresiei aburului, R2 indică un model de regresie și reprezintă fracțiunea din variația totală a caracteristica rezultată y. explicată de schimbarea funcției de regresie f (x) (vezi 2.4). În același timp, coeficientul de determinare ar trebui să fie găsit prin formula
Utilizarea R 2, în cazul de regresie multiplă nu este în întregime corectă, deoarece coeficientul de determinare este crescută prin adăugarea covariate în model. Acest lucru se datorează faptului că varianța reziduală scade atunci când sunt introduse variabile suplimentare. Și în cazul în care numărul de factori mai aproape de numărul de observații, dispersia reziduală este zero, iar coeficientul de corelație multiplă, și, prin urmare, coeficientul de determinare, se apropie de unitate, cu toate că, în realitate, relația dintre factorii și rezultatul și puterea explicativă a ecuației de regresie sunt mult mai mici.
Pentru a obține o estimare adecvată a modului în care variația trăsăturii rezultante se datorează variației mai multor trăsături de factor, coeficientul de determinare ajustat
Coeficientul de determinare ajustat este încă mai mic decât R 2. Totuși, spre deosebire de R 2. care este întotdeauna pozitiv, poate avea o valoare negativă.
Exemplu (continuarea exemplului 1). Calculăm coeficientul de corelație multiplu, conform formulei (3.20):
Mărimea coeficientului de corelație multiplu, egală cu 0,8601, indică o relație puternică între costul transportului și greutatea încărcăturii și distanța, prin transportul acesteia.
Coeficientul de determinare este: R 2 = 0,7399.
Coeficientul de determinare ajustat este calculat prin formula (3.22):
Rețineți că valoarea coeficientului de determinare ajustat diferă de valoarea coeficientului de determinare.
Tᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, variația de 70,9% a variabilei dependente (costul transportului) se explică prin variația variabilelor independente (greutatea încărcăturii și distanța de transport). Restul de 29,1% din variația variabilei dependente se explică prin factori neprevăzuți în model.
Valoarea coeficientului de determinare ajustat este destul de mare, prin urmare, am putut lua în considerare în model cei mai importanți factori care determină costul transportului. Ñ