Dacă vă uitați la imprimarea ecuațiilor de regresie, aproape sigur veți găsi un indicator lângă coeficientul R2, care se numește factorul R2 ajustat (R2 ajustat). Uneori este numit și coeficientul "corectat" al R2, deși această definiție nu înseamnă, în opinia multora, că un astfel de coeficient este îmbunătățit comparativ cu cel obișnuit.
După cum se menționează în secțiunea 5.2, atunci când se adaugă o variabilă explicativă la ecuația de regresie, coeficientul A2 nu scade niciodată, dar crește de obicei. Coeficientul ajustat R2, care este de obicei marcat cu
-2
R. prevede o compensare pentru o astfel de schimbare automată în sus prin impunerea unei "sancțiuni" pentru creșterea numărului de variabile independente. Acest coeficient este definit după cum urmează:
R2 = 1 - (1 - R2) "1 =" 1 R2 = R2 - (1 - R2)
n-k- \ n-k- \ n-k-l n-k-l
unde k este numărul variabilelor independente. Odată cu creșterea k, raportul la / (n - k - 1) crește și, prin urmare, mărimea corecției coeficientului R2 scade.
Se poate demonstra că adăugarea unei noi variabile la regresie va avea ca rezultat
-2
la o creștere în R. dacă și numai dacă statistica corespunzătoare / este mai mare
2
unități (sau mai puțin de -1). Prin urmare, o creștere a R când se adaugă
Noua variabilă nu înseamnă neapărat că coeficientul său este semnificativ diferit de zero. Prin urmare, nu se va urma, așa cum s-ar aștepta, că o creștere a R înseamnă o îmbunătățire a specificației ecuației.
Acesta este unul dintre motivele pentru care R2 nu a devenit utilizat pe scară largă ca valoare diagnostică. Un alt motiv este acela de a reduce atenția asupra coeficientului R2 însuși.
exerciții
- Valoarea coeficientului R2 în regresia logaritmică între cheltuielile pentru alimente, venitul personal disponibil și prețul relativ al alimentelor (vezi ecuația 5.26) a fost de 0.9867. Verificați dacă criteriul F este de aproximativ 820.1 și evaluați semnificația acestuia (820.1 este valoarea reală a criteriului F, numărul pe care îl calculați pe baza coeficientului R2 va fi diferit față de această valoare datorită erorii de rotunjire).
- Verificați dacă criteriul regresiei corespunzătoare pentru produsul pe care l-ați selectat (a se vedea Exercițiul 5.6) a fost corect calculat pe baza coeficientului R2 și verificați relevanța acestuia.
- Suma pătratelor abaterii în regresia din exercițiul 5.6 a fost mai mică decât cea obținută în estimarea dependenței de regresie a costurilor pentru produsul pe care l-ați ales din venitul personal disponibil în Exercițiul 4.2. Utilizați testul F pentru a evalua semnificația reducerii cantității indicate. Acest test este echivalent cu un test pe care l-ați efectuat deja; explicați ce test este implicat și verificați identitatea concluziilor trase.
b