Verificați adecvarea modelului de regresie liniară
Un model de regresie liniară este numit adecvat. Dacă valorile prezise ale variabilei y sunt în concordanță cu rezultatele observațiilor. O estimare brută a adecvării modelului poate fi dată direct din programul reziduurilor, adică de suma pătratelor diferențelor dintre observații și cele corespunzătoare valorilor y obținute din ecuația de regresie.
Dacă modelul este adecvat, reziduurile sunt realizări ale erorilor aleatorii ale observațiilor. care în virtutea ipotezelor sunt independente, au o distribuție normală cu așteptări matematice zero și aceleași variații. Verificarea îndeplinirii acestor ipoteze prin diverse metode statistice sta la baza evaluării adecvării conform schemei de reziduuri.
Să presupunem că pentru unele sau unele valori ale variabilei x există mai multe observații repetate ale variabilei aleatoare y.
Se pot obține observații repetate pentru valorile x1, x2, ..., xm, iar pentru x = xi ni se fac observații. unde = n este mărimea eșantionului observațiilor. Denumiți yij - rezultatele observațiilor repetate ale variabilei y pentru x = xi i = 1,2, ..., m; j = 1,2, ..., ni;
Dacă modelul este adecvat observațiilor. apoi observații de nivel mediu. și anume , i = 1,2, ..., m trebuie să fie aproape de valorile calculate ale y (xi).
În consecință, suma pătratelor Qn = este o măsură a inadecvării modelului.
Suma reziduală a pătratelor Qe poate fi împărțită în două componente:
unde este suma erorii nete
Dacă regresia liniară este adecvată datelor. atunci statisticile Qp și Qn sunt independente și au o distribuție de 2, respectiv, cu grade de libertate m -2 și n-m.
Raportul acestor statistici are o distribuție Fisher, adică
Dacă, atunci modelul este adecvat observațiilor și poate fi folosit ca o estimare a varianței, altfel este necesar să se folosească un alt model (neliniar).
Găsiți estimări ale parametrilor de regresie liniară din următoarele date: