Și de câte ori am observat coeficienții b0 și b1 în ecuația sunt necunoscute. Folosind OLS, putem găsi evaluarea acestor factori B0 și B1, și scrie următoarea expresie pentru y:
Figura următoare (Figura 4) arată valoarea reală a variabila y, graficul unei funcții de regresie ipotetică (care, în general vorbind, noi nu știm!) Și să programați empirică coeficienții funcției de regresie sunt găsite prin minimizarea sumei erorilor la pătrat.
Figura 4. Diagramele ipotetice și funcții de regresie empirice.
Bazat pe logica acțiunilor noastre, apar două întrebări:
# 9679; Este posibil să se mai mult sau mai puțin probabil să găsească dovezi că forma dependențelor funcționale (atâta timp cât acesta este doar o funcție liniară) este selectat corect.
# 9679; Cât de bine, din punct de vedere statistic, evaluarea parametrilor necunoscuți obținute prin OLS, aduce coeficienții necunoscuți.
Pentru răspunsuri la aceste întrebări, avem nevoie, în special, conceptul de coeficientul de determinare. Înainte de a introduce acest concept, ia în considerare următoarele sume:
Arătăm că poate fi reprezentat ca:
Prin funcția de regresie desemnată obținută prin OLS :.
Arătăm că ultimul termen în (1) este zero, acest lucru îl scrie în forma:
Prin (2), se poate argumenta că acesta este 0. Acum transforma primul termen:
Ambii termeni sunt zero de ecuațiile (2) și (3).
Astfel, am arătat că avem următoarea reprezentare pentru suma în cauză:
Valoarea Ei egală cu:
Vom fi numit reziduu. Prin urmare, primul termen din partea dreaptă (2) este suma pătratelor reziduurilor:
Acesta se numește suma reziduală a pătratelor și medie RSS (residualsumofsquares).
A doua sumă este suma pătratelor abaterilor de puncte situate pe o linie dreaptă de la linia de regresie y =. Această sumă se numește suma pătratului abaterilor, de regresie a explicat SSE (explainedsumofsquares).
Partea stângă a ecuației (2) este suma pătratului abaterilor de la valoarea reală a variabilei y din linia y =. Această sumă se numește suma totală de pătrate și medie TSS (totalsumofsquares).
Astfel, suma totală a pătratelor TSS rupt în două componente:
# 9679; ESS- suma pătratelor datorate influenței factorului principal x;
# 9679; RSS - suma pătratelor datorită influenței altora, inclusiv factori aleatori.
Notă 1. Trebuie amintit că, în literatura de specialitate în Econometrie, în special în [9], aceeași notația este folosită invers, dându-i o altă explicație. Suma, care este notat ca mai sus denotă SSE cherezRSS și decriptate ca: regressionsumofsquares. Pe de altă parte, suma desemnată de noi ca RSS numit SSE. errorsumofsquares. Vom folosi terminologia introdusă mai sus. ▲
Nota 2 .Rassmotrim două cazuri particulare. Să presupunem că x nu are nici un efect asupra y, atunci proba medie condiționată coincide cu proba medie, într-o astfel de situație SSE = 0 și
În cazul în care variabila dependentă y nu afectează alți factori, în plus față de x, suma RSS va fi zero, și se va realiza următoarea ecuație:
În cazul general, în cazul în care parametrii funcției de regresie estimată găsit de MNC, va avea întotdeauna egalitatea (3). ▲
Determinarea Determinarea 1.Parnymkoeffitsientom (opțional) este raportul dintre:
Se spune că „coeficientul de determinare arată proporția valorilor varianței y determinate de (determinate prin) variabilitatea (dispersia) a funcției de regresie corespunzătoare y din x» [1].
Să ilustrăm acest lucru. Pentru aceasta înapoi la ecuația (2) și se împarte ambele părți de n, obținem: