Endogenitatea, variabilele instrumentale și metoda generalizată a momentelor (omm)
Până în prezent, sa presupus că reziduurile din modelul de regresie liniară au fost atât necorelate ( „necorelat“), cu variabilele explicative, sau chiar că acestea au fost independente de toate peremennyh1 explicative ^. Ca rezultat, modelul liniar poate fi interpretat ca o descriere a dependenței de așteptare condiționată a yt variabilei dependente de valorile prescrise ale variabilelor explicative Xt. În acest capitol vom discuta cazurile în care este imposibil sau imposibil să se considere variabile explicative în model ca variabile fixe sau exogene. În aceste cazuri, unele dintre variabile explicative pot fi corelate cu restul ecuației, astfel încât estimatorul OLS va fi părtinitoare și inconsistente. Există mai multe motive pentru care se poate argumenta că reziduurile sunt simultan corelate cu una sau mai multe variabile explicative, însă concluzia generală este că linia liniară
Amintiți-vă că independența este o condiție mai strictă decât lipsa corelării (a se vedea apendicele B).
Modelul nu mai corespunde așteptărilor matematice condiționate sau celei mai bune aproximări liniare.
În secțiunea 5.1, începem prin revizuirea proprietăților estimatorului OLS într-un model liniar pentru diferite seturi de ipoteze. Punctul 5.2 discută cazurile în care nu se poate demonstra că estimatorul OLS trebuie să fie imparțial sau consecvent. În astfel de cazuri, trebuie să căutăm estimări alternative. La punctele 5.3 și 5.5 din metoda de estimare a variabilelor instrumentale (MIP-evaluare) întrucât, la punctul 5.6 vom extinde evaluarea clasa MIP, vazandu-le ca un caz special al metodei generalizate a momentelor (GMM), care vă permite să evalueze și modele neliniare. Punctele 5.4 și 5.7 oferă exemple empirice ale randamentelor la educație și evaluarea modelelor de stabilire a prețurilor pentru activele financiare.
5.1. Prezentare generală a proprietăților estimatorului OLS
În capitolele 2 și 4 am văzut că estimatorul OLS b este imparțial
pentru un vector de parametri necunoscuți β, dacă se poate presupune,
că vectorul rămas are un vector mediu zero și un vector de mijloace condiționale care nu depinde de matricea X, adică = 0
(Admiterea (A10) din capitolul 4). Acest lucru sugerează că cunoștințele
oricare dintre variabilele explicative nu este informativă în legătură cu
valoarea așteptărilor matematice ale oricăror reziduuri. Presupunerea independenței matricei X și a vectorului rezidual se mamează împreună
cu ipoteza E = 0 (ipotezele (A1) și (A2) din secțiunea 2.3) înseamnă că E = 0, dar este mai strictă,
deoarece nu permite matricea de covarianță a vectorului rezidual
De asemenea, depind de matricea X.
În multe cazuri, presupunerea că vectorul rămas are o valoare condiționată, independentă de X, este prea strictă. Pentru a ilustra acest lucru, să începem cu un exemplu. Ipoteza unei piețe eficiente (cu venituri așteptate constante) implică faptul că randamentul oricăror active financiare este imprevizibil pentru orice informație disponibilă publicului. Cu așa-numita formă slabă, ipoteza unei piețe eficiente pentru întoarcerea unui activ financiar nu poate fi prezisă din propria lor experiență (a se vedea articolul fundamental (Fama, 1970)). Această ipoteză poate fi testată statistic, utilizând un model de regresie și o testare, indiferent dacă randamentele întârziate explică randamentele curente. Astfel, în model
Vt = Pi + foyt-i + PsVt-2 + eu (5.3)
unde yt denotă randamentul în timpul ciclului £, nul formă ipoteza eficiență slabă înseamnă că / = 2 / PO - 0. Deoarece variabilele explicative sunt rămas variabile dependente (care sunt o funcție a reziduurilor intarziate) E = 0 presupunere este nerealistă. Cu toate acestea, putem face presupunerea mai slab ca estimatorul OLS este consistentă pentru / 3 = (/ Zi, / S2, FPS în notarea unui model mai general (5.1), luați în considerare următorul set de ipoteze:
xt și St sunt independente (pentru fiecare i), (A8) et
unde (All) este o intrare scurtă spunând că rămășițele lui St sunt independente și distribuite în mod identic cu zero și dispersate2 2)
acest lucru a. În anumite condiții suplimentare de regularitate; Estitorul OLS b este consistent pentru vectorul parametrilor necunoscuți β și este distribuit normal asimptotic cu matricea covarianță σ2
J, unde, ca și înainte,
Formal are loc
care corespunde rezultatului (2.74) din Capitolul 2. Astfel, pentru probele mici,
Acest rezultat referitor la OLS alocare este aceeași ca și rezultatul obținut prin ipotezele Gauss-Markov (A1) - (A4) cu presupunerea resturilor normalitate (A5), deși rezultatul (5.5) este valabilă numai aproximează pe baza rezultatelor asimptotice ( 5.4). Acest lucru înseamnă că toate criteriile standard pentru modelul liniar (t-test, F criterii Wald) si testul sunt aproximativ valabile în condițiile în care satisface (A8) și (A 11). Pentru a fi valabil rezultatul distribuției asimptotică (5.4), trebuie să presupunem că vectorul variabilelor explicative xt și restul St independente (pentru toate t). Aceasta înseamnă că dependența vectorului xs de restul st este permisă până când s ^ t. Cel mai important exemplu al acestei situații este includerea unei variabile dependente întârziate. Acest rezultat sugerează că, atâta timp cât rămășițele independente și identic repartizate, în prezența unei variabile dependente decalat în vectorul Xt afectează proprietățile estimatorul OLS este doar pentru eșantioane mici, dar nu afectează distribuția asimptotică. În conformitate cu ipotezele (A8) și (All), estimatorul OLS este consistent și asimptotic eficient.
Ipoteză (AN) exclud prezența autocorelare și heteroscedasticității în reziduu STV exemplul de mai sus, puteți exclude prezența autocorelare, deoarece aceasta încalcă ipoteza pieței eficiente (că randamentul trebuie să fie imprevizibil). Presupunerea homoscedasticității este mai problematică. Heteroskedasticitatea poate să apară dacă este mai probabil ca reziduul să ia valori extreme la valori specifice ale unuia sau mai multor regresoare. În acest caz, variația restului St depinde de vectorul variabilelor explicative xt. În mod similar, perturbarea din seriile de timp financiare, de obicei, au tendința de a se grupeze în timp, adică, cu atât mai probabil ca perturbatii mari vor fi însoțite de tulburări mari în oricare din cele două direcții. De exemplu, după prăbușirea pieței de valori este dificil de prezis, pentru a ridica prețurile sau mai mici de stoc în cicluri ulterioare de timp, și este clar că piața există o mult mai mare incertitudine în această perioadă decât în alte perioade. În acest caz, dispersia erorii Et depinde de perturbările anterioare et-i. Astfel de cazuri sunt numite heteroschedasticitate condiționate, ARCH sau, uneori, acronime sau OARUG care specifică specificația pentru modelarea acestui fenomen ^ 3.
După abandonarea ipotezei (All), nu se mai poate afirma că cr2E
J este matricea de covarianță corespunzătoare și expresia (5.5) este aproximativ validă. Totuși, în general, consistența și normalitatea asimptotică a lui b nu este afectată. În plus, concluzii asimptotice pot fi făcute dacă vom estima matricea covarianței într-un alt mod. Îndepărtați ipotezele (A8) și (All) la ipotezele
E = 0 pentru fiecare £, (A7)
Et sunt serios necorelate.
și au așteptări matematice zero.
Ipoteză (A7) impune condiția ca vectorul explicativ variabile xt necorelat 4) cu Et rezidual, în timp ce ipoteza (A12) admite Heteroskedasticity în reziduu, dar exclude prezența autocorelare. În anumite condiții de regularitate suplimentare, se poate arăta că estimarea celor mai mici pătrate ale b este în concordanță cu vectorul parametru (S și asimptotic normal, și anume
y / T (b0) → H0, S-> SS-i), (5.6)
E plim- et2xtx;
Heteroscedasticitate și SHARP - denumire prescurtată pentru generalizată
discutați acest lucru în capitolul 8.
*) În literatura engleză aceste situații sunt indicate de Archi GARCH-modele, respectiv: .. autoregresiv Condiționat Heteroskedasticity și ARCH generalizate (Nota Nauchn editat de traducere) ..
4) Rețineți că E = cov dacă cel puțin una dintre variabilele xt și zt
are valori medii zero (a se vedea apendicele B).
În acest caz, matricea de covarianță asimptotică poate fi estimată prin metoda White (vezi capitolul 4). În consecință, matricea de covarianță asimptotică
v = J2 x *<Ее*х><(Е ) ' (5-7)
unde denotă OLS estimată a reziduurilor este estimarea consistent pentru adevaratii OLS matrice de covarianță sub ipotezele (A6), (A7) și (A12). Prin urmare, toate criteriile standard pentru modelul liniar este asimptotic valabil în prezența unei specii necunoscute heteroscedasticității dacă statistica critică ajustată prin înlocuirea rating standard, pentru MNC estimare consistentă a matricei de covarianță în heteroskedasticitate prezență (5.7).
Pentru a testa prognozele acestor returnări de cinci ani, să presupunem că evaluăm un model care explică valoarea lui în perioada anterioară de cinci ani (Ui-b)? folosind date pentru fiecare an, adică,
Yt = 65 + 05Yt-5 + eu t = 1. D (ani). (5.8)
Toate observațiile anuale T din eșantion pentru returnările pe cinci ani se regresează la un randament constant și de cinci ani, cu o durată de cinci ani. În acest model, restul este supus autocorelației datorită problemei suprapunerii probelor. Pentru a explica problema probelor suprapuse, să presupunem că modelul următor este valabil pentru returnările anuale
yt = 8r + # iyt_i + ux, (5.9)
unde restul ni nu este supus nici unei autocorelații. Sub ipoteza nulă că # i = 0, se poate arăta că S $ = 55 și 6 $ = 0, în timp ce
În consecință, covarianța dintre St și St-j diferă de la zero până la j <5. Из главы 4 мы знаем, что присутствие автокорреляции делает недействительными обычно вычисляемые стандартные ошибки, включая стандартные ошибки, основанные на состоятельной ковариационной матрице при наличии гетероскедастичности (5.7). Однако если мы можем все еще предположить, что регрессоры одновременно некоррелированны с остатками (условие (А7)) и автокорреляция равна нулю после Н тактов времени, то можно показать, что все результаты, основанные на предположениях (А7) и (12), справедливы, если ковариационная матрица МНК-оценки оценивается с помощью оценки Невье—Веста (Newey, West, 1987), представленной в п. 4.10.2
V * = (j2xtx) TS * (^ xtx> t). (5.10)
= - ^ 2e ^ xtxk + - ^ 2wj eSea (xx'Si + xsxx'8) (5.11)
cu Wj - 1 - j / H. Rețineți că, în exemplul de mai sus, N este egal cu 5. Ca o consecință, în cazul în care Heteroskedasticity și autocorelație (la un număr finit de GAL-uri) criterii standard pentru modelul liniar este asimptotic valabil dacă înlocuim estimarea standard a estimării covarianta în concordanță cu heteroschedasticitate și autocorelația (5.10).
5.2. Cazuri în care nu este posibil să se utilizeze estimatorul OLS
În secțiunea anterioară se arată că ne putem limita la ipoteza (A7), impunând în esență condiția E-0, fără a afecta coerența estimatorului OLS. Dacă autocorelația în restul este limitată în vreun fel, se pot trage concluzii adecvate pentru acest caz, folosind pentru matricea de covarianță estimările White sau Nevier-West. Presupunerea că E-0 spune că restul și variabilele explicative sunt simultan necorelate. Uneori există motive statistice sau economice pentru care nu vrem să impunem această condiție. În astfel de cazuri, nu mai putem argumenta că estimatorul OLS este imparțial sau bine întemeiat și ar trebui să ia în considerare funcțiile alternative de evaluare. Câteva exemple de astfel de situații sunt prezența unei variabile dependente întârziate și prezența autocorelației în restul, erorile de măsurare în regresoare și simultaneitatea sau regresorii endogeni. Acum, să examinăm exemple de astfel de situații.
5.2.7. Autocorelarea reziduurilor și întârzierea
dependentă ca regresor
Să presupunem că modelul de interes pentru noi este dat în formă
Vt = 0i + 02Xt + PsVt-i + (5.12) unde xt este singura variabilă explicativă. Amintiți-vă că pentru moment putem presupune că E = 0 și E = 0 pentru toți E, un estimator OLS pentru vectorul parametrilor necunoscuți / 3 =. R2, P3V este consistent (cu condiția să fie îndeplinite anumite condiții de regularitate). Totuși, să presupunem că restul de Et este supus autocorelației primei ordini, adică
et = pst-i + ni. (5.13) Acum putem rescrie modelul în formă
Vt = 0i + faxt + P3Vi-i + pet-i + vu (5.14) Dar este adevărat că
(5.15) din care rezultă imediat că restul lui St este corelat cu variabila dependentă întârziată yt-iThus, dacă
Se poate observa faptul că, în exemplul de mai sus, modelul de regresie liniară nu se potrivește cu așteptările condiționată de yt variabilă dependentă de variabile explicative specificate xt și cunoștințe yt-iPoskolku rămas dependentă variabila yt-i ne spune ceva despre speranța matematică și reziduul, apoi așteptarea condiționată E este o funcție a variabilei dependente întârziate yt-i-Prin urmare, ultimul termen în expresie
va fi diferit de zero. Din moment ce știm că OLS este în general consecventă în estimarea așteptărilor condiționale, putem presupune că OLS este incontestabil ori de câte ori modelul pe care îl evaluăm nu corespunde așteptărilor matematice condiționale. Acesta este cazul în care variabila dependentă cu întârziere este inclusă în variabilele explicative, iar restul este supusă autocorelației.
5.2.2. Exemplu cu eroare de măsurare
Un alt exemplu în care estimarea OLS este probabil să nu fie posibilă are loc atunci când variabila explicativă este măsurată cu o eroare. Să presupunem că variabila yt depinde de variabila wt în conformitate cu ecuația
yt = Pi + fowt + (5,17)
unde vt este restul cu zero și variația zero <т^. Предполагается, что E = 0, так что модель описывает математическое ожидание зависимой переменной yt при заданном значении переменной wt,
E = 0i + 02Wt De exemplu, putem presupune că variabila dependentă yt denotă economiile familiei și wt denotă venitul disponibil. Presupunem că Wt nu poate fi măsurată cu exactitate (de exemplu, din cauza unui mesaj de informații inexacte) și denotă valoarea măsurată a variabilei explicative wt prin xt. Pentru fiecare observație, variabila explicativă Xt este, prin construcție, valoarea adevărată a Wt plus eroarea de măsurare ut, adică,
Luați în considerare următorul set de ipoteze, care pot fi acceptabile în anumite aplicații. În primul rând, să presupunem că eroarea de măsurare w are un zero și o variație constantă a. În al doilea rând, să presupunem că eroarea de măsurare ui este independentă de restul ui din model. Cea de-a treia și cea mai importantă ipoteză va fi aceea că eroarea de măsurare este independentă de valoarea reală subiacentă a greutății. Aceasta înseamnă că nivelul real al venitului disponibil (în exemplul nostru) nu conține nicio informație despre mărimea, semnul sau valoarea erorii de măsurare. Substituind expresia (5.18) în ecuația (5.17), obținem
Este ușor de observat că Vr = 01 + 02Xt + иi (5.19)
în cazul în care st = u 02SchUravnenie (5.19) este un model liniar în ceea ce privește variabile observabile yt și xt cu restul StEsli folosim datele disponibile pe variabilele observabile yt și xt, și fără îndoială regresia yt pe xt și constantă, atunci OLS estimatorul b este de neconceput pentru vectorul parametrilor necunoscuți 0 = (0, 02), ca xt variabilă observată depinde de erorile de măsurare ni și, prin urmare, de la StTo reziduuri acolo, E / Oi una dintre condițiile necesare pentru viabilitatea b încălcate. Să presupunem că fa> 0. Atunci când eroarea de măsurare în observație este pozitiv, în acest caz, pot apărea două situații: Xt de (5,18) are o componentă r pozitiv și Et al (5,19) are o componentă -faut negativă. Prin urmare, xt și et sunt corelate negativ, E
Pentru a ilustra inadecvarea estimatorului OLS, vom scrie estimatorul OLS al parametrului fa în formă (vezi § 2.1.2),
unde x reprezintă valoarea medie a probei Xt # 9632; Substituirea expresiei (5.19) în expresie (5.20), se poate obține