Amintiți-vă că, în cazul cenzurării variabilei dependente yt în loc de valorile sale de mai sus (sau de mai jos) un anumit nivel, acest nivel în sine este luat în considerare.
De exemplu, dacă cererea de bilete este semnificativ mai mare decât oferta, atunci numărul de bilete vândute (cenzurarea de sus) este considerat ca fiind nivelul cererii. În acest caz, distribuția variabilei aleatoare poate fi reprezentată ca o combinație a distribuțiilor discrete și continue (a se vedea Figura 10.9).
Fig. 10.9. Distribuție, cenzurat "de sus"
Abordările studiului probelor cenzurate și trunchiate sunt foarte asemănătoare. De asemenea, se presupune că variabila aleatoare y are o distribuție normală.
Să arătăm cum se schimbă așteptarea și varianța variabilei aleatoare y. Dacă selecția valorilor sale este cenzurată de jos.
Introducem o nouă variabilă aleatoare y *. astfel încât
unde b este punctul de cenzură.
N [m, s 2], atunci așteptarea și varianța variabilei aleatorii censurate y sunt, respectiv, *
Pentru a descrie dependența variabilei cenzurate yt de factorii care o influențează, se folosește în mod obișnuit modelul așa-numit tobită.
Modelul Tobit presupune că variabila cenzurată yt este descrisă de următoarea expresie:
unde yt sunt valorile observate ale variabilei dependente (de exemplu, fie cheltuielile efective în concediu în străinătate, fie 0); xt este un vector al variabilelor independente care afectează variabila dependentă yt. a este un vector de parametri; et este eroarea de model.
Din expresia (10.159) rezultă că așteptarea matematică condiționată a variabilei yt în termeni de factori xt este definită ca
Bazate așteptare censurat yt (.. M e M [yt prețurile]) pentru punctul cenzurării b = 0 sunt determinate după cum urmează (vezi expresia (10.154).)
Conform expresiei (10.160), efectele marginale ale factorilor xt pentru așteptarea matematică a variabilei yt (fără cenzurare) sunt definite ca
Conform expresiei (10.161), efectele marginale ale factorilor xt pentru așteptarea matematică a variabilei yt, luând în considerare cenzura, pot fi reprezentate în următoarea formă:
Rețineți că Tobit-model presupune că modificarea factorilor conduce la xt faptul că probabilitatea P (yt> 0), și așteptarea lui M (yt | yt> 0) asigurați-vă că pentru a schimba în aceeași direcție. Într-adevăr, conform expresiei (10.156), probabilitatea ca yt> 0 să fie definită ca
Corespunzător, efectul marginal al factorilor xt pentru probabilitatea P (yt> 0) poate fi reprezentat în următoarea formă:
Dacă coeficientul de ai este pozitiv, atunci, conform ecuațiilor (10.164) și (10.166), cu creșterea factorului lovit (i = 1,2 n; t = 1,2 T ..) Crește ca așteptările M (yt | yt> 0) sau și probabilitatea P (yt> 0), și invers, pentru un negativ ai, cu o creștere a factorului xit, acești indicatori scad.
În același timp, observăm că efectul unei creșteri simultane a așteptărilor matematice și a probabilității cu creșterea unui factor independent xi în practică nu poate avea loc. În special, așa cum au arătat Finn și Schmidt (1984), variabila independentă xi. care crește probabilitatea de observare necenzurate (P (yt> 0)), nu întotdeauna mărește așteptările matematice ale variabilei (M (yt | yt> 0)). De exemplu, acestea duc la pierderi cauzate de incendiile din clădiri. Riscul de incendiu într-o clădire veche de mai sus, astfel ¶P (yt> 0) / ¶hit> 0 (hit - vârsta T-lea al clădirii), ci ca vechea clădire este mai ieftin, iar apoi foc-l aduce mai puține pierderi atât. adică, ¶M (yt | yt> 0) / ¶xit <0. Таким образом, в данной задаче предполагается, что коэффициент ai при факторе “возраст здания” имеет разные знаки в функциях вероятности и математического ожидания. В рамках tobit -модели это учесть невозможно.
Pentru a descrie procesul în care nu este îndeplinită prezumția de aceeași natură a efectului marginal al probabilității și așteptări matematice, a fost oferit un model mai general, care este o combinație de uni-dimensional model probit și regresie trunchiată (valori cenzurate pentru variabila dependentă).
Pe baza modelului probit, probabilitatea observării necenzurate (sau cenzurate) este determinată pentru un anumit set de factori xt.
unde F (g xt) este funcția integrală a legii distribuției normale, care determină probabilitatea observării necenzurate; g este vectorul parametrilor modelului, zt este variabila indicator care ia valoarea 1 pentru observația necenzurate și valoarea 0 pentru cea cenzurată.
În plus, pe baza modelului de regresie trunchiată, se determină așteptările matematice ale observațiilor necenzurate. În conformitate cu expresia (10.150), așteptarea matematică a unei variabile neîncărcate poate fi reprezentată în următoarea formă: