Modelos truncados y censurados - Gabriel Montes

Transcripción

Modelos truncados y censurados - Gabriel Montes
Tobit
Modelo de Heckman
Modelos truncados y censurados
Gabriel V. Montes-Rojas
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
Ejemplo: Horas trabajadas. El número de horas de trabajo no puede ser
negativa, h ≥ 0. El valor h = 0 es verdadero.
Ejemplo: Cantidad gastada en artı́culos electrónicos (TV, DVD). Puede ser que
algunos meses se gaste 0.
En ambos casos, el 0 es un valor verdadero. Estos modelos se llaman modelos
Tobit de tipo I, a partir de un paper de Tobin (1958) sobre gastos en consumos
durables.
Consideremos el siguiente modelo de variable latente:
y ∗ = x β + u, u |x ∼ N (0, σ2 )
Sin embargo no se observa y ∗ , pero
y = max {0, y ∗ }
En este caso puede ser que la variale latente no se pueda interpretar, dado que y
es interpretable directamente.
En este caso y está truncada en 0, o sea, no puede tomar valores negativos.
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
Podrı́amos entonces plantear el siguiente modelo de verosimilitud
`i ( β, σ) = 1[yi = 0] log[1 − Φ(x i β/σ)] + 1[yi > 0] log[(1/σ)φ ((yi − x i β)/σ)]
Notar que a diferencia del modelo probit, acá sı́ podemos identificar σ. En
general para obtener mayor estabilidad en la estimación se usa σ2 como
parámetro a estimar:
`i ( β, σ) = 1[yi = 0] log[1 − Φ(x i β/σ)] − 1[yi > 0] log(σ2 )/2 + (yi − x i β)2 /2σ2
Hallar las funciones scores (y probar que la esperanza es cero):
∂`i ( β, σ)/∂β = −1[yi = 0]φ(x i β/σ)(x i /σ)[1 − Φ(x i β/σ )] + 1[yi > 0](yi − xi β)xi /σ2
∂`i ( β, σ )/∂σ2 = 1[yi = 0]φ(x i β/σ )(x i /σ)/{2σ3 [1 − Φ(x i β/σ)]}
+1[yi > 0]{(yi − xi β)2 xi /(2σ4 ) − 1/(2σ2 )}
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
Notemos que,
E (y |x ) = P [y > 0|x ] × E [y |y > 0, x ] + P [y = 0|x ] × 0
= P [y > 0|x ] × E [y |y > 0, x ]
Notar que P [y > 0|x ] = P [u > −x β|x ] = P [u/σ > −x β/σ|x ] = Φ(x β/σ)
puede ser estimado con un modelo probit.
Necesitamos ciertas herramientas matemáticas. Si z ∼ N (0, 1), entonces
E (z |z > c ) = φ(c )/[1 − Φ(c )]. En nuestro caso,
E (y |y > 0, x ) = x β + E (u |u > −x β) = x β + σφ(x β)/Φ(x β). (usando
propiedades de las variables aleatorias normales, φ(−c ) = φ(c ) y
1 − Φ(−c ) = Φ(c ))
Ası́,
E (y |y > 0, x ) = x β + σλ(x β/σ)
donde λ(.) es la inversa de Mills (inverse Mills ratio) el ratio de pdf y cdf de una
normal.
Además,
E (y |x ) = Φ(x β/σ)E (y |y > 0, x ) = Φ(x β/σ )[x β + σλ(x β/σ)]
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
Efectos marginales
Hay dos tipos de efectos marginales de interés para xj contı́nua:
∂E (y |y > 0, x )/∂xj = β j + β j
donde
dλ
dc
dλ
(x β/σ)
dc
= −λ(c )[c + λ(c )], entonces
= β j {1 − λ(x β/σ) [x β + σλ(x β/σ)]}
∂E (y |x )/∂xj = β j Φ(x β/σ)
(luego de simplificar bastante)
Notar que si Φ() está cercano a 1, entonces es improbable observar y = 0, y por
lo tanto el factor de ajuste se vuelve insignificante.
Para variables x que son dummies lo correcto es calcular la diferencia para
xj = 1 y xj = 0.
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
STATA
tobit y x1 x2 (estimación de modelo tobit)
mfx compute, predict(ystar(0,.)) (∂E (y |y > 0, x = x̄ )/∂xj )
mfx compute, predict(e(0,.)) (∂E (y |x = x̄ )/∂xj )
http://www.stata.com/manuals13/rtobit.pdf
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo Tobit
Ejemplo: Oferta de trabajo de las mujeres casadas
http://fmwww.bc.edu/gstat/examples/wooldridge/wooldridge17.html
http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter16.htm
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo de selección muestral
Supongamos un modelo donde las observaciones están censuradas, y usemos
una variable si que =1 si la observacin se observa, =0 si no se observa.
Entonces nuestra muestra aleatoria es {si , yi , x i }N
i =1 .
La condición para que la censura no nos afecte los resultados de la regresión es
E (x 0 u |s = 1) = 0.
Tenemos que evaluar cómo es el mecanismo de selección. Dos modelos: (i)
missing completely at random (MCAR) cuando s es independiente de (y , x ), (ii)
missing at random (MAR) cuando s es independiente de u pero no de x
(también llamada selección en observables).
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo de selección muestral
Consideremos el siguiente modelo:
1. La ecuación de resultados (outcome equation) es
y ∗ = x β + u, E (u |x ) = 0
Sin embargo, sólo observamos la variable dependiente si ocurre un mecanismo de
“selección”.
2. La ecuación de selección es
z γ + v > 0,
entonces
y = y ∗ × 1[z γ + v > 0]
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo de selección muestral
Bajo ciertas condiciones el estimador de MCO es sesgado. ¿Cuáles?
Asumamos que u
y v están
i.e. corr (u, v ) = ρ. También
correlacionados,
0
σu2
ρσu
(u, v ) ∼ Normal
,
.
0
ρσu
1
Ası́,
E (y |y > 0, x ) = E (y |y > 0, x, z γ + v > 0) = x β + E (u |z γ + v > 0)
= x β + ρσu λ(z γ)
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Modelo de selección muestral
De esta manera tenemos
∂E (y |y > 0, x )/∂xj = β j + ρσu ∂λ(z γ)/∂xj
Esto nos dice que el sesgo de selección se puede ver como un problema de variables
omitidas. Esto también sugiere una forma el estimar el modelo en dos etapas, el
estimador Heckit:
1
Modelo probit para estimar γ: P (y > 0|z ) = Φ(zγ), usando TODAS las
observaciones i = 1, 2, ..., N. Construir λ̂i = λ(zi γ̂).
2
Correr un modelo MCO para las observaciones con yi > 0 usando
yi = βxi + δλ̂i
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Heckman, J. (1979) “Sample selection bias as a specification
error.” Econometrica 47, 153–161.
Gabriel Montes-Rojas
Modelos truncados y censurados
Tobit
Modelo de Heckman
Sample selection models
STATA
Dos maneras de estimar el modelo (ver
http://www.stata.com/manuals13/rheckman.pdf):
1
MLE: heckman y x1 x2, select(c= z1 z2)
2
Heckman’s two-step estimator: heckman y x1 x2, select(c= z1 z2)
twostep
Ver: http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter17.htm
Gabriel Montes-Rojas
Modelos truncados y censurados