Modelos truncados y censurados - Gabriel Montes
Transcripción
Modelos truncados y censurados - Gabriel Montes
Tobit Modelo de Heckman Modelos truncados y censurados Gabriel V. Montes-Rojas Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit Ejemplo: Horas trabajadas. El número de horas de trabajo no puede ser negativa, h ≥ 0. El valor h = 0 es verdadero. Ejemplo: Cantidad gastada en artı́culos electrónicos (TV, DVD). Puede ser que algunos meses se gaste 0. En ambos casos, el 0 es un valor verdadero. Estos modelos se llaman modelos Tobit de tipo I, a partir de un paper de Tobin (1958) sobre gastos en consumos durables. Consideremos el siguiente modelo de variable latente: y ∗ = x β + u, u |x ∼ N (0, σ2 ) Sin embargo no se observa y ∗ , pero y = max {0, y ∗ } En este caso puede ser que la variale latente no se pueda interpretar, dado que y es interpretable directamente. En este caso y está truncada en 0, o sea, no puede tomar valores negativos. Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit Podrı́amos entonces plantear el siguiente modelo de verosimilitud `i ( β, σ) = 1[yi = 0] log[1 − Φ(x i β/σ)] + 1[yi > 0] log[(1/σ)φ ((yi − x i β)/σ)] Notar que a diferencia del modelo probit, acá sı́ podemos identificar σ. En general para obtener mayor estabilidad en la estimación se usa σ2 como parámetro a estimar: `i ( β, σ) = 1[yi = 0] log[1 − Φ(x i β/σ)] − 1[yi > 0] log(σ2 )/2 + (yi − x i β)2 /2σ2 Hallar las funciones scores (y probar que la esperanza es cero): ∂`i ( β, σ)/∂β = −1[yi = 0]φ(x i β/σ)(x i /σ)[1 − Φ(x i β/σ )] + 1[yi > 0](yi − xi β)xi /σ2 ∂`i ( β, σ )/∂σ2 = 1[yi = 0]φ(x i β/σ )(x i /σ)/{2σ3 [1 − Φ(x i β/σ)]} +1[yi > 0]{(yi − xi β)2 xi /(2σ4 ) − 1/(2σ2 )} Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit Notemos que, E (y |x ) = P [y > 0|x ] × E [y |y > 0, x ] + P [y = 0|x ] × 0 = P [y > 0|x ] × E [y |y > 0, x ] Notar que P [y > 0|x ] = P [u > −x β|x ] = P [u/σ > −x β/σ|x ] = Φ(x β/σ) puede ser estimado con un modelo probit. Necesitamos ciertas herramientas matemáticas. Si z ∼ N (0, 1), entonces E (z |z > c ) = φ(c )/[1 − Φ(c )]. En nuestro caso, E (y |y > 0, x ) = x β + E (u |u > −x β) = x β + σφ(x β)/Φ(x β). (usando propiedades de las variables aleatorias normales, φ(−c ) = φ(c ) y 1 − Φ(−c ) = Φ(c )) Ası́, E (y |y > 0, x ) = x β + σλ(x β/σ) donde λ(.) es la inversa de Mills (inverse Mills ratio) el ratio de pdf y cdf de una normal. Además, E (y |x ) = Φ(x β/σ)E (y |y > 0, x ) = Φ(x β/σ )[x β + σλ(x β/σ)] Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit Efectos marginales Hay dos tipos de efectos marginales de interés para xj contı́nua: ∂E (y |y > 0, x )/∂xj = β j + β j donde dλ dc dλ (x β/σ) dc = −λ(c )[c + λ(c )], entonces = β j {1 − λ(x β/σ) [x β + σλ(x β/σ)]} ∂E (y |x )/∂xj = β j Φ(x β/σ) (luego de simplificar bastante) Notar que si Φ() está cercano a 1, entonces es improbable observar y = 0, y por lo tanto el factor de ajuste se vuelve insignificante. Para variables x que son dummies lo correcto es calcular la diferencia para xj = 1 y xj = 0. Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit STATA tobit y x1 x2 (estimación de modelo tobit) mfx compute, predict(ystar(0,.)) (∂E (y |y > 0, x = x̄ )/∂xj ) mfx compute, predict(e(0,.)) (∂E (y |x = x̄ )/∂xj ) http://www.stata.com/manuals13/rtobit.pdf Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo Tobit Ejemplo: Oferta de trabajo de las mujeres casadas http://fmwww.bc.edu/gstat/examples/wooldridge/wooldridge17.html http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter16.htm Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo de selección muestral Supongamos un modelo donde las observaciones están censuradas, y usemos una variable si que =1 si la observacin se observa, =0 si no se observa. Entonces nuestra muestra aleatoria es {si , yi , x i }N i =1 . La condición para que la censura no nos afecte los resultados de la regresión es E (x 0 u |s = 1) = 0. Tenemos que evaluar cómo es el mecanismo de selección. Dos modelos: (i) missing completely at random (MCAR) cuando s es independiente de (y , x ), (ii) missing at random (MAR) cuando s es independiente de u pero no de x (también llamada selección en observables). Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo de selección muestral Consideremos el siguiente modelo: 1. La ecuación de resultados (outcome equation) es y ∗ = x β + u, E (u |x ) = 0 Sin embargo, sólo observamos la variable dependiente si ocurre un mecanismo de “selección”. 2. La ecuación de selección es z γ + v > 0, entonces y = y ∗ × 1[z γ + v > 0] Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo de selección muestral Bajo ciertas condiciones el estimador de MCO es sesgado. ¿Cuáles? Asumamos que u y v están i.e. corr (u, v ) = ρ. También correlacionados, 0 σu2 ρσu (u, v ) ∼ Normal , . 0 ρσu 1 Ası́, E (y |y > 0, x ) = E (y |y > 0, x, z γ + v > 0) = x β + E (u |z γ + v > 0) = x β + ρσu λ(z γ) Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Modelo de selección muestral De esta manera tenemos ∂E (y |y > 0, x )/∂xj = β j + ρσu ∂λ(z γ)/∂xj Esto nos dice que el sesgo de selección se puede ver como un problema de variables omitidas. Esto también sugiere una forma el estimar el modelo en dos etapas, el estimador Heckit: 1 Modelo probit para estimar γ: P (y > 0|z ) = Φ(zγ), usando TODAS las observaciones i = 1, 2, ..., N. Construir λ̂i = λ(zi γ̂). 2 Correr un modelo MCO para las observaciones con yi > 0 usando yi = βxi + δλ̂i Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Heckman, J. (1979) “Sample selection bias as a specification error.” Econometrica 47, 153–161. Gabriel Montes-Rojas Modelos truncados y censurados Tobit Modelo de Heckman Sample selection models STATA Dos maneras de estimar el modelo (ver http://www.stata.com/manuals13/rheckman.pdf): 1 MLE: heckman y x1 x2, select(c= z1 z2) 2 Heckman’s two-step estimator: heckman y x1 x2, select(c= z1 z2) twostep Ver: http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter17.htm Gabriel Montes-Rojas Modelos truncados y censurados