Propuesta de solución: ejercicio C3.9 (Wooldridge, 2010)
Transcripción
Propuesta de solución: ejercicio C3.9 (Wooldridge, 2010)
Propuesta de solución: ejercicio C3.9 (Wooldridge, 2010) Fortino Vela Peón [email protected] Octubre, 2011 F. VELA Ejercicio C3.9. Wooldridge (2010) Contains data from C:\FVELA\DATOS STATA\WOOLDRIGE\charity.dta obs: 4,268 vars: 8 5 Apr 2008 16:22 size: 110,968 (99.8% of memory free) -----------------------------------------------------------------------------storage display value variable name type format label variable label -----------------------------------------------------------------------------respond byte %9.0g =1 if responded with gift gift int %9.0g amount of gift, Dutch guilders resplast byte %9.0g =1 if responded to most recent mailing weekslast float %9.0g number of weeks since last response propresp float %9.0g response rate to mailings mailsyear float %9.0g number of mailings per year giftlast int %9.0g amount of most recent gift avggift float %9.0g average of past gifts -----------------------------------------------------------------------------Sorted by: F. VELA i) gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u Modelo 1 gift = βo + β1 mailsyear+ u Modelo 2 ---------------------------------Variable | model1 model2 -------------+-------------------mailsyear | 2.1663 2.6495 | 0.3319 0.3431 | 0.0000 0.0000 giftlast | 0.0059 | 0.0014 | 0.0000 propresp | 15.3586 | 0.8745 | 0.0000 _cons | -4.5515 2.0141 | 0.8030 0.7395 | 0.0000 0.0065 -------------+-------------------N | 4268 4268 r2 | 0.0834 0.0138 r2_a | 0.0827 0.0136 ---------------------------------legend: b/se/p F. VELA ii) En el modelo 1, al aumentar en una unidad el número de envíos (correos) al año, el monto de las donaciones aumenta en promedio 2.17 florines, manteniendo al resto de las variables constantes. Por su parte, en el modelo 2, al aumentar en una unidad el número de enviós al año, el monto de las donaciones aumenta en promedio 2.65 florines. Se observa que βˆ1 MODELO 2 > βˆ1 MODELO 1 (2.65>2.17) F. VELA iii) gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u En el modelo 1, al aumentar en 1% la tasa de respuesta de los correos, en promedio, las donaciones aumentan en aproximadamente 15.36 florines, ceteris paribus. F. VELA iv) gift = βo + β1 mailsyear+ β2 giftlast + β3 propresp+ β4 avggift+ u -------------------------------------------Variable | model1 model2 model3 -------------+-----------------------------mailsyear | 2.1663 2.6495 1.2012 | 0.3319 0.3431 0.3124 | 0.0000 0.0000 0.0001 giftlast | 0.0059 -0.2609 | 0.0014 0.0108 | 0.0000 0.0000 propresp | 15.3586 16.2046 | 0.8745 0.8175 | 0.0000 0.0000 avggift | 0.5269 | 0.0211 | 0.0000 _cons | -4.5515 2.0141 -7.3278 | 0.8030 0.7395 0.7582 | 0.0000 0.0065 0.0000 -------------+-----------------------------N | 4268 4268 4268 r2 | 0.0834 0.0138 0.2005 r2_a | 0.0827 0.0136 0.1998 -------------------------------------------legend: b/se/p Se puede observar que el efecto parcial de mailsyear disminuye. F. VELA v) gift = βo + β1 mailsyear+ β2 giftlast + β3 propresp+ β4 avggift+ u -------------------------------------------Variable | model1 model2 model3 -------------+-----------------------------mailsyear | 2.1663 2.6495 1.2012 | 0.3319 0.3431 0.3124 | 0.0000 0.0000 0.0001 giftlast | 0.0059 -0.2609 | 0.0014 0.0108 | 0.0000 0.0000 propresp | 15.3586 16.2046 | 0.8745 0.8175 | 0.0000 0.0000 avggift | 0.5269 | 0.0211 | 0.0000 _cons | -4.5515 2.0141 -7.3278 | 0.8030 0.7395 0.7582 | 0.0000 0.0065 0.0000 -------------+-----------------------------N | 4268 4268 4268 r2 | 0.0834 0.0138 0.2005 r2_a | 0.0827 0.0136 0.1998 -------------------------------------------legend: b/se/p Por su parte, el efecto parcial de la variable giftlast no solo cambia de valor sino que también de signo. F. VELA Examínenos algunos aspectos del modelo con ayuda de lo señalado en Wooldridge (2010) y Stata. F. VELA Matriz de diagramas de dispersión 0 2 4 0 .5 1 300 amount of gift, Dutch guilders 200 100 0 4 number of mailings per year 2 0 10000 amount of most recent gift 5000 0 1 response rate to mailings .5 0 6000 average of past gifts 0 100 200 300 0 5000 10000 0 2000 4000 4000 2000 0 6000 50 100 150 200 250 0 0 50 100 150 200 250 F. VELA 0 1 2 3 number of mailings per year 0 2000 4000 6000 8000 amount of most recent gift amount of gift, Dutch guilders 10000 Fitted values 0 0 50 100 150 200 250 Fitted values 50 100 150 200 250 amount of gift, Dutch guilders 4 0 .2 .4 .6 .8 response rate to mailings amount of gift, Dutch guilders 1 Fitted values 0 1000 2000 3000 4000 average of past gifts amount of gift, Dutch guilders 5000 Fitted values F. VELA reg gift mailsyear giftlast propresp avggift Source | SS df MS -------------+-----------------------------Model | 194137.386 4 48534.3466 Residual | 773962.453 4263 181.553472 -------------+-----------------------------Total | 968099.84 4267 226.880675 Number of obs F( 4, 4263) Prob > F R-squared Adj R-squared Root MSE = = = = = = 4268 267.33 0.0000 0.2005 0.1998 13.474 -----------------------------------------------------------------------------gift | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------mailsyear | 1.201168 .312418 3.84 0.000 .5886665 1.81367 giftlast | -.2608573 .0107565 -24.25 0.000 -.2819456 -.239769 propresp | 16.20464 .8175292 19.82 0.000 14.60186 17.80743 avggift | .5269471 .0210811 25.00 0.000 .4856172 .5682769 _cons | -7.327763 .75822 -9.66 0.000 -8.814269 -5.841257 ------------------------------------------------------------------------------ vif Variable | VIF 1/VIF -------------+---------------------avggift | 64.70 0.015457 giftlast | 64.66 0.015466 mailsyear | 1.02 0.978145 propresp | 1.01 0.991483 -------------+---------------------Mean VIF | 32.85 F. VELA | gift mailsy~r giftlast propresp avggift -------------+--------------------------------------------gift | 1.0000 | | mailsyear | 0.1174 1.0000 | 0.0000 | giftlast | 0.0579 0.0063 1.0000 | 0.0002 0.6820 | propresp | 0.2654 0.0814 -0.0130 1.0000 | 0.0000 0.0000 0.3943 | avggift | 0.1004 0.0213 0.9921 -0.0168 1.0000 | 0.0000 0.1634 0.0000 0.2713 F. VELA -200 Leverage .4 .6 .2 0 -100 Residuals 0 100 .8 200 1 Valores atípicos y leverage 0 .02 .04 Normalized residual squared .06 F. VELA Especificación del modelo Tres son las características esenciales de considerar al momento de elegir un modelo: la forma funcional; la selección de las variables o regresores del modelo; y el cumplimiento de los supuestos sobre los que se sustenta el modelo. Vamos a referirnos a las dos primeras. F. VELA Forma funcional Aunque intervienen aspectos teóricos, la elección de la forma funcional de la ecuación de regresión es más un “arte” que una “ciencia”. Una ayuda indispensable son los diagramas de dispersión. Existe una prueba que también nos auxilia a resolver este punto: la prueba RESET de Ramsey. F. VELA Prueba RESET Diseñada para verificar error de especificación en la forma funcional plantada por el modelo pero NO como una prueba de variables omitidas. F. VELA El procedimiento es el siguiente: H0: Forma funcional es adecuada vs H1: La forma funcional no es adecuada Estime el modelo de regresión suponiendo que la forma funcional es la correcta. Obtenga los valores Yˆ . Calcule el cuadrado y cubo de estos valores (esto es, Yˆ 2y Yˆ 3 ), y agréguese al modelo como variables independientes. Estime el nuevo modelo y pruebe la significancia conjunta de los coeficientes asociados a las nuevas variables. F. VELA De esta manera, para el ejemplo considerado, se tiene: gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift+ u …(1) gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift γ 1 Ŷ2 + γ 2 Ŷ3 + u Al modelo (2) se le denomina el modelo no restringido, mientras que al modelo (1) el modelo restringido. La restricción impuesta en (1) es que γ1=γγ2=0 …(2) F. VELA H0: Forma funcional es adecuada vs H1: La forma funcional no es adecuada equivalentes H0: γ1=γγ2=0 vs H1: cualquier otra cosa El estadístico de prueba apropiado para este contraste de hipótesis esta dado por: (SCER − SCENR ) / M F= SCENR /(n − k ) donde M= # de restricciones; n= # obs. y k= # coeficientes del modelo no restringido. F. VELA H0: γ1=γγ2=0 vs ---------------------------------Variable | full restr~o -------------+-------------------mailsyear | 1.2012 0.7016 | 0.3124 0.3010 | 0.0001 0.0198 giftlast | -0.2609 -0.2545 | 0.0108 0.0251 | 0.0000 0.0000 propresp | 16.2046 11.3160 | 0.8175 1.0663 | 0.0000 0.0000 avggift | 0.5269 0.5128 | 0.0211 0.0503 | 0.0000 0.0000 yhat2 | 0.0195 | 0.0028 | 0.0000 yhat3 | -0.0001 | 0.0000 | 0.0000 _cons | -7.3278 -5.3312 | 0.7582 0.8976 | 0.0000 0.0000 -------------+-------------------N | 4268 4268 r2 | 0.2005 0.2647 r2_a | 0.1998 0.2637 rss | 7.7e+05 7.1e+05 ---------------------------------legend: b/se/p H1: cualquier otra cosa (SCER − SCENR ) / M F= SCENR /(n − k ) (773962.453− 711805.636) / 2 = 711805.636/(4268 − 7) = 186.04109 Regla de decisión Rechazar Ho ssi Fc > Ft donde Ft=F(2-4261)=3.00 F. VELA Otra versión de la prueba sería: gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift+ u …(1) gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift γ 1 Ŷ2 + γ 2 Ŷ3 + γ 3 Ŷ4 + u Técnicamente no hay problema pero consume más grados de libertad y la prueba pierde potencia en la medida que se agregan más términos. A esta versión se le suele denominar RESET(3), ya que se tienen tres restricciones. La anterior versión, por ende, sería RESET(2). …(2) F. VELA ---------------------------------Variable | full1 restr~o -------------+-------------------mailsyear | 0.4665 0.7016 | 0.3076 0.3010 | 0.1294 0.0198 giftlast | -0.1581 -0.2545 | 0.0367 0.0251 | 0.0000 0.0000 propresp | 6.4374 11.3160 | 1.7250 1.0663 | 0.0002 0.0000 avggift | 0.3175 0.5128 | 0.0740 0.0503 | 0.0000 0.0000 yhat2 | 0.0430 0.0195 | 0.0071 0.0028 | 0.0000 0.0000 yhat3 | -0.0005 -0.0001 | 0.0001 0.0000 | 0.0000 0.0000 yhat4 | 0.0000 | 0.0000 | 0.0003 _cons | -2.4573 -5.3312 | 1.2011 0.8976 | 0.0408 0.0000 -------------+-------------------N | 4268 4268 r2 | 0.2670 0.2647 r2_a | 0.2658 0.2637 rss | 7.1e+05 7.1e+05 ---------------------------------legend: b/se/p (SCER − SCENR ) / M F= SCENR /(n − k ) (773962.453− 709653.024) / 3 = 709653.024/(4268 − 8) = 128.68174 Regla de decisión Rechazar Ho ssi Fc > Ft donde Ft=F(3,4260)=3.00. La decisión sería la misma, Rechazar Ho. F. VELA RESET(3) es la versión que por default tiene integrada Stata en sus rutinas. quietly reg gift mailsyear giftlast propresp avggift estat ovtest Ramsey RESET test using powers of the fitted values of gift Ho: model has no omitted variables F(3, 4260) = 128.68 Prob > F = 0.0000 Pero observe lo que se señala en Ho. Tenga cuidado. F. VELA SELECCIÓN DE REGRESORES Dos casos: Omitir variables relevantes. Incluir variables irrelevantes. Cada uno tiene diferentes implicaciones sobre el modelo. En el caso de omisión los estimadores son sesgados. F. VELA OMISIÓN DE VARIABLES Sea Yi = β1 + β2 X 2i + β3 X 3i + ui …(1) modelo real Yi = β1 + β2 X 2i + vi …(2) modelo estimado donde vi = β3 X 3i + ui βˆ2 = ∑ ( X 2i − X 2 )(Yi − Y ) 2 ( X − X ) ∑ 2i 2 …(3) …(4) Recordemos que, en general, n ∑( X i − X ) = 0 i =1 …(5) F. VELA Reescribiendo a (4) se tiene ( X 2i − X 2 )Yi − Y ∑( X 2i − X 2 ) ∑ βˆ2 = 2 ( X − X ) ∑ 2i 2 Tomando en cuenta (5) queda como ( X 2i − X 2 ) ( X 2i − X 2 )Yi ∑ β̂2 = = ∑ Y = ∑ wiYi 2 2 i ∑( X 2i − X 2 ) ∑ ( X 2i − X 2 ) …(6) donde ( X 2i − X 2 ) wi = 2 ( X − X ) ∑ 2i 2 …(7) F. VELA Por lo tanto (6) es β̂2 = ∑ wiYi …(6) Recuerde también que wi presenta las propiedades ∑ wi = 0 …(7’) ∑ wi X i =1 …(7’’) Sustituyendo a (2) en (6) se tiene βˆ2 = ∑ wi (β1 + β2 X 2i + vi ) = β1 ∑ wi + β2 ∑ wi X 2i + ∑ wi vi βˆ2 = β2 + ∑ wi vi …(8) F. VELA Ahora sustituyendo (3) en (8) βˆ2 = β2 + ∑ wi vi = β2 + ∑ wi (β3 X 3i + ui ) =β2 + β3 ∑ wi X 3i + ∑ wiui …(9) Tomando la esperanza de (9) E[βˆ2 ] = β2 + β3 ∑ wi X 3i + ∑ wi E(ui ) = β2 + β3 ∑ wi X 3i …(9´) Considerando (7) y (7´) la expresión (9´) se reescribe como ( X 2i − X )X 3i ∑ ˆ β2 = β2 + β3 ∑ wi X 3i = β2 + β3 2 ( X − X ) ∑ 2i ( X 2i − X )(X 3i − X 3 ) Cov( X 2 , X 3 ) ∑ ˆ β2 = β2 + β3 = β2 + β3 2 Var( X 2 ) ∑( X 2i − X ) …(10) F. VELA Por lo tanto de (10) se desprende que: Cov( X 2 , X 3 ) ˆ β 2 = β 2 + β3 Var( X 2 ) …(10) i) Ante la omisión de variables relevantes en el modelo, los estimadores son sesgados; ii) La dirección del sesgo depende del signo de β3 estimado y de la covarianza entre X2 y X3; iii) En un modelo de regresión lineal simple, el sesgo podría sobrevalorar la contribución de la variable incluida en el modelo. F. VELA Recordemos lo que sucede en nuestro ejemplo. gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u gift = βo + β1 mailsyear+ u ---------------------------------Variable | model1 model2 -------------+-------------------mailsyear | 2.1663 2.6495 | 0.3319 0.3431 | 0.0000 0.0000 giftlast | 0.0059 | 0.0014 | 0.0000 propresp | 15.3586 | 0.8745 | 0.0000 _cons | -4.5515 2.0141 | 0.8030 0.7395 | 0.0000 0.0065 -------------+-------------------N | 4268 4268 r2 | 0.0834 0.0138 r2_a | 0.0827 0.0136 ---------------------------------legend: b/se/p Modelo 1 Modelo 2 F. VELA INCLUSIÓN DE VARIABLES NO RELEVANTES La posibilidad de omitir variables podría hacer pensar que una “buena” estrategia sería incluir al mayor número de variables en el modelo. Esto no solo complica la interpretación de los resultados sino que infla las varianzas de los estimadores. De esta manera, se reduce la precisión de los estimadores. F. VELA En el ejemplo considerado se tiene: -------------------------------------------Variable | model1 model2 model3 -------------+-----------------------------mailsyear | 2.1663 2.6495 1.2012 | 0.3319 0.3431 0.3124 | 0.0000 0.0000 0.0001 giftlast | 0.0059 -0.2609 | 0.0014 0.0108 | 0.0000 0.0000 propresp | 15.3586 16.2046 | 0.8745 0.8175 | 0.0000 0.0000 avggift | 0.5269 | 0.0211 | 0.0000 _cons | -4.5515 2.0141 -7.3278 | 0.8030 0.7395 0.7582 | 0.0000 0.0065 0.0000 -------------+-----------------------------N | 4268 4268 4268 r2 | 0.0834 0.0138 0.2005 r2_a | 0.0827 0.0136 0.1998 -------------------------------------------legend: b/se/p F. VELA Multicolinealidad F. VELA Sintaxis en Stata .quietly reg gift mailsyear giftlast propresp .estimates store model1 .quietly reg gift mailsyear .estimates store model2 .estimates table model1 model2, b(%7.4f) se(%7.4f) p(%7.4f) stats(N r2 r2_a) .quietly reg gift mailsyear giftlast propresp avggift .estimates store model3 F. VELA .estimates table model1 model2 model3, b(%7.4f) se(%7.4f) p(%7.4f) stats(N r2 r2_a) .graph matrix gift propresp avggift mailsyear giftlast .twoway (sc gift mailsyear) (lfit gift mailsyear), saving(C:\FVELA\graficasstata\x1.gph) F. VELA .twoway (sc gift giftlast) (lfit gift giftlast), saving(C:\FVELA\graficasstata\x2.gph) .twoway (sc gift propresp) (lfit gift propresp), saving(C:\FVELA\graficasstata\x3.gph) .twoway (sc gift avggift) (lfit gift avggift), saving(C:\FVELA\graficasstata\x4.gph) F. VELA .graph combine C:\FVELA\graficasstata\x1.gph C:\FVELA\graficasstata\x2.gph C:\FVELA\graficasstata\x3.gph C:\FVELA\graficasstata\x4.gph, ycommon .reg gift mailsyear giftlast propresp avggift .vif .pwcorr gift mailsyear giftlast propresp avggift, sig F. VELA **Valores atípicos y leverage** .quietly reg gift mailsyear giftlast propresp avggift .predict res, res .predict hi, lev .sum res hi .graph box res .dis 5.82e-09-(3*13.46786) .dis 5.82e-09+(3*13.46786) .list res if -40.40358<res<40.40358 .list hi if hi>.50 .lvr2plot F. VELA **Prueba de homoscedasticidad** .rvfplot .rvpplot mailsyear, ms(oh) yline(0) .graph save Graph "C:\FVELA\graficasstata\x5.gph" .rvpplot propresp, ms(oh) yline(0) .graph save Graph "C:\FVELA\graficasstata\x6.gph" .rvpplot giftlast, ms(oh) yline(0) .graph save Graph "C:\FVELA\graficasstata\x7.gph" .rvpplot avggift, ms(oh) yline(0) F. VELA .graph save Graph "C:\FVELA\graficasstata\x8.gph" .gr combine C:\FVELA\graficasstata\x5.gph C:\FVELA\graficasstata\x6.gph C:\FVELA\graficasstata\x7.gph C:\FVELA\graficasstata\x8.gph .quietly reg gift mailsyear giftlast propresp avggift .hettest .whitetst .imtest, white F. VELA **RESET** .quietly reg gift mailsyear giftlast propresp avggift .estimates store full .estimates table full, b(%7.4f) se(%7.4f) p(%7.4f) stats(N r2 r2_a rss) .predict yhat .gen yhat2=yhat^2 .gen yhat3=yhat^3 .quietly reg gift mailsyear giftlast propresp avggift yhat2 yhat3 .estimates store restringido .estimates table full, b(%7.4f) se(%7.4f) p(%7.4f) stats(N r2 r2_a rss) F. VELA **RESET** .quietly reg gift mailsyear giftlast propresp avggift .estimates store full .predict yhat .gen yhat2=yhat^2 .gen yhat3=yhat^3 .quietly reg gift mailsyear giftlast propresp avggift yhat2 yhat3 .estimates store restringido .estimates table full restringido, b(%7.4f) se(%7.4f)p(%7.4f) stats(N r2 r2_a rss) .scalar num=(773962.453-711805.636)/2 .scalar den=711805.636/(4268-7) .dis num/den F. VELA **RESET(3)** .gen yhat4=yhat^4 .quietly reg gift mailsyear giftlast propresp avggift yhat2 yhat3 yhat4 .estimates store full1 .estimates table full1 restringido, b(%7.4f) se(%7.4f)p(%7.4f) stats(N r2 r2_a rss) .scalar num=(773962.453-709653.024)/3 .scalar den=709653.024/(4268-8) .dis num/den .quietly reg gift mailsyear giftlast propresp avggift .estat ovtest