Propuesta de solución: ejercicio C3.9 (Wooldridge, 2010)

Transcripción

Propuesta de solución: ejercicio C3.9 (Wooldridge, 2010)
Propuesta de solución: ejercicio
C3.9 (Wooldridge, 2010)
Fortino Vela Peón
[email protected]
Octubre, 2011
F. VELA
Ejercicio C3.9. Wooldridge (2010)
Contains data from C:\FVELA\DATOS STATA\WOOLDRIGE\charity.dta
obs:
4,268
vars:
8
5 Apr 2008 16:22
size:
110,968 (99.8% of memory free)
-----------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
-----------------------------------------------------------------------------respond
byte
%9.0g
=1 if responded with gift
gift
int
%9.0g
amount of gift, Dutch guilders
resplast
byte
%9.0g
=1 if responded to most recent
mailing
weekslast
float %9.0g
number of weeks since last
response
propresp
float %9.0g
response rate to mailings
mailsyear
float %9.0g
number of mailings per year
giftlast
int
%9.0g
amount of most recent gift
avggift
float %9.0g
average of past gifts
-----------------------------------------------------------------------------Sorted by:
F. VELA
i)
gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u
Modelo 1
gift = βo + β1 mailsyear+ u
Modelo 2
---------------------------------Variable | model1
model2
-------------+-------------------mailsyear | 2.1663
2.6495
| 0.3319
0.3431
| 0.0000
0.0000
giftlast | 0.0059
| 0.0014
| 0.0000
propresp | 15.3586
| 0.8745
| 0.0000
_cons | -4.5515
2.0141
| 0.8030
0.7395
| 0.0000
0.0065
-------------+-------------------N |
4268
4268
r2 | 0.0834
0.0138
r2_a | 0.0827
0.0136
---------------------------------legend: b/se/p
F. VELA
ii)
En el modelo 1, al aumentar en una unidad el número
de envíos (correos) al año, el monto de las
donaciones aumenta en promedio 2.17 florines,
manteniendo al resto de las variables constantes.
Por su parte, en el modelo 2, al aumentar en una
unidad el número de enviós al año, el monto de las
donaciones aumenta en promedio 2.65 florines.
Se observa que βˆ1
MODELO 2
> βˆ1 MODELO 1 (2.65>2.17)
F. VELA
iii)
gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u
En el modelo 1, al aumentar en 1% la tasa de
respuesta de los correos, en promedio, las
donaciones aumentan en aproximadamente
15.36 florines, ceteris paribus.
F. VELA
iv) gift = βo + β1 mailsyear+ β2 giftlast + β3 propresp+ β4 avggift+ u
-------------------------------------------Variable | model1
model2
model3
-------------+-----------------------------mailsyear | 2.1663
2.6495
1.2012
| 0.3319
0.3431
0.3124
| 0.0000
0.0000
0.0001
giftlast | 0.0059
-0.2609
| 0.0014
0.0108
| 0.0000
0.0000
propresp | 15.3586
16.2046
| 0.8745
0.8175
| 0.0000
0.0000
avggift |
0.5269
|
0.0211
|
0.0000
_cons | -4.5515
2.0141
-7.3278
| 0.8030
0.7395
0.7582
| 0.0000
0.0065
0.0000
-------------+-----------------------------N |
4268
4268
4268
r2 | 0.0834
0.0138
0.2005
r2_a | 0.0827
0.0136
0.1998
-------------------------------------------legend: b/se/p
Se puede observar que el efecto parcial de
mailsyear disminuye.
F. VELA
v) gift = βo + β1 mailsyear+ β2 giftlast + β3 propresp+ β4 avggift+ u
-------------------------------------------Variable | model1
model2
model3
-------------+-----------------------------mailsyear | 2.1663
2.6495
1.2012
| 0.3319
0.3431
0.3124
| 0.0000
0.0000
0.0001
giftlast | 0.0059
-0.2609
| 0.0014
0.0108
| 0.0000
0.0000
propresp | 15.3586
16.2046
| 0.8745
0.8175
| 0.0000
0.0000
avggift |
0.5269
|
0.0211
|
0.0000
_cons | -4.5515
2.0141
-7.3278
| 0.8030
0.7395
0.7582
| 0.0000
0.0065
0.0000
-------------+-----------------------------N |
4268
4268
4268
r2 | 0.0834
0.0138
0.2005
r2_a | 0.0827
0.0136
0.1998
-------------------------------------------legend: b/se/p
Por su parte, el
efecto parcial de la
variable giftlast
no solo cambia de
valor
sino
que
también de signo.
F. VELA
Examínenos algunos aspectos del modelo con
ayuda de lo señalado en Wooldridge (2010) y
Stata.
F. VELA
Matriz de diagramas de dispersión
0
2
4
0
.5
1
300
amount of
gift,
Dutch
guilders
200
100
0
4
number of
mailings
per year
2
0
10000
amount of
most
recent
gift
5000
0
1
response
rate to
mailings
.5
0
6000
average
of past
gifts
0
100
200
300
0
5000
10000
0
2000
4000
4000
2000
0
6000
50 100 150 200 250
0
0
50 100 150 200 250
F. VELA
0
1
2
3
number of mailings per year
0
2000
4000
6000
8000
amount of most recent gift
amount of gift, Dutch guilders
10000
Fitted values
0
0
50 100 150 200 250
Fitted values
50 100 150 200 250
amount of gift, Dutch guilders
4
0
.2
.4
.6
.8
response rate to mailings
amount of gift, Dutch guilders
1
Fitted values
0
1000
2000
3000
4000
average of past gifts
amount of gift, Dutch guilders
5000
Fitted values
F. VELA
reg gift mailsyear giftlast propresp avggift
Source |
SS
df
MS
-------------+-----------------------------Model | 194137.386
4 48534.3466
Residual | 773962.453 4263 181.553472
-------------+-----------------------------Total |
968099.84 4267 226.880675
Number of obs
F( 4, 4263)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
4268
267.33
0.0000
0.2005
0.1998
13.474
-----------------------------------------------------------------------------gift |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------mailsyear |
1.201168
.312418
3.84
0.000
.5886665
1.81367
giftlast | -.2608573
.0107565
-24.25
0.000
-.2819456
-.239769
propresp |
16.20464
.8175292
19.82
0.000
14.60186
17.80743
avggift |
.5269471
.0210811
25.00
0.000
.4856172
.5682769
_cons | -7.327763
.75822
-9.66
0.000
-8.814269
-5.841257
------------------------------------------------------------------------------
vif
Variable |
VIF
1/VIF
-------------+---------------------avggift |
64.70
0.015457
giftlast |
64.66
0.015466
mailsyear |
1.02
0.978145
propresp |
1.01
0.991483
-------------+---------------------Mean VIF |
32.85
F. VELA
|
gift mailsy~r giftlast propresp avggift
-------------+--------------------------------------------gift | 1.0000
|
|
mailsyear | 0.1174 1.0000
| 0.0000
|
giftlast | 0.0579 0.0063 1.0000
| 0.0002 0.6820
|
propresp | 0.2654 0.0814 -0.0130 1.0000
| 0.0000 0.0000 0.3943
|
avggift | 0.1004 0.0213 0.9921 -0.0168 1.0000
| 0.0000 0.1634 0.0000 0.2713
F. VELA
-200
Leverage
.4
.6
.2
0
-100
Residuals
0
100
.8
200
1
Valores atípicos y leverage
0
.02
.04
Normalized residual squared
.06
F. VELA
Especificación del modelo
Tres son las características esenciales de
considerar al momento de elegir un modelo:
la forma funcional;
la selección de las variables o
regresores del modelo; y
el cumplimiento de los supuestos sobre los
que se sustenta el modelo.
Vamos a referirnos a las dos primeras.
F. VELA
Forma funcional
Aunque intervienen aspectos teóricos, la
elección de la forma funcional de la ecuación
de regresión es más un “arte” que una “ciencia”.
Una ayuda indispensable son los diagramas de
dispersión.
Existe una prueba que también nos auxilia a
resolver este punto: la prueba RESET de
Ramsey.
F. VELA
Prueba RESET
Diseñada para verificar error de especificación
en la forma funcional plantada por el modelo
pero NO como una prueba de variables
omitidas.
F. VELA
El procedimiento es el siguiente:
H0: Forma funcional
es adecuada
vs
H1: La forma funcional
no es adecuada
Estime el modelo de regresión suponiendo
que la forma funcional es la correcta.
Obtenga los valores Yˆ .
Calcule el cuadrado y cubo de estos valores
(esto es, Yˆ 2y Yˆ 3 ), y agréguese al modelo como
variables independientes.
Estime el nuevo modelo y pruebe la
significancia conjunta de los coeficientes
asociados a las nuevas variables.
F. VELA
De esta manera, para el ejemplo considerado, se
tiene:
gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift+ u …(1)
gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift
γ 1 Ŷ2 + γ 2 Ŷ3 + u
Al modelo (2) se le denomina el modelo no
restringido, mientras que al modelo (1) el
modelo restringido.
La restricción impuesta en (1) es que γ1=γγ2=0
…(2)
F. VELA
H0: Forma funcional
es adecuada
vs
H1: La forma funcional
no es adecuada
equivalentes
H0: γ1=γγ2=0
vs
H1: cualquier otra cosa
El estadístico de prueba apropiado para este
contraste de hipótesis esta dado por:
(SCER − SCENR ) / M
F=
SCENR /(n − k )
donde M= # de restricciones; n= # obs. y k= #
coeficientes del modelo no restringido.
F. VELA
H0: γ1=γγ2=0
vs
---------------------------------Variable | full
restr~o
-------------+-------------------mailsyear | 1.2012
0.7016
| 0.3124
0.3010
| 0.0001
0.0198
giftlast | -0.2609
-0.2545
| 0.0108
0.0251
| 0.0000
0.0000
propresp | 16.2046
11.3160
| 0.8175
1.0663
| 0.0000
0.0000
avggift | 0.5269
0.5128
| 0.0211
0.0503
| 0.0000
0.0000
yhat2 |
0.0195
|
0.0028
|
0.0000
yhat3 |
-0.0001
|
0.0000
|
0.0000
_cons | -7.3278
-5.3312
| 0.7582
0.8976
| 0.0000
0.0000
-------------+-------------------N |
4268
4268
r2 | 0.2005
0.2647
r2_a | 0.1998
0.2637
rss | 7.7e+05
7.1e+05
---------------------------------legend: b/se/p
H1: cualquier otra cosa
(SCER − SCENR ) / M
F=
SCENR /(n − k )
(773962.453− 711805.636) / 2
=
711805.636/(4268 − 7)
= 186.04109
Regla de decisión
Rechazar Ho ssi Fc > Ft
donde Ft=F(2-4261)=3.00
F. VELA
Otra versión de la prueba sería:
gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift+ u …(1)
gift = β0 + β1 mailsyear+ β2 giftlast+ β3 propresp+ β4 avggift
γ 1 Ŷ2 + γ 2 Ŷ3 + γ 3 Ŷ4 + u
Técnicamente no hay problema pero consume
más grados de libertad y la prueba pierde
potencia en la medida que se agregan más
términos. A esta versión se le suele denominar
RESET(3), ya que se tienen tres restricciones.
La anterior versión, por ende, sería RESET(2).
…(2)
F. VELA
---------------------------------Variable | full1
restr~o
-------------+-------------------mailsyear | 0.4665
0.7016
| 0.3076
0.3010
| 0.1294
0.0198
giftlast | -0.1581
-0.2545
| 0.0367
0.0251
| 0.0000
0.0000
propresp | 6.4374
11.3160
| 1.7250
1.0663
| 0.0002
0.0000
avggift | 0.3175
0.5128
| 0.0740
0.0503
| 0.0000
0.0000
yhat2 | 0.0430
0.0195
| 0.0071
0.0028
| 0.0000
0.0000
yhat3 | -0.0005
-0.0001
| 0.0001
0.0000
| 0.0000
0.0000
yhat4 | 0.0000
| 0.0000
| 0.0003
_cons | -2.4573
-5.3312
| 1.2011
0.8976
| 0.0408
0.0000
-------------+-------------------N |
4268
4268
r2 | 0.2670
0.2647
r2_a | 0.2658
0.2637
rss | 7.1e+05
7.1e+05
---------------------------------legend: b/se/p
(SCER − SCENR ) / M
F=
SCENR /(n − k )
(773962.453− 709653.024) / 3
=
709653.024/(4268 − 8)
= 128.68174
Regla de decisión
Rechazar Ho ssi Fc > Ft
donde Ft=F(3,4260)=3.00.
La decisión sería la
misma, Rechazar Ho.
F. VELA
RESET(3) es la versión que por default tiene
integrada Stata en sus rutinas.
quietly reg gift mailsyear giftlast propresp avggift
estat ovtest
Ramsey RESET test using powers of the fitted values of gift
Ho: model has no omitted variables
F(3, 4260) =
128.68
Prob > F =
0.0000
Pero observe lo que se señala en Ho.
Tenga cuidado.
F. VELA
SELECCIÓN DE REGRESORES
Dos casos:
Omitir variables relevantes.
Incluir variables irrelevantes.
Cada uno tiene diferentes implicaciones sobre el
modelo.
En el caso de omisión los estimadores son
sesgados.
F. VELA
OMISIÓN DE VARIABLES
Sea
Yi = β1 + β2 X 2i + β3 X 3i + ui
…(1)
modelo real
Yi = β1 + β2 X 2i + vi
…(2)
modelo estimado
donde
vi = β3 X 3i + ui
βˆ2 = ∑
( X 2i − X 2 )(Yi − Y )
2
(
X
−
X
)
∑ 2i 2
…(3)
…(4)
Recordemos que, en general,
n
∑( X i − X ) = 0
i =1
…(5)
F. VELA
Reescribiendo a (4) se tiene
( X 2i − X 2 )Yi − Y ∑( X 2i − X 2 )
∑
βˆ2 =
2
(
X
−
X
)
∑ 2i 2
Tomando en cuenta (5) queda como
 ( X 2i − X 2 ) 
( X 2i − X 2 )Yi
∑
β̂2 =
= ∑
Y = ∑ wiYi
2
2 i
∑( X 2i − X 2 )
 ∑ ( X 2i − X 2 ) 
…(6)
donde
( X 2i − X 2 )
wi =
2
(
X
−
X
)
∑ 2i 2
…(7)
F. VELA
Por lo tanto (6) es
β̂2 = ∑ wiYi
…(6)
Recuerde también que wi presenta las propiedades
∑ wi = 0
…(7’)
∑ wi X i =1
…(7’’)
Sustituyendo a (2) en (6) se tiene
βˆ2 = ∑ wi (β1 + β2 X 2i + vi ) = β1 ∑ wi + β2 ∑ wi X 2i + ∑ wi vi
βˆ2 = β2 + ∑ wi vi
…(8)
F. VELA
Ahora sustituyendo (3) en (8)
βˆ2 = β2 + ∑ wi vi = β2 + ∑ wi (β3 X 3i + ui ) =β2 + β3 ∑ wi X 3i + ∑ wiui
…(9)
Tomando la esperanza de (9)
E[βˆ2 ] = β2 + β3 ∑ wi X 3i + ∑ wi E(ui ) = β2 + β3 ∑ wi X 3i
…(9´)
Considerando (7) y (7´) la expresión (9´) se reescribe
como
( X 2i − X )X 3i
∑
ˆ
β2 = β2 + β3 ∑ wi X 3i = β2 + β3
2
(
X
−
X
)
∑ 2i
( X 2i − X )(X 3i − X 3 )
Cov( X 2 , X 3 )
∑
ˆ
β2 = β2 + β3
= β2 + β3
2
Var( X 2 )
∑( X 2i − X )
…(10)
F. VELA
Por lo tanto de (10) se desprende que:
Cov( X 2 , X 3 )
ˆ
β 2 = β 2 + β3
Var( X 2 )
…(10)
i) Ante la omisión de variables relevantes en el
modelo, los estimadores son sesgados;
ii) La dirección del sesgo depende del signo de
β3 estimado y de la covarianza entre X2 y X3;
iii) En un modelo de regresión lineal simple, el
sesgo podría sobrevalorar la contribución de
la variable incluida en el modelo.
F. VELA
Recordemos lo que sucede en nuestro ejemplo.
gift = β o + β1 mailsyear+ β 2 giftlast + β 3 propresp+ u
gift = βo + β1 mailsyear+ u
---------------------------------Variable | model1
model2
-------------+-------------------mailsyear | 2.1663
2.6495
| 0.3319
0.3431
| 0.0000
0.0000
giftlast | 0.0059
| 0.0014
| 0.0000
propresp | 15.3586
| 0.8745
| 0.0000
_cons | -4.5515
2.0141
| 0.8030
0.7395
| 0.0000
0.0065
-------------+-------------------N |
4268
4268
r2 | 0.0834
0.0138
r2_a | 0.0827
0.0136
---------------------------------legend: b/se/p
Modelo 1
Modelo 2
F. VELA
INCLUSIÓN DE VARIABLES NO RELEVANTES
La posibilidad de omitir variables podría hacer
pensar que una “buena” estrategia sería incluir
al mayor número de variables en el modelo.
Esto no solo complica la interpretación de los
resultados sino que infla las varianzas de los
estimadores.
De esta manera, se reduce la precisión de los
estimadores.
F. VELA
En el ejemplo considerado se tiene:
-------------------------------------------Variable | model1
model2
model3
-------------+-----------------------------mailsyear | 2.1663
2.6495
1.2012
| 0.3319
0.3431
0.3124
| 0.0000
0.0000
0.0001
giftlast | 0.0059
-0.2609
| 0.0014
0.0108
| 0.0000
0.0000
propresp | 15.3586
16.2046
| 0.8745
0.8175
| 0.0000
0.0000
avggift |
0.5269
|
0.0211
|
0.0000
_cons | -4.5515
2.0141
-7.3278
| 0.8030
0.7395
0.7582
| 0.0000
0.0065
0.0000
-------------+-----------------------------N |
4268
4268
4268
r2 | 0.0834
0.0138
0.2005
r2_a | 0.0827
0.0136
0.1998
-------------------------------------------legend: b/se/p
F. VELA
Multicolinealidad
F. VELA
Sintaxis en Stata
.quietly reg gift mailsyear giftlast
propresp
.estimates store model1
.quietly reg gift mailsyear
.estimates store model2
.estimates table model1 model2, b(%7.4f)
se(%7.4f) p(%7.4f) stats(N r2 r2_a)
.quietly reg gift mailsyear giftlast
propresp avggift
.estimates store model3
F. VELA
.estimates table model1 model2 model3,
b(%7.4f) se(%7.4f) p(%7.4f) stats(N r2
r2_a)
.graph
matrix
gift
propresp avggift
mailsyear
giftlast
.twoway (sc gift mailsyear) (lfit gift
mailsyear),
saving(C:\FVELA\graficasstata\x1.gph)
F. VELA
.twoway (sc gift giftlast) (lfit gift
giftlast),
saving(C:\FVELA\graficasstata\x2.gph)
.twoway (sc gift
propresp) (lfit gift
propresp),
saving(C:\FVELA\graficasstata\x3.gph)
.twoway (sc gift
avggift) (lfit gift
avggift),
saving(C:\FVELA\graficasstata\x4.gph)
F. VELA
.graph combine C:\FVELA\graficasstata\x1.gph
C:\FVELA\graficasstata\x2.gph
C:\FVELA\graficasstata\x3.gph
C:\FVELA\graficasstata\x4.gph, ycommon
.reg gift mailsyear giftlast propresp
avggift
.vif
.pwcorr gift mailsyear giftlast propresp
avggift, sig
F. VELA
**Valores atípicos y leverage**
.quietly reg gift mailsyear giftlast
propresp avggift
.predict res, res
.predict hi, lev
.sum res hi
.graph box res
.dis 5.82e-09-(3*13.46786)
.dis 5.82e-09+(3*13.46786)
.list res if
-40.40358<res<40.40358
.list hi if hi>.50
.lvr2plot
F. VELA
**Prueba de homoscedasticidad**
.rvfplot
.rvpplot mailsyear, ms(oh) yline(0)
.graph save Graph
"C:\FVELA\graficasstata\x5.gph"
.rvpplot propresp, ms(oh) yline(0)
.graph save Graph
"C:\FVELA\graficasstata\x6.gph"
.rvpplot giftlast, ms(oh) yline(0)
.graph save Graph
"C:\FVELA\graficasstata\x7.gph"
.rvpplot avggift, ms(oh) yline(0)
F. VELA
.graph save Graph
"C:\FVELA\graficasstata\x8.gph"
.gr combine C:\FVELA\graficasstata\x5.gph
C:\FVELA\graficasstata\x6.gph
C:\FVELA\graficasstata\x7.gph
C:\FVELA\graficasstata\x8.gph
.quietly reg gift mailsyear giftlast
propresp avggift
.hettest
.whitetst
.imtest, white
F. VELA
**RESET**
.quietly reg gift mailsyear giftlast
propresp avggift
.estimates store full
.estimates table full, b(%7.4f) se(%7.4f)
p(%7.4f) stats(N r2 r2_a rss)
.predict yhat
.gen yhat2=yhat^2
.gen yhat3=yhat^3
.quietly reg gift mailsyear giftlast
propresp avggift yhat2 yhat3
.estimates store restringido
.estimates table full, b(%7.4f) se(%7.4f)
p(%7.4f) stats(N r2 r2_a rss)
F. VELA
**RESET**
.quietly reg gift mailsyear giftlast
propresp avggift
.estimates store full
.predict yhat
.gen yhat2=yhat^2
.gen yhat3=yhat^3
.quietly reg gift mailsyear giftlast
propresp avggift yhat2 yhat3
.estimates store restringido
.estimates table full restringido, b(%7.4f)
se(%7.4f)p(%7.4f) stats(N r2 r2_a rss)
.scalar num=(773962.453-711805.636)/2
.scalar den=711805.636/(4268-7)
.dis num/den
F. VELA
**RESET(3)**
.gen yhat4=yhat^4
.quietly reg gift mailsyear giftlast
propresp avggift yhat2 yhat3 yhat4
.estimates store full1
.estimates table full1 restringido, b(%7.4f)
se(%7.4f)p(%7.4f) stats(N r2 r2_a rss)
.scalar num=(773962.453-709653.024)/3
.scalar den=709653.024/(4268-8)
.dis num/den
.quietly reg gift mailsyear giftlast
propresp avggift
.estat ovtest