Resumen - Grupo ekd

Transcripción

Resumen - Grupo ekd
www.grupoekd.es
TEMA 1: MUESTREO Y DISTRIBUCIONES MUESTRALES
1. CONCEPTOS BÁSICOS SOBRE MUESTREO
· Definiciones:
- Inferencia estadística: proceso que tiene por objeto sacar conclusiones sobre una
población a partir de una muestra.
- Variable: rasgo o característica que queremos estudiar de un objeto de una población.
- Muestra aleatoria simple (m.a.s.): muestra en la que cada objeto tiene la misma
probabilidad de ser seleccionado, y los objetos han sido seleccionados
seleccionados de forma
independiente (la selección de un objeto no cambia la probabilidad de elegir otro).
- Diferencia entre parámetro y estadístico:
o El parámetro hace referencia a la población (ej: µ)
o El estadístico se construye con la muestra para sacar conclusiones
conclusi
sobre el
parámetro (ej: x)
- Distribución muestral: distribución de probabilidad de un estadístico
o Los estadísticos son variables aleatorias, porque nos dan un valor u otro
dependiendo de la muestra aleatoria con el que lo calculemos
o Por eso los estadísticos
estadís
tienen distribuciones muestrales.
2. DISTRIBUCIÓN DE LA MEDIA MUESTRAL Y TEOREMA CENTRAL DEL LÍMITE
2.1. PROPIEDADES ESTADÍSTICAS DE LA MEDIA MUESTRAL
· Si tenemos una m.a.s. X1, X2,…, Xn (esto es n variables aleatorias v.a., independientes e
. /
∑ $
/ 0 . 0
idénticamente distribuidas i.i.d.) entonces la media muestral viene dada por: $
· Cálculo de la esperanza y la varianza de la media muestral:
- Si X1, X2,…, Xn tiene
o Media μ=E(Xi)
o Varianza σ
E X μ
E X !
E X !
- Y sabiendo dos propiedades básicas de la esperanza:
∑ aE X
o E ∑ aX b
b
o Si X
son independientes, Var ∑ a X b
- Podemos demostrar que:
La esperanza de la media muestral,
muestral es la media poblacional: # $
-
Demostración: E X
E& ∑
∑
X'
E X
nμ
∑
a Var X
%
μ
La varianza de la media muestral es la varianza poblacional dividida entre n: )*+ $
-
Demostración: Var X
Var & ∑
X'
,
∑
Var X
,
nσ
3,
12
/
2.2. ¿CÓMO
CÓMO SE DISTRIBUYE LA MEDIA MUESTRAL?
MUESTRAL
· Distribución normal:
- Sea X una v.a. con distribución normal N(μ,σ
N( 2)
- Propiedad de “linealidad”:
o Las transformaciones lineales de v.a. normales, siguen siendo v.a. normales
o SiX~N μ, σ → aX b~N aμ b, a σ
[email protected]
Estadística e intro a la econometría
Tema 1
1
www.grupoekd.es
-
Normalización (tipificación, estandarización):
Si X~N μ, σ
o
entonces
<=>
3
tiene una distribución N(0,1) llamada
distribución normal estándar.
- Combinaciones lineales de normales independientes:
o Si X
son v.a. independientes con X ~N μ , σ
o Y si c
son números reales
o Entonces ∑ c X ~N ∑ c μ , ∑ c σ !
- Si tenemos Z~N 0,1
1 denotamos por zα al número que deja a la derecha una
probabilidad α.
o Esto es: P Z 9 zC
α
o Ejemplo: z0.025=1.96, esto significa que P Z 9 1.96
0.025
· Aplicación a la media muestral:
-
Si tenemos una m.a.s. de una v.a. X~N μ, σ
Demostración:
o
X
E X
Var X
-
∑
X
E& ∑
X'
Var & ∑
Otro resultado importante:
<=>
,
?@
A
X'
entonces X~N &μ,
∑
~N 0,1
E X
,
∑
nμ
Var X
3,
μ
,
'
nσ
3,
2.3. TEOREMA CENTRAL DEL LÍMITE
· Si tenemos:
- X1, … , Xn una m.a.s. de una v.a. X.
- E(X)=µ
- Var(X)= σ2
- El tamaño muestral n es “suficientemente” grande.
Si aplicamos el TCL tenemos que X se distribuye aproximadamente como una normal
X ≅ N μ, σ
· Aplicación a la media muestral:
-
-
Sabemos que E X
μ y que Var X
TCL entonces: $ ≅ ; &%,
12
/
3,
, si n es suficientemente grande y aplicamos
'
En caso de que queremos tipificar, se distribuirá como una normal estándar:
Z
<=>
,
?@
A
~N 0,1
· Es importante diferencia entre cuando se distribuye exactamente como una normal y cuando
se distribuye aproximadamente como una normal:
- Si X se distribuye como una normal: cuando tipificamos Z es exactamente normal
estándar.
- Si X no se distribuye como una normal: Z se distribuye aproximadamente como una
normal estándar al aplicar TCL.
[email protected]
Estadística e intro a la econometría
Tema 1
2
www.grupoekd.es
3. DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL
· Queremos estudiar la proporción de la población (p) que satisface una cierta característica.
- Llamamos Xi a esta variable aleatoria
1sieli ésimoelementodelamuestrasatisfacelacaracter
característica a
X
J
0encasocontrario
contrario
- Características:
o Distribución binomial: X ~Bi 1, p
o Además, si Xi son independientes: ∑ X ~Bi n, p
o Esperanza: E(Xi)=p
o Varianza: Var(Xi)=p(1-p)
- La proporción poblacional es p (proporción de la población que sí satisface la
característica).
-
∑
La proporción muestral es pQ
o
Esperanza: E pQ
p
Varianza: Var pQ
X
Demo: E pQ
o
X
E & ∑
=X
Var & ∑
Demo: Var pQ
· ¿Cómo se distribuye pQ ? : aplicamos el TCL
-
Sabiendo que E pQ
X'
p y que Var pQ
X'
X
∑
,
∑
E X
Var X
np
p
,
np 1
p
X =X
=X
Si n es suficientemente grade (suele funcionar cuando np(1-p)>5
np(1 p)>5 en las proporciones)
Entonces podemos aplicar el TCL:
o
Resultado: pQ ≅ N &p,
o
Y si tipificamos:
Y =X
X
X
Z [\Z
?
A
=X
'
] N 0,1
4. DISTRIBUCIÓN DE LA VARIANZA MUESTRAL
· Si tenemos:
- Una m.a.s. X1, X2,…, Xn
- Con media μ
- Con varianza σ
Entonces la varianza muestral viene dada por: S
,
∑A
^_[ <^ =<
=
,
,
∑A
^_[ <^ = <
=
· La esperanza de la varianza muestral es la varianza poblacional: E(S2)=σ2
- Demostración resumida:
resumida
∑ X
nX
E ∑ X
nX ! n σ
μ
n Var X
E S
ER
`
n 1
n 1
n 1
σ
nσ
σ
nμ
n n nμ
n 1 σ
σ
n 1
n 1
[email protected]
Estadística e intro a la econometría
Tema 1
E X
3
www.grupoekd.es
· Distribución chi-cuadrado (χχn2):
- Se llama distribución chi-cuadrado
chi cuadrado con n grados de libertad a la distribución de la v.a.
∑ Z siendo Zi v.a. i.i.d. con distribución normal estándar.
- Propiedades:
o Es una v.a. continua
o Siempre toma valores no negativos
o Esperanza: n (demo en clase)
o Varianza: 2n
o Es asimétrica
o Depende de n
o Denotaremos por χ ;C al número que deja a la derecha una probabilidad de
d α
P χ 9χ
· Teorema:
;C !
α
Si tenemos X1, X2, …, Xn m.a.s. de una v.a. X~N μ, σ
entonces
cuadrado con n-1
1 grados de libertad.
libertad
- Ten en cuenta que:
o
o
d= e ,
f,
[email protected]
es una chi-
,
∑j
i_[ hi =h
f,
Si cambiamos la media muestral por la media poblacional, es una chi-cuadrado
chi
con n grados de libertad:
libertad
o
= g,
~χ =
3,
,
∑A
^_[ <^ =>
3,
∑
<^ =>
'
3
&
∑
Z ~χ
Este teorema permite calcular probabilidades sobre la varianza muestral
cuando conocemos σ.
Estadística e intro a la econometría
Tema 1
4