Estimación Puntual e Intervalo de Confianza

Transcripción

Estimación Puntual e Intervalo de Confianza
Estimación Puntual
Para estimar el valor de un parámetro poblacional se calcula la característica correspondiente de
la muestra, a lo que se le conoce como estadístico muestral . A la media muestral x̅ se le identifica
como estimador puntual de la media poblacional µ, a la desviación estándar muestral s como el
estimador puntual de la desviación estándar poblacional σ. Al valor numérico obtenido de x̅ o s se
le conoce como estimación puntual.
Estimación por Intervalo de Confianza
Una estimación de un intervalo de confianza es un rango de números llamado intervalo, que se
construye en torno a un estimador puntual. Como no se puede esperar que dicho estadístico
muestral suministre el valor exacto del parámetro poblacional, suele calcularse una estimación por
intervalo al sumar y restar a la estimación puntual una cantidad llamada margen de error. La
forma general de una estimación por intervalo es
Estimación puntual ± Margen de error
Estimación de un intervalo de confianza para la media poblacional (Cuando se conoce σ)
La distribución de muestreo de x̅ sirve para calcular la probabilidad de que x̅ esté dentro de una
distancia dada de µ. Se puede concluir que la distribución de muestreo de x̅ sigue una distribución
normal con un error estándar de σx̅ = σ⁄
√n
La estimación de un intervalo de confianza tiene un nivel de confianza, que por lo general se
maneja del 90%, 95% y 99%.
La fórmula general de una estimación por intervalo de la media poblacional con σ conocida es la
siguiente:
σ
x̅ ± zα⁄2
√n
Donde (1- α) es el coeficiente de confianza y zα⁄2 es el valor de z que proporciona un área de α⁄2
en la cola superior de la distribución de probabilidad normal estándar.
α ⁄2
0.05
0.025
0.005
α
0.1
0.05
0.01
Nivel de confianza
90%
95%
99%
95%
90%
0.05
α/2
0.025
0.05
µ
0
zα⁄2
1.645
1.960
2.576
α/2
0.025
µ
0
α/2
α/2
99%
0.005
α/2
0.005
µ
0
α/2
Ejemplo
Una cierta organización determina que el comportamiento de compra de los clientes corresponde
a una distribución normal con 𝑥̅ = 82 y 𝜎 = 20, para un tamaño de muestra de 100. Constrúyase
para la media poblacional un intervalo de confianza de 90 %.
a) Intervalo de confianza de 90%.
El coeficiente de confianza (1-α) = 0.90, entones α=0.1 y α/2=0.05.
Z0.025 = 1.645
82 ± 1.645
20
√100
82 ± 3.29
Por lo tanto el margen de error es 3.29 y el intervalo de confianza de 90% 78.71 a 85.29.
b) Para los mismos datos, determinar el intervalo de confianza de 93%.
El coeficiente de confianza (1-α) = 0.93, entones α=0.07 y α/2=0.035.
Z0.035 = 1.81
82 ± 1.81
20
√100
82 ± 3.62
Por lo tanto el margen de error es 3.62 y el intervalo de confianza de 93% 78.38 a 85.62.
c) Para los mismos datos, determinar el intervalo de confianza de 95%.
El coeficiente de confianza (1-α) = 0.95, entones α=0.05 y α/2=0.025.
Z0.025 = 1.96
20
82 ± 1.96
82 ± 3.92
√100
Por lo tanto el margen de error es 3.92 y el intervalo de confianza de 95% 78.08 a 85.92.
d) Para los mismos datos, determinar el intervalo de confianza de 98%.
El coeficiente de confianza (1-α) = 0.98, entones α=0.02 y α/2=0.01.
Z0.01 = 2.32
82 ± 2.32
20
√100
82 ± 4.64
Por lo tanto el margen de error es 4.64 y el intervalo de confianza de 98% 77.36 a 86.64.
e) Intervalo de confianza de 99%.
El coeficiente de confianza (1-α) = 0.99, entones α=0.01 y α/2=0.005.
Z0.025 = 2.576
82 ± 2.576
20
√100
82 ± 5.15
Por lo tanto el margen de error es 5.15 y el intervalo de confianza de 99% 76.84 a 87.15.
Nivel de Confianza
90%
93%
95%
98%
99%
Margen de Error
3.29
3.62
3.92
4.64
5.15
Intervalo de Confianza
78.71 a 85.29
78.38 a 85.62
78.08 a 85.92
77.36 a 86.64
76.84 a 87.15
Ejercicios
1. En una muestra aleatoria simple de 40 artículos la media muestral obtenida es 25. La desviación
estándar poblacional es σ = 5.
a. ¿Cuál es el error estándar de la media ?
b. ¿Cuál es el margen de error para tener 95% de confianza?
2. En una muestra aleatoria simple de 50 artículos de una población en la que σ = 6 la media
muestral fue 32.
a. Proporcione un intervalo de confianza de 90% para la media poblacional.
b. Establezca un intervalo de confianza de 95% para la media poblacional.
c. Proporcione un intervalo de confianza de 99% para la media poblacional.
3. En una muestra aleatoria simple de 60 artículos la media muestral fue 80. La desviación
estándar poblacional es σ = 15.
a. Calcule el intervalo de confianza de 95% para la media poblacional.
b. Suponga que la misma media muestral se obtuvo de una muestra de 120 artículos. Dé el
intervalo de confianza de 95% para la media poblacional.
4. Para la media poblacional se dio el siguiente intervalo de confianza de 95%, de 152 a 160. Si
σ = 15, ¿cuál es el tamaño de la muestra que se usó en este estudio?
5. Con objeto de estimar la cantidad media que gasta un cliente en una comida en un importante
restaurante, se recogieron los datos de una muestra de 49 clientes. Suponga que la desviación
estándar de la población es $5.
a. ¿Cuál es el margen de error para 95% de confianza?
b. Si la media muestral es $24.80, ¿cuál es el intervalo de confianza de 95% para la media
poblacional?
Media Poblacional: σ desconocida
Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse con una
buena estimación de la desviación estándar poblacional. En tales casos se usa la misma muestra
para estimar µ y σ. Esta situación es el caso que se conoce como σ desconocida. Cuando se usa s
para estimar σ, el margen de error y la estimación por intervalo de la media poblacional se basan
en una distribución de probabilidad conocida como distribución t.
Distribución t de Student
A mediados del siglo XX William S. Gosset trabajaba en la empresa Guiness, en Irlanda, tratando de
elaborar una cerveza a un menor costo. Como solo contaba con muestras pequeñas para su
estudio, necesitaba encontrar una forma de hacer inferencias sobre medias sin conocer σ. Gosset
resolvió el problema desarrollando lo que ahora se conoce como la distribución t de Student. La
distribución t es una familia de distribuciones de probabilidades similares; cada distribución t
depende de un parámetro conocido como grados de libertad (n-1). La distribución t para un grado
de libertad es única, como lo es la distribución t para dos grados de libertad, para tres grados de
libertad, etc. A medida que el grado de libertad aumenta, la diferencia entre la distribución t y la
distribución normal estándar se va reduciendo.
Características de la distribución t:
1. Es de forma acampanada y simétrica alrededor de la media.
2. Es una familia de curvas, cada una es determinada por un parámetro llamado grados de
libertad, gl = n-1.
3. El área total bajo la curva es 1 o 100%.
4. La media, mediana y la moda de la distribución son igual a cero.
5. A medida que el número de grados de libertad crece, la distribución se aproxima a una normal.
Estimación por intervalo de la media poblacional: σ desconocida
𝑥̅ ± 𝑡𝛼⁄2
𝑠
√𝑛
Area de distribución t con un área o probabilidad 𝛼/2 en la cola superior
Los valores críticos de t para los grados de libertad adecuados se encuentran en la tabla de la
distribución t. Las columnas de la tabla representan las probabilidades acumuladas más utilizadas
y sus áreas correspondientes de la cola superior. Los renglones de la tabla representan los grados
de libertad. Los valores t críticos se encuentran en las celdas de la tabla.
Ejercicios:
1. En la distribución t con 16 grados de libertad, encuentre el área, o la probabilidad, de cada una
de las regiones siguientes:
a) A la derecha de 2.120
b) A la izquierda de 1.337
c)A la izquierda de -1.746
d) A la derecha de 2.583
e) Entre -2.120 y 2.120
f) Entre -1.746 y 1.746
Sol.
a)
gl=16
t
0
2.120
0.025
16
2.120
b)
0.9
gl=16
t
0
1.337
0.10
16
1.337
c)
gl=16
t
-1.746
0
1.746
0.05
16
1.746
d)
gl=16
t
0
2.583
0.01
16
2.583
e)
1 - 2*0.025 = .95
gl=16
t
-2.120
0
2.120
0.025
16
2.120
f)
1 - 2*0.05 = .9
gl=16
t
-1.746
0
1.746
0.05
16
1.746
2. Encuentre los valores de t para las situaciones siguientes.
a) Un área de 0.025 en la cola superior, con 12 grados de libertad (2.179)
b) Un área de 0.05 en la cola inferior, con 50 grados de libertad (-1.676)
c) Un área de 0.01 en la cola superior, con 30 grados de libertad (2.457)
d) Entre los que queda 90% del área, con 25 grados de libertad (-1.708 y 1.708)
e) Entre los que queda 95% del área, con 45 grados de libertad (-2.014 y 2.014)
3. Los datos muestrales siguientes provienen de una población normal: 10, 8, 12, 15, 13, 11, 6, 5.
a) ¿Cuál es la estimación puntual de la media poblacional?
b) ¿Cuál es la estimación puntual de la desviación estándar poblacional?
c) Con 95% de confianza, ¿cuál es el margen de error para la estimación de la media poblacional?
d) ¿Cuál es el intervalo de confianza de 95% para la media poblacional?
Sol. 𝑥̅ = 10 s = 3.464
a) 𝜇 = 𝑥̅ 𝑏) 𝜎 = 𝑠
c) gl = 7
𝑡0.025
3.464
√8
= 2.365 ∗ 1.2247 = 2.8964
d)
𝑥̅ ± 𝑡𝛼⁄2
𝑠
√𝑛
= 10 ± 𝑡0.025
7.1035 ≤ 𝜇 ≤ 12.896
3.464
√8
4. En una muestra aleatoria simple con n = 54 la media muestral fue 22.5 y la desviación estándar
muestral 4.4.
a) Encuentre un intervalo de confianza de 90% para la media poblacional.
b) Dé un intervalo de confianza de 95% para la media poblacional.
c) Dé un intervalo de confianza de 99% para la media poblacional.
d) ¿Qué pasa con el margen de error y con el intervalo de confianza a medida que aumenta
el nivel de confianza
Sol. 𝑥̅ = 22.5 s = 4.4
a) gl = 53
𝑥̅ ± 𝑡𝛼⁄2
𝑠
√𝑛
= 22.5 ± 𝑡0.05
22.5
√54
21.4976 ≤ 𝜇 ≤ 23.5023
b) 𝑡0.025
= 2.006
c) 𝑡0.005
= 2.672
21.2988 ≤ 𝜇 ≤ 23.7011
20.9001 ≤ 𝜇 ≤ 24.0998
d) Un margen de error mayor y un intervalo más amplio.
5. La International Air Transport Association realiza encuestas entre los viajeros de negocios en las
que se califica la calidad de los aeropuertos internacionales. La calificación máxima es 10. Se
seleccionó una muestra aleatoria simple de 50 viajeros de negocios y a cada uno se le solicitó su
evaluación para el aeropuerto internacional de Miami. Las calificaciones que proporcionaron estos
50 viajeros se muestran a continuación.
6
7
4
9
4
8
4
9
6
7
8
5
8
5
4
9
7
9
5
7
7
5
6
8
6
8
2
3
3
4
5
10
3
3
9
8
8
8
9
9
10
5
8
6
4
5
4
8
4
8
Proporcione la estimación por intervalo de confianza de 95% para la media poblacional de las
calificaciones al aeropuerto de Miami.
𝑥̅ = 6.34 s=2.1628
NC = 95
𝛼 − 1 = 0.95, 𝛼 = 0.05,
𝛼
= 0.025
2
6. El costo promedio por noche de una habitación de hotel en la ciudad de New York es $273.
Suponga que esta estimación se basa en una muestra de 45 hoteles y que la desviación estándar
muestral es $65.
a) Con 95% de nivel de confianza, ¿Cuál es el margen de error?
b) ¿Cuál es la estimación por intervalo de confianza de 95% para la media poblacional?
7. El consumo de bebidas alcohólicas entre mujeres jóvenes en edad de beber se ha incrementado
en el Reino Unido, Estados Unidos y Europa. Datos (consumo anual en litros) tomados de una
muestra de 20 mujeres europeas jóvenes son los siguientes:
266
170
164
93
82
222
102
0
199
115
113
93
174
130
171
110
97
169
0
130
Suponga que la población es aproximadamente normal. Proporcione un intervalo de confianza de
95% para el consumo medio anual de bebidas alcohólicas entre mujeres europeas jóvenes.
𝑥̅ = 130 s=65.3911