texto de problemas de inferencia estadística

Transcripción

texto de problemas de inferencia estadística
UNIVERSIDAD NACIONAL DEL CALLAO
VICERECTORADO DE INVESTIGACIÓN
FACULTAD DE CIENCIAS ECONÓMICAS
TEXTO DE PROBLEMAS DE
INFERENCIA ESTADÍSTICA
AUTOR:
JUAN FRANCISCO BAZÁN BACA
(Resolución Rectoral 940-2011-R del 22-9-11)
01-09-11 al 31-08-13
CALLAO – PERÚ
2013
1
ÍNDICE
Pág.
INDICE
2
INTRODUCCIÓN
5
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE
CENTRAL
6
1.1
Distribución normal
6
1.2
Distribución normal estándar
7
1.3
Propiedad reproductiva de la distribución normal
9
1.4
Teorema del límite central
10
1.5
Ejercicios resueltos
13
1.6
Ejercicios propuestos
29
Capítulo 2. DISTRIBUCIONES MUESTRALES
33
2.1
Distribución muestral de la media
37
2.2
Distribución muestral del total (conocida la media)
39
2.3
Distribución de la diferencia de medias muestrales
40
2.4
Distribución muestral de la proporción
43
2.5
Distribución muestral del total (conocida la proporción)
47
2.6
Distribución muestral de la diferencia de proporciones
48
2.7
Ejercicios resueltos
52
2.8
Ejercicios propuestos
73
Capítulo 3. DISTRIBUCIONES ESPECIALES
77
3.1
Distribución Chi-cuadrado
77
3.2
Distribución t de student
86
3.3
Distribución muestral de la media (n < 30)
92
3.4
Distribución de la diferencia de medias muestrales con varianzas
desconocidas pero iguales
93
3.5
Distribución F de Snedecor
94
3.6
Distribución de la razón de dos varianzas muestrales
98
3.7
Ejercicios resueltos
100
2
3.8
Ejercicios propuestos
119
Capítulo 4. ESTIMACIÓN PUNTUAL
122
4.1
Estimadores. Propiedades
123
4.2
Métodos de Estimación Puntual
130
4.3
Método de Máxima Verosimilitud
130
4.4
Método de los Momentos
132
4.5
Método de los mínimos cuadrados
133
4.6
Ejercicios resueltos
135
4.7
Ejercicios propuestos
152
Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA
155
5.1
Intervalo de confianza para la media y tamaño de muestra
160
5.2
Intervalo de confianza para el total (conocida la media)
162
5.3
Intervalo de confianza para la proporción y tamaño de muestra
164
5.4
Intervalo de confianza para el total (conocida la proporción)
167
5.5
Intervalo de confianza para la diferencia de medias
168
5.6
Intervalo de confianza para la diferencia de proporciones
170
5.7
Intervalo de confianza para la media (n < 30)
173
5.8
Intervalo de confianza para la varianza
175
5.9
Intervalo de confianza para la razón de varianzas
177
5.10
Intervalo de confianza para la diferencia de medias (n y m <30)
179
5.11
Ejercicios resueltos
187
5.12
Ejercicios propuestos
235
Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245
6.1
Prueba de hipótesis para la media (con varianza conocida)
251
6.2
Prueba de hipótesis para la media (con varianza desconocida)
258
6.3
Prueba de hipótesis acerca de una varianza
263
6.4
Prueba de hipótesis para la razón de varianzas
270
6.5
Prueba de hipótesis acerca de dos medias (varianzas conocidas)
276
6.6
Prueba de hipótesis acerca de dos medias (varianzas desconocidas)
281
6.7
Prueba de hipótesis para la proporción
290
3
6.8
Prueba de hipótesis para la diferencia de proporciones
293
6.9
Ejercicios resueltos
299
6.10
Ejercicios propuestos
348
Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS
355
7.1
Uso de la distribución Chi-cuadrado. Test de independencia
356
7.2
Test de bondad de ajuste
362
7.3
Test de Wilcoxon
364
7.4
Test de signos
367
7.5
Test de la mediana
374
7.6
Ejercicios resueltos
379
7.7
Ejercicios propuestos
395
REFERENCIAS BIBLIOGRÁFICAS
398
Apéndice
400
Tabla 1. Distribción acumulativa normal estándar
401
Tabla 2. Distribución acumulativa chi-cuadrado
403
Tabla 3. Distribución acumulativa T de student
407
Tabla 4. Distribución acumulativa F
408
Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01
409
Tabla 6. Valores críticos para la prueba del signo S
409
4
INTRODUCCIÓN
La ciencia económica para poder realizar las mediciones económicas recurre
permanentemente a la inferencia estadística, ya que las deducciones y conjeturas
económicas acerca de los parámetros están basadas en muestras aleatorias tratadas
por esta disciplina.
Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la
estadística para economistas en la Universidad Nacional del Callao (UNAC),
hemos creído conveniente elaborar un
“Texto de problemas de inferencia
estadística” que de manera sencilla ayude a estudiantes de la especialidad a
desarrollar competencias conceptuales y procedimentales, mediante la asimilación
de la terminología propia de la estadística, así como las correspondientes
aplicaciones a la economía.
El texto consta de siete capítulos. En el primero, se desarrolla la distribución
normal y el teorema del límite central; el capítulo dos, presenta las distribuciones
muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las
distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la
chi-cuadrado, t de student y F.
En los capítulos cuatro y cinco se desarrollan los temas relacionados a la
estimación puntual y la estimación por intervalos de confianza respectivamente.
En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas
paramétricas, poniendo especial énfasis en la determinación del valor-P
(probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos
computacionales modernos. Finalmente, en el capítulo siete se presentan las
pruebas de hipótesis no paramétricas.
Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para
alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas
para la discusión en clases. El reconocimiento especial a los estudiantes de
economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los
últimos años se han puesto en práctica los resultados de este modesto trabajo.
5
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA
CENTRAL DEL LÍMITE
“Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar
cuando se mira lejos”.
José Ortega y Gasset
CONTENIDO
1.1
1.2
1.3
1.4
1.5
1.6
Distribución normal.
Distribución normal estándar.
Propiedad reproductiva de la distribución normal.
Teorema del límite central.
Ejercicios resueltos.
Ejercicios propuestos.
1.1 DISTRIBUCIÓN NORMAL
La teoría de probabilidades nos ofrece la distribución normal como una de las
distribuciones más importantes, junto al teorema central del límite, con múltiples
aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las
distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la
distribución normal y la presentación del teorema central del límite.
Definición.- una variable aleatoria continua X tiene distribución normal con media
μ y varianza σ2 , si su función de densidad de probabilidad esta dada por:
f ( x) 
donde: π = 3.14159265....
1
2 2
y
e
 ( X   )2
2 2
-∞ < x < ∞
e = 2.71828184
(la base de los logaritmos
neperianos).
Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2 )
Que se lee “la variable aleatoria X se distribuye normalmente con media μ y
varianza σ2 ”.
Características geométricas.
La gráfica tiene forma acampanada, con centro en μ.
6

Es una función creciente en el intervalo (- ∞ , μ).

Es una función decreciente en el intervalo (μ , ∞).

Tiene sus puntos de inflexión en μ – σ y μ + σ.
Características estadísticas.
Media:
E (X) = μ

Varianza:
V (X) = σ2

Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se
distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2 σ2
. Es decir: Y ~ N(a + bμ , b2 σ2 )

Si X ~ N(μ , σ2 ) el cálculo de probabilidades se efectúa realizando el
proceso de estandarización siguiente:
Z = (X - μ ) / σ
~ N(0, 1) y decimos que la v.a. Z tiene distribución
normal estándar.
DISTRIBUCIÓN NORMAL
40
35
30
25
20
15
10
5
0
μ - 3σ
X
μ - 2σ
μ-σ
μ
μ+σ
μ + 2σ
μ + 3σ
1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR
Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal
estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2 =
1) y su función de densidad de probabilidades es:
f ( z) 
1 z2 / 2
e
2
-∞ < z < ∞
La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula
así:
7
z
Φ (z) = F(z) = P [Z  z] =
1 t 2 / 2
e
dt
2


Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z.
Entonces, conocidos los valores de la media μ y la varianza σ2 de una variable aleatoria
X ~ N(μ , σ2 ) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede
efectuar el cálculo de probabilidades tales como:

P[a  X  b] = P[ (a - μ ) / σ  (X - μ ) / σ  (b - μ ) / σ ]
= P[ (a - μ ) / σ  Z  (b - μ ) / σ ]
= Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]

P[X  a] = P[(X - μ ) / σ  (a - μ ) / σ ] = P[Z  (a - μ ) / σ ] = Φ [(a - μ ) / σ ]

P[X > a] = 1 – P[X  a] = 1 - Φ [(a - μ ) / σ ]
Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z),
han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel.
Uso de la Tabla de la distribución normal estándar
a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ
(z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que:
Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500.
b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la
probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor
de z que acumule en probabilidad α y que denotaremos como z = Zα .
Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica
que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .
Una característica importante de la distribución normal es que:
 Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que :
    X       


P(μ – σ  X  μ + σ) = P 
  P 1  Z  1 





= Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268
8
 Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que:
  2   
   2  
P(μ – 2σ  X  μ + 2σ) = P 
Z
  P 2  Z  2 




= Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545
 Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que:
  3   
   3  
P(μ – 3σ  X  μ + 3σ) = P 
Z
  P 3  Z  3 




= Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973
 Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir
que:
  4   
   4  
P(μ – 4σ  X  μ + 4σ) = P 
Z 
  P  4  Z  4 



= Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937
 Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir
que:
  5   
   5  
Z
P(μ – 5σ  X  μ + 5σ) = P 
  P  5  Z  5 



= Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942
 Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es
decir que:
  6   
   6  
Z 
P(μ – 6σ  X  μ + 6σ) = P 
  P  6  Z  6 



= Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998
1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas
normalmente con media μi y varianza σi2 .
Es decir: Xi ~ N(μi , σi2 ) i = 1, 2, 3,
.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +
n
an Xn . Entonces, la variable aleatoria Y ~ N [a0 +  ai i ,
i 1
9
n
a 
i 1
2
i
2
i
]
Puesto que:

μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =
= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =
n
= a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 +  ai i
i 1
2
  Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =
= 0 + a12 V(X1 ) + a22 V(X2 ) + .... + an2 V(Xn ) =
= a12 σ12 + a22 σ22 + .... + a2n σn2 =
n
a 
i 1
2
i
2
i
1.4 TEOREMA DEL LÍMITE CENTRAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas
dadas por: E(Xi) = μi y V(Xi ) = σi2 .
n
Si:
Yn = X1 + X2 + .... + Xn =
X
i 1
i
, entonces bajo ciertas condiciones generales,
la variable aleatoria Zn definida por:
n
Y  E (Yn )
Zn  n

V (Yn )
n
 X  
i 1
i
i 1
i
n

2
i
i 1
tiene aproximadamente una distribución normal estándar N(0, 1).
Nota.
E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
10
n
= μ1 + μ2 + .... + μn =

i 1
i
.
 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
n

= σ12 + σ22 + .... + σn2 =
i 1
2
i
.
Observaciones.n
1. La variable aleatoria Yn =
X
i 1
i
(suma de v.a. independientes) puede ser
aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución
de las Xi .
2. Las condiciones generales indicadas en el teorema están referidas a que los términos
Xi tomados individualmente, contribuyen con una cantidad despreciable a la
variación de la suma, y no es probable que un simple término tenga una gran
contribución a la suma.
Una aplicación importante de estas condiciones generales del teorema central del
límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei
Donde la variable explicada o dependiente Y es función de un conjunto de variables
explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del
teorema central del límite se da cuando se asume que los errores ei se distribuyen
normalmente, debido a que estos errores recogen la suma de las contribuciones
despreciables de todas las variables dejadas de considerar en el modelo.
Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las
cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del
precio (P) del bien. Efectivamente, pero existen otras variables independientes
(gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que
también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar
la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en
los errores ei se aproximan a la distribución normal.
11
3. Una situación especial del teorema central del límite se presenta cuando cada Xi
tiene la misma distribución (que es el caso de la definición de muestra aleatoria,
como veremos más adelante) y que permita encontrar la distribución de una media
muestral. La propuesta es la siguiente:
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente
distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2.
n
Si:
Yn = X1 + X2 + .... + Xn =
X
i 1
n
por :
Y  E (Yn )
Zn  n

V (Yn )
X
i 1
i
i
, entonces la variable aleatoria Zn dada
 n
 n

Xn  
/ n
tiene aproximadamente distribución normal estándar N(0 , 1). Donde X n 
es la media muestral de las Xi .
Nota.
E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
= μ + μ + .... + μ = n μ .
 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
= σ2 + σ2 + .... + σ2 = n σ2
12
1 n
 Xi
n i 1
1.5 EJERCICIOS RESUELTOS
1.
Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar
las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z <
0.50) ;
d) P(-1.65 < Z < -1.00) ;
e) P(Z < -1.52) ;
f) P(0 < Z < 1.25) y g)
P(-1.63 < Z < 0).
Solución.-Usando la tabla 1 del anexo se tiene:
a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292
b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809
Para obtener los gráficos en Minitab ver Bazán, Juan (2010)
0.4
0.4
0.6247
0.3
Densidad
Densidad
0.3
0.0809
0.2
0.1
0.1
0.0
0.2
0
Z
0.0
1 1.42
-1.5
0
0.5
Z
P(-1.5  Z < 0.5)
En Minitab: P(1.00 < Z < 1.42)
c) P(-1.5  Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247
d) P(-1.65  Z  -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092
e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643
f) P(0  Z  1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944
g) P(-1.63 < Z  0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484
2.
Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes: a) Φ(z) = 0.9500;
b) Φ(z) = 0.9772;
c) Φ(z) =
0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y
f) el área a la derecha de z es 0.05.
13
Solución
a) Sí Φ (z) = F (z) = P [Z  z] = 0.9500, esto implica que, en la tabla 1, a la
probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.
b) Sí Φ (z) = F (z) = P [Z  z] = 0.9772, esto implica que, en la tabla 1, a la
probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.
c) Sí Φ (z) = F (z) = P [Z  z] = 0.9987, esto implica que, en la tabla 1, a la
probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.
d) Si 0.95 = P [-z  Z  z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1.
Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.
e) Si 0.01 = Φ (z) = P [Z  z], esto implica que, en la tabla 1, a la probabilidad
0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.
f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo
visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.
3.
El monto de las solicitudes de préstamo de los comerciantes que recibe un
Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y
σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo
solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c)
Mayores de que cantidad será el 20 % de los préstamos?
Solución
Sea X = monto de las solicitudes de préstamo.
Se sabe que X ~ N(10000 , 10002),
entonces
Z = (X – 10000)/ 1000 ~ N(0,
1). Luego, las probabilidades solicitadas son:
 8500  10000 X  10000 12000  10000 


a) P(8500 ≤ X ≤ 12000) = P 
 =
1000
1000
1000

= P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044
Rpta.
Interpretación: el 91.04% de los montos de préstamo solicitados por los
comerciantes fluctúa entre S/. 8,500 y 12,000.
14
 X  10000 8000  10000 

b) P(X ≤ 8000) = P 
 =
1000
 1000
= P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta.
Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos
de préstamo solicitados por los comerciantes es menor a S/. 8,000.
Distribución del monto de préstamo
Normal, Media=10000, Desv.Est.=1000
0.0004
Densidad
0.0003
0.0002
0.0001
0.0228
0.0000
8000
10000
X = monto del préstamo
Resultado gráfico en Minitab
c) Sea C la cantidad de préstamo buscada, entonces:
C  10000 

0.20 = P(X > C) = 1 - P  Z 

1000 

 C  10000 
0.80 =  

 1000 

C  10000
 Z 0 . 8 0 0.84
1000
 C = S/. 10840
Rpta.
Interpretación: el 20% de los montos de préstamo solicitados por los
comerciantes es mayor a S/. 10,840.
15
Distribución del monto de préstamo
Normal, Media=10000, Desv.Est.=1000
0.0004
Densidad
0.0003
0.0002
0.20
0.0001
0.0000
4.
10000 10840
X = monto del préstamo
Para cierto examen la calificación vigesimal tiene distribución normal con media
11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados.
¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado.
Solución
Sea X = calificación vigesimal de los examinados.
Se sabe que X ~ N(11 , 22),
entonces
Z = (X – 11)/ 2 ~ N(0, 1).
Sea M la máxima nota desaprobatoria buscada, entonces:
M  11 

 M  11 
0.40 = P(X < M) = P  Z 
 =  2 
2 




M  11
 Z 0.40  0.25  M = 10.5 Rpta.
2
Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5.
5.
Los ingresos de los trabajadores tiene distribución normal con media µ= S/.
1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos
trabajadores, calcule e interprete:
a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600?
b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300?
Solución
16
Si X = ingreso de los trabajadores ~ N(1000, 2002), Z = (X – 1000)/ 200 ~ N(0,
1).
Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
 X  1000 600  1000 
a) P = P(X < 600) = P 

 = P(Z < -2.0) = Φ(-2.0) =
200
 200

0.02275
Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.
Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.
 850  1000 X  1000 1300  1000 


b) P = P(850 ≤ X ≤ 1300) = P 
 =
200
200
 200
= P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656
Distribución del ingreso
Normal, Media=1000, Desv.Est.=200
0.0020
0.0015
Densidad
0.7066
0.0010
0.0005
0.0000
850
1000
X = ingreso
1300
Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.
Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre
S/. 850 y 1300.
6.
El volumen de negociaciones diarias (en millones de nuevos soles) para las
acciones comercializadas en la bolsa de Lima tiene distribución normal con
media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e
interprete:
a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones?
b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?
17
Solución
Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002)
 Z = (X – 800)/ 100 ~ N(0, 1).
Para determinar en cuántos de los n = 60 días el volumen de las negociaciones
está en los intervalos dados, primero se determina la probabilidad P y después
multiplica por n. Se pide:
 X  800 600  800 
a) P = P(X ≤ 600) = P 

 = P(Z < -2.0) = Φ(-2.0) =
100 
 100
0.02275
Luego nP = 0.02275 x 60 = 1.4 días Rpta.
Interpretación: en alrededor de 1.4 días (2.28%) el volumen de
negociaciones es de 600 o menos millones de nuevos soles.
 X  800 900  800 
b) P = P(X > 900) = P 

 = P(Z > 1.0) = 1 - Φ(1.0) =
100 
 100
= 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta.
Interpretación: en alrededor de 9.5 días (15.87%) el volumen de
negociaciones es mayor de 900 millones de nuevos soles.
7.
El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.
y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete
¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90
gramos?
Solución
Si X = peso de los pernos ~ N(80, 52)  Z = (X – 80)/ 5 ~ N(0, 1).
Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos
dados, primero se determina la probabilidad P y después multiplica por n. Se
pide:
 X  80 70  80 
a) P = P(X < 70) = P 

 = P(Z < -2.0) = Φ(-2.0) = 0.02275
5 
 5
Luego nP = 0.02275 x 2000 = 46 pernos Rpta.
Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.
 75  80 X  80 90  80 


b) P = P(75 ≤ X ≤ 90) = P 
= P(-1 ≤ Z ≤ 2) =
5
5 
 5
18
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859.
Distribución del peso de los pernos
Normal, Media=80, Desv.Est.=5
0.09
0.08
0.07
Densidad
0.06
0.8186
0.05
0.04
0.03
0.02
0.01
0.00
75
80
X = peso
90
Resultado gráfico en Minitab
Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.
Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90
gramos.
8.
El tiempo necesario para terminar un examen se distribuye normalmente con
media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60
alumnos, calcule e interprete cuántos alumnos terminan el examen:
a) ¿en una hora o menos?
b) ¿en más de 60 minutos, pero en menos de 75 minutos?
c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?
Solución
Si X = tiempo para terminar un examen ~ N(80, 102)
 Z = (X – 80)/ 10 ~ N(0, 1).
Para determinar cuántos de los n = 60 alumnos terminan el examen en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
 X  80 60  80 
a) P = P(X ≤ 60) = P 

 = P(Z ≤ -2.0) = Φ(-2.0) = 0.02275.
10 
 10
Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
19
Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una
hora o menos.
 60  80 X  80 75  80 


b) P = P(60 ≤ X ≤ 75) = P 
= P(-2 ≤ Z ≤ -0.5) =
10
10 
 10
= Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579.
Resultado gráfico en Minitab
Distribución tiempo duración examen
Normal, Media=80, Desv.Est.=10
0.04
Densidad
0.03
0.02
0.286
0.01
0.00
60
75 80
X = tiempo duración examen
Luego nP = 0.28579 x 60 = 17 alumnos Rpta.
Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más
de 60 minutos, pero en menos de 75 minutos.
 X  80 90  80 
c) P = P(X > 90) = P 

 = P(Z > 1.0) = 1 - Φ(1.0) =
10 
 10
= 1 – 0.84134 = 0.15866.
Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.
Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si
éste dura 90 minutos.
9.
Suponga que el ingreso familiar mensual (X) en una comunidad tiene
distribución normal con media $400 y desviación estándar $50. Si los gastos de
consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e
interprete la probabilidad de que los gastos de consumo familiar sean inferiores a
$320?
Solución
20
Si X = ingreso familiar mensual ~ N(400, 502),  Z = (X – 400)/ 50 ~ N(0, 1).
Se pide:
P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) =
 X  400 337.5  400 
= P

 = P(Z < -1.25)
50
 50

= Φ(-1.25) = 0.10565 Rpta.
Otra forma de resolver es usando la propiedad reproductiva de la distribución
normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:
 C  E(C)  0.8E( X )  50  0.8(400)  50  370
  C2  Var (0.8 X  50)   0.8 Var ( X )  0.64(2500)  1600  402
2
Luego C ~ N(370, 402),  Z = (C – 370)/ 40 ~ N(0, 1). Entonces:
 C  370 320  370 
P(C < 320) = P 

 = P(Z < -1.25) = Φ(-1.25) = 0.10565
40
 40

Rpta.
Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de
consumo familiar en la comunidad son menores a S/. 320.
10.
Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )
;
X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:
a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete P  8  Y  10
Solución
X1 ~ N (10 , 3 )
1  10
;
 12  3
X2 ~ N (12 , 4 )
2  12
;
 22  4
X3 ~ N (14 , 6 )
3  14
;
 32  6
a) Cálculo de la media y la varianza de Y
 Y  E Y   E  X1  2 X 2  X 3   E( X1 )  2E( X 2 )  E( X 3 ) =
Y  1  22  3  10  2(12)  14  0 Rpta.
  Y2  V (Y )  V ( X1  2 X 2  X 3 )  V ( X1 )  4V ( X 2 )  V ( X 3 )
 Y2  12  4 22   32  3  4(4)  6  25 Rpta.
21
b) Cálculo de la P  8  Y  10
Sabemos que Y  0 y  Y2  25   Y  5 .
Además Y ~ N [0, 25]  Z = (Y – 0)/ 5 ~ N(0, 1). Luego:
 8  0 Y  0 10  0 
P  8  Y  10  P 


 P  1.6  Z  2 
5
5 
 5
= Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta.
Interpretación: alrededor del 92.25% de los valores observados de Y se
encuentran entre -8 y 10.
11.
Sean X1, X2, X3 y
X4 variables aleatorias normales independientes con μ1
2
2
2
2
 30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ;  1 = 8 ;  2 = 6 ;  3 = 6 ;  4 = 2. Sí:
 X  2X 2   X3  X4 
Y=  1
 - 2 
4


 
Calcule e interprete: a) P 8  Y  14
y
b) P  Y  12
Solución:
X
X X
X
 X  2X 2   X3  X4 
Y =  1
- 
= 1 2 3 4


4
2
2
2
4

  2 

1
1
1
1
E  X1   E  X 2   E  X 3   E  X 4 
4
2
2
2
μY = E(Y) =
=

1
1
1
1
(30)  (25)  (12)  (8)  10
4
2
2
2
 Y2 = V (y) = 1 V ( X )  1 V ( X )  1 V ( X )  1 V ( X )
1
2
3
4
16
=
4
4
4
1
1
1
1
(8)  (6)  (6)  (2)  4
16
4
4
4
Siendo Y una combinación lineal de las variables independientes Xi cada una
con distribución normal, entonces por la propiedad reproductiva de la
distribución normal se cumple que Y ~ N [10, 4]  Z = (Y – 10)/ 2 ~ N(0, 1).
Luego:
 8 10 Y 10 14 10 


a) P 8  Y  14 = P 
= P (-1.0 ≤ Z ≤ 2.0) =
2
2 
 2
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.
22
Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14.
 12 10 Y 10 12 10 
b) P  Y  12 = P  12  Y  12  = P 
=


2
2 
 2
= P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) =
= 0.97725 – 0.00000 = 0.0.97725 Rpta.
Interpretación: alrededor del 97.73% de los valores absolutos de Y son
menores o iguales a 12.
12.
En el proceso de fabricación de condensadores, varias pruebas han demostrado
que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los
sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un
condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará
por sobre calentamiento? Interprete el resultado.
Solución
Sean: F = temperatura más alta de fabricación ~ N(125, 9) y
U = temperatura máxima de uso ~ N(116, 16)
Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.
Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0)
determinamos la distribución de F – U usando la propiedad reproductiva de la
distribución normal, así:
F – U ~ N(9, 25)  Z = ( F – U – 9)/ 5 ~ N(0, 1).
Entonces:
 F  U  80 0  9 
P(S) = P(F < U) = P(F – U < 0) = P 

=
5
5 

= P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta.
Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores
fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.
13.
En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que
ajustarse a una abertura circular seleccionando cada elemento al azar en un
suministro continuo. Los diámetros del tapón y de los casquillos en mm, son
N(24.9, 0.032 ) y N(25, 0.042 ) respectivamente. Si para que el ajuste sea
23
satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en
qué proporción de los casos el ajuste no será satisfactorio? Interprete el
resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón)
Solución
Sean: T = diámetro del tapón ~ N(24.9, 0.032) y
C = diámetro del casquillo ~ N(25, 0.042)
Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la
distribución normal se tiene que:
µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10
σ2X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052.
Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052)
 Z = (X – 0.10)/ 0.05 ~ N(0, 1).
Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:
 X  0.10 0.02  0.10 
P(X < 0.02) = P 

 = P(Z ≤ -1.8) = Φ(-1.6) = 0.0548
0.05 
 0.05
Rpta.
Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000)
ensambles el tapón no se ajusta al casquillo.
14.
Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en
serie y puede suponerse que sus longitudes siguen una distribución normal con
media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben
ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no
mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción
de estos no se ajustará en el espacio requerido? Interprete el resultado.
Solución
Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162) y
9
L = longitud del recipiente con 9 pastillas =
X
i 1
i
.
Por la propiedad reproductiva de la distribución normal, se tiene que:
9
E(L) = E(  X i ) =
i 1
9
 E( X i ) =
i 1
9
 0.29 = 9 x 0.29 = 2.61 cm.
i1
24
9
V(L) = V(  X i ) =
i 1
9
V ( X i ) =
i 1
9
 0.016
2
= 9 x 0.0162 = 0.002304 cm2.
i1
Luego:
9
L = longitud del recipiente con 9 pastillas =
X
i 1
i
~ N(2.61, 0.0002304)
 Z = (L – 2.61)/ 0.048 ~ N(0, 1).
Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:
 L  2.61 2.67  2.61 
P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 - P 

=
0.048 
 0.048
= 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta.
Interpretación: en alrededor del 10.56% de los (ó en 1056 de cada 10000)
recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.
15.
Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de
50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto
como falla el primer tubo, empieza a funcionar el segundo y cuando falla el
segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50
tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la
probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido
entre 20 000 y 30 000 horas? Interprete el resultado.
Solución
Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500)
Entonces µ = E(Xi) = 1/ λ = 500 , σ2 = 1/ λ2 = 5002] i = 1, 2, …., 50.
Sea Y50 = tiempo de funcionamiento de los 50 tubos =
50
= X1  X 2  ............  X 50   X i
i 1
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(20 000 ≤ Y50 ≤ 30 000) =
50


 20000  50 x500  X i  50 x500 30000  50 x500 
 = P(-1.41 ≤ Z ≤
 i 1

= P
500 x 50)
500 x 50) 
 500 x 50)




1.41)
25
= Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta.
Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000)
tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30
000 horas.
16.
Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y
una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6
litros.
Solución
Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36
= X1  X 2  ............  X 36   X i
i 1
Entonces, por el teorema del límite central la probabilidad solicitada es:
 36

  X i  36 x1 36.6  36 x1 
=

P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 - P  i 1
0.04 36 
 0.04 36




= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36
botellas de aceite el contenido es de más de 36.6 litros.
17.
En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100
hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no
tengan desagüe.
Solución
Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]
Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =
100
= X1  X 2  ............  X100   X i ~ B[n = 100, p = 0.20] ó N[np = 20, npq =
i 1
16]
Entonces, por el teorema del límite central la probabilidad solicitada es:
26
P(Y100
>
30)
=
1
-
P(Y100
≤
30)
=
1
-
 100

  X i  100 x0.20
30  100 x0.20 
=
P  i 1

0.20 x0.80 100 
 0.20 x0.80 100




= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de
100 hogares escogidos, más de 30 hogares no tienen desagüe.
18.
Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación
estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a
razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera
de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete
su resultado.
Solución
Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.]
100
Sea Y100 = peso total de los 100 pavos = X1  X 2  ............  X100   X i
i 1
Entonces, por el teorema del límite central la probabilidad solicitada es:
 100

  X i  100 x7 697  100 x7 
 =

P(Y100 < 697) = P  i 1
0.15 100 
 0.15 100




= P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta.
Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores
minoristas recibe un peso total menor a 697 Kg.
19.
La Constructora “Techito” estima que el peso promedio de las personas que
vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar
de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para
36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta,
calcule e interprete la probabilidad de que un cupo completo exceda la capacidad
del ascensor.
Solución
27
Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.]
36
Sea Y36 = peso total de las 36 personas = X1  X 2  ............  X 36   X i
i 1
Entonces, por el teorema del límite central la probabilidad solicitada es:
 36

  X i  36 x68 2700  36 x68 
=

P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 - P  i 1
15 36
15 36






= 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta.
Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos
completos del ascensor con 36 personas exceden su capacidad máxima de 2700
Kg.
20.
Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una
desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36
litros.
Solución
Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.]
Sea
Y36
=
contenido
por
caja
de
las
36
botellas
=
36
X1  X 2  ............  X 36   X i
i 1
Entonces, por el teorema del límite central la probabilidad solicitada es:
 36

  X i  36 x2 72.36  36 x 2 
 =

P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 - P  i 1
0.018 36 
 0.018 36




= 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta.
Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36
botellas de ron contienen más de 72.36 litros.
28
EJERCICIOS PROPUESTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)].
Hallar las probabilidades siguientes:
a) P(Z ≤ 2.15)
b) P(0.80 < Z < 1.96)
c) P(-2.45 < Z ≤ 1.65)
d) P(-2.75 ≤ Z ≤ -0.65)
e) P(Z ≥ -1.38)
f) P(-2.57 ≤ Z < 0)
g) P(0 ≤ Z < 2.33).
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes:
a) Φ(z) = 0.8665
b) Φ(z) = 0.9222
c) Φ(z) = 0.9972
d) el área entre –z y z es 0.99
e) el área a la izquierda de z es 0.05
f) el área a la derecha de z es 0.025
3. El contenido en las botellas de cierta gaseosa tiene distribución normal con
media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la
probabilidad de que una botella de gaseosa tenga:
a) Entre 990 y 1005 ml.
b) Menos de 985 ml.
4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene
distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80.
Calcule e interprete la probabilidad de que el precio pagado por el kilo de
pescado:
a) Sea menor de S/. 10.
b) Se encuentre entre S/. 10.50 y 13.50.
c) Por arriba de que precio paga el 10% superior de los consumidores.
29
5. El tiempo que dura la atención a los clientes de un negocio se distribuye
normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos.
Calcule e interprete la probabilidad de que el tiempo de atención a los clientes:
a) dure entre 25 y 40 minutos.
b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones.
6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y
desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete
¿qué cantidad de cajas pesan:
a) menos de 19 kilos?
b) entre 19.5 y 21 kilos?
7. El peso de los huevos de gallina producidos por una avícola se distribuye
normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se
almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan:
a) Menos de 70 gramos?
b) Entre 55 y 60 gramos?
8. La duración de ciertos focos eléctricos tiene distribución normal con media µ=
1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos,
calcule e interprete:
a) ¿Cuántos focos durarán menos de 600 horas?
b) ¿Cuántos focos durarán entre 850 y 1300 horas?
9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora
“Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación
estándar σ = 100. En un período de 60 días, calcule e interprete:
a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar?
b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar?
10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con
2
2
μ1  50; μ2 = 35;  1 = 10;  2 = 6. Si: Y = X1 - X2. Calcule e interprete:
a) La media y la varianza de Y
b) P 10  Y  25
30
11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente
2
2
 32 = 6. Sí: Y = X + 2 X con μ1  10; μ2 = 15; μ3 = 12;  1 = 3;  2 = 4;
1
2
X3
Calcule e interprete:
a) P  20  Y  40
b) P Y  18
12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,
2002 ) y N(2878, 2502 ) respectivamente. Si se prueba la vida de cada uno de los
teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que
los A duren un año o más que los B? Interprete su resultado.
13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100
hogares, calcule e interprete la probabilidad que más de 30 no tengan agua.
14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener
entre 40 y 60 caras.
15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar
de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas
recibidas al azar y cargadas en un camión, supere su capacidad máxima que es
de 8,250 kg.
16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50
kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad
de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.
17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar
de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas
tomadas al azar sea menor de 5,980 kg.
18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una
desviación
estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a
razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera
31
de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete
su resultado.
19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de
580 libras y una desviación estándar de 80 libras. Calcule e interprete la
probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un
montacargas, supere su capacidad de 30 000 libras.
20.
Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una
desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los
supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la
probabilidad de que un supermercado cualquiera, reciba un peso total de
menos de 1 990.2 Kg.?
32
Capítulo 2. DISTRIBUCIONES MUESTRALES
“¿Hace falta remarcar que un país que no conoce su demografía,
tampoco conoce su economía? No se puede saber lo que un país
produce y ahorra si se ignora esta cosa fundamental: la población. ....
En un país donde no se puede contar a los hombres, menos aún se
puede contar la producción. Se desconoce el primero de sus factores:
el factor humano, el factor trabajo..”
José Carlos Mariátegui
CONTENIDO
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
Distribuciones muestral de la media.
Distribución muestral del total (conocida la media)
Distribución de la diferencia de medias muestrales.
Distribución muestral de la proporción.
Distribución muestral del total (conocida la proporción)
Distribución muestral de la diferencia de proporciones.
Ejercicios resueltos.
Ejercicios propuestos.
La estadística es una ciencia importante porque permite el conocimiento de la
población basándose en muestras aleatorias representativas. El principal problema de
la estadística es estudiar una población con función de cuantía o función de densidad,
f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se
conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una
muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se
busca alguna función de esta muestra que estime el parámetro desconocido θ,
problema que será abordado con mayor detalle en el capítulo de estimación.
En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n
≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia
de proporciones y a los totales (conocida la distribución de la media y la proporción).
Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte
fundamental para poder comprender el desarrollo de la estimación por intervalos y la
docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla
cada uno de los conceptos importantes de las distribuciones muestrales.
33
Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a
ser observadas y que poseen una característica común. Es decir, es el conjunto de
todas las observaciones posibles que puede tomar una variable aleatoria X. Por
ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las
ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.
Muestra.- es una parte representativa de la población. La representatividad implica
adecuado: método de muestreo, tamaño de muestra, selección de la muestra y
propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra
vendría dada por una parte representativa de empresas u hogares.
Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad
f(x) (función de cuantía o función de densidad) con media μ y varianza σ2. Una
muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias
(X1 , X2 , .... , Xn ) que cumplen:
1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la
misma distribución de probabilidades f X i ( x)  f X ( x) , la misma función de
distribución acumulativa FX i ( x)  FX ( x) , la misma media  X i = E(Xi) = E(X)
N
=
μ con  
N
2 
(X
i 1
i
X
i 1
N
i
y la misma varianza  X2 I = V(Xi ) = V(X) =
  )2
N
.
2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la
función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está
dada
por:
n
f X1 , X 2 ,...., X n ( X 1 , X 2 ,...., X n )  f X ( X 1 ) f X ( X 2 ).... f X ( X n )   f X ( X i ) .
i 1
Esta probabilidad de ocurrencia de la muestra observada, es importante en
estimación puntual, ya que allí representa la función de verosimilitud a
maximizar.
Nota:
34

La definición de m.a. se cumple cuando la muestra proviene de una población
infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de
una población finita.

La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una
población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin
embargo, si el tamaño n de la muestra es muy pequeño en comparación con el
tamaño N de la población (n < 5% N ) se cumple aproximadamente la
definición.
Ejemplo 1.Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson,
con parámetro λ, hallar la función de probabilidad conjunta (función de
verosimilitud) para dicha muestra.
Solución:
Como la v.a. X ~ Poisson (λ), entonces Xi
probabilidad es: f X ( X i ) 
 X e 
i
~ Poisson (λ) y su función de
, i  1,2,....,n ; Xi = 0, 1, 2, 3, ......
X i!
Luego la función de probabilidad conjunta (función de verosimilitud) será:
f X1 , X 2 ,....,X n ( X 1 , X 2 ,...., X n )  f X ( X 1 ) f X ( X 2 ).... f X ( X n ) =
n

i 1
 X e 
i
X i!
  X n e  
  X1 e     X 2 e  


....
=

=


 X 1!   X 2 ! 
 X n! 
n
Xi

i 1
=

e n
n
X !
i 1
, Xi = 0, 1, 2, 3, ...... ;  i = 1, 2, .... , n .
i
Rpta.
Ejemplo 2.Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2 ),
hallar la función de probabilidad conjunta (función de verosimilitud) para dicha
muestra.
Solución:
35
Como la v.a. X ~ N(μ , σ2 ), entonces Xi ~ N(μ , σ2 ) y su función de probabilidad
está dada por:
1
f X (Xi ) 
2 2
e ( X i   )
2
/ 2 2
;  X i  ,  i = 1, 2, 3, .... , n.
Luego la función de densidad conjunta (función de verosimilitud) será:
f X1 , X 2 ,....,X n ( X 1 , X 2 ,...., X n )  f X ( X 1 ) f X ( X 2 ).... f X ( X n ) =
 1
2
2 
 1
2
2  
2
2 
1
e ( X n   ) / 2 
=
e ( X1  ) / 2  
e ( X 2  ) / 2  .... 
2
2
2
 2

 2
  2

=
n
2
 1 
e
=
2
 2 

n
( X i   ) 2 / 2 2

i 1
;  xi  ,  i = 1, 2, 3, .... , n. Rpta.
Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.
Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral
( X ) y la varianza muestral (s2 ) son estadísticos. Donde:
n
X 
n
 Xi
i 1
n
s2 
y
( X
i 1
i
 X )2
n 1
Distribución muestral.- es la distribución de probabilidad de un estadístico.
Error estándar de un estadístico.- es la desviación estándar de la distribución
muestral de un estadístico.
Error relativo de un estadístico.- es el coeficiente de variación de la distribución
muestral de un estadístico.
Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una
n
población X, con media E(X) = μ
y varianza Var (X) = σ . Sea X 
2
media muestral, entonces: E (X )  
y
 X2  Var( X ) 
2
n
X
i 1
n
i
la
.
Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n
de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X)
= Var (Xi) = σ2.
Entonces: E (X )  
y
2  N n
S2  N  n 
  Var( X )  
 
.
n  N 1  n  N 
2
X
36
N
Donde:
S2 
( X
i 1
i
  )2
, representa la cuasivarianza poblacional y el factor
N 1
N n
se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que
N 1
es
f 
descartado
cuando
n
 0.05  0.97 
N
la
fracción
de
muestreo
(f
)
N n
 1.
N 1
A continuación presentamos las distribuciones muestrales de la media, del total
(conocida la media), de la diferencia de medias muestrales, de la proporción, del total
(conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma
importancia en el diario quehacer de muchos campos de la investigación científica,
ya que como estudiaremos más adelante, van a permitir la determinación de
intervalos de confianza y la verificación de hipótesis para los parámetros
poblacionales.
2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una
población X, con media E(X) = μ
y varianza Var (X) = σ2. Entonces, por el
n
teorema central del límite, la media muestral X 
X
i 1
n
i
tiene aproximadamente
distribución normal con media μ y varianza σ2/n. X  N (, 2 / n) . Y la variable
aleatoria Z 
( X  )
tiene aproximadamente distribución N(0, 1).
/ n
Este teorema es válido para cualquier población finita o infinita, discreta o continua,
cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple
cualquiera sea el tamaño n de la muestra.
Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la
variables aleatorias Xi no son independientes, entonces la distribución de X es
hipergeométrica, con:
E (X )  
y
 X2  Var( X ) 
2  N n

 . Luego:
n  N 1 
37
Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin
reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza
n
Var (X) = σ . Entonces, la media muestral X 
2
X
i 1
n
i
tiene aproximadamente
distribución normal con media μ y varianza   Var( X ) 
2
X
2  N n

 . Y la
n  N 1 
( X  )
tiene aproximadamente distribución N(0, 1).
 N n
n N 1
variable aleatoria Z 
Ejemplo 3.En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio
promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras
aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio
promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el
precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos
alrededor del precio promedio verdadero se encontrará el 95 % de los precios
promedios muestrales.
Solución.Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50.
 X2  Var( X ) 
2
n
= (0.40)2 / 50 = 0.0032
Luego: X  N (5.00;0.0032) y Z 
  X  0.057. S/.
( X  5.00)
 N (0,1) . Nos piden:
0.057
 4.85  5.00 X  5.00 5.10  5.00 


a) P(4.85  X  5.10) = P
=
0.057
0.057 
 .057
= P(-2.63  Z  1.75) =  (1.75) -  (-2.63) =
= 0.95994 – 0.00427 = 0.95567 Rpta.
Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de
50 precios.
b) P( X < 4.80) = P(
X  5.00 4.80  5.00

)  P( Z  3.51)  0.00022
0.057
0.057
38
Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios.
c) Sean 5.00 – E y 5.00 + E los límites simétricos alrededor de la media μ = S/.
5.00, dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(5.00 – E  X  5.00 + E) = P(
E
E
Z
)
0.057
0.057
 E   E 
 E 
 E 
= 
  
  2 
  1  
  0.975 
 0.057   0.057 
 0.057 
 0.057 
E
 Z 0.975  1.96  E  1.96(0.057 )  0.11 . Luego los límites serán:
0.057
5.00 – E= 5.00 – 0.11 = S/. 4.89
y
5.00 + 0.11 = S/. 5.11. Es decir:
0.95 = P(4.89  X  5.11)
Interpretación.- el 95 % de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de μ =
S/. 5.00, para muestras de 50 precios.
2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la media muestral, para lo cual se tiene que tener presente
lo siguiente:
N

Sí el promedio poblacional es:
X
i 1
i
N
n
El total de la población se define como: X   X i  N
i 1
Xˆ  N̂  NX
el cual es estimado por:
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:
Xˆ  Nˆ  NX  N N , N 2 X2 
y
Z
NX  N
~ N(0, 1)
N X
Donde la varianza del estimador del total está dada por:
39


,
Var( Xˆ )  Var( Nˆ )  Var( NX )  N 2Var( X )  N 2 X2  N 2
n
2
si
la
fracción de muestreo f = n / N  0.05 , o

Var( Xˆ )  Var( Nˆ )  Var( NX )  N 2Var( X )  N 2 X2  N 2
2 N n
n N 1
,
si
la fracción de muestreo f = n / N > 0.05.
2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES
Esta distribución va a surgir cuando estemos interesados en efectuar la comparación
de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio
poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio
poblacional del mismo bien o servicio en la ciudad Y (μY ). O comparar los ingresos
promedios, ventas promedios, los rendimientos promedios, etc. no sólo entre
ciudades, sino también entre grupos.
Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o
servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a
plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0?
Es decir, que esta comparación se reduce a conocer la diferencia de medias
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas,
de la siguiente manera:
 Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de
y varianza Var (X) =  X2 . Sabemos que la
tamaño N, con media E(X) = μX
n
media muestral X 
X
i 1
i
tiene aproximadamente distribución normal:
n
X  N ( X , X2 ) . Donde:  X2 
 X2
o  X2  Var( X ) 
n
 X2  N  n 

 ..... (1)
n  N 1 
 Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de
tamaño M, con media E(Y) = μY
y varianza Var (Y) =  Y2 . Sabemos que la
m
media muestral Y 
Y
i 1
m
i
tiene aproximadamente distribución normal:
40
 Y2
Y  N (Y , Y2 ) . Donde:   m o
2
Y
 Y2  Var(Y ) 
 Y2  M  m 


m  M  1  ..... (2)
 De (1) y (2) tenemos que X - Y es una variable aleatoria con media:
X Y  E X  Y   E X   EY   X  Y  X  Y
y varianza:
 X2 Y  Var X  Y   Var X   VarY    X2   Y2
 X2  Y2
+
n
m
 X2 Y =
o
 X2  N  n 
  M m

 + Y

m  M 1 
n  N 1 
2
.............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene
que:
X - Y ~ N(  X  Y ,  X2 Y )
Z
y
X  Y  (  X  Y ) )
 X Y
~
N(0 , 1)
donde  X Y se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 5.
Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaños n y
m) de dos poblaciones X e Y, con medias μX y μY , y varianzas Var (X) =  X2 y
Var (Y) =  Y2 , respectivamente, entonces la distribución muestral de la diferencia de
medias es aproximadamente normal N(  X  Y ,  X2 Y ) y la variable aleatoria
Z
X  Y  (  X  Y ) )
 X2
n

 Y2
o
Z
X  Y  ( X  Y ) )
 X2  N  n   Y2  M  m 
tiene




n  N 1  m  M 1 
m
aproximadamente distribución normal estándar N(0 , 1).
Si n y m son mayores o iguales que 30, la aproximación a la normal para la
diferencia de medias muestrales es óptima.
Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier
tamaño de muestra.
Ejemplo 4.Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de
20 gr. Cierto día de producción se toman independientemente dos muestras al azar
sin reposición, con n = 500 y m = 800. ¿Cuál es la probabilidad que los pesos medios
41
de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar
los resultados.
Solución.Sea X la muestra de tamaño n = 500 bolsas de café, con μX = 500 gr. y  X = 20 gr.
Sea Y la muestra de tamaño m = 800 bolsas de café, con μY = 500 gr. y  Y = 20 gr.
Luego:  X Y =  X  Y = 500 – 500 = 0,
1.3 y
Además,
 X2 Y =
 X2  Y2
+
n
m
=
202 202
=

500 800
 X Y = 1.14 gr.
X - Y ~ N(0, 1.3) y
Z
X Y  0
~ N(0 , 1).
1.14
Nos piden:
a) P ( X - Y > 2 ) = 1 - P ( X - Y  2 ) = 1 - P(-2  X - Y  2) =
  2  0 X Y  0 2  0
= 1 - P


 = 1 - P(-1.75  Z 
1.14
1.14 
 1.14
1.75) =
= 1 – [ (1.75) -  (-1.75)] = 1 - [ (1.75) – 1 +  (1.75)] =
= 2 – 2  (1.75) = 2 – 2 (0.95994) = 0.08012 Rpta.
Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán mayores a 2
gramos.
b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) =
 1 0 X  Y  0 1 0 


= P
 = P(-0.88  Z  0.88) =
1.14
1.14 
 1.14
= (0.88) - (-0.88) = 0.81057 – 0.18943 = 0.62114 Rpta.
Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán menores de
1 gramo.
42
2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o
cuantitativos de la población en dos clases distintas (población dicotómica o
binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor y en contra;
aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más);
caras y sellos; empleados y desempleados; etc.
En este caso, se desea estimar la proporción de unidades (P) o el número total de
unidades (A) en la población que poseen una cierta característica o atributo que
cae dentro de una clase definida. Por ejemplo, se desea estimar:
- El porcentaje (o número) de personas que consumen un cierto producto.
- El porcentaje (o número) de clientes que compran más de 10 000 dólares
mensuales.
- El porcentaje (o número) de ciudadanos que está a favor de un personaje.
Notación: Además de la notación usada anteriormente, si se define la v.a.
Bernoulli:
Xi = 1, si la unidad estadística observada posee la característica de interés
(éxito).
Xi = 0, si la unidad estadística no posee la característica de interés (fracaso).
Entonces:
N
N
A   Xi
y
P
X
i 1
i 1
i
representan el número total de unidades (A) y la
N
proporción (P) de unidades en la población que poseen una cierta característica.
Suponga que se extrae una muestra aleatoria simple de tamaño n de la población
binomial, entonces la proporción muestral p definida como:
n
p
X
i 1
n
i

X
n
43
,
estima a P.
n
X =
X
i 1
i
= número de éxitos en la muestra es una v.a. Binomial (n, P). La
proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y
V(Xi ) = P Q; representa la proporción de éxitos en la muestra y estima a la
proporción de éxitos en la población P. Es decir, que p tiene el mismo
comportamiento de una media muestral X . Por lo tanto:

 n

 Xi  1 n
1 n
1
E ( p)  E  i 1    E ( X i )   P  (nP)  P
n i 1
n
 n  n i 1



n
 n

X
Var
(
Xi )

 i 
i 1
i 1

Var( p)  Var
n2
 n 


n

(propiedad de la varianza)
n
Var( X )  PQ
i
i 1
n

2
i 1
n
2

nPQ PQ

  p2
2
n
n
n
Luego:
y
p
Z
X
i 1
n
i

X
n
 PQ 
 N  P,

n 

pP
~ N(0, 1)
PQ
n
Si el muestreo se efectúa sin reemplazo de una población binomial finita, la
distribución muestral de p sigue la distribución hipergeométrica y su varianza
requiere el factor de corrección para poblaciones finitas (salvo que la fracción de
muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:
n
p
X
i 1
n
i

X
n
 PQ  N  n 
 N  P,


n  N  1 

44
Z
y
pP
~ N(0, 1)
PQ  N  n 


n  N 1 
Ejemplo 5.Según el Censo Nacional de Talla en Escolares de 19991 la desnutrición crónica en el
Perú era del 27.9%. Si se toma una muestra al azar sin reposición, de n = 1500 niños
y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral
se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la
proporción verdadera de desnutridos crónicos se encontrará el 95% de las
proporciones muestrales.
Solución.El mencionado Censo tiene los siguientes datos:
N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.
N
X=
X
i 1
= 574 314 niños y niñas desnutridos crónicos.
i
N
P
X
i 1
N
i

X
574,314
= 0.279 = proporción censal de niños y niñas con

N 2'059,426
desnutrición crónica.
Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica.
n = 1500 niños y niñas = tamaño de la muestra.
Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción
muestral:
1
Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999.
Lima, Perú, Noviembre de 2000.
45
n
p
y
X
i 1
Z
n
i

X
n
 PQ 
 N  P,
  N 0.279; 0.0001341 
n 

pP
p  0.279
p  0.279
~ N(0, 1)


0.0116
PQ
0.0001341
n
Se pide calcular:
 0.26  0.279 p  0.279 0.30  0.279 
a) P ( 0.26  p  0.30 ) = P



0.0116
0.0116 
 0.0116
= P( -1.64  Z  1.81 ) =  (1.81) -  (-1.64) =
= 0.96485 – 0.05050 = 0.91435 Rpta.
Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel
nacional, el porcentaje de desnutridos crónicos, se encuentra entre el 26 y 30 %.
b) Sean 0.279 – E y 0.279 + E los límites simétricos alrededor de la proporción
verdadera P = 0.279 , dentro de los cuales estará el 95 % de las p. Entonces:
0.95 = P(0.279 – E  p  0.279 + E) = P(
E
E
Z
)
0.0116
0.0116
 E   E 
 E 
 E 
= 
  
  2 
  1  
  0.975 
 0.0116   0.0116 
 0.0116 
 0.0116 
E
 Z 0.975  1.96  E  1.96(0.0116 )  0.023 . Luego los límites serán:
0.0116
0.279 – E = 0.279 – 0.023 = 0.256
y
0.279 + 0.023 = 0.302 . Es decir:
0.95 = P(0.256  p  0.302 )
Rpta.
Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional,
la proporción de desnutridos crónicos se encontrará entre 0.256 y 0.302 alrededor
de la proporción verdadera P = 0.279.
46
2.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la proporción muestral, para lo cual se tiene que tener
presente lo siguiente:
N
Sí
P
X
i 1
N
i
representa la proporción (P) de unidades en la población que
N
poseen una cierta característica y A   X i
el número total (A) de unidades que
i 1
poseen dicha característica. Entonces:
N
El total de la población se define como: A   X i  NP
i 1
Aˆ  NPˆ  Np
el cual es estimado por:
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:

Aˆ  NPˆ  Np  N NP, N 2 p2

y
Z
Np  NP
~ N(0, 1)
N p
Donde la varianza del estimador del total está dada por:

Var( Aˆ )  Var( NPˆ )  Var( Np)  N 2Var( p)  N 2 p2  N 2
PQ
,
n
si
la
fracción de muestreo f = n / N  0.05 , o

Var( Aˆ )  Var( NPˆ )  Var( Np)  N 2Var( p)  N 2 p2  N 2
la fracción de muestreo f = n / N > 0.05.
47
PQ  N  n 

 , si
n  N 1 
2.6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE
PROPORCIONES
Esta distribución surge cuando estemos interesados en efectuar la comparación de las
proporciones de dos poblaciones. Por ejemplo: comparar la proporción poblacional
de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción
poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ).
Comparar las proporciones de aceptación no sólo entre ciudades, sino también entre
grupos.
Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de
individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a
plantearse ¿ P1 = P2 o P1 – P2 = 0 ?
Es decir, que esta comparación se reduce a conocer la diferencia de proporciones
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la proporción muestral en cada una de
ellas y de la diferencia p1 – p2 de la siguiente manera:
 Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población
binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el
número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de
éxitos p1 , definida como p1 
X1
n1
estima a P1 y para n1 suficientemente
grande tiene aproximadamente distribución normal:
p1  N ( P1, p21 ) . Donde:  p21 
P1Q1
n1
o  p21 
P1Q1  N1  n1 


n1  N1  1 
..... (1)
 Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población
binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea X2 el
número de éxitos en la muestra de tamaño n2 , entonces la proporción muestral de
éxitos p2 , definida como p2 
X2
n2
estima a P2 y para n2 suficientemente
grande tiene aproximadamente distribución normal:
48
p2  N ( P2 , p22 ) . Donde:  p22 
P2Q2
n2
 p2 
o
2
P2Q2  N2  n2 


n2  N2  1 
.....
(2)
 Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones están
dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:
 p  p  E  p1  p2   E  p1   E  p2    p   p  P1  P2
1
2
1
2
y varianza:
 p2  p  Var p1  p2   Var p1   Var p2    p2   p2
1
2
1
 p2  p =
1
2
2
P1Q1 P2Q2
PQ  N  n  P Q  N  n2 

+
o 1 1  1 1  + 2 2  2
n2  N 2  1 
n1
n2
n1  N1  1 
............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se
tiene que:
p1 – p2 ~ N(P1 – P2 ,  p21  p2 )
Z
y
p1  p2  ( P1  P2 )
 p p
1
~ N(0 , 1)
2
donde  p1  p2 se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 6.
Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños
n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la
distribución muestral de la diferencia de proporciones p1 - p2 ~ N(P1 – P2 ,  p21  p2 )
y
Z
la
variable
Z
aleatoria
p1  p2  ( P1  P2 )
P1Q1  N1  n1  P2Q2  N 2  n2 




n1  N1  1 
n2  N 2  1 
normal estándar N(0 , 1).
49
p1  p2  ( P1  P2 )
P1Q1 P2Q2

n1
n2
o
tiene aproximadamente distribución
Si n1 y n2 son mayores o iguales que 30, la aproximación a la normal para la
diferencia de proporciones muestrales es óptima.
Ejemplo 6.Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación
de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un
30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. ¿Cuál es la
probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el
producto en ambas ciudades sea menor al 8%? Interpretar el resultado.
Solución.P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.
Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad
1.
P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.
Q2 = 1 – P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad
2.
n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades)
Considerando que ambas ciudades son grandes y que las correspondientes fracciones
de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
p1 – p2 ~ N(P1 – P2 ,  p21  p2 )
Con media:  p1  p 2  P1  P2 = 0.35 – 0.30 = 0.05
Y varianza:
 p2  p =
1
2
(0.35)(0.65) (0.35)(0.65)
P1Q1
PQ

+ 2 2 =
= 0.0011 .
400
400
n1
n2
Luego:
p1 – p2 ~ N(0.05 ; 0.0011) y Z 
p1  p2  ( P1  P2 )
 p p
1
50
2

p1  p2  0.05
~ N(0 , 1)
0.0331
Se pide calcular:
P (p1 – p2  0.08 ) = P(-0.08  p1 – p2  0.08) =
  0.08  0.05 p1  p2  0.05 0.08  0.05 
= P


 =
0.0331
0.0331 
 0.0331
= P(-3.93  Z  0.91) =  (0.91) -  (-3.93) =
= 0.81859 – 0.00004 = 0.81855
Rpta.
Interpretación.- en el 81.86% de las comparaciones, para muestras de 400 hogares
de cada ciudad, las diferencias de proporciones muestrales de hogares que
prefieren el producto en ambas ciudades será menor al 8%.
51
2.7 EJERCICIOS RESUELTOS
1. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución Bernoulli, con parámetro p, hallar la función de probabilidad conjunta
(o de verosimilitud) para dicha muestra.
Solución
Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su
función de probabilidad es: f X ( xi )  p xi q1 xi , i  1, 2,...., n ; xi = 0 y 1.
Luego la función de probabilidad conjunta o de verosimilitud será:
f ( x1, x2 ,...., xn )  f X ( x1 ) f X ( x2 ).... f X ( xn )   p x1 q x1   p x2 q x2  ....  p xn q xn 
n
 xi
= p i1
n
q
n
 xi
i 1
, xi = 0 y 1;  i = 1, 2, .... , n . Rpta.
2. Si se toma una muestra aleatoria de tamaño m, de una población X con
distribución binomial, con parámetros n y p, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su función
de probabilidad es: f X ( xi )  n C x p xi q n xi , i  1, 2,...., m ; xi = 0, 1, 2, 3, .... , n
i
Luego la función de probabilidad conjunta o de verosimilitud será:
f ( x1, x2 ,...., xn )  f X ( x1 ) f X ( x2 ).... f X ( xn ) 
=  n Cx1 p x1 q n x1   n Cx2 p x2 q n x2  ....  n Cxm p xm q n xm 
m
m

  xi m xi
=   n Cxi  p i1 q i1 , xi = 0, 1, 2,....,n;  i = 1, 2, ..., m .
 i 1

m
Rpta.
3. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución de Pareto, con parámetro B, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
52
Solución
Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de
probabilidad es: f X ( xi ) 
BX 0B
, X i  X 0 , i  1, 2,...., n . Donde:
X iB 1
B = Coeficiente de Pareto > 0.
Xo = Ingreso mínimo.
Luego la función de probabilidad conjunta o de verosimilitud será:
 BX 0B 
f ( x1, x2 ,...., xn )  f X ( x1 ) f X ( x2 ).... f X ( xn )   X B 1 
 1 
 BX 0B 
 BX 0B 
 B 1  ....  B 1 
 X1 
 X1 


 B n X nB 
  n 0  ; X i  X 0 , i  1, 2,...., n
 X B 1 
,
i
 

i 1
Rpta.
4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución
log-normal, con parámetros μ y σ2, hallar la función de probabilidad conjunta (o de
verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ LN (μ , σ2 ), entonces cada Xi ~ LN (μ , σ2 ) y su
f X ( xi ) 
función de probabilidad esta dada por:
1
xi 2
2
e (ln xi   )
2
/ 2 2
; xi  0,  i =
1, 2, ...., n.
Luego la función de densidad conjunta o de verosimilitud será:
f ( x1, x2 ,...., xn )  f X ( x1 ) f X ( x2 ).... f X ( xn ) 
=


2
2 
2
2  
2
2 
1
1
1
e (ln x1   ) / 2  
e (ln x2   ) / 2  .... 
e (ln xn   ) / 2  =

2
2
2
 x1 2
  x2 2

 xn 2

n
n
(ln xi   )
1  1  2 
i 1
= n
e
 2 2 
x 

i 1
2
/ 2 2
; xi  0,  i = 1, 2, 3, .... , n. Rpta.
i
53
5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros
y una desviación estándar de 0.12 litros. Si se toma una muestra aleatoria de 36
botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.
b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 2.0 lts., σ = 0.12 lts. y n = 36 botellas.
 X2  Var( X ) 
2
n
= (0.12)2 / 36 = 0.0004
  X  0.02 lts.
Luego: X  N (  ,  X2 ) = N(2.00, 0.0004) y Z 
( X  2.00)
 N (0,1) . Nos piden:
0.02
 1.96  2.00 X  2.00 2.03  2.00 


a) P(1.96  X  2.03) = P 
= P(-2.0  Z 
0.02
0.02 
 0.02
1.5)
=  (1.5) -  (-2.0) =
= 0.93319 – 0.02275 = 0.91044 Rpta.
Distribución contenido medio de aceite
Normal, Media=2, Desv.Est.=0.02 lts.
20
Densidad
15
0.9104
10
5
0
1.96
2.00
2.03
X = media muestral
Resultado gráfico en Minitab
54
Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.96 y 2.03 litros.
b) Sean 2.00 – E y 2.00 + E los límites simétricos alrededor de la media μ = 2.0 lts.,
dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(2.00 – E  X  2.00 + E) = P(
E
E
Z
)
0.02
0.02
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.975
 0.02   0.02 
 0.02 
 0.02 
E
 Z 0.975 = 1.96 → E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán:
0.02
2.00 – E = 2.00 – 0.039 = 1.961 lts.
y
2.00 + 0.039 = 2.039 lts. Es decir:
0.95 = P(1.961  X  2.039) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.961 y 2.039 lts. alrededor de μ = 2.0 lts.
6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas
semanales de petróleo tienen un promedio de 15 galones por cliente con una
desviación estándar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e
interprete:
a) La probabilidad de que la compra promedio semanal de petróleo sea menor de
14 galones;
b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 15 glns., σ = 2.8 glns. y n = 49 clientes.
 X2  Var( X ) 
2
n
= (2.8)2 / 49 = 0.16   X  0.4 glns.
55
Entonces: X  N (  ,  X2 ) = N(15, 0.16) y Z 
( X  15)
 N(0, 1). Nos piden:
0.4
 X  15 14  15 

a) P( X < 14) = P 
= P(Z < -2.5) =  (-2.5) = 0.00621 Rpta.
0.4 
 0.4
Interpretación.- en el 0.621% de las (ó en 62 de cada 10000) muestras de 49
clientes de petróleo, la compra media es menor a 14 galones.
b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15
glns., dentro de los cuales caerá el 99 % de las X . Entonces:
0.99 = P(15 – E  X  15 + E) = P(
E
E
Z
)
0.4
0.4
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.995
 0.4   0.4 
 0.4 
 0.4 
E
 Z 0.995 = 2.575 → E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán:
0.4
15 – E = 15 – 1.03 = 13.97 glns.
y
15 + 1.03 = 16.03 glns. Es decir:
0.99 = P(13.97  X  16.03)
Rpta.
Distribución compra media de petróleo
Normal, Media=15, Desv.Est.=0.4
0.99
1.0
Densidad
0.8
0.6
0.4
0.2
0.0
13.97
15
X = media muestral
16.03
Resultado gráfico en Minitab
56
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 49
clientes de petróleo, la venta media se encuentra entre 13.97 y 16.03 glns.
alrededor de μ = 15 glns.
7.
La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5
kilos y una desviación estándar de 0.2 kilos. Si se toma muestras al azar de 36
bolsas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
90% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 5 Kg., σ = 0.2 Kg. y n = 36 bolsas.
 X2  Var( X ) 
2
n
= (0.2)2 / 36 = 0.0011   X  0.033 Kg.
Entonces: X  N (  ,  X2 ) = N(5, 0.0011) y Z 
( X  5)
 N(0, 1). Se pide:
0.033
 X  5 5.1  5 

a) P( X > 5.1) = P 
 = P(Z > 3.03) = 1 -  (3.03) =
 0.033 0.033 
= 1 - 0.99878 = 0.00122 Rpta.
Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas
de azúcar, el peso medio supera los 5.1 kilos.
b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg.,
dentro de los cuales caerá el 90 % de las X . Entonces:
0.90 = P(5 – E  X  5 + E) = P(
E
E
Z
)
0.033
0.033
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.95
 0.033   0.033 
 0.033 
 0.033 
E
 Z0.95 = 1.645 → E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:
0.033
57
5 – E = 5 – 0.054 = 4.946 Kg.
y
5 + 0.054 = 5.054 Kg. Es decir:
0.90 = P(4.946  X  5.054)
Rpta.
Interpretación.- en el 90% de las (ó en 9000 de cada 10000) muestras de 36
bolsas de azúcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg.
alrededor de μ = 5 Kg.
8.
En Lima el precio promedio al consumidor del kilo de arroz es μ = S/. 3.20 con
una desviación estándar σ = S/. 0.25. Si se selecciona una muestra aleatoria de 100
consumidores de arroz, calcule e interprete:
a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el
kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios
muestrales alrededor de la media poblacional?
Solución
Los datos del problema son: μ = S/. 3.20, σ = S/. 0.25. y n = 100 consumidores.
 X2  Var( X ) 
2
n
= (0.25)2 / 100 = 0.000625   X  S/. 0.025
Entonces: X  N (  ,  X2 ) = N(3.20, 0.000625) y Z 
( X  3.20)
 N(0, 1). Se
0.025
pide:
 X  3.20 3.25  3.20 

a) P( X > 3.25) = P 
= P(Z > 2.0) = 1 -  (2.00) =
0.025 
 0.025
= 1 - 0.97725 = 0.02275 Rpta.
Interpretación.- en el 2.28% de las (ó en 228 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25.
b) Sean 3.20 – E y 3.20 + E los límites simétricos alrededor de la media μ = S/.
3.20, dentro de los cuales caerá el 95 % de las X . Entonces:
0.95 = P(3.20 – E  X  3.20 + E) = P(
58
E
E
Z
)
0.025
0.025
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.975
 0.025   0.025 
 0.025 
 0.025 
E
 Z 0.975 = 1.96 → E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán:
0.025
3.20 – E = 3.20 – 0.05 = S/. 3.15
y
3.20 + 0.05 = S/. 3.25. Es decir:
0.95 = P(3.15  X 3.25) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25
nuevos soles alrededor de μ = S/. 3.20.
9.
La compañía “La negrita” vende latas de café con un contenido medio de 195
gramos y una desviación estándar de 6 gramos. Si se toman muestras al azar de 25
latas. Calcule e interprete:
a)
La probabilidad de que el peso medio de la muestra sea menor de 192
gramos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
99.73% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 195 gr., σ = 6 gr. y n = 25 latas.
  Var( X ) 
2
X
2
n
= (6)2 / 25 = 1.44   X  1.2 gr.
Entonces: X  N (  ,  X2 ) = N(195, 1.44) y Z 
( X  195)
 N(0, 1). Se pide:
1.2
 X  195 192  195 

a) P( X < 192) = P 
= P(Z < -2.5) =  (-2.50) = 0.00621
1.2 
 1.2
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 25
latas de café, el peso medio es menor 192 gr.
b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195
gr, dentro de los cuales caerá el 99.73 % de las X . Entonces:
59
0.9973 = P(195 – E  X  195 + E) = P(
E
E
Z  )
1.2
1.2
 E   E 
 E 
 E 
= 
  
  2    1      0.99865
 1.2   1.2 
 1.2 
 1.2 
E
 Z 0.99865 = 3.0 → E = 3 x 1.2 = 3.6 gr. Luego los límites serán:
1.2
195 – E = 3.6 – 0.05 = 191.4 gr.
y
195 + 3.6 = 198.6 gr. Es decir:
0.9973 = P(191.4  X  198.6) Rpta.
Interpretación.- en el 99.73% de las (ó en 9973 de cada 10000) muestras de 25
latas de café, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de μ =
195 gr.
10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con
una desviación típica de S/. 60; mientras que en la ciudad B dicho gasto medio
mensual es de S/. 235, con una desviación típica de S/. 50. En una auditoría para
determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una
muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la
probabilidad de que:
a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad
A.
b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más
que el gasto medio mensual en arbitrios en la ciudad B.
Solución
Los datos del problema son: μA = S/. 250, σA = S/. 35 y nA = 300 hogares.
μB = S/. 235, σA = S/. 20 y nB = 300 hogares. Luego:
 X2  Var ( X A ) 
A
 A2
nA

 2 (50)2
(60)2
= 12.00 y  X2 B  Var ( X B )  B 
= 8.33
300
nB
300
60
X
A XB
X
AXB
  A  B = 250 - 235 = 15,  X2 A  X B   x2A   x2B = 12 + 8.33 = 20.33
y
= 4.51. Luego:
X A  X B  N (  A  B ,  X2 A  X B ) = N(15, 20.33) y Z 
( X A  X B  15)
 N(0, 1).
4.51
Se pide:
a) P( X B
> XA)
=
P( X A
<
XB )
=
P( X A
-
XB
<
0)
=
 ( X  X B  15) 0  15 
P A

=
4.51
4.51 

= P(Z < -3.33) =  (-3.33) = 0.00043 Rpta.
Interpretación.- en el 0.04% de las (ó en 4 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B será
mayor que en la ciudad A.
 X  X B  15 25  15 

b) P  X A  X B  25 = 1 - P  X A  X B  25 = 1 - P  A

4.51
4.51 

=
= 1 – P(Z < 2.22) = 1 -  (2.22) =
= 1 – 0.98679 = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A
será al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad
B.
11. Dos fábricas A y B productoras de bombillas afirman que el promedio de
duración de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones
típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fábrica,
calcule e interprete la probabilidad de que:
a) Las bombillas B tengan una duración media menor de 1930 horas.
b) Las bombillas B tengan una duración media mayor que la duración media de
las bombillas A.
61
Solución
Los datos del problema son: μA = 1980 horas, σA = 90 horas y nA = 100 bombillas.
μB = 1950 horas, σB = 100 horas y nB = 100 bombillas. Luego:
 X2  Var ( X A ) 
A
 A2
nA
= (90)2 / 100 = 81 y  X2 B  Var ( X B ) 
 B2
nB
= (100)2 / 100 =
100
a) X B  N ( B ,  X2 B ) = N(1950, 81) y Z 
( X B  1950)
 N(0, 1). Se pide:
9
 X  1950 1930  1950 

P( X B < 1930) = P  B
 = P(Z < -2.22) =
9
9


=  (-2.22) = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 100
bombillas B, la duración media menor de 1930 horas.
b)  X A  X B   A  B = 1980 - 1950 = 30,  X2 A  X B   x2A   x2B = 81 + 100 = 181 y
X
AXB
= 13.45. Luego:
X A  X B  N (  A  B ,  X2 A  X B ) = N(30, 181) y Z 
( X A  X B  30)
 N(0,
13.45
1). Se pide:
 ( X  X B  30) 0  30 

P( X B > X A ) = P( X A < X B ) = P( X A - X B < 0) = P  A

13.45
13.45 

=
= P(Z < -2.23) =  (-2.23) = 0.01287 Rpta.
Interpretación.- en el 1.29% de las (ó en 129 de cada 10000) muestras de 100
bombillas A y 100 bombillas B, la duración media de las bombillas B es mayor
que la duración media de las bombillas A.
12. Un proceso automático es realizado por dos máquinas que empaquetan un
producto en bolsas de 500 gramos. La máquina 1 llena con una desviación
estándar de 15 gramos y la máquina 2 de 20 gramos. Si se seleccionan muestras
de 100 bolsas de cada máquina, calcule e interprete la probabilidad de que:
a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq.
2.
62
b) Las medias muestrales difieran en menos de 2 gramos.
Solución
Los datos del problema son: μ1 = 500 gr., σ1 = 15 gr. y n1 = 100 bolsas.
μ2 = 500 gr., σ2 = 20 gr. y n2 = 100 bolsas. Luego:

2
X1
 Var ( X 1 ) 
 12
n1
= (15) / 100 = 2.25 y 
2
 X  X  1  2 = 500 - 500 = 0,
1
X
2
AXB
2
X2
 Var ( X 2 ) 
 22
n2
= (20)2 / 100 = 4.
 X2  X   x2   x2 = 2.25 + 4 = 6.25
1
2
1
2
y
= 2.5. Luego:
X1  X 2  N ( 1  2 ,  X2 1  X 2 ) = N(0, 6.25) y Z 
( X1  X 2  0)
 N(0, 1). Se pide:
2.5
 ( X  X 2  0) 0  0 

a) P( X 1 < X 2 ) = P( X 1 - X 2 < 0) = P  1
=
2.5
2.5 

= P(Z < 0) =  (0) = 0.5000 Rpta.
Interpretación.- en el 50% de las (ó en 5000 de cada 10000) muestras de 100
bolsas de la máquina 1 y 100 bolsas de la máquina 2, el llenado medio de la
máquina 1 es menor que el llenado medio de la máquina 2.
 2  0 X 1  X 2  0 2  0 


b) P X1  X 2  2 = P  2  X1  X 2  2 = P 
=
2.5
2.5 
 2.5


= P(-0.80 < Z < 0.80) = 2  (0.80) - 1 =
= 2 (0.78814) – 1 = 0.57628 Rpta.
Interpretación.- en el 57.63% de las (ó en 5763 de cada 10000) muestras de
100 bolsas de cada máquina, las medias muestrales difieren en 2 gramos.
13. Según un estudio del Ministerio de Salud,2 en el Perú los varones de 9 años de
edad tienen un peso promedio de 26.8 Kg. y una desviación estándar de 2.5 Kg.,
mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviación
estándar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin
reposición, de n = 300 niños y m = 300 niñas. Calcule e interprete la probabilidad
de que:
2
Ministerio de Salud. Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010,
CENAN – INEI,.. Lima, Perú, 2011.
63
a) El peso promedio de los niños sea menor que el peso promedio de las niñas.
b) El peso promedio de los niños sea al menos 0.6 kg. más que el peso promedio
de las niñas.
Solución
Los datos del problema son: μv = 26.8 Kg., σv = 2.5 Kg. y nv = 300 niños.
μm = 26.7 Kg., σm = 3.8 Kg. y nm = 300 niñas. Luego:
 X2  Var ( X v ) 
 v2
v

2
Xm
 Var ( X m ) 
= (2.5)2 / 300 = 0.02083 y
nv
 m2
nm
= (3.8)2 / 300 = 0.04813.
 X  X  v  m = 26.8 – 26.7 = 0.1,
v
X
m
v Xm
 X2
v  Xm
  x2v   x2m = 0.06896
y
= 0.2626. Luego:
X v  X m  N ( v  m ,  X2 v  X m ) = N(0.1, 0.2626) y Z 
( X v  X m  0.1)
 N(0,
0.2626
1). Se pide:
 ( X  X m  0.1) 0  0.1 

a) P( X v < X m ) = P( X v - X m < 0) = P  v
 =
0.2626
0.2626 

= P(Z < -0.38) =  (-0.38) = 0.35197 Rpta.
Interpretación.- en el 35.2% de las (ó en 3520 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
es menor que el peso promedio de las niñas.
b) P  X v  X m  0.6 
=
1
-
P  X v  X m  0.6 
=
1
-
 X  X m  0.1 0.6  0.1 
P v

 =
0.2626 
 0.2626
= 1 – P(Z < 1.90) = 1 -  (1.90) =
= 1 – 0.97128 = 0.02872 Rpta.
Interpretación.- en el 2.87% de las (ó en 287 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
será al menos 0.6 kg. más que el peso promedio de las niñas.
14. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. y
desviación estándar de 0.5 kg. Para el control de calidad se toman muestras
64
aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna.
Calcule e interprete la probabilidad de que la producción media de las bolsas de
ambos turnos difieran en menos de 0.2 kg.
Solución
Los datos del problema son: μ1 = 50 Kg., σ1 = 0.5 Kg. y n1 = 25 bolsas.
μ2 = 50 Kg., σ2 = 0.5 Kg. y n2 = 50 bolsas. Luego:
 X2  Var ( X 1 ) 
1
 12
n1
= (0.5) / 25 = 0.01 y  X2  Var ( X 2 ) 
2
2
 22
n2
= (0.5)2 / 50 =
0.005
 X  X  1  2 = 50 - 50 = 0,  X2  X   x2   x2 = 0.010 + 0.005 = 0.015
1
X
1
2
AXB
2
1
2
y
= 0.1225. Luego:
X1  X 2  N ( 1  2 ,  X2 1  X 2 ) = N(0, 0.015) y Z 
pide:

( X1  X 2  0)
 N(0, 1). Se
0.1225

P X1  X 2  0.2 = P  0.2  X1  X 2  0.2  =
 0.2  0 X1  X 2  0 0.2  0 


= P
=
0.1225
0.1225 
 0.1225
= P(-1.63 < Z < 1.63) = 2  (1.63) - 1 =
= 2 (0.94845) – 1 = 0.8969 Rpta.
Interpretación.- en el 89.69% de las (ó en 8969 de cada 10000) muestras de 25
bolsas de la producción diurna y 50 de la producción nocturna, la producción
media de las bolsas de ambos turnos difieren en menos de 0.2 kg.
15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se
seleccionan muestras aleatorias de 200 compras. Calcule e interprete:
a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea
mayor al 80%.
b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras
en alimentos y bebidas caerá el 99% de los porcentajes muestrales?
Solución
Los datos del problema son: P = 0.70 = proporción de las compras en alimentos y
bebidas en las tiendas Metro, Q = 0.30,
n = 200 compras = tamaño de la muestra.
65
Asumiendo un número muy grande de compradores, entonces, la proporción muestral:
n
p
Z
X
i 1
n
i

X
 PQ 
 N  P,
 = N(0.70; 0.00105) y
n
n 

pP
p  0.70
p  0.70
~ N(0, 1). Se pide calcular:


PQ
0.00105 0.0324
n
 p  0.70 0.80  0.70 
a) P (p > 0.80 ) = 1 - P (p ≤ 0.80 ) = 1 - P 


0.0324 
 0.0324
= 1 - P(Z  3.09) = 1 -  (3.09) = 1- 0.9990 = 0.0010 Rpta.
Interpretación.- en el 0.10 % de las (ó en 10 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es
mayor al 80%.
b) Sean 0.70 – E y 0.70 + E los límites simétricos alrededor de la proporción
verdadera P = 0.70, dentro de los cuales estará el 99 % de las p (proporciones
muestrales). Entonces:
0.99 = P(0.70 – E  p  0.70 + E) = P(
E
E
Z
)=
0.0324
0.0324
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.995
 0.0324   0.0324 
 0.0324 
 0.0324 
E
 Z0.995  2.575  E  2.575(0.0324)  0.083 . Luego los límites serán:
0.0324
0.70 – E = 0.70 – 0.083 = 0.617
y
0.70 + 0.083 = 0.783. Es decir:
0.99 = P(0.617  p  0.783)
Rpta.
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y
bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporción
verdadera P = 0.70.
16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra
aleatoria de 200 clientes. Calcule e interprete:
a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%.
66
b) ¿dentro de que límites simétricos del porcentaje de mujeres en la población
caerá el 95% de los porcentajes de la muestra?
Solución
Los datos del problema son: P = 0.40 = proporción de clientes varones en las tiendas
Saga, Q = 0.60 y
n = 500 clientes.
Asumiendo un número muy grande de clientes en las tiendas Saga, la distribución
de la proporción muestral de hombres p es:
n
p
Z
X
i 1
n
i

X
 PQ 
 N  P,
 = N(0.40; 0.0012) y
n
n 

p  P p  0.40 p  0.40
~ N(0, 1). Se pide calcular:


PQ
0.0012 0.0346
n
 0.36  0.40 p  0.40 0.45  0.40 


a) P ( 0.36  p  0.45 ) = P 
 =
0.0346
0.0346 
 0.0346
= P(-1.16  Z  1.45) =  (1.45) -  (-1.16) =
= 0.92647 – 0.12302 = 0.80345 Rpta.
Interpretación.- en el 80.35 % de las (ó en 8035 de cada 10000) muestras de 200
clientes de las tiendas Saga, el porcentaje de clientes varones está entre 36% y
45%.
b) La distribución de la proporción muestral de mujeres q es:
n
q
Z
X
i 1
n
i

X
 PQ 
 N  Q,
 = N(0.60; 0.0012) y
n
n 

q  0.60
~ N(0, 1). Se pide calcular límites simétricos.
0.0346
Sean 0.60 – E y 0.60 + E los límites simétricos alrededor de la proporción
verdadera Q = 0.60, dentro de los cuales estará el 95 % de las proporciones
muestrales de mujeres q. Entonces:
0.95 = P(0.60 – E  q  0.60 + E) = P(
E
E
Z
)=
0.0346
0.0346
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.975
 0.0346   0.0346 
 0.0346 
 0.0346 
67
E
 Z0.975  1.96  E  1.96(0.0346)  0.068 . Luego los límites serán:
0.0346
0.60 – E = 0.60 – 0.068 = 0.532
y
0.60 + 0.068 = 0.668. Es decir:
0.95 = P(0.532  q  0.668)
Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 200
clientes de las tiendas Saga, el porcentaje de clientes mujeres está entre 53.2% y
66.8% alrededor de la proporción verdadera Q = 0.60.
17. En Lima el 60% de los hogares consume mantequilla. Si se toma una muestra
aleatoria de 1000 hogares. Calcule e interprete:
a)
La probabilidad que menos del 57% de los hogares consuma mantequilla.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de
hogares que consume mantequilla, estará el 99% de las proporciones
muestrales.
Solución
Los datos del problema son: P = 0.60 = proporción de hogares que consume
mantequilla, Q = 0.40 y
n = 1000 hogares.
Asumiendo un número muy grande de hogares en Lima, la distribución de la
proporción muestral de hogares que consume mantequilla p es:
n
p
Z
X
i 1
n
i

X
 PQ 
 N  P,
 = N(0.60; 0.00024) y
n
n 

p  P p  0.60 p  0.60


~ N(0, 1). Se pide calcular:
PQ
0.0155 0.0155
n
 p  0.60 0.57  0.60 

a) P (p < 0.57 ) = P 
 =
0.0155 
 0.0155
= P(Z < - 1.94) =  (-1.94) = 0.02619 Rpta.
Interpretación.- en el 2.62 % de las (ó en 262 de cada 10000) muestras de 1000
hogares, menos del 57% de los hogares consume mantequilla.
b) Sean 0.60 – E y 0.60 + E los límites simétricos alrededor de la proporción
verdadera P = 0.60, dentro de los cuales cae el 99 % de las proporciones
muestrales de hogares que consume mantequilla p. Entonces:
68
0.99 = P(0.60 – E  p  0.60 + E) = P(
E
E
Z
)=
0.0155
0.0155
 E   E 
 E 
 E 
= 
  
  2 
 1   
  0.995
 0.0155   0.0155 
 0.0155 
 0.0155 
E
 Z 0.995  2.575  E  2.575(0.0155)  0.04 . Luego los límites serán:
0.0155
0.60 – E = 0.60 – 0.04 = 0.56
y
0.60 + 0.04 = 0.64. Es decir:
0.99 = P(0.56  p  0.64)
Rpta.
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 1000
hogares de Lima, el porcentaje de hogares que consume mantequilla está entre
56% y 4% alrededor de la proporción verdadera P = 0.60.
18. Dos empresas producen cierto artículo, la empresa A produce por término medio
20% de defectuosos, mientras que la empresa B produce un 30% de defectuosos.
Si se extrae una muestra aleatoria de 300 y 150 artículos respectivamente, calcule
e interprete la probabilidad de que el porcentaje de artículos defectuosos
producidos por la empresa B difiere de los defectuosos producidos por la empresa
A en 2% o menos.
Solución
Los datos del problema son:
PA = 0.20 = proporción de artículos defectuosos producidos por la empresa A.
QA = 0.80 = proporción de artículos buenos producidos por la empresa A.
PB = 0.30 = proporción de artículos defectuosos producidos por la empresa B.
QB = 0.70 = proporción de artículos buenos producidos por la empresa B.
nA = 300 y nB = 150 artículos.
Considerando que ambas empresas producen gran número de artículos y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
pB - pA ~ N(PB – PA ;  p2B  pA )
Con media:  pA  pB = PB – PA = 0.30 – 0.20 = 0.10
Y varianza:  p2B  pA =
PAQA PB QB (0.2)(0.8) (0.3)(0.7)

+
=
= 0.0019. Luego:
300
150
nA
nB
69
pB – pA ~ N(0.10 ; 0.0019) y
Z
pB  pA  ( PB  PA )
p

B  pA
pB  pA  0.10
~ N(0 ,
0.044
1)
Se pide calcular:
 p  pA  0.10 0.02  0.10 
P (pB – pA  0.02) = P  B
=

0.044
0.044 

= PZ  -1.82) =  (-1.82) = 0.03438 Rpta.
Interpretación.- en el 3.44% de las (ó en 344 de cada 10000) comparaciones, para
muestras de 300 artículos de la empresa A y 150 de la empresa B, el porcentaje de
artículos defectuosos producidos por la empresa B difiere de los defectuosos
producidos por la empresa A en 2% o menos.
19. En una ciudad se sabe que la preferencia de las mujeres por un diario es del 20% y
para los hombres de un 25%. Si se toma una muestra aleatoria de 200 mujeres y
100 hombres, calcule e interprete la probabilidad de que el porcentaje de mujeres
que prefiere el diario difiera del porcentaje de hombres que lo prefiere en 8% o
más.
Solución
Los datos del problema son:
PM = 0.20 = proporción de mujeres que prefiere el diario.
QM = 0.80 = proporción de mujeres que no prefiere el diario.
PH = 0.25 = proporción de hombres que prefiere el diario.
QH = 0.75 = proporción de hombres que prefiere el diario.
nM = 200 mujeres y nH = 100 hombres.
Considerando que el número de mujeres y hombres en la ciudad es grande y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
PM – pH ~ N(PM – PH ;  p2M  pH )
Con media:  pA  pB = PM – PH = 0.20 – 0.25 = -0.05
Y varianza:  p2M  pH =
PM QM PH QH (0.2)(0.8) (0.25)(0.75)

+
=
= 0.0027. Luego:
200
100
nM
nH
70
pM – pH ~ N(-0.05 ; 0.0027) y Z 
pM  pH  ( PM  PH )
p
M
 pH

pM  pH  0.05
~ N(0 ,
0.052
1)
Se pide calcular:
 p  pH  0.05 0.08  0.05 
P (pM – pH ≥ 0.08) = P  M
= P(Z ≥ 2.50) =

0.052
0.052 

= 1 -  (2.50) = 1 - 0.99379 = 0.00621 Rpta.
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 200 mujeres y
100 hombres, el porcentaje de mujeres que prefiere el diario difiere del porcentaje de
hombres que lo prefiere en 8% o más.
20. Considere que los niveles de preferencia de un determinado artículo en la ciudad
A es de un 30% de hogares y en la ciudad B de un 35%; si se seleccionan
muestras aleatorias de 250 hogares de la ciudad A y 150 hogares de la B, calcule e
interprete la probabilidad de que el % de hogares que prefiere el artículo en la
ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.
Solución
Los datos del problema son:
PA = 0.30 = proporción de hogares que prefiere el artículo en la ciudad A.
QA = 0.70 = proporción de hogares que no prefiere el artículo en la ciudad A.
PB = 0.35 = proporción de hogares que prefiere el artículo en la ciudad B.
QB = 0.65 = proporción de hogares que no prefiere el artículo en la ciudad B.
nA = 250 y nB = 150 hogares.
Considerando que en ambas ciudades hay un gran número de hogares y que las
correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene
que:
pA – pB ~ N(PA – PB ;  p2A  pB )
Con media:  pA  pB = PA – PB = 0.30 – 0.35 = -0.05
Y varianza:  p2A  pB =
PAQA PB QB (0.3)(0.7) (0.35)(0.65)

+
=
= 0.0024. Luego:
250
150
nA
nB
71
pA – pB ~ N(-0.05 ; 0.0024) y Z 
pA  pB  ( PA  PB )
p
A  pB

p A  pB  0.05
~ N(0 ,
0.049
1)
Se pide calcular:
 p  pB  0.05 0.07  0.05 
P (pA – pB ≥ 0.07) = P  A
= P(Z ≥ 2.45) =

0.049
0.049 

= 1 -  (2.45) = 1 - 0.99286 = 0.00714 Rpta.
Interpretación.- en el 0.71% de las (ó en 71 de cada 10000) muestras de 250 hogares
de la ciudad A y 150 hogares de la ciudad B, el % de hogares que prefiere el artículo
en la ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.
72
2.8 EJERCICIOS PRPUESTOS
1. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución geométrica, con parámetro p, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
2. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución binomial negativa, con parámetros r y p, hallar la función de
probabilidad conjunta (o de verosimilitud) para dicha muestra.
3. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución exponencial, con parámetro λ, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
4. Las botellas de la bebida “Rica Kola” familiar tienen un contenido medio de 2.5
litros y una desviación estándar de 0.1 litros. Si se toma una muestra aleatoria de
36 botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 2.46 y 2.53 litros.
b) ¿dentro de qué límites simétricos caerá el 99 % de las medias muestrales
alrededor de la media poblacional?
5. En Lima el precio promedio al consumidor del kilo de mango es μ = S/. 2.20 con
una desviación estándar σ = S/. 0.20. Si se selecciona una muestra aleatoria de 100
consumidores de mango, calcule e interprete la probabilidad:
a) que el precio medio muestral sea mayor a S/. 2.25 el kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de las medias muestrales
alrededor de la media poblacional?
6. Las cajas con mango tienen un peso medio de 20 Kg. y una desviación estándar de
0.75 Kg. Si se cargan 400 cajas al azar en un camión, calcule e interprete la
probabilidad de que:
a) El peso total de las cajas supere la capacidad máxima del camión que es de
8,040 Kg.
b) El peso medio de las cajas sea menor a 19.92 Kg.
c) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
95% de las medias muestrales?
73
7. En una gran ciudad el promedio de empleados para establecimientos pequeños es
de 10 y la desviación estándar de 5 empleados. Para una muestra aleatoria de 36
establecimientos pequeños extraídos sin reemplazo, calcule e interprete:
a) La probabilidad que el promedio muestral de empleados sea menor que 8.
b) ¿Dentro de que límites simétricos del promedio poblacional caerá el 95% de
las medias muestrales de empleados por establecimientos pequeños?
8. Una empresa eléctrica fabrica focos cuya duración tiene distribución normal con
media de 1500 horas y desviación estándar de 50 horas. En una muestra aleatoria
de 16 focos, calcule e interprete la probabilidad que:
a) La duración promedio de los focos menor de 1475 horas.
b) ¿Dentro de que límites simétricos de la duración media poblacional caerá el
95% de las duraciones medias muestrales?
9. Dos fábricas A y B que embolsan café, afirman que el promedio en las bolsas es
de 495 y 490 gramos, respectivamente, con desviaciones típicas de 5 y 6 gramos.
Si se seleccionan 36 bolsas al azar de cada fábrica, calcule e interprete la
probabilidad de que:
a) El contenido medio de las bolsas A sea mayor de 497 gramos.
b) El contenido medio de las bolsas A sea menor que el contenido medio de las
bolsas B.
10. Uno de los principales fabricantes de tv compra cables a dos compañías. Los
cables de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años
con una desviación estándar de 0.7 años. Si se toman m.a. de 34 cabless de A y 40
de B, calcule e interprete la probabilidad de que la vida media de los cables A sea
de al menos un año más que la vida media de los B.
11. En una empresa de gaseosas la producción media de los varones es de 52 lts. Con
una desviación estándar de 7 lts. y la producción media de las mujeres es de 48 lts.
con una desviación estándar de 5 lts. Si se toma una muestra aleatoria de 40
trabajadores hombres y 40 mujeres. Calcule e interprete la probabilidad que la
producción media de los varones resulte menor que la producción media de las
mujeres.
74
12. En una universidad la edad promedio de los alumnos del turno de la mañana es de
22 años con una desviación estándar de 3 años, mientras que los del turno de la
noche tienen una edad media de 28 años con una desviación estándar de 5 años. Si
se toma una muestra aleatoria de 50 alumnos de cada turno, calcule e interprete la
probabilidad de que la edad promedio de los alumnos de la mañana es superior a
la edad media de los de la noche.
13. El 60% de los ciudadanos esta de acuerdo con la gestión presidencial. Si se toma
una muestra aleatoria de 500 ciudadanos, calcule e interprete:
a) La probabilidad de que más del 65% esté de acuerdo con la gestión
presidencial.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de
ciudadanos esta de acuerdo con la gestión presidencial, esta el 95% de las
proporciones muestrales.
14. En Lima el 60% de los hogares usa gas como combustible para cocinar. Si se
toma una muestra aleatoria de 1000 hogares. Calcule e interprete:
a) La probabilidad que más del 65% de los hogares use gas.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de
hogares que usa gas, estará el 99% de las proporciones muestrales.
15. En Lima el 30% de los hogares compra periódicos y/o revistas. Si se toma una
muestra aleatoria de 1000 hogares. Calcule e interprete:
a) La probabilidad de que más del 34% de hogares compre periódicos y/o
revistas.
b) ¿Dentro de que límites simétricos alrededor de la proporción verdadera caerá
el 99.73% de las proporciones muestrales de hogares que compra periódicos
y/o revistas?
16. El 70% de empleados públicos es casado. Si se toma una muestra aleatoria de 64
empleados, calcule e interprete:
a) La probabilidad de que más del 85% esté casado.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de
empleados públicos casados, estará el 95% de las proporciones muestrales.
75
17. El 70 % de las compras con tarjeta de crédito en tiendas Ripley son superiores a
$200. Si se seleccionan muestras aleatorias de 100 compras; Calcule e interprete:
a) La probabilidad que las muestras tengan entre 65% y 80 % de compras
mayores que $200?
b) ¿Entre que límites simétricos del porcentaje de compras mayores de $200 en
la población caerá el 99% de los porcentajes muestrales?
18. Dos empresas producen equipos de sonido, la empresa A produce por término
medio 10% de defectuosos, mientras que la empresa B produce un 20%. Si se
extrae una muestra aleatoria de 400 y 200 unidades respectivamente, calcule e
interprete la probabilidad de que el porcentaje de equipos defectuosos producidos
por la empresa A difiere de los defectuosos producidos por la empresa B en 7% o
menos.
19. En un estudio pasado se determinó que el porcentaje de hombres que está de
desacuerdo con la construcción de un gimnasio era del 12%, mientras que el
porcentaje de mujeres en desacuerdo era del 10%. Si se toma una muestra
aleatoria de 100 hombres y 100 mujeres, calcule e interprete la probabilidad de
que el porcentaje de hombres en desacuerdo sea al menos 3% mayor que el de las
mujeres.
20. En cierta ciudad se sabe que el 25% de los hombres y el 30% de las mujeres están
familiarizados con un producto. Si se toma una muestra aleatoria de 200 hombres
y 200 mujeres, calcule e interprete la probabilidad de que el porcentaje de
hombres familiarizados con el producto sea mayor que el de mujeres.
76
Capítulo 3. DISTRIBUCIONES ESPECIALES
“El informar mal, utilizando material estadístico, podría llamarse
manipulación estadística, y resumiéndolo en una sola palabra (aunque
no sea muy buena), estadisticulación”
Darrell Huff
CONTENIDO
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
Distribución Chi-cuadrado.
Distribución t de student.
Distribución muestral de la media (n < 30).
Distribución de la diferencia de medias muestrales con varianzas
desconocidas pero iguales.
Distribución F de Snedecor
Distribución de la razón de dos varianzas muestrales.
Ejercicios resueltos.
Ejercicios propuestos.
En este capítulo, se presentan las distribuciones muestrales especiales, las mismas
que han sido desarrolladas fundamentalmente para muestras pequeñas (menores de
30 observaciones).
Entre las principales distribuciones tenemos: la distribución chi – cuadrado de
Pearson, la distribución t – student de Gosset y la distribución F de Snedecor. A
continuación veremos sus principales características y propiedades de cada una de
ellas.
3.1 DISTRIBUCIÓN CHI-CUADRADO
Esta distribución fue descubierta por Helmert el año 1875 y redescubierta por Karl
Pearson el año 1900.
Definición.- Sean Z1, Z2, ..., Zr, variables aleatorias independientes, cada una
con distribución normal estándar, Zi ~ N(0 , 1) . Entonces, la variable aleatoria
x²  Z12  Z22  ...  Zr2
77
tiene una distribución chi-cuadrado (o Ji-cuadrado) con r grados de libertad, si
su función de densidad de probabilidades está dada por:
f X 2 ( x) =
1
r
2  
2
r
2
r
1
x 2 e x / 2
= 0
,
0<x<
,
en otros casos
Donde:


Γ representa el gamma de un número, (n)   X n 1e x dx , n > 0. Si n
0
1
es entero positivo (n) = (n – 1)! . Además,     .
2

r = grados de libertad (g.l.) representa el número de v.a. independientes
que se suman o el número de variables que pueden variar libremente. En
regresión y econometría es el rango de una matriz (máximo número de
columnas linealmente independientes) asociado a formas cuadráticas delas
sumas de cuadrados.
Observación: la distribución chi – cuadrado es un caso particular de la
distribución de probabilidades Gamma con n = r / 2 y λ = 1 / 2.
Si X ~ Gamma con parámetros n > 0 y λ > 0, entonces su función de densidad
de probabilidades está dada por:
f ( x) 
n
 ( n)
x n 1e x
= 0
,x>0
, en otros casos.
La esperanza y la varianza de la distribución gamma son:
E(X) = n / λ
Var (X) = n / λ2
y
Notación: decir que la variable aleatoria X tiene distribución chi-cuadrado con
r grados de libertad, la denotaremos como X ~ X r2 .
Media y Varianza:
La media y la varianza de la v. a. chi-cuadrado con r grados de libertad son:
78
 = E(x²) = r
² = Var(x²) = 2r
y
Es decir, la media es igual a los grados de libertad y la varianza es igual a dos
veces los grados de libertad. La fig. 1 muestra la forma de la función de
densidad de la variable aleatoria chi-cuadrado, para distintos grados de libertad.
Función de Distribución Acumulativa de Probabilidades.Las probabilidades para v.a. chi-cuadrado, se calculan utilizando los valores de
la función de distribución acumulativa menor o igual que, los que han sido
reproducidos en la Tabla 2 del Anexo, utilizando la hoja de cálculo Excel.
Así tenemos que, la probabilidad que la variable aleatoria X con distribución
xr2 1  r  30 sea menor o igual a un valor constante x2 , representada por:




P X  X 2   ,
P X  x2  
x2
0
0 <  < 1, está dada por:
f X 2 x dx  

0
r
1
x2
r
2  
2
r
2
y representada en la figura 2.
79
1 
x
x 2 e 2 dx  


Note que P x  x2  1  
Puesto que existe una distribución chi-cuadrado diferente para cada valor de r,
resulta impráctico proporcionar tablas de áreas completas. En lugar de esto, la
tabla 2 de la distribución acumulativa chi-cuadrado, presenta un resumen de la
información más esencial acerca de la distribución. En el encabezado de la
columna de la izquierda, dice grados de libertad (G.L.) y cada fila de esta tabla
corresponde a una distribución chi-cuadrado particular, con sus probabilidades
(p) en la parte superior de esta tabla.
En la hoja de cálculo Excel se determina las probabilidades y los valores de
chi-cuadrado así:
a) DISTR.CHI: devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución chi cuadrado de una sola cola. La distribución
chi cuadrado está asociada con la prueba chi cuadrado.
Sintaxis: DISTR.CHI(x;grados_de_libertad)
X es el valor al que desea evaluar la distribución.
Grados_de_libertad es el número de grados de libertad = r.
Observaciones :

Si uno de los argumentos no es numérico, DISTR.CHI devuelve el
valor de error #¡VALOR!.

Si el argumento x es negativo, DISTR.CHI devuelve el valor de error
#¡NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10,
DISTR.CHI devuelve el valor de error #¡NUM!

DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una
variable aleatoria chi cuadrado. El cálculo es el complemento de la
mayoría de tablas.
Ejemplo:
DISTR.CHI(18,307;10) es igual a 0,050001
80
b) PRUEBA.CHI.INV: devuelve para una probabilidad dada, de una sola
cola, el valor x de la variable aleatoria siguiendo una distribución chi
cuadrado.
Si el argumento probabilidad = p = DISTR.CHI(x;...), entonces
PRUEBA.CHI.INV(probabilidad,...) = x.
Sintaxis: PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Probabilidad
es una probabilidad asociada con la distribución chi
cuadrado.
Grados_de_libertad es el número de grados de libertad.
Observaciones

Si uno de los argumentos no es numérico, PRUEBA.CHI.INV devuelve
el valor de error #¡VALOR!.

Si
el
argumento
probabilidad
<
0
o
probabilidad
>
1,
PRUEBA.CHI.INV devuelve el valor de error #¡NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10,
PRUEBA.CHI.INV devuelve el valor de error #¡NUM!.
PRUEBA.CHI.INV usa una técnica iterativa para calcular la función.
Dado un valor de probabilidad, PRUEBA.CHI.INV reitera hasta que el
resultado tenga una exactitud de ± 3x10^-7. Si PRUEBA.CHI.INV no
converge después de 100 iteraciones, la función devuelve el valor de error
#N/A.
Ejemplo:
PRUEBA.CHI.INV(0,05;10) es igual a 18,3070290368475
Ejemplo 1.Si X ~ X r2 . Usando la tabla 2, de Ji-cuadrado, hallar el x2 correspondiente
para:
81
a) P(X < x2 ) = 0.05, si r = 15 g.l.
Se busca en la tabla 2, 15 g.l. en el margen izquierdo y se intercepta con la
probabilidad 0.05 de las columnas y se obtiene x2 = x02.05, 15 = 7.26 Rpta.
b) P(X < x2 ) = 0.99, si r = 21 g.l.
Procediendo como en a) se obtiene entonces x2 = x02.99, 21 = 38.9 Rpta.
Ejemplo 2.2
Si X es una variable aleatoria x20
. Calcular:
a) P[X < 10.9];
c) P[ 10.9 < X  31.4 ]
b) P[ X > 31.4 ];
Solución
Para obtener las probabilidades solicitadas, en la fila de 20 g.l de la tabla 2 se
buscan los valores dados para X y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas así:
a) P[X < 10.9] =

P X  x02.05

= 0.05

Rpta.

b) P[ X > 31.4 ] = 1  PX  31.4  1  P X  x02.95 = 1 – 0.95 = 0. 05
Rpta.
c) P[ 10.9 < X  31.4 ] = P[X  31.4 ] - P[X  10.9 ] =

 
= P X  x02.95  P X  x02.01
= 0.95 – 0.01 = 0.94

Rpta.
Ejemplo 3.Si X es X 132 . Hallar P(X  20).
Solución
P(X  20) = 1 – P(X < 20) = 1 – p
Como en la tabla 2, de chi cuadrado, para 13 grados de libertad, no se
encuentra el valor 20, pero éste se encuentra entre los valores 19.8 (con
probabilidad 0.90) y 22.4 (con probabilidad 0.95) para hallar p interpolamos
de la siguiente manera:
82
x2
P
19.8
0.90
20
p
22.4
0.95
22.4  19.8 20  19.8

0.95  0.90 p  0.90

 52 
0.2
 52 p  46.8  0.2 
p  0.90
 P(X  20) = 1 – 0.9038 = 0.0962
p  0.9038
Rpta.
Ejemplo 4.2
Si X es una variable aleatoria con distribución x25
. Hallar a y b tal que:
P[a ≤ X ≤ b] = 0.95
P[ X ≤ a ] = 0.025
y
Solución
a = x02.025 , 25 = 13.1
Para r = 25 g.l.,
Rpta.
0.95 = P[a ≤ X ≤ b] = P[X  b] – P[X  a] = P[X  b] - 0.025
Luego:
P[X  b] = 0.975

b = x02.975 , 25 = 40.6
Rpta.
Veamos a continuación algunos teoremas importantes relacionados con la
distribución chi-cuadrado y de mucha importancia para la construcción de
intervalos de confianza y pruebas de hipótesis.
Teorema 1.- Si la variable aleatoria
X ~ N(, ²), entonces la variable
Y = Z² = (X - )²/² es una x12 .
aleatoria,
n
Sabemos que X 
X
i 1
n
N(0,1) entonces, Z 2 
I
~ N ( ,
 X   ²n
²
~
 X    n es
²
) y por lo tanto Z 
n

x12 .
Ejemplo 5.Si X ~ N(12, 5). Calcule e interprete P[13.55  (X – 12)² < 19.20 ]
83
Solución
Como X ~ N (12, 5) entonces la variable aleatoria
Y
 X  12²
5
~ x12 .
Luego:
13.55  X  12 ² 19.20 
P[13.55  (X – 12)² < 19.20 ] = P 
=


5
5 
 5
= P[2.71  x12 < 3.84 ] = P[ x12  3.84 ] - P[ x12  2.71 ] =
= 0.95 - 0.90 = 0.04
Interpretación: el
Rpta.
4% de las desviaciones al cuadrado, de los valores
observados de X ~ N (12, 5)
con respecto a su media 12, estarán
comprendidos entre 13.55 y 19.20.
Teorema 2.- (Propiedad Reproductiva de la Chi-Cuadrado)
Sean X 12 , X 22 ,..., X p2 variables aleatoria chi-cuadrados dependientes con
grados de libertad r1, r2, ..., rp respectivamente, entonces la variable aleatoria:
X ²  X 12  X 22  ...  X p2
p
Sigue una distribución chi-cuadrado con grado de libertad igual a r   ri
i 1
Teorema 3.-
Sea X1, X2, ..., Xn, una muestra aleatoria de una variable
aleatoria X ~ N (, ²). Entonces, la variable aleatoria:
n
2
Y   xi    /  ² ~ x n2
i 1
Distribución de la Varianza Muestral
Teorema 4.- Sea X1, X2, ... , Xn una muestra aleatoria de tamaño n de una
población normal con media  y varianza ². Sea X y S² la media muestral y
varianza muestral respectivamente, entonces:
a) Las variables aleatorias X y S² son independientes.
n
b) La función de la varianza muestral x
84
2
n  1S ²  
i 1

²
xi  X ²
²
~ x n21 .
Demostración.- Demostraremos sólo la parte b)
n
 x
i 1
Sabemos que la variable aleatoria
i
  ²
tiene una distribución xn2 ,
²
puesto que cada término (xi - )/ son variables aleatorias normales estándar
e independientes (teorema 3).
Consideremos:
n
n
i 1
i 1
  X i   ²    X i  X    X   ²
n
n
n
i 1
i 1
i 1
   X i  X ²    X   ²  2 X     X i  X 
n
=
 X
i 1
i
 X ²  n X   ²
Dividiendo entre ² y ordenando tenemos:
n
n
 X i   ²   X i  X ²

 X   ²
i 1
 i 1

²
²
²/n
=
n  1S ²   X   ²
²
²/n
Dado que ( X - )²/(²/n) tiene una distribución X 12 . Además, como X y S²
n
son independientes, y
 X
i 1
i
  ² /  ² tiene una distribución x n2 , por la
propiedad aditiva de la chi-cuadrado, concluimos que la distribución de
n  1S ²
²
2
es x n 1 .
Ejemplo 6.Suponga que X1, X2, …......,X10 es una muestra aleatoria de una variable
aleatoria normal estándar. Calcule e interprete:
10


a) P 2.56   X i2  18.3
110


b) P(S2 < 1.88)
y
Solución
entonces X2 i ~ X 12 y por lo tanto
a) Como las v.a Xi ~ N(0, 1),
10
X
i 1
2
i
85
~ X 102
10


 P 2.56   X i2  18.3 = P 2.56  X 102  18.3 =
110




= P( X 102  18.3) – P( X 102  2.56) =
= 0.95 – 0.01 = 0.94
Rpta.
Interpretación: En el 94% de las muestras de 10 observaciones de la
10
distribución normal estándar, la
X
i 1
b) P(S2 < 1.88) = P(
9S 2

2

2
i
estará entre 2.56 y 18.3.
9 x1.88
) = P( X 92  16.92) = 0.95
1
Rpta.
Interpretación: En el 95% de las muestras de 10 observaciones de la
distribución normal estándar, la varianza muestral es menor que 1.88.
3.2 DISTRIBUCIÓN T DE STUDENT
Esta distribución fue descrita en 1908 por el estadístico inglés William S. Gosset,
quien, al estar prohibido de publicar artículos científicos por la empresa cervecera
Guinness donde laboraba en Dublin, tuvo que presentarla con el pseudónimo de
“Student” y es comúnmente conocida como la “distribución t”.
“Es Ronald A. Fisher quien aprecia la importancia de los trabajos de Gosset sobre
muestras pequeñas, tras recibir correspondencia de Gosset en la que le decía le
envío una copia de las Tablas de Student, ¡ya que es la única persona que
probablemente las use jamás.” 3
Definición.- Sea Z una variable aleatoria normal estándar N(0, 1). Sea X2 ~ X r2
una variable aleatoria que tiene una distribución chi-cuadrado con r grados de
libertad, y si Z y X2 son independientes, entonces la variable aleatoria
T
Z
X2
r

Z r
~ tr
Y
tiene una distribución t, con r grados de libertad, y su función de densidad de
probabilidades está dada por:
3
http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.
86
 r  1
 r 1 



2   t ²   2 

f t  
1
,
 r   r 
r  
2
- < t < 
Notación: decir que la variable aleatoria T, tiene distribución t con r grados de
libertad, se denota como T ~ tr.
Media y Varianza:
La media y la varianza de la v. a. T con r grados de libertad son:
E(T) =  T = 0
Var(T) =  T2 
,
r
r2
r>1
,
r>2
Observe que la distribución de la variable aleatoria T, queda completamente
determinada sólo por el parámetro r. Por lo tanto, hay una distribución t
correspondiente a cada grado de libertad. En la figura 3 se presenta la función
de densidad de la variable aleatoria T, para diferentes grados de libertad. En la
misma figura se da, la gráfica de la normal estándar.
La distribución t es simétrica alrededor de la media 
T
= 0 y varía de menos
infinito a más infinito. Es muy similar a la distribución normal estándar, ya que
ambas varían de -  a , son simétricas y centradas alrededor de  = 0, es decir
su media es cero, pero la distribución t tiene mayor dispersión que la
87
distribución normal estándar, esto se observa de la varianza  T2 
r
, que
r2
se aproxima a 1 cuando el grado de libertad r es grande (r → ∞).
Por lo tanto, la distribución t, se aproxima a la distribución normal estándar
cuando el grado de libertad r es suficientemente grande. En la práctica se trata
a la distribución t, como N(0,1) cuando r > 30.
Función de Distribución Acumulativa de Probabilidades.El cálculo de probabilidades para la v.a. t, se efectúa utilizando los valores de
la función de distribución acumulativa menor o igual que, los que han sido
reproducidos en la Tabla 3 del Anexo, utilizando la hoja de cálculo Excel.
Así tenemos que, la probabilidad que la variable aleatoria T con distribución tr
(con 1  r < 30) sea menor o igual a un valor constante t , representada por:
PT  t   
,
0<<1
Está dada por:
PT  t    f t dt 
t

t


 r  1
r 1



t
²
 2  1   2 dt  
 r   r 
r    
2
cuya representación gráfica la podemos ver en la fig. 4.
Estas probabilidades están determinadas en la Tabla 3, de la distribución
acumulativa t de student. En el encabezado de la columna de la izquierda, dice
grados de libertad (G.L.) y cada fila de esta tabla corresponde a una
distribución t particular, con sus probabilidades (p) en la parte superior de esta
tabla.
En la hoja de cálculo Excel, las probabilidades y los valores de T se determinan
así:
88
a) DISTR.T: devuelve la probabilidad (los puntos porcentuales) de la
distribución t de Student, donde un valor numérico (x) es un valor calculado
de t para el que deben calcularse los puntos porcentuales. La distribución t
de Student se utiliza para la comprobación de pruebas de hipótesis cuando el
tamaño de la muestra es pequeño (n < 30). Se puede utilizar esta función en
lugar de una tabla de valores críticos para la distribución t.
Sintaxis: DISTR.T(x; grados_de_libertad; colas)
X es el valor numérico al que se ha de evaluar la distribución.
Grados_de_libertad
es un entero que indica el número de grados de
libertad.
Colas
especifica el número de colas de la distribución que se ha de
devolver. Si colas = 1, DISTR.T devuelve la distribución de una cola. Si
colas = 2, DISTR.T devuelve la distribución de dos colas.
Observaciones:

Si uno de los argumentos no es numérico, DISTR.T devuelve el valor de
error #¡VALOR!

Si grados_de_libertad < 1, DISTR.T devuelve el valor de error #¡NUM!

Los argumentos grados_de_libertad y colas se truncan a enteros.

Si el argumento colas es un número distinto de 1 ó 2, DISTR.T devuelve
el valor de error #¡NUM!

DISTR.T se calcula como DISTR.T = P( x < X ), donde X es una variable
aleatoria que sigue la distribución t.
Ejemplo:
DISTR.T(1,96;60;2) es igual a 0,054645 ó 5,46%
b) DIST.T.INV : Devuelve el valor t de la distribución t de Student como
función de la probabilidad y los grados de libertad.
Sintaxis:
DISTR.T.INV(probabilidad;grados_de_libertad)
Probabilidad:
es la probabilidad asociada con la distribución t de
Student dos colas.
89
Grados_de_libertad: es el número de grados de libertad para diferenciar
la distribución.
Observaciones:

Si uno de los argumentos no es numérico, DISTR.T.INV devuelve el
valor de error #¡VALOR!

Si el argumento probabilidad < 0 o si probabilidad > 1, DISTR.T.INV
devuelve el valor de error #¡NUM!

Si el argumento grados_de_libertad no es un entero ≥ 1, se trunca.

DISTR.T.INV se calcula como DISTR.T.INV = P (X > t ), donde X es
una variable aleatoria que sigue la distribución t.

Puede devolverse un valor t de una cola reemplazando probabilidad por
2*probabilidad. Para una probabilidad de 0,05 y grados de libertad de 10,
el valor de dos colas se calcula con DISTR.T.INV(0,05;10), que
devuelve 2,28139. El valor de una cola para la misma probabilidad y los
mismos
grados
de
libertad
puede
calcularse
con
DISTR.T.INV(2*0,05;10), que devuelve 1,812462.
Nota.- En algunas tablas, la probabilidad se describe como (1-p).
DISTR.T.INV se calcula utilizando una técnica iterativa. Dado un valor
del argumento probabilidad, DISTR.T.INV reitera hasta obtener un
resultado con una exactitud de ± 3x10-7. Si DISTR.T.INV no converge
después de 100 iteraciones, la función devuelve el valor de error #N/A.
Ejemplo:
DISTR.T.INV(0,054645;60) es igual a 1,96
Ejemplo7.Si la variable aleatoria T ~ t20 (r = 20). Usando la tabla 3, de T de student,
hallar: P[T  1.725 ]
Solución
Para obtener las probabilidad solicitada, buscar en la tabla 3 el valor T =
1.725 en la fila de 20 g.l y su probabilidad correspondiente se lee en la parte
superior de esa columna, cuyo valor es 0.95. Es decir:
90
P[T  1.725 ] = P[T  t 0.95 ] = 0.95
Rpta.
Nota.- Por la simetría de la distribución t, se tiene que:
 Para  < 0.5, los valores t son: t = - t1- , .
(ver fig. 5).
Fig. 5 Obtención de valores Tα para α < 0.05
α
0
α
Tα = - T(1 - α)
0
T(1 - α)
 P[ T  -a ] = 1 - P[ T  a ]
Ejemplo 8.Sea T una variable aleatoria que tiene una distribución t con varianza ² =
5
.
3
Calcular: P[-2.015  T  2.571]
Solución
Como  T2 
r
5
 , entonces r = 5 y T ~ t5 . Luego:
r 2 3
P [- 2.015  T  2.571] = P[T  2. 571] – P[T  - 2. 015 ] =
= P[T  2. 571] – [1 – P[T  2. 015 ] =
Buscando las probabilidades en la tabla 3 y reemplazando se tiene:
= P [T  t0.975 ] – {1 - P[T  t0.95 ]} =
= 0.975 – [ 1 - 0.95 ] =
= 0.975 - 0.05 = 0.925
Rpta.
Ejemplo 9.Sea T una variable aleatoria que tiene una distribución t con 23 grados de
libertad. Hallar el valor de a tal que: P[T  a ] = 0.95
91
Solución
0.95 = P [T  a ] = P[-a  T  a ] =
= P[T  a] – P[T  - a]
= P[ T  a ] – [ 1 – P[T  a ]
= 2P[Ta]–1

P[ T  a ] = 0.975 
En la tabla 3, a = t0.975 , 23 = 2.069
Rpta.
3.3 DISTRIBUCIÓN MUESTRAL DE LA MEDIA (n < 30)
En el acápite 2.1 vimos la distribución muestral para la media, con muestras
grandes (n ≥ 30), la misma que se aproximaba a la distribución normal. Sin
embargo, cuando las muestra son pequeñas (n < 30) la aproximación es hacia la
distribución t de student, tal como veremos a continuación.
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria
X con distribución N(, ²), en acápites anteriores hemos visto que:
X 
~ N(0,1).
/ n
1.
La variable aleatoria Z 
2.
La variable aleatoria x 2 
3.
X y S² son variables aleatorias independientes
(n  1)S 2

2
~ x 2n 1
(teorema 4).
(teorema 4).
Usando la definición de la variable aleatoria T, tenemos que:
X   
T
Z
x2
g.l.


n
n  1S ² / n  1

X   
S
n
~ tn-1
²
tiene distribución t con n – 1 grados de libertad y se usa para estimar  cuando no
se conoce la desviación estándar .
Ejemplo 9.Si X y S 2 son la media y la varianza de una muestra aleatoria de tamaño 17 de
una distribución N(, o2). Hallar la constante C tal que:
92
4X   


P  C 
 C   0.95
S


Solución
En el problema propuesto, T 
( X   ) n ( X   ) 17
~ t 16. Entonces:

S
S
 C 17 X    17 C 17 
= P 


 =
4
S
4 



4X   
 C
0.95 = P  C 
S


 C 17


C 17 
C 17 
C 17 
= P 
 t16 
 = P t16 
 - P t16  
 =
4
4 
4 
4 




C 17 
= P t16 
4 


 1  P  t16 



C 17 
0.95 = 2 P t16 
- 1
4



C 17
 t16 , 0.975  2.12
4
C 17 

4 


C 17 
P t16 
 = 0.975
4



 C = 2. 0567
Rpta.
3.4 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES,
CON VARIANZAS DESCONOCIDAS PERO IGUALES
Si se toma dos muestras aleatorias independientes de dos poblaciones normales
X e Y, con varianzas desconocidas pero iguales ²X = ² Y = ², así:
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria
X con distribución N(X, ²). Sea también Y1, Y2, ..., Ym una muestra aleatoria
de tamaño m de una variable aleatoria Y, con distribución N(Y, ²). De
acuerdo a lo estudiado en acápites anteriores se tiene que:
1.
La distribución de la variable aleatoria
Z
 X  Y    X  Y    X  Y    X  Y 
² ²
n
2.

1 1


n m
m
~ N (0 , 1 )
La variable aleatoria:
n
n  1S
U
²
2
X

X
i 1
93
i
 X ²
²
~ x 2n  1
U es independiente de X e Y .
3.
La variable aleatoria:
n

m  1SY2
V
²
 Y  Y ²

i 1
i
~ x2m  1
²
V es independiente de X , Y y S X2 .
4.
Por la propiedad reproductiva de la distribución chi-cuadrado, la v.a. :
U+V=
n  1S X2
+
²
m  1SY2
²
~ x2n  m  2
Con los resultados encontrados en (1) y (4); siendo las variables Z normal
estándar y U + V chi-cuadrado e independientes; usando la definición de la
variable aleatoria T se obtiene la distribución de la diferencia de medias
muestrales X - Y siguiente:
 X  Y    X  Y 
T
Z

U V
nm2
1 1

n m
(n  1) S X2  (m  1) SY2 /  2
nm2



 X  Y    X  Y 
n  1S X2  m  1SY2 1  1
~ t n+m-2
Simplificando:
T
nm2
n
m
tiene distribución t con n + m – 2 grados de libertad. Observe que esta variable
aleatoria depende de las medias y las varianzas muestrales.
3.5 DISTRIBUCIÓN F DE SNEDECOR
Esta distribución fue descubierta por Fisher, de allí la denominación F y
redescubierta por Snedecor. Es muy utilizada para comparar las varianzas de
dos variables aleatorias independientes distribuidas normalmente.
94
Definición.- Sea U y V dos variables aleatorias independientes que tienen
distribuciones chi-cuadrado, con r1 y r2 grados de libertad, respectivamente.
F
Entonces, la variable aleatoria:
tiene una distribución F con r
1
y r
2
U / r1
V / r2
grados de libertad y su función de
densidad de probabilidades está dada por:
r r  1 2
r1
1
  1 2  r1 2 r2 2
x2
 2 
.
 r1   r2  x r  r r1 2 r2
    
1
2
2  2 
r
fF (x) =
r
= 0
,
,
0<x<
en otros casos
La distribución F depende de los parámetros r1 y r2 en ese orden.
r1 = grados de libertad en el numerador, y
r2 = grados de libertad en el denominador.
En la figura 6 se muestra la función de densidad de probabilidades de la
variable aleatoria F para tres pares diferentes de grados de libertad.
Fig. 6
Las distribuciones F son una familia de distribuciones asimétricas hacia la
derecha. Existe una distribución F separada para cada par de valores de sus
parámetros r1 y r2.
95
Notación: decir que la variable aleatoria F tiene distribución F con r1 y r2
grados de libertad, se denota como F ~ Fr1 , r 2 .
Media y Varianza.La media y la varianza de la v. a. F con r1 y r2 grados de libertad son:
 F  E F  
r2
r2  2
 F2  VarF  
,
2r22 r1  r2  2
,
r1 r2  2²r2  4
r2 > 2
r2 > 4
Función de Distribución Acumulativa de Probabilidades
El cálculo de probabilidades para v.a. F, se efectúa utilizando la Tabla 4 de
distribución acumulativa F, las mismas que han sido elaboradas utilizando la
función de distribución acumulativa de probabilidades que en la mayoría de los
casos son del tipo de acumulación menor o igual que.
La probabilidad que la variable aleatoria F ~ Fr1 , r 2 sea menor o igual que una
constante f está dada por:
PF  f   
0
PF  f   
0
f F x  dx  
r r  1 2
r1
1
  1 2  r1 2 r2 2
2
x
2


.
dx  
 r1   r2  x r  r r1 2 r2
    
1
2
2  2 
r
f
f
96
r
Estas probabilidades se presentan en tablas de F. Como la distribución depende
de los dos parámetros r1, y r2, se necesita una tabla con tres entradas para
tabular el valor de F que corresponde a diferentes probabilidades y valores de
r1 y r2.
Para valores de  < 0.50 , se obtiene usando la siguiente igualdad
U / r

V / r
1 
1
2
  P
 F ,r ,r   P 


V
/
r
U
/
r
f ,r ,r 

2
1



1 2
1 2
V / r2
1
= 1  P

U / r1 f ,r1 ,r2
V / r2
1 
P

  1
U / r1 f ,r1 ,r2 

Pero,



1 V / r2

~ Fr2 , r1
F U / r1
tiene distribución F con r2 y r1 g.l.
V / r2

P
 f1 ,r2 ,r1   1  
U / r1


................ (1)
............... (2)
Igualando (1) y (2), se tiene que:
f1 , r2 , r1 
1
f , r1 , r2
f , r1 , r2 

1
f1 , r2 , r1
, para  < 0.50
Ejemplo 10.Sea F una variable aleatoria que tiene una distribución F con r1 y r2 grados de
libertad. Hallar :
a) PF  15.0 ,
con r1 = 7,
r2 = 4
b) PF  3.69 ,
con r1 = 5,
r2 = 8
c) P[F  0.0358 ],
con r1 = 3,
r2 = 6
d) Hallar los valores a y b tales que:
97
P[ F  b ] = 0.975 y P[a  F  b] = 0.95 . Con r1 = 7,
r2 = 5
Solución
Usando la tabla F:
a) P[F  15.0 ] = 1 – P[F  15.0 ] = 1 – P[F  f0.99, 7, 4 ] =1 – 0.99 = 0.01
Rpta.
b) P[F  3.69 ] = P[F  f0.95, 5, 8 ] = 0.95
Rpta.
1 
1
1

c) P[F  0.0358] = P  
 1  P   27.9

 F 0.0358 
F

1

= 1  P   f 0.99, 6, 3  = 1 – 0.99 = 0.01
F

d) P[F  b] = 0.975

b = f0.975, 7, 5 = 6.85
Rpta.
Rpta.
0.95 = P[a  F  b] = P[F  b] - P[F  a] = 0.975 - P[F  a]
 P[F  a] = 0.025
 1 1
 1 1
P[F  a] = P     1  P     0.025
F a
F a

 1 1
P     0.975 ,
F a
Luego:
1
 f.0975, 5, 7  5.29 , de donde a = 0.189
a
1/F ~ F 5, 7
Rpta.
3.6 DISTRIBUCIÓN DE LA RAZÓN DE DOS VARIANZAS MUESTRALES
Si se toman dos muestras aleatorias independiente de las poblaciones normales
X e Y, encontraremos la distribución de probabilidades para la razón de
varianzas muestrales de la siguiente manera.
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n de una variable aleatoria
X ~ N(X,  X2 ). Sea Y1, Y2, ..., Ym una muestra aleatoria de tamaño m de una


variable aleatoria Y con distribución N Y ,  Y2 . Entonces, la variable
aleatoria,
98
n
n  1S X2
U

2
X

X
i 1
i

 X ²
2
X
~ x 2n  1
De modo similar, la variable aleatoria,
m
V
m  1SY2

 Y2

 Y  Y ²
i 1
i
 Y2
~ x2m  1
Además, las dos variables aleatorias chi-cuadrado U y V son independientes
por que X e Y son independientes. Entonces, usando la definición de la
variable aleatoria F, tenemos que la variable aleatoria:
n  1S X2 / n  1
F
U / (n  1)
 X2

V / (m  1) m  1SY2
 Y2
/ m  1
99

S X2 /  X2 S X2  Y2
~ Fn–1,m-1

SY2 /  Y2 SY2  X2
3.7 EJERCICIOS RESUELTOS
1.
Si X ~ X2 con 15 grados de libertad, hallar:
a) P(X > 27.5).
b) P(7.26 ≤ X ≤ 25.0).
c) P(X ≤ 23.5).
d) Hallar a y b tal que P(X ≤ a) = 0.025 y P(a ≤ X ≤ b) = 0.95.
Solución
Para obtener las probabilidades solicitadas, en la fila de 15 g.l de la tabla 2 se
buscan los valores dados para X y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas así:
2
 = 1 – 0.975 = 0.025 Rpta.
a) P[X > 27.5] = 1 - P(X ≤ 27.5) = 1- P  X  x0.975
b) P[7.26 ≤ X ≤ 25.0] = P[X  25.0 ] - P[X  7.26] =
2
2
  P  X  x0.05
 =
= P  X  x0.95
= 0.95 – 0.05 = 0.90
Rpta.
Distribución chi-cuadrado con 15 g.l.
0.900
0
0
7.26
25.0
X
Resultado gráfico en Minitab
c) P(X ≤ 23.5) = p
Como en la tabla 2, de chi cuadrado, para 15 grados de libertad, no se
encuentra el valor 23.5, pero éste se encuentra entre los valores 22.3 (con
probabilidad 0.90) y 25.0 (con probabilidad 0.95) para hallar p interpolamos
de la siguiente manera:
100
x2
P
22.3
0.90
23.5
p

25.0
0.95
 54 
Luego:
25.0  22.3 23.5  22.3

0.95  0.90
p  0.90
1.2
 54 p  48.6  1.2 
p  0.90
P(X ≤ 23.5) = 0.9222
p = 0.9222
Rpta.
d) P(X ≤ a) = 0.025
2
a = x0.025
, 15 = 6.26
Para r = 15 g.l.,
Rpta.
0.95 = P[a ≤ X ≤ b] = P[X  b] – P[X  a] = P[X  b] - 0.025
P[X  b] = 0.975
Luego:

2
b = x0.975,
15 = 27.5
Rpta.
Distribución chi-cuadrado con 15 g.l.
0.95
0
0
a = 6.26
b = 27.5
X
2.
De una población X: N(u, 18 ), se extrae una muestra aleatoria de tamaño n =
21. Calcule e interprete:
a) P [ 3.291 < ( x - µ )2 < 5.683 ]
b) ¿Entre que valores se encontrará el 90 % central de las varianzas muestrales?
Solución
101
n
a) Se sabe que X 
X
i 1
n
N(0,1) entonces, Z 2 
I
~ N ( ,
 X    n es
²
) y por lo tanto Z 
n

 X    ²n   X    ² x21 ~ 
²
18
2
1
.
Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad
por 21/18 y se construye una 12 así:
 3.291x21 ( x  ) 2 x21 5.683 x21 
P [3.291 < ( x - µ ) < 5.683] = P 
=


18
18 
 18
2
= P [3.84 < 12 < 6.63] = P[ 12  6.63] - P[ 12  3.84] = 0.99 – 0.95 = 0.04.
Interpretación.- en el 4% de las muestras de tamaño 21, de una población X
N(u, 18 ), las desviaciones al cuadrado, de las medias muestrales x con
respecto a la media poblacional µ, se encuentran entre 3.291 y 5.683.
b) Sean a y b los valores centrales dentro de los cuales se encuentra el 90% de
las varianzas muestrales (S2), con el 5% hasta a y 95% hasta b, es decir:
0.90 = P (a ≤ S2 ≤ b), con P (S2 ≤ a) = 0.05 y P (S2 ≤ b) = 0.95
Se sabe que:
(n 1)S 2
2
 n21 entonces,
(21  1)S 2 20S 2

 202
18
18
Multiplicando en la probabilidad anterior por 20/18 se tiene una  202 así:
0.05
 20S 2 20a 
 2 20a 
P

  P  20 

18 
18 

 18
=
20a
2
  20,
0.05  10.9 .
18
Luego: a = 9.81. Además:
0.95
 20S 2 20b 
 2 20b 
P

  P  20 

18 
18 

 18
=
20b
  22 0 , 0 . 931.4
.
5
18
Luego: b = 28.26. Entonces: 0.90 = P (9.81 ≤ S2 ≤ 28.26) Rpta.
Interpretación.- en las muestras de tamaño 21, de una población X N(u, 18 ),
el 90% central de las varianzas muestrales (S2) se encuentra entre 9.81 y
28.26.
3.
De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 21.
Calcule e interprete:
21
a) P [208.7 <

(X i - µ)2 < 638.7]
i 1
102
b) P (9.77 < S2 < 30.78)
Solución
a) Se sabe que
n
(X
i 1
2
i  )

2
para muestras de una población normal se cumple que:
21
  n2 
(X
i 1
i
  )2
18
  212 .
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por
18 y se construye una  212 así:
21
P [208.7 <

i 1
21


2
 208.7  ( X i   )

638.17
 =
 i 1

(X i - µ)2 < 638.7] = P 
18
18 
 18


= P [11.6 <  212 < 35.5] = P[  212  35.5] - P[  212  11.6] = 0.975 – 0.05 =
0.925.
Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población
X
N(u, 18 ), las sumas de desviaciones al cuadrado, de los valores
observados con respecto a la media poblacional µ, se encuentran entre 208.7
y 638.7.
b) Se sabe que:
(n 1)S 2
2

2
n 1
(21  1)S 2 20S 2
entonces,

 202
18
18
Multiplicando en la probabilidad solicitada por 20/18 se tiene una  202 así:
 20 x9.77 20 S 2 20 x30.78
P (9.77 < S2 < 30.78) = P 


18
18
 18

=

= P[10.9 <  212 < 34.2] = P[  202  34.2] - P[  202  10.9] = 0.975 – 0.05 =
0.925.
Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población
X N(u, 18 ), las varianzas muestrales (S2) se encuentra entre 9.77 y 30.78.
4.
Suponga que el número de horas semanales que las amas de casa ven TV tiene
distribución normal con una varianza de 3. Al escoger una muestra de 17 amas
de casa y registrar el número de horas a la semana que ven TV, calcule e
103
interprete la probabilidad de que la varianza muestral de los tiempos obtenidos
sea mayor que 5.4 (horas)2.
Solución
Sean X = número de horas semanales que las amas de casa ven TV, n = 17 y σ2
= 3.
Se sabe que:
(n 1)S 2
2
 n21 entonces,
(17  1)S 2 16S 2

 162
3
3
Multiplicando en la probabilidad solicitada por 16/3 se tiene una 162 así:
 16S 2 16 x5.4 

P (S > 5.4) = 1 - P (S ≤ 5.4) = 1 - P 
 =
3 
 3
2
2
= 1 - P[ 162 < 28.8] = 1 - 0.975 = 0.025
Rpta.
Interpretación.- en el 92.5% de las muestras de 17 amas de casa, las varianzas
muestrales (S2) del número de horas semanales que ven TV es mayor que 5.4
(horas)2.
5.
La duración de los transistores fabricados por una compañía tienen una media de
2000 horas y una desviación típica de 60 horas. Se selecciona 10 transistores al
azar, calcule e interprete la probabilidad que la desviación típica muestral se
encuentre entre 50 y 70 horas.
Solución
Sean X = duración de los transistores, µ = 2000, σ2 = (60)2 = 3600 y n = 10.
Se sabe que:
(n 1)S 2
2

2
n 1
(10 1)S 2 S 2
entonces,

 92
3600
400
Dividiendo en la probabilidad solicitada entre 400 se tiene una  92 así:
 2500 S 2 4900 
P(50 ≤ S ≤ 70) = P (2500 ≤ S2 ≤ 4900) = P 


=
 400 400 3600 
= P[6.25 ≤  92 ≤ 12.25] = P[  92 ≤ 12.25] – P[  92 ≤ 6.25] = 0.80 - p
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor
6.25, pero éste se encuentra entre los valores 5.38 (con probabilidad 0.20) y 6.39
(con probabilidad 0.30) para hallar p interpolamos así:
104
x2
P
5.38
0.20
6.25
p

6.39
0.30
 10.1 
6.39  5.38 6.25  5.38

0.30  0.20
p  0.20
0.87
 10.1 p  2.02  0.87  p = 0.2861
p  0.20
Reemplazando p = 0.2861 en la última expresión se tiene que:
P(50 ≤ S ≤ 70) = 0.80 - 0.0.2861 = 0.5139
Rpta.
Interpretación.- en el 51.4% de las muestras de 10 transistores, la desviación
estándar muestral de la duración de dichos transistores se encuentra entre 50 y
70 horas.
6.
De una población X: N(0, 1) se extrae una muestra aleatoria de tamaño n = 15.
Calcule e interprete:
15


a) P  7.26   X i2  27.5 
i 1


b) P(0.4693 < S² < 1.864)
Solución
a) Se sabe que las observaciones muestrales tienen la misma distribución que la
población, luego Xi ~ N(0, 1), entonces X i2 ~ 12 y por tanto
15
X
i 1
2
i
~ X 152 .
La probabilidad solicitada es:
15


P  7.26   X i2  27.5  = P  7.26  152  27.5 =
i 1


= P[ 152 ≤ 27.5] – P[ 152 ≤ 7.26] = 0.975 – 0.05 = 0.925 Rpta.
Interpretación.- en el 92.5% de las muestras de 15 observaciones de la
distribución normal estándar, la suma de los valores observados al cuadrado
se encuentra entre 7.26 y 27.5.
b) Dado que:
(n 1)S 2
2
 n21 entonces,
(15 1)S 2
 14 S 2  142
1
Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad
por 14 y se construye una 142 así:
105


P(0.4693 < S² < 1.864) = P 14 x 0.4693  14 S 2  14 x1.864 =
= P[6.57 ≤ 142 ≤ 26.1] = P[ 142 ≤ 26.1] – P[ 142 ≤ 6.57] = 0.975 – 0.05 =
0.925.
Interpretación.- en el 92.5% de las muestras de 15 observaciones de la
distribución normal estándar, la varianza muestral se encuentra entre 0.4693
y 1.964.
7.
De una población X: N(μ, 10) se extrae una muestra aleatoria. de tamaño n = 9 y
de una población Y: N(μ, 12) se extrae una muestra aleatoria de tamaño m = 4.
Calcule e interprete:
9


a) P  21.8   ( X i  X )2  175 
i 1


y
4


b) P  5.81   (Yi   ) 2  133.2 
i 1


Solución
 x  X  ²
n
a) Si  2 
 n  1 S ² 
²
i 1
i
²
 x  X  ²
9
  n21 entonces
i 1
i
10
 82 .
Para obtener la probabilidad solicitada se divide dentro de la desigualdad
entre 10 y se construye una  82 así:
9


( X i  X )2


9
21.8 i 1
175 


=


P  21.8   ( X i  X )2  175  = P 
10
10 
 10
i 1






= P(2.18 ≤  82 ≤ 17.5) = P[  82 ≤ 17.5] – P[  82 ≤ 2.18] =
= 0.975 – 0.025 = 0.955 Rpta.
Interpretación.- en el 92.5% de las muestras de 9 observaciones de la
población X: N(μ, 10), la suma de de las desviaciones al cuadrado de los
valores observados respecto a la media muestral, se encuentra entre 21.8 y
175.
106
m
 Y    ²
b) Para una muestra de una población normal, se sabe que:
i 1
i
²
  m2
4
 Y    ²
entonces
i 1
i
12
  42 . Para obtener la probabilidad solicitada se divide
dentro de la desigualdad por 12 y se construye una  42 así:
4


(Yi   )2



4
5.81
133.2


=
 i 1

P  5.81   (Yi   ) 2  133.2  = P 
12
12 
 12
i 1






= P[0.484 ≤  42 ≤ 11.1] = P[  42 ≤ 11.1] – P[  42 ≤ 0.484] =
= 0.975 – 0.025 = 0.95.
Rpta.
Interpretación.- en el 92.5% de las muestras de 4 observaciones de la
distribución normal Y: N(μ, 12), la suma de de las desviaciones al cuadrado
de los valores observados respecto a la media poblacional μ, se encuentra
entre 5.81 y 133.2.
8.
Si T ~ t con 18 grados de libertad (T18), hallar:
a) P(T > 2.101)
b) P(-1.734 ≤ T ≤ 2.552)
c) P(T ≤ 1.53)
d) Hallar t0 tal que P(-t0 ≤ T ≤ t0) = 0.95.
Solución
Para obtener las probabilidades solicitadas, en la fila de 18 g.l de la tabla 3 se
buscan los valores dados para T y se leen las probabilidades (acumuladas
menores que) correspondientes en el encabezamiento de las columnas así:
a) P(T > 2.101) = 1 - P(T ≤ 2.101) = 1- P(T ≤ T18, 0.975) = 1 – 0.975 = 0.025
Rpta.
b) P(-1.734 ≤ T ≤ 2.552) = P(T  2.552) – P(T  -1.734) =
= P(T ≤ T18, 0.99) – [1 - P(T  1.734)] =
= 0.99 – [1 – 0.95] = 0.99 - 0.05 = 0.94
107
Rpta.
Gráfica de distribución T con 18 G.L.
0.940
0
-1.734
0
T
2.552
Resultado gráfico en Minitab
c) P(T ≤ 1.53) = p
Solución
Como en la tabla 3, T de student, para 18 grados de libertad, no se encuentra
el valor 1.53, pero éste se encuentra entre los valores 1.33 (con probabilidad
0.90) y 1.734 (con probabilidad 0.95) para hallar p interpolamos de la
siguiente manera:
Tα
P
1.33
0.90
1.53
p

1.734
0.95
 8.08 
Luego:
1.734 1.33 1.53 1.33

0.95  0.90
p  0.90
0.2
 8.08 p  7.272  0.2  p = 0.9248
p  0.90
P(T ≤ 1.53) = 0.9248
Rpta.
d) 0.95 = P(-t0 ≤ T ≤ t0) = P(T18 ≤ t0 ) – P(T18 ≤ -t0) =
= P(T18 ≤ t0 ) – [1 - P(T18 ≤ t0)] = 2 P(T18 ≤ t0 ) – 1
 P(T18 ≤ t0 ) = 0.975  to = T18, 0.975 = 2.101 Rpta.
Resultado gráfico en Minitab
108
Gráfica de distribución T con 18 G.L.
0.95
0.025
0
9.
0.025
-2.101
0
T
2.101
Un inspector investiga las acusaciones contra la fábrica de ron “Pepito” porque
no llena bien sus envases. Una muestra de 25 botellas de ron indica una
desviación típica S = 0.18 litros. Calcule e interprete la probabilidad de que el
promedio muestral difiera de su media poblacional µ en menos de 0.085 litros.
Solución

Datos: n = 25, S = 0.18 lts. Se pide hallar P X    0.085
Se sabe que: T 

X 
X 
X 
 tn1 , entonces: T 

 t24
0.18 / 25 0.036
S/ n
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por
0.036 y se construye una T24 así:
 X   0.085 
P X    0.085 = P 

  P( T24  2.361) =
0.036
0.036




= P(-2.131 ≤ T24 ≤ 2.131) = P(T24 ≤ 2.131) – P(T24 ≤ -2.131) =
= P(T24 ≤ 2.131) – [1 - P(T24 ≤ 2.131)] =
= 2 P(T24 ≤ 2.131) – 1 = 2p – 1 …. (1)
Como en la tabla 3, T de student, para 24 grados de libertad, no está el valor
2.131, pero éste se encuentra entre los valores 2.064 (con probabilidad 0.975) y
2.492 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:
109
Tα
P
2.064 0.975
2.131
p

2.492  2.064 2.131  2.064
0.067
 28.53 =

0.990  0.975
p  0.975
p  0.975
2.492
0.990

28.53p - 27.817 = 0.067  p = 0.9774
Reemplazando p = 0.9774 en (1) se tiene que:


P X    0.085 = 2 (0.9774) – 1 = 0.9548 Rpta.
Interpretación.- en el 95.48% de las muestras de 25 botellas de ron “Pepito”, el
promedio muestral difiere de su media poblacional µ en menos de 0.085 litros.
10. De una población X ~ N(10, 100) se extrae una muestra aleatoria de tamaño 10 y
de una población Y ~ N(20, 40) se extrae una m.a. de tamaño 10. Determine el
valor de la constante a tal que: P (a SY <
X
- 10) = 0.95. Donde
X
es la media
muestral de las X y SY es la desviación estándar muestral de las Y.
Solución
Para resolver el problema es necesario construir una distribución T de student.
Con la muestra de tamaño 10 de la población X, se tiene que: X  N(10, 10).
Entonces: Z 
X  10
 N (0, 1) .
10
Con la muestra de la población Y se tiene que:  2 
(10 1)SY2
 92
40
Con los resultados anteriores construimos una variable T así:
T
Z
2
se distribuye como una T con los grados de libertad de la chi-
G.L
cuadrado. Reemplazando Z y la  92 en la expresión anterior se obtiene:
X  10
2( X  10)
10
T

 t9
SY
9SY2 / 40
9
110
Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a
la distribución t de student antes construida, así:
0.95 = P(a SY <
X
- 10) = P ( X - 10 ≥ a SY ) = 1 - P ( X - 10 ≤ a SY )
 2( X 10)

 2a  = P(T9 ≤ 2a)
 0.05 = P ( X - 10 ≤ a SY) = P 
SY


Luego: 2a = T9, 0.05 = - T9, 0.95 = -1.833  a = -0.9165 Rpta.
11. Para analizar el tiempo de atención por clienta en las tiendas de pantalones
“Ricas y apretaditas”, se tomó una muestra aleatoria sin reemplazo de 25
atenciones con lo cual se obtiene S2 = 2.25 minutos2. Calcule e interprete la
probabilidad de que el tiempo promedio muestral de atención a las clientas
difiera de su media poblacional µ en menos de 0.57 minutos.
Solución

Datos: n = 25, S2 = 2.25 minutos2. Se pide hallar P X    0.57
Se sabe que: T 

X 
X 
X 
 tn1 , entonces: T 

 t24
0.3
1.5 / 25
S/ n
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.3
y se construye una T24 así:
 X   0.57 
P X    0.57 = P 

  P( T24  1.9) =
0.3
0.3




= P(-1.9 ≤ T24 ≤ 1.9) = P(T24 ≤ 1.9) – P(T24 ≤ -1.9) =
= P(T24 ≤ 1.9) – [1 - P(T24 ≤ 1.9)] = 2 P(T24 ≤ 1.9) – 1 = 2p – 1
…. (2)
Como en la tabla 3, T de student, para 24 grados de libertad, no tiene el valor
1.9, pero éste se encuentra entre los valores 1.711 (con probabilidad 0.95) y
2.064 (con probabilidad 0.975) para hallar p interpolamos así:
Tα
P
1.711
0.95
1.9
p
2.064 0.975

2.064  1.711 1.9  1.711
0.189
 14.12 =

0.975  0.95
p  0.95
p  0.95

14.12p - 13.414 = 0.189  p = 0.9634
111
Reemplazando p = 0.9634 en (2) se tiene que:


P X    0.57 = 2 (0.9634) – 1 = 0.9268
Rpta.
Interpretación.- en el 92.68% de las muestras de 25 atenciones en las tiendas de
pantalones “Ricas y apretaditas”, el tiempo promedio muestral de atención a las
clientas difiere de su media poblacional µ en menos de 0.57 minutos.
12. De una población X: N(0, ¼) se extrae una m.a. de tamaño 7 y de una población
Y: N(0, 1/3) se extrae una m.a. de tamaño 9. Determine el valor de la constante a
tal que: P (a x > SY) = 0.01. Donde x es la media muestral de las X y SY es la
desviación estándar de las Y.
Solución
Para resolver el problema es necesario construir una distribución T de student.
Con la muestra de tamaño 7 de la población X, se tiene que: X  N(0, 1/28).
Entonces: Z 
X 0
 2 7 X  N (0, 1) .
1/ 28
Con la muestra de la población Y se tiene que:  2 
(9 1)SY2
 24SY2  82
1/ 3
Con los resultados anteriores construimos una variable T así:
T
Z
2
se distribuye como una T con los grados de libertad de la chi-
G.L
cuadrado. Reemplazando Z y la  82 en la expresión anterior se obtiene:
T
2 7X
24SY2
8

3.055 X
 t8
SY
Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a
la reciente distribución t de student construida, así:
0.01 = P (a x > SY) = 1 - P ( X /SY ≤ 1/a)
 3.055 X 3.055 

 0.99 = P ( X /SY ≤ 1/a) = P 
 = P(T8 ≤ 3.055/a)
a 
 SY
Luego: 3.055/a = T8, 0.99 = 2.896  a = 1.055 Rpta.
112
13. Para analizar el Nº de libros encuadernados diariamente por una máquina
automática, se seleccionó una muestra aleatoria de 25 días con lo cual se obtiene
S = 8 libros. Calcule e interprete la probabilidad de que el número medio
muestral de libros encuadernados difiera de su media poblacional µ en a lo más
4 libros.
Solución

Datos: n = 25 días, S = 8 libros. Se pide hallar P X    4
Se sabe que: T 

X  X 
X 
 tn1 , entonces: T 

 t24
1.6
8 / 25
S/ n
Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre
1.6 y se construye una T24 así:
 X 
4 
P X    4 = P

  P( T24  2.5) =
1.6 
 1.6


= P(-2.5 ≤ T24 ≤ 2.5) = P(T24 ≤ 2.5) – P(T24 ≤ -2.5) =
= P(T24 ≤ 2.5) – [1 - P(T24 ≤ 2.5)] = 2 P(T24 ≤ 2.5) – 1 = 2(0.99) – 1 = 0.98
Rpta.
Interpretación.- en el 98% de las muestras de 25 días de encuadernación cada
una, el número medio muestral de libros encuadernados difiere de su media
poblacional µ en a lo más 4 libros.
14. De una población X: N(μ, σ²), se extrae una m.a. de n+1 observaciones.
Encontrar c tal que el estadístico c( X – Xn+1)/S tenga distribución t. Donde X y
S es la media y la desviación estándar muestral obtenidas con las n + 1
observaciones.
Solución
Para hallar la constante c es necesario construir una distribución T de student.
Con la muestra dada se tiene que: X → N(μ,
2
n 1
) y Xn+1 → N(μ, σ²).
Por la propiedad reproductiva de la distribución normal, se tiene que:
X - Xn+1 → N[0, σ²(n +2)/(n + 1)]. Puesto que las correspondientes medias se
restan y las varianzas se suman.
113
Entonces: Z 
X  X n1  0
 (n  2) /(n  1)
2
n  1  X  X n1 

  N (0, 1) .
n2  


Como S la desviación estándar muestral obtenidas con las n + 1 observaciones,
entonces la chi-cuadrado es:  2 
nS 2

2
 n21
Con los resultados anteriores construimos una variable T así:
T
Z
2
se distribuye como una T con los grados de libertad de la chi-
G.L
cuadrado. Reemplazando Z y la  n21 en la expresión anterior se obtiene:
T
n  1  X  X n1 

n  2 


nS 2

n  1  X  X n1 

  tn1
n(n  2) 
S

2
Comparando el resultado anterior con la expresión dada, se tiene que:
c=
n 1
n(n  2)
Rpta.
15. Si F ~ f con 7 y 8 grados de libertad, hallar:
a) P(F7,8 > 3.50)
b) P(F7,8 ≤ 0.268)
c) P(0.1462 ≤ F7,8 ≤ 4.53)
d) Hallar c y d tal que P(F7,8 ≤ c) = 0.025 y P(c ≤ F7,8 ≤ d) = 0.95
Solución
Para obtener las probabilidades solicitadas en la tabla 4, ubicarse en la gran
casilla formada por la intercepción de la columna 7 (G.L. numerador) y la fila 8
(G.L. denominador) se busca el valor dado de F y se leen las probabilidades
acumuladas menores que correspondientes, en la intercepción de la línea del
valor dado de F (en la fila 8) con la columna P así:
a) P(F7,8 > 3.50) = 1 - P(F7,8 ≤ 3.50) = 1 – 0.95 Rpta.
 1
1 
b) P(F7,8 ≤ 0.268) = P

F
  P(F8,7 > 3.73) = 1 - P(F8,7 ≤ 3.73) =
 7,8 0.268 
= 1 – 0.95 = 0.05
Rpta.
114
Para valores de 0 < F < 1 les corresponde probabilidades P =  < 0.50 y se
usa la relación: f , r1 , r2 
1
f1 , r2 , r1
Como el valor de F7,8 = 0.268 no se encuentra en la intercepción de la
columna 7 y la fila 8 de la Tabla 4, se toma el inverso de F7,8 que es otra
distribución F8,7 (con los grados de libertad permutados). En la intercepción
de la columna 8 y la fila 7 de la Tabla 4 se busca el valor 3.73 y le
corresponde la probabilidad 0.95.
c) P(0.1462≤ F7,8 ≤ 4.53) = P(F7,8 ≤ 4.53) - P(F7,8 ≤ 0.1462)
 1
1 
= P(F7,8 ≤ 4.53) - P

F

0
.
268
7
,
8


= P(F7,8 ≤ 4.53) - P(F8,7 > 3.73)
= P(F7,8 ≤ 4.53) - [1 - P(F8,7 ≤ 3.73)]
= 0.975 - [1 – 0.95] = 0.925
Rpta.
d) Hallar c y d tal que P(F7,8 ≤ c) = 0.025 y P(c ≤ F7,8 ≤ d) = 0.95
Si P(F7,8 ≤ c) = 0.025 entonces c = f 7,8,0.025 
1
f 8,7,0.975

1
= 0.204
4.90
Rpta.
Si 0.95 = P(c ≤ F7,8 ≤ d) = P(F7,8 ≤ d) - P(F7,8 ≤ c) = P(F7,8 ≤ d) – 0.025
Luego: P(F7,8 ≤ d) = 0.975 entonces d = F7,8,0.975 = 4.53
Rpta.
16. Si muestras aleatorias independientes de tamaño n1 = n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la
probabilidad que la varianza de la primera muestra sea al menos 4 veces más
grande que la otra.
Solución
Dado que las varianzas son iguales, para obtener la probabilidad solicitada se
S12  22 S12
emplea la distribución siguiente: F  2 2  2  f n1 1,n2 1 = F7,7
S2 1 S2

P S  5S
2
1
2
2

 S12

 P 2  5  = P(F7,7 > 5) = 1 - P(F7,7 ≤ 5) =
 S2

= 1 – 0.975 = 0.025 Rpta.
115
Interpretación.- en el 2.5% de las (ó en 25 de cada 1000) muestras de tamaño 8
de cada población, la varianza de la primera muestra es al menos 4 veces más
grande que la segunda.
17. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la
probabilidad que la varianza de la primera muestra sea menor que seis veces la
segunda.
Solución
Para hallar la probabilidad solicitada se emplea la propuesta del problema 16.
 S2

P S12  6S 22  P 12  6  = P(F5,7 < 6) = p = 0.984 Rpta.
 S2



Como en la tabla 4 de la distribución F, para 5 y 7 grados de libertad, no se tiene
el valor 6, pero éste se encuentra entre los valores 5.29 (con probabilidad 0.975)
y 7.46 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:
Fα
P
5.29
0.975
6.0
p

7.46  5.29 6.0  5.29
1.29
 144.67 =

0.99  0.975 p  0.975
p  0.975
7.46
0.99

144.67 p – 141.05 = 1.29  p = 0.984
Interpretación.- en el 98.4% de las (ó en 984 de cada 1000) muestras de tamaño
6 de la población 1 y 8 de la población 2, la varianza de la primera muestra es
menor que seis veces la segunda.
18. De una población X: N(0, ¼) se extrae una muestra aleatoria de tamaño 7 y de
una población Y: N(0, 1/3) se extrae una muestra aleatoria de tamaño 9 Calcule
9
 7

e interprete: P 4 X i2  9Y j2  .
j 1
 i 1

Solución
Para hallar la probabilidad solicitada se construye una F como el cociente de dos
chi-cuadrados entre sus respectivos grados de libertad.
116
Si X: N(0, ¼) entonces cada Xi: N(0, ¼) → Z i 
Luego: Z i2  4 X i2  12 y
7
7
i 1
i 1
 Z i2  4 X i2   72 .
Si Y: N(0, 1/3) entonces cada Yj: N(0, 1/3) → Z j 
Luego: Z 2j  3Y j2  12 y
Xi  0
 2 X i  N (0,1) .
1/ 2
9
Z
j 1
Yj  0
1/ 3
 3Y j  N (0,1) .
9
2
j
 3Y j2   92 .
j 1
Con las dos chi-cuadrado anteriores se construye la distribución F siguiente:
7
F
4 X i2 / 7
i 1
9
3 Y / 9
2
j
j 1
7

9 x4 X i2 / 7
i 1
9
7 x3 Y / 9
j 1
 F7,9
2
j
Acondicionando la probabilidad solicitada a la distribución anterior se tiene:
7
 7 2



4
X
9
x
4
X i2






i
7
9

9 x3 
2
2
i 1
i 1



=
P 4 X i  9 Y j   P 9
3 P

9



7 
2
2
j 1
 i 1

 3 Y j

 7 x3 Y j

j 1
 j 1



= P(F7,9 > 3.86) = 1 - P(F7,9 ≤ 3.86) = 1 – p = 1 – 0.991 = 0.009 Rpta.
Como en la tabla 4 de la distribución F, para 7 y 9 grados de libertad, no está el
valor 3.86, pero éste se encuentra entre los valores 5.61 (con probabilidad 0.99)
y 6.88 (con probabilidad 0.995) para hallar p interpolamos así:
Fα
P
5.61
0.99
5.86
p

6.88  5.61 5.86  5.61
0.25
 254 =

0.995  0.99
p  0.99
p  0.99
6.88
0.995

254 p – 251.46 = 0.25 
p = 0.991
Interpretación.- en el 0.9% de las (ó en 9 de cada 1000) muestras de tamaño 7
7
9
i 1
j 1
de la población X y 9 de la población Y, 4 X i2  9Y j2 .
19. Dos compañías A y B fabrican transistores. La duración para los fabricados por
A tienen una desviación estándar de 40 horas, en tanto que los B tienen una
desviación estándar de 50 horas. Se toma una muestra de 8 transistores de A y
117
16 de B. Calcule e interprete la probabilidad que la varianza de la primera
muestra sea mayor 4.23 veces que la segunda.
Solución
Datos: σA = 40 horas, σB = 50, nA = 8 transistores y nB = 16.
Para obtener la probabilidad solicitada se emplea la distribución F siguiente:
F
S A2  B2 S A2 40 2
S A2


0
.
64
 f n A 1,nB 1 = F7,15
S B2  A2 S B2 50 2
S B2
Adecuando la probabilidad solicitada al resultado anterior se obtiene:
 S2



S2
P S A2  4.23S B2  P A2  4.23   P 0.64 A2  4.23x0.64  = P(F7,15 > 2.71) =
SB
 SB





= 1 - P(F7,15 ≤ 2.71) = 1 – 0.95 = 0.05 Rpta.
Interpretación.- en el 5% de las (ó en 50 de cada 1000) muestras de tamaño 8 de
la población A y 16 de la población B, la varianza de la duración de los
transistores de la primera muestra es mayor 4.23 veces que la varianza muestral
de la segunda.
20. De una población X ~ N(μ, 100) se extrae una muestra aleatoria de tamaño 12
y de una población Y ~ N(μ, 225) se extrae una muestra aleatoria de tamaño 8.
Calcule e interprete: P( S X2  1.6SY2 ) .
Solución
Datos: σ2X = 100 horas, σ2Y = 225, nX = 12 transistores y nY = 8.
Para obtener la probabilidad solicitada se emplea la distribución F siguiente:
F
S X2  Y2 S X2 225
S X2


2
.
25
 f n X 1,nY 1 = F11,7
SY2  X2
SY2 100
SY2
Adecuando la probabilidad solicitada al resultado anterior se obtiene:
 S2



S2
P S X2  1.6SY2  P X2  1.6   P 2.25 X2  2.25 x1.6  =
SY
 SY





= P(F11,7 ≤ 3.6) = 0.95 Rpta.
Interpretación.- en el 95% de las (ó en 950 de cada 1000) muestras de tamaño
12 de la población X y 8 de la población Y, la varianza muestral de las X es
menor o igual que 1.6 veces que la varianza muestral de las Y.
118
3.7 EJERCICIOS PROPUESTOS
1. Si X ~ X2 con 25 grados de libertad, hallar:
a) P(X ≤ 46.9).
b) P(11.5 ≤ X ≤ 44.3).
c) P(X > 37.7).
d) Hallar a y b tal que P(X ≤ a) = 0.05 y P(a ≤ X ≤ b) = 0.90.
2.
De una población X N(u, 18 ), se extrae una muestra aleatoria de tamaño n = 25.
Calcule e interprete:
a) P [ 0.011 < ( x - µ )2 < 3.614 ]
b) ¿Entre que valores se encontrará el 95 % central de las varianzas muestrales?
3.
De una población X → N(µ , 20 ), se extrae una muestra aleatoria de tamaño n =
30. Calcule e interprete:
a) P [354 ≤
30
(X
i 1
i
  ) 2 ≤ 876 ]
b) P ( 11.04 ≤ S2 ≤ 31.52 )
4.
Se sabe que los pesos de ciertas latas de atún se distribuyen normalmente con una
desviación estándar de 2 gramos. Si se toma una muestra de 12 latas, calcule e
interprete la probabilidad de que la varianza de la muestra sea menor que 8.5
(gr.)2.
5.
La duración de los focos producidos por una compañía tienen una media de 1500
horas y una desviación típica de 80 horas. Se seleccionan 23 focos al azar, calcule
e interprete la probabilidad de que la desviación estándar muestral se encuentre
entre 60 y 100 horas.
6.
La duración de transistores fabricados por una compañía tienen distribución
normal con una media de 2000 horas y una desviación típica de 60 horas. Se
selecciona 10 transistores al azar, calcule e interprete la probabilidad que la
varianza muestral se encuentre entre 2500 y 4900 (horas)2.
7.
De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 25.
Calcule e interprete:
25
a) P [327.5 <

(X i - µ)2 < 978.8 ]
i 1
119
b) P (8.18 < S2 < 32.25).
8.
De una población X → N(μ, 10) se extrae una m.a. de tamaño n = 10 y de una
población Y → N(μ, 15) se extrae una m.a. de tamaño m = 8. Calcule e interprete:
9.
10


a) P  30.1   ( X i  X )2  190.0 
i 1


8


b) P  32.7   (Yi   ) 2  201.0 
i 1


Si T ~ t con 23 grados de libertad, hallar:
a) P(T ≤ -1.714)
b) P(-1.319 ≤ T ≤ 2.5)
c) P(T > 1.319)
d) Hallar a y b tal que P(T ≤ -t0) = 0.05 y P(-t0 ≤ T ≤ t0) = 0.90.
10. Un inspector investiga las acusaciones contra una fábrica de gaseosas porque no
llena bien sus envases. Una muestra de 16 botellas de gaseosa indica una
desviación típica S = 0.18 litros. Calcule e interprete la probabilidad de que el
promedio muestral difiera de su media poblacional µ en menos de 0.096 litros.
11. De una población X: N(0, ¼) se extrae una muestra aleatoria de tamaño 10.
Determine el valor de la constante k tal que: P (k x > SX) = 0.05. Donde x es la
media muestral de las X y SX es la desviación estándar muestral de las X.
12. Para analizar el tiempo de atención por cliente en un establecimiento grande, se
tomó una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene
un tiempo promedio de 7.5 minutos y una varianza S2 = 2.25 minutos2. Calcule e
interprete la probabilidad de que el promedio muestral difiera de su media
poblacional en menos de 0.513 minutos.
13. De una población X: N(μ, σ²), se extrae una muestra aleatoria de n+1
observaciones. Encontrar c tal que el estadístico c( x – Xn+1
)/S
tenga
distribución t. Donde x y S es la media y la desviación estándar muestral
obtenidas con las n primeras observaciones.
14. Una inspectora de calidad investiga las acusaciones contra una fábrica de cerveza
porque no llena bien sus envases. Una muestra de 25 latas de cerveza indica un
contenido medio x = 33.2 onzas y S = 2.25 onzas. Calcule e interprete la
probabilidad de que el promedio muestral difiera de su media poblacional en
menos de 0.929 onzas.
120
15. Si F ~ f con 10 y 12 grados de libertad, hallar:
a) P(F ≤ 0.212)
b) P(0.276 ≤ F ≤ 4.30)
c) P(F > 3.37)
d) Hallar c y d tal que P(F ≤ c) = 0.05 y P(c ≤ T ≤ d) = 0.90.
16. Si muestras aleatorias independientes de tamaños n1 = n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la probabilidad
que la varianza de la primera muestra sea mayor que 5 veces la segunda.
17. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la probabilidad
que la varianza de la primera muestra sea 5 veces más grande que la segunda
18. Sea X1 , X2 , …. , X7 e Y1 , Y2 , …. , Y9 muestras aleatorias independientes de
distribuciones normales, ambas con media cero y varianza uno. Calcule e
9
 7

interprete: P 2 X i2  7Y j2 
j 1
 i 1

19. Dos compañías A y B fabrican transistores. La duración para los fabricados por A
tiene una desviación estándar de 40 horas, en tanto que los B tienen una
desviación estándar de 50 horas. Se toma una muestra de 10 transistores de A y 10
de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea al
menos dos veces más grande que la B.
20. Dos compañías A y B fabrican focos. La duración de los fabricados por A tiene
una desviación típica de 40 horas, en tanto que los B tienen una desviación
estándar de 50 horas. Se toma una muestra aleatoria de 10 focos de A y 10 de B.
Calcule e interprete la probabilidad que la varianza de la muestra A sea mayor que
tres veces la varianza de la muestra B.
121
Capítulo 4. ESTIMACIÓN PUNTUAL
“Lo que escucho lo olvido, lo que veo lo recuerdo, pero lo que hago lo
entiendo”
Confucio
CONTENIDO
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Estimadores. Propiedades.
Métodos de estimación puntual.
Método de máxima verosimilitud.
Método de los momentos.
Método de los mínimos cuadrados.
Ejercicios resueltos.
Ejercicios propuestos.
En este capítulo, se presenta los aspectos fundamentales de la estimación puntual, es
decir la aproximación al valor del parámetro a través de un solo valor, buscando de
observar las propiedades que deben reunir los estimadores de los parámetros, así
como el uso de los métodos de estimación puntual.
La estadística provee técnicas que permiten obtener conclusiones generales a partir
de una muestra (un conjunto limitado, pero representativo de datos). Cuando
inferimos no tenemos garantía de que la conclusión que obtenemos sea exactamente
correcta. Sin embargo, la estadística permite cuantificar el error asociado a la
estimación.
La mayoría de las distribuciones de probabilidad dependen de cierto número de
parámetros. Por ejemplo: P(λ), N(µ, σ2 ), B(n, p), etc. Salvo que estos parámetros se
conozcan, deben estimarse a partir de los datos muestrales.
El objetivo de la estimación puntual es usar una muestra para obtener números que,
en algún sentido, sean los que mejor representan a los verdaderos valores de los
parámetros de interés.
Supongamos que se selecciona una muestra de tamaño n de una población. Antes de
obtener la muestra no sabemos cuál será el valor de cada observación. Así, la primera
observación puede ser considerada una variable aleatoria X1, la segunda una v.a. X2,
etc. Por lo tanto, antes de obtener la muestra denotaremos X1 , X2 , .... , Xn a las
observaciones y, una vez obtenida la muestra los valores observados los denotaremos
x1, x2, .... , xn.
122
4.1 ESTIMADORES. PROPIEDADES
Estimador y estimación
Definición: Un estimador puntual ˆ del parámetro θ es un estadístico, una
fórmula, obtenido como una función de la muestra, es decir ˆ = F(X1 , X2 , ....
, Xn).
Definición: Una estimación puntual de un parámetro θ es un valor que puede
ser considerado representativo de θ y se indicará ˆ . Se obtiene una vez
determinada la muestra de valores observados x1 , x2 , .... , xn , es decir
ˆ =
F(x1 , x2 , .... , xn ).
Ejemplo 1.- Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado
100 veces en forma independiente, obteniéndose 21 ases. ¿Qué valor podría
utilizarse, en base a esa información, como estimación de la probabilidad de as?
Parece razonable utilizar la frecuencia relativa de ases.
En este caso, si llamamos p a la probabilidad que queremos estimar,
p = 21 / 100 = 0.21.
Propiedades de los estimadores
Observemos que dada una m.a. X1 , X2 , .... , Xn un estimador puntual del
parámetro θ obtenido en base a ella, es una v.a. ˆ . La diferencia ˆ - θ es el
error de estimación y una estimación será más precisa cuanto menor sea este
error.
Este error es también una v.a. dado que depende de la muestra obtenida. Para
algunas muestras será positivo, para otras negativo. Una propiedad deseable es
que la esperanza del error sea 0, es decir que “en promedio” el error obtenido al
estimar a partir de diferentes muestras sea cero.
a) Insesgamiento.- un estimador puntual ˆ del parámetro θ es insesgado si:
E( ˆ ) = θ .
Si ˆ no es insesgado, a la diferencia E( ˆ ) – θ = b ( ˆ ) se le denomina sesgo de
ˆ .
123
Por lo tanto, se dice que un estimador es insesgado si su distribución tiene como
valor esperado al parámetro que se desea estimar.
Ejemplo 2.- sea X1 , X2 , .... , Xn una m.a. de una población X con media μ y
varianza σ2. Hemos visto en las distribuciones muestrales que un estimador de la
n
media poblacional μ es la media muestral, es decir que ̂  X 
X
i 1
n
i
, y
hemos probado que:
 n

 Xi  1 n
1 n
1
E ( X )  E  i 1    E ( X i )     (n )  
n i 1
n
 n  n i 1


Es decir que la media muestral X es un estimador insesgado de la media
poblacional μ.
Ejemplo 3.- Si X1 , X2 , .... , Xn una m.a. de una población X ~ N(μ , σ2 ) .
Veremos más adelante, en estimación máximo verosímil, que un estimador de la
n
̂ 2 
varianza poblacional σ2 es
( X
i 1
i
 X )2
n
, cuya esperanza está dada por:
 n

  ( X I  X )2 
n
n
  1 E X 2  nX 2   1 E X 2   E X 2
E (ˆ 2 )  E I 1
 i
i

 n 
n
i 1
 n  i 1




 
=
    
 
n
2
2
E X i2  E X 2  V ( X i )  E ( X i )   V ( X )  E ( X ) 
n
=   
2
2
n
 2 
E (ˆ 2 ) 
Es decir que:
n
Luego ̂ 2 
2
( X
i 1
i

n 1 2

n
n 1 2

n
 X )2
n
no es estimador insesgado de la varianza poblacional
σ2.
b) Insesgamiento asintótico.- Un estimador puntual ˆ del parámetro θ, basado en
una muestra aleatoria X1 , X2 , .... , Xn , es insesgado asintóticamente si:
124
lím
n
E(ˆ)  
n
En el ejemplo 3, si bien ̂ 2 
( X
i 1
i
 X )2
no es un estimador insesgado,
n
pero es asintóticamente insesgado ya que su esperanza tiende a σ2 cuando el
tamaño de la muestra tiende a infinito.
n
Ejercicio.- verificar que la varianza muestral s 2 
( X
i 1
i
 X )2
n 1
es un
estimador insesgado de la varianza poblacional σ2 cualquiera sea la
distribución.
c) Consistencia.- Sea X1, X2, .... , Xn una m.a. de una distribución que
depende de un parámetro θ, y sea ˆn un estimador puntual de θ basado en
esa muestra. Diremos que ˆn es un estimador consistente de θ, si
  0 ,


lím
P ˆn      1
n
n
Ejemplo 4.- Demuestre que la media muestral ̂  X 
X
i 1
n
i
es un estimador
consistente de la media poblacional μ.
Solución.Como la media muestral
Z
X  N (, 2 / n) . Y la variable aleatoria
( X  )
tiene aproximadamente distribución N(0, 1) ; tenemos que:
/ n
  n
 n 
 n
 1
P X       P   X       P
Z
  2 








Luego:
 n 
lím
lím
  1 = 2 (1) – 1 = 1
2 
P X      =
n
n     
125
n
Por lo tanto, la media muestral X 
X
i 1
i
es un estimador consistente de la
n
media poblacional μ, cualquiera que sea el tipo de distribución de la población,
siempre que tenga media y varianza.
d) Error Cuadrático Medio (ECM) de un Estimador .- Sea ˆ un estimador
puntual
del
θ,
parámetro
su
error
cuadrático
medio
es:
2
ECM (ˆ)  Eˆ   
Proposición.-
ECM (ˆ)  Eˆ     Var(ˆ)  b(ˆ)
2
2
Siendo b (ˆ ) = E( ˆ ) – θ el sesgo del estimador ˆ .
Demostración.2
ECM (ˆ)  E[(ˆ   ) 2 ]  E[ˆ  E(ˆ)  E(ˆ)    ] =
2
2
= E[ˆ  E(ˆ   E(ˆ)     2ˆ  E(ˆE(ˆ)   ]
=
E[ˆ  E(ˆ ]  E[E(ˆ)    ]  2Eˆ  E(ˆE(ˆ)   
2
2
Utilizando las propiedades del operador esperanza, se tiene que:
ECM (ˆ)  E[ˆ  E (ˆ  ]  [E (ˆ)    ]  2Eˆ  E (ˆ E (ˆ)   

V (ˆ)

[b(ˆ)]2 
0
2
2
y, por lo tanto, ECM ( ˆ ) = Var ( ˆ ) + [ b( ˆ ) ]2, como queríamos probar.
Nota.- Si el estimador ˆ es insesgado, el error cuadrático medio es igual a la
varianza del estimador. Es decir, ECM ( ˆ ) = Var ( ˆ ).
e) Eficiencia Relativa (Principio de estimación de menor error cuadrático
medio).- Dados dos o más estimadores del parámetro θ, se debe elegir al que
tiene menor ECM.
En el caso de que los estimadores sean insesgados, se escoge al que tenga
menor varianza. Entre un estimador insesgado y otro que no lo es, si el
126
estimador sesgado tiene una varianza mucho menor que el insesgado, podría ser
preferible su uso.
Ejemplo 5.Suponga que ˆ1 y ˆ2 son dos estimadores de  con E ( ˆ1 ) = , E( ˆ2 )
= /3, Var ( ˆ1 ) = 6 , Var ( ˆ2 ) = 2. ¿Cuál es mejor estimador de  ? ¿por
qué?
Solución.El estimador ˆ1 es insesgado, por lo tanto: ECM ( ˆ1 ) = Var ( ˆ1 ) = 6 ........
(1)
El estimador ˆ2 es sesgado, por lo tanto:
ECM ( ˆ2 ) = Var( ˆ2 ) + [ E ( ˆ2 ) -  ]2 = 2 + [/3 -  ]2 = (18 + 4 2) / 9 ...
(2)
ˆ1 será mejor estimador que ˆ2 si:
ECM (1 ) < ECM ( ˆ2 )
Reemplazando (1) y (2):
6
< (18 + 4 2) / 9
 > 3.
Cuya solución es:
Es decir que ˆ1 será mejor estimador que ˆ2 si  > 3, porque tiene menor
ECM; en caso contrario, si
 < 3, ˆ2 será mejor estimador que ˆ1 .
Rpta.
Ejemplo 6.Sea X1 , X2 , .... , Xn una m.a. de una población X ~ N(μ , σ2 ) . Se puede
verificar inmediatamente que los siguientes estimadores, son estimadores
insesgados de μ.
̂1  X ,
ˆ 2 
X1  X 2
2
y
ˆ 3  X 1
Mientras que, la varianza de estos estimadores es:
127
V (ˆ1 ) 
2
n
, V ( ˆ 2 ) 
2
y V ( ˆ 3 )   2
2
Por lo tanto, el mejor estimador de μ será ̂1  X por tener menor varianza.
f) Eficiencia.- Se dice que un estimador puntual ˆ es un estimador eficiente del
parámetro θ si es insesgado y de varianza mínima.
Para todos los estimadores insesgados de θ, Cramer y Rao establecieron una
cota inferior de las varianzas, de la siguiente manera:
La cota inferior de Cramer – Rao [ B(θ) ]
Sea ˆ un estimador insesgado del parámetro θ, basado en una m.a. de n
observaciones y sea f(x; θ) la distribución de probabilidades de la v.a X.
Entonces, la cota inferior de la varianza de ˆ es:
Var(ˆ)  B( ) 
1
d

nE  ln f ( x; 
 d

2
Si la varianza de un estimador insesgado ˆ satisface la desigualdad de Cramer
y Rao como una igualdad, este es un estimador insesgado de varianza mínima o
eficiente.
Ejemplo 7.Demostrar que la proporción muestral p es un estimador insesgado de varianza
mínima de la proporción poblacional P, de una variable aleatoria X con
distribución de Bernoulli.
Solución.Suponga que se extrae una muestra aleatoria simple de tamaño n de la población X
con distribución de Bernoulli., entonces:
n
p
X
i 1
i
,
n
estima a P.
La proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) =
P y V(Xi ) = PQ; representa la proporción de éxitos en la muestra y estima a la
proporción de éxitos en la población P. Luego:
128

 n

 Xi  1 n
1 n
1
E ( p)  E  i 1    E ( X i )   P  (nP)  P
n i 1
n
 n  n i 1


Es decir que la proporción muestral p es un estimador insesgado de la
proporción poblacional P. Veamos si es de varianza mínima.

n
 n

  X i  Var( X i )
i 1
Var( p)  Var i 1  
n2
 n 


n


Var( X i )
i 1
n
2
(propiedad de la varianza)
n

 PQ
i 1
n
2

nPQ PQ

n2
n
Hallemos la cota inferior de Cramer – Rao, B(P):
i)
f(x; P) = P x (1 – P) 1 - x , x = 0 , 1
ii)
ln f(x; P) = x ln P + (1 – x) ln (1 – P)
iii)
d
x 1 x
xP
ln f ( x; P)  

dP
P 1  P P(1  P)
iv)
 ( x  P)2  Var( X )
PQ
1
d

E  ln f ( x; P)  E  2
 2 2  2 2 
2
PQ
PQ
PQ
 dP

 P (1  P) 
v)
B( P) 
2
1
d

nE  ln f ( x; P)
 dP

2

1
PQ
= Var (p)

n
 1 
n

 PQ 
Dado que la Var (p) es igual a la cota inferior de Cramer-Rao B(P), p es
un estimador de varianza mínima para P.
Como la proporción muestral p es un estimador insesgado y de varianza
mínima para P, es un estimador eficiente.
129
4.2 MÉTODOS DE ESTIMACIÓN PUNTUAL
Entre los principales métodos de estimación puntual se tiene:
El método de máxima verosimilitud (que busca maximizar la probabilidad de que
ocurra la muestra observada)
El método de los momentos (en el que se iguala los correspondientes momentos
poblacionales y muestrales).
El método de los mínimos cuadrados ordinarios (que busca minimizar la varianza
de los errores en el modelo de regresión lineal).
A continuación presentamos cada uno de estos métodos de estimación.
4.3 MÉTODO DE MÁXIMA VEROSIMILITUD
El método consiste en seleccionar como Estimador Máximo Verosímil4 (EMV)
puntual del parámetro θ, al estimador ˆ que maximiza la probabilidad de
obtener la muestra realmente observada. Dicha probabilidad está representada
por la función de probabilidad conjunta de la muestra y recibe la denominación
de función de verosimilitud.
Procedimiento.Sea X1, X2, .... , Xn una m. a. de X, una variable aleatoria con función de
probabilidad f(x; θ) que depende del parámetro θ, y sean x1 , x2 , .... , xn , los
valores observados. Para hallar el EMV del parámetro desconocido θ se
procede de la siguiente manera:
1) Hallar la función de verosimilitud, que representa la probabilidad de
obtener la muestra observada, y se define así:
n
V(θ) = f (x1 , x2 , .... , xn ; θ) = f (x1 ; θ) f (x2 ; θ) .... f (xn ; θ) =
 f ( x ; )
i 1
i
2) El método de máxima verosimilitud consiste en tomar como estimación el
valor ˆ que hace máxima la función de verosimilitud V(θ). Sabemos que si
4
http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos reservados. Vigésima segunda edición (2001).
Verosímil: 1. Adj. Que tiene apariencia de verdadero. 2. Adj. Creíble por no ofrecer carácter alguno de falsedad.
130
ˆ hace máxima a V(θ), también hace máxima a su logaritmo ln V(θ). Para
convertir el producto en suma, se toma la función:
n
L = ln V(θ) =
 ln f ( x ; )
i 1
i
3) Se toma derivadas parciales de L con respecto a θ, se iguala a cero y se
obtiene ˆ . Es decir:
n
L
 ln f ( xi ; )

 0  ˆ = F (x1 , x2 , .... , xn )
 i 1

Si la distribución tiene r parámetros desconocidos θ1 , θ2 , .... , θr ; se toma
derivadas parciales con respecto a cada parámetro y en lugar de una
ecuación tendremos las r ecuaciones:
L
0 ,
1
L
L
 0 , .... ,
0
 2
 r
a partir de las cuales se obtiene los estimadores ˆ 1 , ˆ 2 , .... , ˆ r .
Ejemplo 8.Hallar el estimador de máxima verosimilitud para el parámetro P (proporción o
probabilidad de éxito) de la distribución X de Bernoulli.
Solución.i)
La función de probabilidad de la v.a. X Bernoulli es:
f (x; P) = P x (1 – P) 1 - x , x = 0 , 1 ; 0 < P < 1
ii) Sea X1 , X2 , .... , Xn una m. a. de X, cuyos valores observados son x1 , x2 ,
.... , xn. Entonces:
f ( xi ; P)  P xi (1  P)1 xi , xi = 0 , 1 ; i = 1, 2, …. , n
iii) La función de verosimilitud V(P) está dada por:
V(P) = f (x1 , x2 , .... , xn ; P) = f (x1 ; P) f (x2 ; P) .... f (xn ; P) =
n
n
=
 f ( x ; P) =  P
i 1
i
xi
X
n
X
(1  P)1 xi = P  i (1  P)  i
i 1
n


x
ln
P

n


i
  xi  ln(1  P)
i 1
i 1


n
iv) L = ln V(P) =
131
n
 xi
v)
n
n   xi
L i 1
i 1


P
P
1 P
n
0
1 P

P
n   xi
i 1
n
x
i 1

i
n
Pˆ  p 
Luego:
x
i 1
n
i
X
Rpta.
Estimador muestral que sabemos es un estimador eficiente de la proporción
poblacional P.
4.4 MÉTODO DE LOS MOMENTOS
La idea básica de este método consiste en igualar los momentos muestrales con
los correspondientes momentos poblacionales. Recordemos la siguiente
definición.
Definición.Sea X una v.a. con función de probabilidad puntual p(x) en el caso discreto o
función de densidad f(x) en el caso continuo. Se denomina momento de orden
k (k  N) o momento poblacional de orden k a E(Xk ), es decir:
E ( X k )   x k p( x) en el caso discreto, y
x
E( X k ) 

x
k
f ( x)dx en el caso continuo.

si esas esperanzas existen.
Dada una muestra aleatoria X1 , X2 , .... , Xn , el momento muestral de orden k
n
alrededor del origen denotado por M’k , es:
M 'k 
X
i 1
k
i
n
Definición.Sea X1 , X2 , .... , Xn , una m.a. de una distribución con función de probabilidad
o función de densidad que depende de m parámetros Ө1, Ө2, ...., Өm. Los
estimadores de momentos de Ө1, Ө2, ...., Өm son los valores ˆ 1, ˆ 2, .... , ˆ m
que se obtienen igualando m momentos poblacionales con los correspondientes
momentos muestrales. En general, se obtienen resolviendo el siguiente sistema
de ecuaciones:
132
n
E ( X k )  M 'k 
X
i 1
k
i
,
n
k = 1, 2, .... , m
Ejemplo 9.Sea X1, X2, .... , Xn, una m.a. de una distribución exponencial de parámetro λ.
Como hay un solo parámetro a estimar, basta plantear una ecuación basada en
el primer momento.
Es decir, M1’ = E (X).
Sabemos que para la distribución exponencial E ( X ) 
1
Entonces:

n
M 
'
1
X
i 1
n
i
 E( X ) 
1

 ˆ 
n

n
X
i 1
1
X
i
4.5 MÉTODO DE LOS MÍNIMOS CUADRADOS
Conocido también como el método de los mínimos cuadrados ordinarios, es
utilizado para estimar los parámetros del modelo de regresión lineal simple y
múltiple. Se parte del hecho de que no todos los puntos caen sobre la recta
postulada, a la cual se le agrega la variable aleatoria error y lo que se busca es
n
minimizar la varianza de los errores representada por
e
i 1
2
i
.
Si Yi = a + b Xi + ei entonces ei = Yi - a - b Xi y por tanto se busca minimizar:
n
n
i 1
i 1
 ei2   (Yi  a  bX i ) 2
Se toman derivadas parciales con respecto a a y con respecto a b, se igualan a cero
así:
n
d n 2
ei  2 (Yi  a  bX i )(1)  0

da i 1
i 1
133
n
d n 2
e

2
(Yi  a  bX i )( X i )  0
i 
db i 1
i 1
Luego de igualarlas a cero se obtiene las denominadas ecuaciones normales:
n
n
i 1
i 1
na  b X i   Yi
….. (1)
n
n
n
i 1
i 1
i 1
a X i  b X i2   X i Yi ….. (2)
Cuya solución proporciona los siguientes estimadores: de b y a:
n
bˆ 
 X Y  nX Y
i 1
n
i i
X
i 1
aˆ  Y  bˆ X
y
2
i
 nX
2
Cuando se reemplaza los resultados muestrales se obtiene: Yˆ  aˆ  bˆX i
134
4.6 PROBLEMAS RESUELTOS
n
1.
Demostrar que la varianza muestral ˆ 2  s 2 
(X
i 1
i
 X )2
n 1
es un estimador
insesgado de la varianza poblacional σ2.
Solución
Sabemos que:
n
n
i 1
i 1
 ( X i  X ) 2   X i2  nX 2
Hallando la esperanza de la varianza muestral se tiene:
 n 2
 n 2
 n

2
2
  ( X I  X ) 2  E  X i  nX  E  X i   nE X
   i 1

   i 1
E (ˆ 2 )  E (s 2 )  E i 1


n 1
n 1
n 1




 
  
 
 
nE X i2  nE X 2
n V ( X i )  E ( X i )   V ( X )  E ( X ) 

=
n 1
n 1
2
2



2
n 2   2 
 2
n
n 2   2


=

n 1
n 1
(n  1) 2
Es decir que: E(ˆ )  E(s ) 
2
n
2
2
n
Luego ˆ 2  s 2 
(X
i 1
i
 X )2
n 1
es estimador insesgado de la varianza poblacional
σ2.
2.
La primera observación de una muestra aleatoria de tamaño n, podría utilizarse
como un estimador de la media poblacional. ¿Es éste un estimador: a)
insesgado? y b) eficiente?
Solución
Por definición de muestra aleatoria se sabe que: X1, X2 , …., Xn son n variables
aleatorias independientes con: E(Xi) = µ, V(Xi) = σ2.
Si ˆ  X1 , entonces:
a) E(ˆ )  E( X1 ) = µ, luego ˆ  X1 es un estimador insegado de µ.
135
b) Como X1 es un estimador insesgado, entonces ECM (X1) = V(X1) = σ2.
n
Pero,
X
X
i 1
i
también es un estimador insesgado de µ, con
n
ECM ( X )  V ( X ) 
2
n .
Comparando los errores cuadráticos medios de ambos estimadores, se tiene
que:
ECM (X1) > ECM ( X ) luego X1 no es un estimador eficiente de µ, ya que
X es un estimador más eficiente.
3.
Las cajas de un cereal producido por una fábrica deben tener un contenido de 16
onzas (una libra). Un inspector toma una muestra aleatoria simple que arroja los
siguientes pesos en onzas: 15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8,
15.6.
a) ¿Cuál es la estimación puntual del peso medio poblacional de las cajas de
cereal?
b) ¿Cuál es la estimación puntual de la varianza poblacional del peso de las
cajas?
Solución
a) El estimador puntual de la media poblacional es la media muestral y su
estimación es la siguiente:
n

 X 
 Xi
i 1
n
10

X
i 1
i
10

15.7  15.7  ....  15.6 159

= 15.9 onzas.
10
10
b) El estimador puntual de la varianza poblacional es la varianza muestral y su
estimación es:
n
ˆ 2  S 2 
n
10
i 1
i 1
( X i  X )2
i 1
n 1
n

 X i2  nX 2
i 1
n 1
10

X
i 1
2
i
 10 X 2
10  1

 X i2   X i2  15.7 2  15.7 2  ....  15.6 2 = 2528.58.
Reemplazando en la expresion de la varianza muestral se obtiene:
136
10
ˆ 2  S 2 
4.
X
i 1
2
i
 10 X 2
10  1

2528 .58  10 x (15.9) 2
= 0.0533 (onzas)2.
9
En una encuesta de opinión a 1000 adultos para conocer su opinión acerca de la
economía. Las respuestas fueron las siguientes:
OPINIÓN:
ADULTOS
La economía se está contrayendo
300
La economía permanece igual
400
La economía está creciendo
200
No sabe/No opina
100
Determine la estimación puntual de los siguientes parámetros de la población:
a) La proporción de adultos que opinan que la economía se está contrayendo.
b) La proporción de adultos que opinan que la economía permanece igual.
c) La proporción de adultos que opinan que la economía está creciendo.
d) La proporción de adultos que No sabe/No opina.
Solución
El estimador puntual de la proporción poblacional es la proporción muestral
siguiente:
n

p p
X
i 1
n
i

X N  de éxitos

n
n
a) La estimación de la proporción de adultos que opinan que la economía se está
contrayendo es:

p
X adultos que opinan que la economía se está contrayendo 300


=
n
1000
1000
0.30.
b) La estimación de la proporción de adultos que opinan que la economía
permanece igual es:

p
X adultos que opinan que la economía sige igual
400


= 0.40
n
1000
1000
c) La estimación de la proporción de adultos que opinan que la economía está
creciendo es:
137

p
X adultos que opinan que la economía está creciendo 200


= 0.20.
n
1000
1000
d) La estimación de la proporción de adultos que No sabe/No opina es:

p
X adultos que No sabe/No opina
100


= 0.10.
n
1000
1000
Estimaciones que casi siempre son presentadas como porcentajes de la siguiente
manera:
NÚMERO Y PORCENTAJE DE ADULTOS, SEGÚN SU OPINIÓN SOBRE LA
SITUACIÓN DE LA ECONOMÍA
OPINIÓN:
5.
ADULTOS
%
La economía se está contrayendo
300
30
La economía permanece igual
400
40
La economía está creciendo
200
20
No sabe/No opina
100
10
Total
1000
100
Asumiendo que X1 y X2 son variables aleatorias independientes con: E(X1) = 3,
V(X1) = 4, E(X2) = 4, V(X2) = 8. Si ˆ1 = 3X1 – X2 y ˆ2 = 3X2 – X1 son dos
estimadores de ϴ, ¿Cuál de los estimadores es más eficiente?
Solución
Para determinar cuál de los estimadores es más eficiente hay que hallar sus errores
cuadráticos medios y compararlos.
ECM (ˆi )  V (ˆi )    E(ˆi ) 
2
E (ˆ1 ) = E[3X1 – X2] = 3 E(X1) - E(X2) = 3(3) – 4 = 5
V (ˆ1 ) = V[3X1 – X2] = 32 V(X1) + V(X2) = 9(4) + 8 = 44. Luego:
2
ECM (ˆ1 )  V (ˆ1 )    E (ˆ1 )  =
= 44 + [ϴ - 5]2 = 44 + [ϴ2 – 10 ϴ + 25] = ϴ2 – 10 ϴ + 69
E(ˆ2 ) = E[3X2 – X1] = 3 E(X2) – E(X1) = 3(4) – 3 = 9
V (ˆ2 ) = V[3X2 – X1] = 32 V(X2) + V(X1) = 9(8) + 4 = 76. Luego:
138
2
ECM (ˆ2 )  V (ˆ2 )    E (ˆ2 )  =
= 76 + [ϴ - 9]2 = 68 + [ϴ2 - 18ϴ + 81] = ϴ2 - 18ϴ + 157
El estimador ˆ1 es un estimador más eficiente para ϴ que ˆ2 si se cumple que:
ECM (ˆ1 )  ECM (ˆ2 )
→ 8ϴ < 88
→ ϴ2 – 10 ϴ + 69 < ϴ2 - 18ϴ + 157
→
→ ϴ < 11.
Si ϴ > 11, el estimador ˆ2 es un estimador más eficiente para ϴ que ˆ1 Rpta.
6.
Suponga que tiene una muestra de tamaño 2n de una población X con E(X) = µ
2n
y Var(X) = σ . Sean X 1 
2
n
 Xi
i 1
X2 
y
2n
X
i 1
i
n
dos estimadores de µ, ¿cuál
es el mejor estimador de µ?
Solución
2n
Ambos estimadores de µ propuestos, X 1 
n
 Xi
i 1
2n
y
X2 
X
i 1
n
i
, son
estimadores insesgados, ya que son medias muestrales con 2n y n observaciones
muestrales respectivamente. Luego, será mejor estimador el que tenga menor
varianza.
Teniendo en cuenta que E(Xi) = µ y Var(Xi) = σ2, por definición de muestra
aleatoria, hay que hallar sus varianzas y compararlas.
 2n
  Xi
V ( X 1 )  V  i 1
 2n








V ( X i )
 n
  Xi
V ( X 2 )  V  i 1
 n








V ( X )  
2n
i 1
( 2 n) 2
2n

n

2
i 1
( 2 n) 2

2n 2  2

2n
( 2n ) 2

n 2  2

n
n2
n
i
i 1
n2

i 1
n2
2
Se observa que V ( X 1 )  V ( X 2 ) . Por lo tanto, X 1 es el mejor estimador de µ.
Rpta.
139
7.
Sea X1, X2,…..,Xn, una muestra aleatoria de una variable aleatoria X con
distribución uniforme en el intervalo [α, α + 1].
a) Demuestre que la media muestral x = ̂ es un estimador sesgado de α.
b) Calcule el error cuadrático medio del estimador ̂  x .
Solución
a) Como la variable aleatoria X tiene distribución uniforme en el intervalo [α, α + 1],
entonces f ( x) 
1
 1 , α ≤ X ≤ α + 1. Así mismo,
 1
E( X )  EX i  
   1
2
2  1
(  1   ) 2 1
y V ( X )  V X i  

2
12
12

Si ̂  x , entonces:
 n
  Xi
E (ˆ )  E ( x )  E  i 1
 n








n
 E( X i )
i 1
n
n


i 1
2  1
2  1
1
2

 
n
2
2
Luego: ̂ = x es un estimador sesgado de α. Rpta.
b) El error cuadrático medio del estimador ̂  x esta dado por:
ECM (ˆ )  V (ˆ )    E(ˆ )
2
 n
  Xi
V (ˆ )  V ( X )  V  i 1
 n








….. (b)
n
n
1
V ( X )  12
i
i 1
n
2

i 1
n
2

1
n

2
12n
12n
Reemplazando la varianza de ̂ y la esperanza de ̂ en (b) se tiene:
2
1 
1 
1
1 1  3n

ECM (ˆ ) 
      
 
12n 
2 
12n 4 12n

8.
Rpta.
Sea X1 , X2 , …. , X7 una muestra aleatoria de una población con media µ y
varianza 2. Considere los siguientes estimadores de µ:
ˆ1 = (X1 + X2 + …. + X7 ) / 7 ;
ˆ2 = ( 2 X1 - X6 + X4 ) / 2
a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ?
Solución
a) Por definición de muestra aleatoria E(Xi) = µ y Var(Xi) = σ2. Luego:
140
E ( X 1 )  E ( X 2 )  ....  E ( X 7 )     .... 7



7
7
7
2E ( X 1 )  E ( X 6 )  .E ( X 4 ) 2     2
E ˆ2  



2
2
2
Por lo tanto ˆ1 como ˆ2 son estimadores insesgados de µ. Rpta.
E ˆ1  
b) Por ser insesgados, es mejor estimador de µ el que tiene menor varianza.
Luego:
V ˆ1  
V ( X 1 )  V ( X 2 )  ....  V ( X 7 )  2   2  ....   2 7 2
= 0.14 σ2.


2
49
49
7
2 2 V ( X 1 )  V ( X 6 )  .V ( X 4 ) 4 2   2   2 6 2
ˆ
= 1.5 σ2.
V  2  


2
4
4
2
Por lo tanto ˆ1 es mejor estimador de µ que ˆ2 .
9.
Rpta.

Suponga que ˆ 1 y ˆ 2 son estimadores de  con E(ˆ 1) = , E( ˆ 2) = , Var ( ˆ 1
2
) = 6 , Var ( ˆ 2 ) = 2. ¿Cuál es mejor estimador de  ? ¿por qué?
Solución
De los dos estimadores, es mejor el que tiene menor error cuadrático medio.
2
ˆ
ˆ
ˆ
Sabemos que: ECM (i )  V (i )    E (i )  .
Como ˆ 1 es estimador insesgado de , entonces: ECM (ˆ1 )  V (ˆ1 )  6
2
   8 
ECM (ˆ2 )  V (ˆ2 )    E (ˆ2 )   2     
2
4

2
2
El estimador ˆ1 es mejor estimador de ϴ que ˆ2 si se cumple que:
ECM (ˆ1 )  ECM (ˆ2 )
→ 6
8  2
→ 24 < 8 + 2 → 2 > 16 →   4 .
4
Si   4 , el estimador ˆ2 es mejor estimador de ϴ que ˆ1 .
10. Suponga que ̂1 y ̂ 2 son 2 estimadores de β con:
/3, Var ( ̂1 ) = 7
y
Rpta.
E ( ̂1 ) = β /2, E ( ̂ 2 ) = β
Var ( ̂ 2 ) = 6. ¿Cuál es mejor estimador de β? ¿Por
qué?
Solución
141
De los dos estimadores, es mejor el que tiene menor error cuadrático medio.
2
  28  

ECM (ˆ1 )  V (ˆ1 )     E (ˆ1 )   7      
2
4

2
2
2
  54  4

ECM (ˆ2 )  V ( ˆ2 )     E (ˆ2 )   6      
3
9

2
2
El estimador ̂1 es mejor estimador de β que ̂2 si se cumple que:
28   2 54  4 2

→ 252 + 9 β2 < 216 + 16 β2
ECM (ˆ1 )  ECM (ˆ2 ) →
4
9
→
36 < 7 β2 → 7 β2 > 36 →
6 7
 
Si
7 ,
 
6 7
7 .
el estimador ̂2 es mejor estimador de β que ̂1 .
Rpta.
11. Si ˆ1 y ˆ2 son estimadores independientes insesgados de un parámetro
desconocido , con varianzas conocidas  12 y  22 respectivamente:
a) Demostrar que ˆ = a ˆ1 + (1 – a) ˆ2 también es un estimador insesgado de
, para cualquier valor de a.
b) Encontrar el valor de a que minimiza la varianza de ˆ .
Solución
a) Si ˆ1 y ˆ2 son estimadores independientes insesgados del parámetro
desconocido , entonces: E( ˆ1 ) =  y E( ˆ2 ) = . Luego:
E( ˆ ) = E[a ˆ1 + (1 – a ) ˆ2 ] = a E( ˆ1 ) + (1 – a) E( ˆ2 ) =
= a  + (1 – a )  = .
Por lo tanto ˆ es un estimador insesgado de , para cualquier valor de a.
b) Se tiene como datos: V( ˆ1 ) =  12 y V( ˆ2 ) =  22 . Luego, la varianza del
estimador es:
V( ˆ ) = V[a ˆ1 + (1 – a ) ˆ2 ] = a2 V( ˆ1 ) + (1 – a)2 V( ˆ2 )
Reemplazando la varianza de los estimadores se obtiene:
V( ˆ ) = a2  12 + (1 – a)2  22 = f(a)
142
Para hallar el valor de a que minimiza la varianza del estimador ˆ , se toma la
derivada parcial de V( ˆ ) con respecto a a y se iguala a cero. Así:
dV (ˆ)
= 2a  12 + 2(1 – a)  22 (-1) = 0
da
f’(a) =
Para resolver la ecuación anterior se divide entre 2 en ambos miembros y se
tiene:
a  12 - (1 – a )  22 = 0 → a  12 + a  22 =  22 →
a=
 22
, punto
 12   22
crítico.
f’’(a) =
d 2V (ˆ)
= 2  12 + 2  22 .
da 2
Reemplazando el punto crítico encontrado en f’’(a) se tiene que:
f’’(a) = 2  12 + 2  22 > 0 → a es un mínimo para la V( ˆ ).
Por lo tanto el valor a =
12.
 22
minimiza la varianza de ˆ . Rpta.
 12   22
Sea X una variable aleatoria con media  y varianza σ2. Dadas dos muestras
aleatorias de tamaños n1 y n2 con medias muestrales X 1 y X 2 respectivamente.
a) Demostrar que: X  aX1  (1  a) X 2 , 0 ≤ a ≤ 1, es un estimador insesgado de
.
b) Asumiendo que X 1 y X 2 son independientes, hallar el valor de a que
minimiza la varianza de X .
Solución
Se sabe que la media muestral es un estimador insesgado de la media
poblacional. Entonces: E( X 1 ) =  y E( X 2 ) = .
Además, la varianza de la media muestral es igual a la varianza poblacional
entre el tamaño de la muestra. Luego: V ( X 1 ) 
2
n1
y V (X 2 ) 
a) E( X ) = E[ aX 1  (1  a) X 2 ] = a E( X 1 ) + (1 – a) E( X 2 ) =
= a  + (1 – a)  = .
Entonces, X es un estimador insesgado de . L.Q.Q.D.
143
2
n2
.
b) V( X ) = V[ aX 1  (1  a) X 2 ] = a2 V( X 1 ) + (1 – a) 2 V( X 2 ) =
Reemplazando la varianza de las medias muestrales se obtiene:
V( X ) = a2
2
2
+ (1 – a)2
= f(a)
n1
n2
Para hallar el valor de a que minimiza la varianza del estimador X , se toma
la derivada parcial de V( X ) con respecto a a y se iguala a cero. Así:
f’(a) =
2
2
dV ( X )
= 2a
+ 2(1 – a)
(-1) = 0
da
n1
n2
Para resolver la ecuación anterior se divide entre 2σ2 en ambos miembros y se
tiene:
n1
a 1 a
= 0 → an2 + an1 = n1 → a =
, punto crítico.
n1
n2
n1  n 2
f’’(a) =
2
2
d 2V ( X )
=
2
+
2
.
n1
n2
da 2
Reemplazando el punto crítico encontrado en f’’(a) se tiene que:
2
2
f’’(a) = 2
+2
> 0 → a es un mínimo para la V( X ).
n1
n2
Por lo tanto el valor a =
13.
n1
minimiza la varianza de X . Rpta.
n1  n 2
En base a una muestra aleatoria de tamaño n de una distribución Poisson con
parámetro  , se pide:
a) Determinar el estimador máximo verosímil del parámetro  .
b) Es eficiente el estimador obtenido para el parámetro  ?
Solución
Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ Poisson( ). Entonces:
f (Xi, ) =
 X e 
i
Xi !
Además: E(Xi) =  = Var (Xi).
, Xi = 0, 1, 2, ……
La función de verosimilitud es:
n
V() = f(X1, X2, X3 ,…, Xn) =

i 1
 X e 
i
X i!

 Xi e  n
n
 Xi !
i 1
144
n

 Xi
i 1
L = Ln V() = Ln
e n
n
 Xi !
i 1
n
L=
n
 X i Ln  n Ln e  ln  X i ! =
i 1
i 1
n
n
i 1
i 1
 X i Ln  n   ln X i !
a) Determinación del estimador de :
n
L


n
 Xi
n0
i 1

→


X
i 1
i
n
= x Rpta.
b) ¿Es eficiente el estimador de ?
Será eficiente si es insesgado y de varianza mínima.


E ( ) 
1 n
1 n
n
E
(
X
)





i
n i 1
n i 1
n

Por lo tanto  = x es un estimador insesgado para  .


Es de varianza mínima si: V(  ) = B()

V ( λ) 
λ
,
n
B( ) 
1


nE 
ln f ( x,  )
 

2
 X e 
f(X, ) =
X!
ln f(X, ) = X ln  -  ln e – ln X ! = X ln  -  - ln X !

X
( X  )
ln f ( X ,  )   1 



2
 

( X   )²

ln f ( X ,  )  
²
 

2
 

1
1
 1
E
ln f ( X ,  )  
E ( X   )²  V ( X )  2 
²
²


 

Luego:
B( ) 

1


  V ( )  .
n
1 n
n  .


Por lo tanto  = x es un estimador de varianza mínima.
145

Como  = x es un estimador insesgado y de varianza mínima, es un
estimador eficiente para  .
14.
En base a una muestra aleatoria de tamaño n de la distribución geométrica
determine el estimador máximo verosímil del parámetro p.
Solución
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Geométrica (p). Entonces:
f X ( X i )  p(1  p) X 1 ; X i  1, 2,3,....  i  1, 2,3,...., n
Luego la función de verosimilitud será:
n
n
V ( p)  f ( X1 , X 2 ,...., X n )   p(1  p)
X i 1
 Xi  n
 p (1  p) i1
n
i 1

n
Xi  n 

n
i 1

 = n Ln p    X i  n  Ln (1  p)
L = Ln V(p) = Ln p (1  p)


 i 1



n
n
L n
 
p p
X
i 1
i
n
0
1 p
pˆ 
→
n
X
i 1
15.

n
1
X
Rpta.
i
En base a una muestra aleatoria de tamaño n de una distribución normal N(µ, σ2
) se pide:
a) Determinar el estimador máximo verosímil de µ y σ2.
b) Es eficiente el estimador del parámetro µ?
Solución
Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ N(μ , σ2 ) . Entonces:
f (Xi ) 
1
2 2
1
e
2 2
( X i  )2
;    X i   ;  i  1,2,....,n
La función de verosimilitud es:
n
V(,²) = f(X1, X2, X3 ,…, Xn) =

i 1
n
2
1
 1  2
e
L = Ln V(,²) = Ln 
2
 2 
2
1
2 2
n
( X i  )2

i 1
146
1
e
2
2
n
( X i  )2
1
n
( X i  )
 1  2 2 2 
i 1
e
= 
2
 2 
2
n
 Ln1  Ln ( ²2 )  1  ( X i   )² Ln e
2
2 ²
=
L=
n
n
1
Ln ²  Ln 2 
2
2
2 ²
n
(X
i 1
  )²
i
a) Determinación del estimador de μ
n
L
1

(2) (1)  ( X i   )  0

2 ²
i 1
n
Luego:
(X
i 1
i
n
 )  0
X
ó
i 1
i
 n  0
n
X

i 1
μ=
Por lo tanto:
i
X
n
Rpta.
Determinación del estimador de σ2
L
n
1


2
2 ² 2( ²)²

n
(X
i 1
i
n
1
  )² = 0
→
n
 ( Xi   )²  2 ²
2( ²)²
i 1
n
→
 ( X i   )²
i 1
n
n
2( ²)²

2 ²

² 
→
 ( Xi   )
i 1
2
Rpta.
n
b) ¿Es eficiente el estimador de μ?
Será eficiente si es insesgado y de varianza mínima.
n

E( X ) 
X
i 1
i
n

1 n
1 n
n
E X i   E( X i ) 
 
n i 1
n i 1
n

Por lo tanto μ = X es un estimador insesgado para μ.

Es de varianza mínima si: B(  ) 
f(X, ) =
1
 

nE 
ln f ( x,  )
 

1
 2 2
e
1  X   


2  
2
1 X 
Ln f(X,) = Ln1-Ln  2  
 Ln e
2  
2
2
147
2
V ( X ) 
2
n
1 X 
= - Ln  2  

2  
2
2

1
( X  )
ln f ( X ,  )  
(2) ( X   )(1) =

2 ²
²
B ( ) 
1
( X  ) 
n E
  ² 
2
1
1
²


=
n
n
 ( X   )² 
( ²)
n E

(

²)²
(

²)²


=
V (X )

Por lo tanto μ = X es un estimador de varianza mínima.

Como μ = X es un estimador insesgado y de varianza mínima, es un
estimador eficiente para μ.
16.
Rpta.
En base a una muestra aleatoria de tamaño n de la distribución de Pareto
determine el estimador máximo verosímil del parámetro B.
Solución
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Pareto (B) . Entonces:
fX (Xi ) 
BX 0B
, X i  X 0 , i  1, 2,...., n . Donde: B = Coeficiente de Pareto > 0 y
X iB 1
Xo = Ingreso mínimo.
La función de verosimilitud es:
n
V(B) = f(X1 , X2 , ....,Xn ) = 
i 1
BX 0B
B n X 0nB

n
X iB 1
 X iB1
i 1
L = Ln V(B) = Ln
B n X 0nB
n
X
i 1
B 1
i
n
 n LnB  nB LnX 0  ( B  1) Ln X i
i 1
n
n
L n
n
  n Ln X 0   Ln X i  0 
  Ln X i  n Ln X 0 
B B
B i 1
i 1

n
n
n
n
  Ln X i   Ln X 0   Ln ( X i / X 0 )
B i 1
i 1
i 1
148
 Bˆ 
n
 Ln ( X
i 1
17.
Rpta.
n
i
/ X0)
En base a una muestra aleatoria de tamaño n de una distribución Lognormal con
parámetros (µ, σ2). Se pide:
a) Determinar el estimador máximo verosímil de los parámetros µ y σ2.
b) Se sabe que el ingreso familiar anual (en miles de soles) tiene
aproximadamente distribución Lognormal. Determine una estimación de µ
con los ingresos de 20 familias escogidas al azar siguientes:
10
18
50
61
40
16
8
9
12
11
15
19
10
21
25
27
14
25
32
30
Solución
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Lognormal (µ, σ2). Entonces:
fX (Xi ) 
1
X i 2 2
e ( L n X i   )
2
/ 2 2
; X i  0,  i = 1, 2, ...., n.
Luego la función de verosimilitud será:
V(µ, σ2) = f ( X1, X 2 ,...., X n ) 
n
X
i 1
=
n
2
 1 
 2 2  e
 Xi
1

1
2
i
e ( L n X i   )
2
2
/ 2 2
=
n
( L n X i  )2 / 2 2
i 1
n
; X i  0,  i = 1, 2, 3, .... , n.
i 1
L = Ln V(,²) = Ln
n
2
 1 
 2 2  e
 Xi
1

n
( L n X i  )2 / 2 2
i 1
n
i 1
n
= Ln1  Ln X i 
i 1
n
L =   Ln X i 
i 1
n
 Ln1  Ln ( ²2 )  1  ( Ln X i   )² Ln e
2
2 ²
n
n
1
Ln ²  Ln 2 
2
2
2 ²
 ( Ln X
a) Determinación del estimador de μ
L
1

(2) (1)

2 ²
n
 (Ln X
i 1
i
 )  0
149
n
i 1
i
  )²
n
Luego:
n
 ( Ln X i   )  0
 Ln X
ó
i 1
i 1
 n  0
i
n

μ=
Por lo tanto:
 Ln X
i 1
i
Rpta.
n
Determinación del estimador de σ2
L
n
1


2
2 ² 2( ²)²

n
 ( Ln X
i 1
i
  )² = 0 →
n
 ( Ln X
n
1
n
→
→
( Ln Xi   )² 

2( ²)² i 1
2 ²
i 1
i
  )²
n

2( ²)²
2 ²
n

² 
Por lo tanto:
 ( Ln Xi   )
2
i 1
Rpta.
n
b) Estimación de µ con los ingresos de las 20 familias:
n

Ln10  Ln 50  Ln 40  ....  Ln 25  Ln 30
= 2.9538 Rpta.
n
20
Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
μ=
18.
 Ln X
i 1
i

para el parámetro , de la distribución de Poisson.
Solución
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ Poissón ()
Como hay un solo parámetro a estimar, basta plantear una ecuación basada en el
primer momento.
Es decir, M1’ = E (X).
Sabemos que para la distribución Poisson E(X) = . Entonces:
n
M 
'
1
19.
 Xi
i 1
n
n
 E ( X )    ˆ 
X
i 1
n
i
X
Rpta.
Sea X una variable aleatoria con distribución uniforme en el intervalo [-a , 3a].
Hallar el estimador de a por el método de los momentos, basado en una muestra
aleatoria de tamaño n de X.
Solución
150
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ uniforme en el
intervalo [ -a , 3a ]. Como el único parámetro es a, basta plantear una ecuación
basada en el primer momento.
Es decir, M1’ = E (X).
Sabemos que para la distribución uniforme en el intervalo [a, b], E(X) = (a +
b)/2. Luego: en el intervalo [ -a , 3a ], E(X) = a. Por lo tanto:
n
M 
'
1
20.
 Xi
i 1
n
n
 E ( X )  a  aˆ 
X
i 1
i
 X Rpta.
n
Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
para los parámetros  y σ2 de la distribución de normal.
Solución
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ N(, σ2). Como
la distribución tiene dos parámetros, es necesario igualar los dos momentos
muestrales y poblacionales correspondientes. Es decir:
M1’ = E (X)
….. (1)
M2’ = E (X2) …. (2)
En la distribución normal E (X) =  y E (X2) = σ2 + 2. Reemplazando en las
ecuaciones anteriores se tiene:
n
En (1): M 
'
1
X
i 1
n
i
n
 E ( X )    ˆ 
X
i 1
n
i
X
Rpta.
n
En (2): M 2' 
X
i 1
n
2
i
 E( X 2 )   2   2
Como la media muestral es un estimador de la media poblacional , la
reemplazamos en la expresión anterior para hallar el estimador de σ2.
n
 2  2  2  X 2 
X
i 1
n
 ̂ 2 
 X i2
i 1
n
2
i
n
n
X2 
 X i2  nX 2
i 1
n
n

151
(X
i 1
i
 X )2
n
Rpta.
4.7 PROBLEMAS PROPUESTOS
1.
Si X1, y X2 son variables aleatorias independientes con: E(X1) = 4, E(X2) = 2,
V(X1) = 8 y V(X2) = 4. Siendo ˆ1 = 2X1 – 3 X2 y ˆ2 = 3 X2 - X1 dos
estimadores de ϴ, ¿cuál de los estimadores es más eficiente?
2.
Suponga que tiene una muestra de tamaño n de una población X con E(X) = µ y
n2
2
Var(X) = σ . Sean X 1 
X
i 1
n
i
n2
y
X2 
X
i 1
n
i
dos estimadores de µ, ¿cuál es
el mejor estimador de µ?
3.
Los pesos netos (grs.) en una muestra aleatoria simple de diez latas de conserva
fueron los siguientes: 159, 162, 159, 158, 156,157, 157, 163, 158, 161
a) ¿Cuál es la estimación puntual del peso neto medio poblacional de las latas de
conserva?
b) ¿Cuál es la estimación puntual de la desviación estándar poblacional del peso
neto de las latas de conserva?
4.
Realizada una encuesta de opinión, a una muestra aleatoria simple de 800
ciudadanos, en la pregunta, ¿Está usted de acuerdo con la gestión del Alcalde de
la ciudad? 260 responden que Sí, 440 que No y el resto No sabe/No opina.
a) ¿Cuál es la estimación puntual de la proporción de la población que Si está de
acuerdo con la gestión del Alcalde de la ciudad?
b) ¿Cuál es la estimación puntual de la proporción de la población que No está de
acuerdo con la gestión del Alcalde de la ciudad?
5.
Sea X1, X2, …. , X10 una muestra aleatoria de una población con media µ y
varianza 2. Considere los siguientes estimadores de µ:
ˆ1 = (X1 + X2 + …. + X10 ) / 10 ;
ˆ2 = ( X1 + 3 X5 - X10 ) / 3
a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ?
6.
Sean ˆ 1 y ˆ 2 dos estimadores de  con E ( ˆ 1) = , E ( ˆ 2) = /3, Var ( ˆ 1 ) = 8,
Var ( ˆ 2 ) = 2. ¿Cuál es mejor estimador de  ? ¿por qué?
152
7.
Suponga que ̂1 y ̂ 2 son 2 estimadores de β con:
/3, Var ( ̂1 ) = 4
y
E ( ̂1 ) = β /2, E ( ̂ 2 ) = β
Var ( ̂ 2 ) = 3. ¿Cuál es mejor estimador de β? ¿Por
qué?
8.
Si ̂1 y
̂ 2 son estimadores independientes insesgados de un parámetro
desconocido β, con varianzas conocidas  12 y  22 respectivamente:
a) Demostrar que ˆ = k ̂ 2 + (1 – k ) ̂1 también es un estimador insesgado de
β, para cualquier valor de k;
b) Encontrar el valor de k que minimiza la varianza de ˆ .
9.
Sea Y una variable aleatoria con media  y varianza σ2. Dadas dos muestras
aleatorias de tamaños n1 y n2 con medias muestrales y1 y y2 respectivamente.
a) Demostrar que: Y  b y2  (1  b) y1 , 0 ≤ b ≤ 1, es estimador insesgado de  .
b) Asumiendo que y1 y y2 son independientes, hallar el valor de b que
minimiza la varianza de Y .
10. En base a una muestra aleatoria de tamaño m de la distribución binomial con
parámetros n y p, determine el estimador máximo verosímil de dichos
parámetros.
11. En base a una muestra aleatoria de tamaño n de la distribución de Pascal o
binomial negativa, determine el estimador máximo verosímil del parámetro p.
12. En base a una muestra aleatoria de tamaño n de la distribución gamma con
parámetros α = 2 y β, determine el estimador máximo verosímil del parámetro β.
13. En base a una muestra aleatoria de tamaño n de la distribución exponencial con
parámetro λ, se pide:
a) Determinar el estimador máximo verosímil del parámetro λ.
b) Es eficiente el estimador obtenido para el parámetro  ?
14. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
para el parámetro p, de la distribución Bernoulli.
15. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
para el parámetro p, de la distribución Geométrica.
16. Basados en una muestra aleaatoria de tamaño m, hallar el estimador de
momentos para el parámetro p, de la distribución binomial.
153
17. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
para el parámetro p, de la distribución Pascal o binomial negativa.
18. Sea X una variable aleatoria con distribución uniforme en el intervalo [-2, 2a].
Basado en una muestra aleatoria de tamaño n, halle el estimador de a por el
método de los momentos.
19. En base a una muestra aleatoria de tamaño n de la distribución gamma con
parámetros α = 2 y β, determine el estimador de momentos del parámetro β.
20. En base a una muestra aleatoria de tamaño n de la distribución de Pareto
determine el estimador de momentos del parámetro B.
154
Capítulo 5. ESTIMACIÓN POR INTERVALOS DE
CONFIANZA
“Quien hace que las cosas difíciles parezcan fáciles, es el educador”
Emerson
CONTENIDO
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
5.10
5.11
5.12
Intervalo de confianza para la media y tamaño de muestra.
Intervalo de confianza para el total (conocida la media).
Intervalo de confianza para la proporción y tamaño de muestra.
Intervalo de confianza para el total (conocida la proporción).
Intervalo de confianza para la diferencia de medias.
Intervalo de confianza para la diferencia de proporciones.
Intervalo de confianza para la media (n < 30).
Intervalo de confianza para la varianza.
Intervalo de confianza para la razón de varianzas.
Intervalo de confianza para la diferencia de medias (n y m <30).
Ejercicios resueltos.
Ejercicios propuestos.
En el capítulo anterior se establecieron una serie de procedimientos para determinar
estimadores y estimaciones de los parámetros a través de un solo valor, buscando
también algunas bondades para dichos estimadores.
En este capítulo, se presenta los aspectos fundamentales de la estimación por
intervalos de confianza, es decir la aproximación al valor del parámetro a través de
un rango de valores, como un complemento de la estimación puntual.
Cuando inferimos usando muestras, no tenemos garantía de que la conclusión
obtenida sea exactamente correcta. Sin embargo, la estadística permite cuantificar el
grado de confiabilidad y el error asociado a la estimación (la precisión de la
estimación).
El objetivo de la estimación por intervalos de confianza es usar una muestra para
obtener un rango de posibles valores para el parámetro y sean los que mejor lo
representan.
155
Definición.- El procedimiento de determinar un intervalo [a, b] que comprenda un
parámetro
poblacional θ con cierta probabilidad 1 - α, se llama estimación por
intervalos. En general, para cualquier parámetro θ y su estimador ˆ , el intervalo de
confianza será:
 ˆ
ˆ 
1    P(a    b)  P(ˆ  kˆ    ˆ  kˆ )  P    
k2 
 k1
Donde:
a = Límite inferior del intervalo de confianza.
b = Límite superior del intervalo de confianza.
k = una constante positiva que corresponde al valor de la distribución del estimador
para una probabilidad 1 – α.
1 - α = Nivel de confianza (probabilidad de que el parámetro poblacional este
comprendido en el intervalo) cuyo valor se toma de 0.90, 0.95 o 0.99.
Ejemplo 1.Sí 1 – α = 0.95 se dice que se tiene un intervalo de confianza del 95% y que la
probabilidad de que el intervalo contenga el verdadero valor del parámetro es del
95%. Es decir, que si para muestras distintas y bajo el mismo procedimiento se
construye el intervalo repetidamente, 95 de cada 100 de estos intervalos, contendrá el
parámetro y 5 de ellos no.
Se puede pensar que 1 significa certeza, seguridad y α significa riesgo. La seguridad
menos el riesgo, es decir 1 - α da, por lo tanto, el coeficiente de confianza de nuestras
afirmaciones.
En el caso anterior, se tiene una confianza de que 95 de cada 100 intervalos que se
extraigan como muestra, contendrán el verdadero valor del parámetro. Pero una vez
determinado el intervalo, es decir, una vez calculados numéricamente los extremos,
ya no debe hablarse en términos de confiabilidad ni en términos probabilísticos, pues
la situación pasa a ser completamente determinística. De tal manera, asociado a un
intervalo de confianza ya calculado, se tiene una probabilidad 0 ó 1 de que contenga
al parámetro a estimar y no hay otra opción, ya que lo contiene o no lo contiene.
156
Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el
parámetro a determinar es constante.
Los pasos a seguir para construir intervalos de confianza para un parámetro, son:
1. Fijar el nivel de confianza 1 – α que se desea en la estimación.
2. Extraer la muestra y calcular el o los estadísticos necesarios.
3. Determinar la distribución muestral (normal estándar Z, t, chi cuadrado, F, etc.)
que tiene el estadístico empleado, el mismo que debe ser una función del
estimador y del parámetro, es decir f ( ˆ , θ).
4. Conocida la distribución del estadístico y el nivel de confianza, se establece la
relación: 1 – α = P[ d1  f ( ˆ , θ)  d2 ]. Donde d1 y d2 son valores obtenidos de
acuerdo a la distribución muestral.
5. Dentro de la probabilidad se trabaja las desigualdades de modo tal que al centro
quede el parámetro θ y en los extremos los límites inferior y superior de confianza
buscados, dependiendo del estimador y de los valores d1 y d2.
Se verán los casos paramétricos, es decir aquellos en los que se tiene conocimiento
del tipo de distribución de la población o del estimador (Bernoulli, Binomial,
Poisson, Normal, t, chi-cuadrado, F, etc.) los mismos que estudiamos en los capítulos
2 y 3.
Trabajaremos primero un Caso General con muestras grandes (n ≥ 30) los intervalos
de confianza para la media , la proporción P, la diferencia de medias X - Y, la
diferencia de proporciones P1 – P2, los totales conocida la media y la proporción, ya
que sus estimadores tienen distribución normal y la determinación de los intervalos
de confianza para cada uno de ellos es similar.
Es decir, que sí ˆ ~ N[θ,  2ˆ ]
Media:
Z
entonces:
X  N (, 2 / n)
ˆ  
~ N ( 0, 1 ). Así tenemos:
 ˆ
Z
y
( X  )
~ N(0,
/ n
1).

Total: Xˆ  Nˆ  NX  N N , N 2 X2

y
157
Z
NX  N
~ N(0, 1)
N X
Dif. Medias: X - Y ~ N(  X  Y ,  X2 Y )
y Z
X  Y  (  X  Y ) )
 X Y
~ N(0 , 1)
n
Proporción: p 
Total:
X
i 1
i
n

X
n
 PQ 
 N  P,

n 


Aˆ  NPˆ  Np  N NP, N 2 p2

pP
 ~ N(0, 1)
PQ
n
Z
y
Z
y
Dif. Proporc.: p1 – p2 ~ N(P1 – P2 ,  p21  p2 ) y
Z
Np  NP
~ N(0, 1)
N p
p1  p2  ( P1  P2 )
 p p
1
~ N(0 ,
2
1)
Para todos ellos, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ - Z0  Z  Z0 ] ..................... (1)
Donde los valores Z0 son simétricos, de modo tal que centralizan la probabilidad 1 α y se determinan como Z0 = Z
1

, cuyos valores son ubicados en la tabla de la
2
distribución normal estándar. Así tenemos:
1-α
1 – α/2
Z0 = Z
1

2
0.90
0.95
Z0 = Z0.95 = 1.645
0.95
0.975
Z0 = Z0.975 = 1.96
0.99
0.995
Z0 = Z0.995 = 2.575
Reemplazando la v.a. Z 
ˆ  
en (1) y trabajando con la desigualdad buscando
 ˆ
dejar al centro el parámetro θ, la probabilidad queda como:
1 – α = P [ - Z0  Z  Z0 ] = P [ - Z
1

2

ˆ  
 ˆ
 Z
1

2
Multiplicando por el error estándar del estimador  ˆ en la desigualdad:
158
]
1–α =P[- Z
1

 ˆ  ˆ - θ  Z
1
2
 ˆ ]

2
Restando el estimador ˆ en la desigualdad
1 – α = P [- ˆ - Z
1
 ˆ  - θ  - ˆ + Z

1
2

 ˆ ]
2
Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:
1 – α = P [ ˆ - Z
1

 ˆ  θ  ˆ + Z
1
2
 ˆ ]

2
A partir del cual se obtiene el intervalo de confianza para el parámetro θ, cuyo
estimador ˆ ~ N[θ,  2ˆ ], siguiente:
El parámetro θ  [ ˆ - Z0  ˆ , ˆ + Z0  ˆ ] con el 100 (1 – α) % de confianza.
Donde el error de estimación es E = ± Z0  ˆ .
Resumimos el Caso General, señalando que para obtener intervalos del 100 (1 - α)%
de confianza para parámetros θ, cuyo estimador sigue distribución normal ˆ ~ N[θ,
 2ˆ ], al valor del estimador ˆ se le debe restar o sumar el error de estimación E = ±
Z0  ˆ .
Utilizando este resultado veamos rápidamente la determinación de intervalos de
confianza para los parámetros poblacionales: la media, la diferencia de medias, la
proporción, la diferencia de proporciones y los totales.
Media :
Total :
Proporción :
Total :

  X  Z

1

2
X , X  Z
1


X 
2


N   N X  N Z   X , N X  N Z   X 
1
1
2
2




P  p  Z  p , p  Z  p 
1
1
2
2




N P  N p  N Z   p , N p  N Z   p 
1
1
2
2


159



Dif. Medias :  X  Y  ( X  Y )  Z   X Y , ( X  Y )  Z   X Y 
1
1
2
2




Dif. Proporc. : P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2 
1
1
2
2


5.1
INTERVALO DE CONFIANZA PARA LA MEDIA Y TAMAÑO DE
MUESTRA
Sea X1, X2, .............., Xn una muestra aleatoria de tamaño n de una población X
distribuida con media  desconocida y varianza  2 conocida.
Sabemos que el estimador de la media poblacional  , es la media muestral
,y
que para n suficientemente grande (n ≥ 30) por el teorema central del límite:
X  N (, 2 / n)
y
Z
( X  )
~ N(0, 1).
/ n
Entonces, para un nivel de confianza 1 – α, se tiene que:


X 
1 – α = P [ - z0  Z  z0 ] = P  Z  
 Z  
1
2 
 1 2  / n
Trabajando como en el caso general y dejando al centro de la desigualdad el
parámetro poblacional  , se obtiene:


 
1 – α = P X  Z 
   X Z 
1
1
n
n 
2
2

A partir del cual se deduce el intervalo de confianza para la media poblacional 
siguiente:

  X  Z

1


n
2
, X Z
1
 

2
 con el 100 (1 – α ) % de confianza.
n
Si las muestras se toman sin reposición de una población finita de tamaño N,
debe emplearse el factor de corrección por finitud y el intervalo será:

  X  Z

1


2
n
N n

, X Z 
1
N 1
n
2
confianza.
160
N n
 al 100(1 – α ) % de
N 1 
Donde el error de estimación E para la media es:
E  Z

1

2
n
ó E  Z

1

2
n
N n
N 1
La longitud del intervalo de confianza para la media es 2E.
Ejemplo 2
Se hace un estudio de mercado, para determinar la venta promedio de una
nueva marca de gaseosas, durante un mes en una cadena de tiendas. Los
resultados para una muestra de 36 tiendas indicaron ventas promedio de S/1000
con una desviación estándar de S/120. Calcule e interprete un intervalo de
confianza del 95% para la verdadera venta promedio en la cadena de tiendas.
Solución
= 1000,
S = 120,
n = 36. En la tabla de la distribución normal
estándar, al 95% de confianza: Z0 = Z0. 975 = 1.96
Entonces:
Є[
± Z0  / n ] = [1000 ± 1.96x 120/6] = [1000 ± 39.20]
Luego:  Є [960.80, 1039.20] S/. con el 95% de confianza. Rpta.
Interpretación: la verdadera venta media mensual de gaseosas, en la cadena de
tiendas, se encuentra entre S/ 960.80 y S/ 1039.20 con el 95% de confianza.
TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA µ
Se sabe que: X  N (, 2 / n) → Z 
( X  )
E

/ n / n
Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra
siguiente:
n0 
Z 2 2
E2
Donde:
Z = valor de la abscisa de la distribución normal estándar para un nivel de
confianza (1 – α) dado.
σ2 = varianza de la variable en estudio. Si se desconoce se estima con una
muestra pasada o reciente (S2).
161
E= |
- µ| = error máximo permisible.
 Si la fracción inicial de muestreo f = n0 / N ≤ 0.05 ó n0 ≤ 0.05N → n = n0.
 Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones
finitas y se ajusta el tamaño de muestra así:
n
n0
n
1 0
N
Ejemplo 3
En el estudio de mercado del ejemplo 2, para estimar la venta promedio
mensual de una nueva marca de gaseosas, ¿Qué tamaño de muestra debe
tomarse, si se desea que
difiera de µ en menos de S/. 30, con el 95 % de
confianza?
Solución
Datos: S = 120, E = |
- µ| = S/. 30 y según la tabla de la distribución normal
estándar, al 95% de confianza: Z = Z0. 975 = 1.96
Entonces:
Z 2 2 1.96 2 x120 2
n0 

 61 tiendas. Rpta.
E2
30 2
5.2 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la media)
Sea X1, X2, .............., Xn una muestra aleatoria de tamañazo n de una población X
de tamaño N, distribuida con media  desconocida y varianza  2 conocida.
Sabemos que el estimador del total poblacional X = N , es N , y que para n
suficientemente grande (n ≥ 30) por el teorema central del límite:
Xˆ  Nˆ  NX  N N , N 2 X2 
y
Z
NX  N
~ N(0, 1)
N X
Entonces, para un nivel de confianza 1 – α, se tiene que:
162


NX  N
1 – α = P [ - z0  Z  z0 ] = P  Z  
 Z  
 1
1
N / n
2
2 

Trabajando como en el caso general y dejando al centro de la desigualdad el total
poblacional N , se obtiene:


 
1 – α = P NX  NZ 

N


N
X

NZ


1
1
n
n 
2
2

A partir del cual se deduce el intervalo de confianza para el total poblacional N
siguiente:


 
N   NX  NZ 
, NX  NZ 
 con el 100 (1 – α ) % de
1
1
n
n
2
2

confianza.
Si las muestras se toman sin reposición de una población finita de tamaño N,
debe emplearse el factor de corrección por finitud y el intervalo será:


N   NX  NZ 
1
n
2

N n

, NX  NZ 
1
N 1
n
2
N n

N 1 
al 100(1 – α ) % de confianza.
Observe que si se quiere construir intervalos de confianza para el total
poblacional, basta con multiplicar por N los límites encontrados para la media
poblacional; y viceversa, si se conoce el intervalo de confianza para el total
poblacional, entonces dividirlo entre N para determinar los intervalos para la
media poblacional.
Ejemplo 4
En el ejemplo 2, si el número de tiendas de la cadena es 1000, calcule e
interprete un intervalo de confianza del 95% para determinar el monto total
mensual de las ventas de la nueva marca de gaseosas en la cadena de tiendas.
Solución
163
En el ejemplo 2, se ha determinado que la verdadera venta media mensual de
gaseosas en la cadena de tiendas es:  Є [960.80, 1039.20] S/. con el 95% de
confianza.
Entonces, para hallar los límites de confianza para la real venta total mensual
de gaseosas, se multiplica a los límites anteriores por 1000. Es decir,
T = N  Є [(1 000x 960.8) , (1 000x1039.2)]
T = N  Є [960 800, 1 039 200] S/. con el 95% de confianza.
Interpretación: el monto total mensual por la venta de gaseosas se encuentran
entre S/. 960 800 y 1 039 200 con el 95% de confianza.
5.3 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Y TAMAÑO
DE MUESTRA
Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población
binomial X con parámetro P.
Sabemos que el estimador de la proporción poblacional P , es la proporción
muestral p, y que para n suficientemente grande (n ≥ 30) por el teorema central del
límite:
n
p
X
i 1
n
i

X
n
 PQ 
 N  P,

n 

y
Z
pP
 ~ N(0, 1)
PQ
n
Entonces, para un nivel de confianza 1 – α, se tiene que:




pP

1 – α = P [ - Z0  Z  Z0 ] = P  Z  
Z 
 1
1 
PQ
2
2


n


Trabajando como en el caso general y dejando al centro de la desigualdad la
proporción poblacional P, se obtiene:

PQ
PQ 
1 – α = P p  Z 
 P p  Z 
1
1
n
n 
2
2

Luego el intervalo de confianza para la proporción poblacional P es:
164

PQ
PQ 
Pp  Z 
, pZ 
 con el 100 (1 – α ) % de confianza.
1
1
n
n 
2
2

Como los valores poblacionales P y Q = 1 - P se desconocen, se estiman mediante
p y q = 1 - p, resulta entonces el intervalo de confianza para la proporción
poblacional P siguiente:

P  p  Z 
1
2

pq
, pZ 
1
n
2
pq 
 con el 100 (1 – α ) % de confianza.
n 
Si las muestras se toman sin reposición de una población finita de tamaño N,
debe emplearse el factor de corrección por finitud y el intervalo será:

Pp  Z 
1
2

pq N  n
, pZ 
1
n N 1
2
pq N  n 
 al 100 (1 – α ) % de conf.
n N 1 
TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN P
n
Se sabe que: p 
X
i 1
i
n

X
n
 PQ 
 N  P,

n 

→ Z
pP

PQ
n
E
PQ
n
Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra
siguiente:
Z 2 PQ
n0 
E2
Donde:
Z = valor de la abscisa de la distribución normal estándar para un nivel de
confianza (1 – α) dado.
P = proporción de éxitos para la variable en estudio. Si se desconoce se estima
con una muestra pasada o reciente (p). Q = 1 – P.
E = |p - P| = error máximo permisible.
 Si la fracción inicial de muestreo f = n0 / N ≤ 0.05 ó n0 ≤ 0.05N → n = n0.
 Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones
finitas y se ajusta el tamaño de muestra así:
n
165
n0
n
1 0
N
Ejemplo 5
El auditor de una dependencia gubernamental de protección del consumidor,
quiere determinar la proporción de reclamos sobre pólizas de enfermedades
que paga el seguro, en un plazo de dos meses de haber recibido el reclamo. Se
selecciona una muestra aleatoria de 200 reclamos y se determina que 80 fueron
pagados en un plazo de 2 meses después de recibidos. a) Calcule e interprete
un intervalo del 99 % de confianza para la proporción real de reclamos pagados
dentro de ese plazo de dos meses; y b) Con un 95% de confianza, ¿qué tamaño
de muestra (reclamos) será necesario si desea cometer un error máximo del
5%?
Solución
a) n = 200,
X = 80,
1 – α = 0.99,
Z0 = Z 0.995 = 2.575
p = proporción muestral de reclamos pagados en el plazo de dos meses.
p
X 80

 0.4 ,
n 200
q = 1 – p = 0.6
El intervalo de confianza para la verdadera proporción poblacional P de
reclamos pagados en plazo de dos meses, es:

P  p  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Reemplazando valores se tiene:
P ϵ [ 0.40 – 2.575
0.40 x0.60
; 0.40 + 2.575
200
0.40 x0.60
]
200
P ϵ [ 0.40 – 0.089 ; 0.40 + 0.089 ]
Por lo tanto: P ϵ [ 0.311 ; 0.489 ] con el 99% de confianza.
Rpta.
Interpretación.- la verdadera proporción (porcentaje) de reclamos, sobre pólizas
pagadas dentro del plazo de dos meses de haber recibido el reclamo, se encuentra
entre 0.311 y 0.489 (31.1% y 48.9%) con el 99% de confianza.
b) Datos: p = 0.40, q = 0.60, E = |p - P| = 0.05 y según la Tabla 1 de la
distribución normal estándar, al 95% de confianza:
Entonces:
n0 
Z 2 pq 1.96 2 x0.40 x0.60

 369 reclamos. Rpta.
E2
(0.05) 2
166
Z = Z0. 975 = 1.96
5.4 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la
proporción)
Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población
binomial X con parámetro P.
Sabemos que el estimador del total poblacional A = NP, es Np, y que para n
suficientemente grande (n ≥ 30) por el teorema central del límite:

Aˆ  NPˆ  Np  N NP, N 2 p2

y
Z
Np  NP
~ N(0, 1)
N p
Entonces, para un nivel de confianza 1 – α, se tiene que:




Np  NP

1 – α = P [ - Z0  Z  Z0 ] = P  Z  
Z 
 1
1 
PQ
2
2
N


n


Trabajando como en el caso general y dejando al centro de la desigualdad el total
poblacional NP, se obtiene:

PQ
PQ 
1 – α = P N p  N Z 
 N P N p  N Z 
1
1
n
n 
2
2

A partir del cual se deduce el intervalo de confianza para el total poblacional NP
siguiente:

PQ
PQ 
NP   N p  N Z 
, N pNZ 
 con el 100 (1 – α ) % de
1
1
n
n
2
2


confianza.
Como los valores poblacionales P y Q se desconocen, se estiman por p y q, resulta
entonces el intervalo de confianza para el total poblacional NP siguiente:

NP   N p  N Z 
1
2

pq
, N pNZ 
1
n
2
pq 
 con el 100 (1 – α ) % de
n 
confianza.
Si las muestras se toman sin reposición de una población finita de tamaño N,
debe emplearse el factor de corrección por finitud y el intervalo será:

NP   Np  NZ 
1
2

pq N  n
, Np  NZ 
1
n N 1
2
confianza.
167
pq N  n 
 al 100 (1 – α ) % de
n N 1 
Observe que si se quiere construir intervalos de confianza para el total poblacional,
basta con multiplicar por N los límites encontrados para la proporción poblacional; y
viceversa, si se conoce el intervalo de confianza para el total poblacional, entonces
dividirlo entre N para determinar los intervalos para la proporción poblacional.
Ejemplo 6
En el problema 6, si en la dependencia gubernamental de protección del
consumidor hay 5 000 reclamos sobre pólizas de enfermedades que paga el
seguro, en un plazo de dos meses de haber recibido el reclamo. Calcule e
interprete un intervalo del 99% de confianza para el total verdadero de
reclamos pagados dentro de ese plazo de dos meses.
Solución
En el ejemplo 6, se ha determinado que la verdadera proporción de reclamos,
sobre pólizas pagadas dentro del plazo de dos meses de haber recibido el
reclamo, se encuentra entre 0.311 y 0.489 con el 99% de confianza. Entonces,
para hallar los límites de confianza para el total de reclamos pagados dentro del
plazo de dos meses, se multiplica a los límites anteriores por 5 000. Es decir,
A = N P Є [(5 000 x 0.311), (5 000 x 0.489)]
A = N P Є [1 555, 2 445 ] con el 99% de confianza.
Rpta.
Interpretación: el verdadero total de reclamos, sobre pólizas pagadas dentro del plazo
de dos meses de haber recibido el reclamo, se encuentra entre 1 555 y 2 445 reclamos
con el 99% de confianza.
5.5 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población X de
tamaño N, distribuida con media  X desconocida y varianza  X2 conocida.
Sea también Y1, Y2, ..............,Ym una muestra aleatoria de tamañazo m de una
población X de tamaño M, distribuida con media 
Y
desconocida y varianza
 Y2 conocida.
Sabemos que el estimador de la diferencia de medias poblacionales X - Y es la
diferencia de medias muestrales X - Y , y que para n y m suficientemente grandes
(n y m ≥ 30) por el teorema central del límite:
168
X - Y ~ N(  X  Y ,  X2 Y )
X  Y  (  X  Y ) )
y Z
 X Y
~ N(0 , 1)
Entonces, para un nivel de confianza 1 – α, se tiene que:


X  Y  ( X  Y )
1 – α = P [- Z0  Z  Z0] = P  Z  
 Z  
 1
1
 X Y
2
2 

Trabajando como en el caso general y dejando al centro de la desigualdad el
parámetro poblacional X - Y, se obtiene:

1 – α = P ( X  Y )  Z   X Y   X  Y  ( X  Y )  Z   X Y
1
1
2
2





A partir del cual se deduce el intervalo de confianza para la diferencia de medias
poblacionales X - Y siguiente:


µX - µY  ( X  Y )  Z   X Y , ( X  Y )  Z   X Y  al 100 (1- α)% de conf.
1
1
2
2


Donde, el error estándar de la diferencia de medias muestrales  X Y =  Y  X es:
 X Y 
 X2
n

 Y2
m
 X Y 
o
 X2  N  n   Y2  M  m 




n  N 1  m  M 1 
Si se desconoce las varianzas poblacionales, se estiman con las varianzas
muestrales y el error estándar de la diferencia de medias muestrales  X Y es:
 X Y 
S X2 SY2

n
m
 X Y 
o
S X2
n
 N  n  SY  M  m 

 

 N 1  m  M 1 
2
Ejemplo 7
Muestras del pago por hora a los choferes de camiones, en las ciudades X e Y,
proporcionan los siguientes datos:
X = $ 5.40, n = 30, SX = $ 0.16
y
Y = $ 5.30, m = 30, SY = $
0.15.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre los pagos medios por hora a los choferes de camiones de las dos
ciudades.
b) ¿Son iguales los pagos medios por hora en ambas ciudades?
Solución
169
a) Un intervalo de confianza para la diferencia de pagos medios por hora a los
choferes de ambas ciudades viene dado por:


 X  Y  ( X  Y )  Z   X Y , ( X  Y )  Z   X Y  ................ (1)
1
1

2

2
Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96
 X Y 
S X2 SY2
(0.16) 2 (0.15) 2



= $ 0.04
n
m
30
30
Reemplazando valores en (1):
X - Y Є [(5.40 – 5.30) – 1.96 (0.04) , (5.40 – 5.30) + 1.96 (0.04)]
Luego: X - Y Є [0.02, 0.18] $ con el 95% de confianza. Rpta.
Interpretación: la diferencia entre los pagos medios por hora a los choferes de
camiones de las dos ciudades se encuentra entre $ 0.02 y 0.18 con el 95% de
confianza.
b) Responder a la pregunta ¿Son iguales los pagos medios por hora en ambas
ciudades? implica responder si ¿ X =  Y? o también ¿ X -  Y = 0?
Si apreciamos el intervalo de confianza construido en a)  X -  Y no puede ser
cero, es decir  X -  Y ≠ 0 o  X ≠  Y.
Por lo tanto, los pagos medios por hora en ambas ciudades son diferentes.
Rpta.
5.6
INTERVALO DE CONFIANZA
PROPORCIONES
PARA
LA
DIFERENCIA
DE
Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población
binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el
número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de
éxitos p1 , definida como p1 
X1
n1
estima a P1 .
Suponga también que se extrae una muestra aleatoria simple de tamaño n2 de la
población binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea
X2 el número de éxitos en la muestra de tamaño n2 , entonces la proporción
muestral de éxitos p2 , definida como p2 
170
X2
n2
estima a P2 .
Para n1 y n2 suficientemente grande (n1 y n2 ≥ 30) por el teorema central del
límite:
p1 – p2 ~ N(P1 – P2 ,  p21  p2 ) y
Z
p1  p2  ( P1  P2 )
 p p
1
~ N(0 , 1)
2
Entonces, para un nivel de confianza 1 – α, se tiene que:


p  p2  ( P1  P2 )
1 – α = P [ - z0  Z  z0 ] = P  Z   1
Z 
 1
1 
 p1  p2
2
2 

Trabajando como en el caso general y dejando al centro de la desigualdad la
proporción poblacional P1 - P2 se obtiene:


1 – α = P ( p1  p2 )  Z   p1  p2  P1  P2  ( p1  p2 )  Z   p1  p2 
1
1
2
2


A partir del cual se deduce el intervalo de confianza para la diferencia de
proporciones poblacionales P1 - P2 siguiente:

P1 – P2  ( p1  p2 )  Z

1

 p  p , ( p1  p2 )  Z
1
2
2

1

2
 p  p  al 100 (1 – α ) % de
1
2

conf.
Donde  p1  p2 =  p2  p1 se obtiene a partir de:
 p p =
1
2
P1Q1 P2Q2

n1
n2
 p p =
ó
1
2
P1Q1  N1  n1  P2Q2  N 2  n2 




n1  N1  1  n2  N 2  1 
Como los proporciones poblacionales P1 , Q1 , P2 y Q2 se desconocen, se
estiman con las proporciones muestrales p1 
= 1 – p2 , resultando entonces:
 p p =
p1q1 p2 q2

n1
n2
 p p =
p1q1  N1  n1  p2 q2  N 2  n2 




n1  N1  1  n2  N 2  1 
1
1
2
2
o
171
X1
X
, q1 = 1 – p1 , p2  2 y q2
n1
n2
Ejemplo 8
Una empresa de estudios de mercado quiere estimar las proporciones de
hombres y mujeres que conocen un producto promocionado a escala nacional.
en una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20
hombres y 60 mujeres están familiarizados con el artículo indicado. a)
Calcular el intervalo de confianza de 95 % para la diferencia de proporciones
de hombres y mujeres que conocen el producto. b) ¿Son iguales las
proporciones de hombres y mujeres que conocen el producto?
Solución
Sea el grupo 1, el referido a los hombres y el grupo 2, a las mujeres.
a) El intervalo de confianza para la diferencia de proporciones de hombres
(P1 ) y de mujeres (P2 ) que conocen el producto, P1 - P2 está dado por:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.95, entonces Z0 = 1.96
Como:
n1 = 100,
Entonces: p1 
 p p =
1
2
X1 = 20,
X 1 20

= 0.20
n1 100
n2 = 200
y
p2 
y
X2 = 60
X2
60

= 0.30
n2
200
p1q1 p2q2
(0.20)(0.80 (0.30)(0.70)



= 0.0515
n1
n2
100
200
Z0  p1  p2 = 1.96 (0.0515) = 0.1009
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.20 – 0.30) – 0.1009 ; (0.20 – 0.30) + 0.1009] = [0.10 ±
0.1009]
P1 - P2  [-0.2009 ; 0.0009] con el 95% de confianza.
Rpta.
Interpretación: la diferencia de proporciones de hombres (P1) y de
mujeres (P2) que conocen el producto, está entre -0.2009 y 0.0009 con el
95% de confianza.
b) La pregunta ¿Son iguales las proporciones de hombres y mujeres que
conocen el producto? implica preguntar ¿P1 = P2? o también ¿P1 - P2 = 0?
172
La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido
en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2.
Por lo tanto, las proporciones de hombres y mujeres que conocen el producto
son iguales.
Rpta.
Veamos a continuación la construcción de intervalos de confianza para la
media poblacional y la diferencia de medias poblacionales, cuando se trabaja
con muestras pequeñas (n < 30), donde es necesario utilizar la distribución t
de student. El proceso de construcción es idéntico a los determinados
anteriormente.
5.7 INTERVALO DE CONFIANZA PARA LA MEDIA (n < 30)
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria
X con distribución N(, ²), con varianza desconocida, al estudiar la
distribución t de student vimos que para muestras pequeñas, n < 30, la variable
aleatoria:
T
X 
~ tn-1
S/ n
Esta variable aleatoria depende de valores conocidos con la información
muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ - t0  T  t0 ] ..................... (1)
Donde los valores t0 son simétricos, de modo que centralizan la probabilidad 1
- α y se determinan como t0 = t
1

2
, n 1
, cuyos valores son ubicados en la tabla
de la distribución t de student.
Reemplazando la variable aleatoria T 
X 
en (1) y trabajando con la
S/ n
desigualdad buscando dejar al centro el parámetro  , la probabilidad queda
como:
1 – α = P [- t0  T  t0 ] = P [ - t0 
X 
S/ n
 t0]
Multiplicando por el error estándar del estimador S / n en la desigualdad:
173
1 – α = P [- t0 S / n  X    t0 S / n ]
Restando el estimador X en la desigualdad
1 – α = P [- X - t0 S / n  -   - X + t0 S / n ]
Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:
1 – α = P [ X - t0 S / n    X + t0 S / n ]
A partir del cual se obtiene el intervalo de confianza para el parámetro  ,
  [ X - t0 S / n ,
X + t0 S / n ] con el 100 (1 - α )% de confianza.
El intervalo de confianza para el total N se determina multiplicando el intervalo
de confianza para la media  por el tamaño de la población N, obteniéndose:
N  [N X - Nt0 S / n ; N X + Nt0 S / n ] con el 100 (1 - α )% de
confianza.
Ejemplo 9
Una Universidad grande (12 000 alumnos) quiere estimar el número
promedio de días de enfermedad de los estudiantes
durante
un año
académico; una muestra de 25 estudiantes indica que x = 5.2 días y S = 3.1
días.
Calcule e interprete intervalos de confianza del 95% Para: a) el verdadero número
medio de días de enfermedad de los estudiantes, y b) el verdadero número total
de días que los estudiantes se enferman en un año.
Solución
N = 12 000 alumnos, n = 25, x = 5.2 días y
S = 3.1 días
Para 1 – α = 0.95 , t0 = t24 , 0.975 = 2.064
a) El intervalo de confianza para la media  está dado por:
  [ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
  [5.2 – 2.064 x
3.1
3.1
, 5.2 + 2.064 x
] = [5.2 ± 1.28]
25
25
Por lo tanto:   [3.92 ; 6.48] días con el 95% de confianza.
Rpta.
174
Interpretación: en la Universidad el verdadero número medio de días de
enfermedad de los estudiantes en el año, se encuentra entre 3.92 y 6.48 días
con el 95% de confianza.
b) Para hallar el intervalo de confianza para el total se multiplica por N = 12 000
el intervalo de confianza para la media encontrado en a) y se obtiene:
Total = N  [12 000 (3.92) , 12 000 (6.48) ]
Por lo tanto:
Total = N  [47,040 ; 77,760 ] días con el 95% de confianza.
Rpta.
Interpretación: el verdadero número total de días que los estudiantes se
enferman en un año, se encuentra entre 47,040 y 77,760 días con el 95% de
confianza.
5.8 INTERVALO DE CONFIANZA PARA LA VARIANZA
Al estudiar la distribución chi-cuadrado determinamos que si X1, X2, ... , Xn es una
muestra aleatoria de tamaño n de una población normal con media  y varianza ²,
entonces:
La función de la varianza muestral x 2 
n  1S ²
²
~ x n21 .
Esta variable aleatoria depende de valores conocidos con la información
muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ a  x 2  b ] ..................... (2)
Los valores a y b son valores chi-cuadrados, obtenidos en la tabla 2, con n – 1
grados de libertad, centralizando la probabilidad 1 - α y se determinan como:
a = x2
n 1 ,
y

b = x2
2
n 1 , 1

,
2
los mismos que son ubicados en la tabla 2, de la distribución chi – cuadrado.
Reemplazando la v.a. x 2 
n  1S ²
²
en (2) y trabajando con la desigualdad
buscando dejar al centro el parámetro ², la probabilidad queda como:
1 – α = P [ a  x2  b ] = P [ a 
175
n  1S ²
²
 b]
Dividiendo entre (n – 1) S2 tenemos:


a
1
b
1 – α = P
 2 
2
2

(n  1)S 
 (n  1)S
Tomando el inverso dentro de la probabilidad y buscando mantener el sentido
de la desigualdad, se tiene que:
 (n  1) S 2
(n  1) S 2 
2 
1 – α = P

b
a


Luego se tiene que el intervalo de confianza para la varianza ², está dado por:
 (n  1)S 2 (n  1)S 2 
 (n  1) S 2 (n  1) S 2 
,
²  
=
, 2
 2
 al 100 (1 – α)% de

b
a


 xn 1 , 1 / 2 xn 1 ,  / 2 
confianza.
Un intervalo de confianza para la desviación estándar  se obtiene sacando raíz
cuadrada a cada uno de los límites del intervalo anterior, entonces:
 (n  1)S 2 (n  1)S 2   (n  1)S 2 (n  1)S 2 
,
 
,
 al 100(1 – α)% de
 =  2
xn21 ,  / 2 
b
a

  xn 1 , 1 / 2
confianza
Ejemplo 10
Para el ejemplo 9, en la Universidad grande se estudia el número de días que
los estudiantes se enferman durante el año académico, una muestra de 25
estudiantes indica que x = 5.2 días y S = 3.1 días.
Calcule e interprete intervalos de confianza del 95% para la varianza y la
desviación estándar del número de días que los estudiantes se enferman.
Solución
El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 25 y 1 – α = 0.95, entonces:
2
a = x24
, 0.025 = 12.4
y
2
b = x24
, 0.975 = 39.4
Se tiene además la desviación estándar muestral S = 3.1
176
Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:
 (25  1)(3.1)2 (25  1)(3.1)2 
²  
,

39.4
12.4


Por lo tanto:
²  [5.85 , 18.60 ] (días)² con el 95% de confianza.
Rpta.
  [ 2.42 , 4.31 ] (días) con el 95% de confianza.
Rpta.
Interpretación: la varianza del número de días que los estudiantes enferman en la
Universidad durante el año académico, se encuentra entre 5.85 y 18.60 (días)² con
el 95% de confianza. Mientras que la desviación estándar esta entre 2.42 , 4.31
(días) con el 95% de confianza.
5.9 INTERVALO DE CONFIANZA PARA LA RAZÓN DE VARIANZAS
Cuando estudiamos la distribución F, encontramos que si se toman dos muestras
aleatorias independientes de tamaños n y m, de las poblaciones X ~ N (X ,
 X2 )


e Y ~ N Y ,  Y2 , la distribución de probabilidades para la razón de
varianzas muestrales estaba dada por:
F
S X2  Y2
~ Fn–1,m-1
SY2  X2
Esta variable aleatoria depende de valores conocidos con la información
muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ c  F  d ] ..................... (3)
Los valores c y d son valores de la variable aleatoria F, de modo tal que
centralizan la probabilidad 1 - α y se determinan como:
c= F
n 1 , m 1,

y
d= F
2
n 1 , m 1 , 1

,
2
los mismos que son ubicados en la tabla 4 de la distribución F.
S X2  Y2
Reemplazando la variable aleatoria F  2 2 en (3) y trabajando con la
SY  X
desigualdad buscando dejar al centro el parámetro razón de varianzas
poblacionales  X2 /  Y2 , la probabilidad queda como:
1–α =P[c  F  d]=P[c 
177
S X2  Y2
 d]
SY2  X2
Multiplicando en la desigualdad por
SY2
se tiene que:
S X2
SY2
S X2
1–α =P[c

 Y2
SY2

d
]
 X2
S X2
Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la
desigualdad, obtenemos:
1–α =P[
1–α =P[
1 S X2
 X2
1 S X2


]
d SY2
c SY2
 Y2
1
F
n 1, m 1,1

 X2
S X2
1


2
2
Y
SY
F
n 1, m 1,
2

S X2
]
SY2
2
Entonces, el intervalo de confianza para la razón de varianzas  X2 /  Y2 , está dado
por:
 2
2
 S X2 / S Y2 S X2 / S Y2 
S X2 / SY2
 X2
 S X / SY
;
;

=


F
c 
F
 Y2

 d
 n 1,m1,1
n 1, m 1,
2
2



 al 100 (1 – α)% de


conf.
Ejemplo 11
Se hacen 16 ensayos para cada uno de los tratamientos X e Y, con las siguientes
varianzas maestrales S X2 = 35 y SY2 = 10. a) Calcule e interprete un intervalo del
95% de confianza para  X2 /  Y2 b) ¿Son iguales las varianzas poblacionales de X
e Y?
Solución
a) El intervalo de confianza solicitado es:
Datos:
n = m = 16,
S X2 = 10,
 S X2 / S Y2 S X2 / S Y2 
 X2

;


c 
 Y2
 d
SY2 = 35.
Como 1 – α = 0.95,
entonces d = F15 , 15 , 0.975 = 2.86 y c = F15 , 15 , 0.025 = 1/ F15 , 15 , 0.975 = 1/ 2.86 =
0.349.
Reemplazando valores en el intervalo se tiene que:
178
 X2
35 / 10
35 / 10 
 
= [1.22; 10.03] con el 95% de confianza. Rpta.
;
2
Y
0.349 
 2.86
Interpretación: la razón de varianzas de las poblaciones X e Y se encuentra entre
1.22 y 10.03 con el 95% de confianza.
b) Preguntar si ¿Son iguales las varianzas poblacionales de X e Y? es similar a
preguntar si ¿  X2 =  Y2 ? o también si ¿
 X2
= 1?
 Y2
Para responder a esto último, basta con observar si el valor 1 se encuentra en el
intervalo construido. Como el valor 1 no pertenece al intervalo de confianza,
entonces:
 X2
≠ 1
 Y2
 X2 ≠  Y2 .

Por lo tanto, las varianzas poblacionales de X e Y no son iguales.
Rpta.
Si en el intervalo de confianza para la razón de varianzas
 X2
= 1, las varianzas
 Y2
son iguales (homogéneas) caso contrario, son diferentes (heterogéneas)
5.10 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
(n y m <30)
Cuando se quiere determinar intervalos de confianza para la diferencia de
medias con muestras aleatorias independientes pequeñas (n y m < 30) se tiene
que tomar en cuenta si las varianzas de las poblaciones normales de donde se
extraen son homogéneas o heterogéneas, usando el intervalo de confianza
para la razón de varianzas propuesto en el acápite anterior.
A) Caso de varianzas homogéneas (  X2 =  Y2 = ²)
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable
aleatoria X con distribución N(X, ²). Sea también Y1, Y2, ..., Ym una
muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución
N(Y, ²). De acuerdo a lo estudiado en la distribución t de student vimos que
para muestras pequeñas, n < 30 y m < 30, la variable aleatoria:
179
T
 X  Y    X  Y 
n  1S X2  m  1SY2 1  1
nm2
n
~ t n+m-2
m
El estimador de la varianza común ² es: S c2  S p2 
(n1  1) S X2  (n2  1) SY2
n1  n2  2
representa la varianza combinada (o ponderada) de las varianzas muestrales.
Esta variable aleatoria depende de valores conocidos con la información
muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ - t0  T  t0 ] ..................... (4)
Los valores t0 son simétricos, de modo tal que centralizan la probabilidad 1 α y se determinan como t0 = t
1

2
, cuyos valores son ubicados en la
, nm 2
tabla de la distribución t de student.
Reemplazando la variable aleatoria T 
 X  Y    X
Sc
 Y 
1 1

n m
en (4)
tenemos:
1 – α = P [- t0  T  t0] = P [- t0 
 X  Y    X
Sc
 Y 
 t0]
1 1

n m
Trabajando con la desigualdad buscando dejar al centro el parámetro  X - Y,
de manera similar a los intervalos anteriores, la probabilidad queda como:
1 – α = P [ ( X - Y ) - t0 S c
1 1

  X - Y  ( X - Y ) + t0 S c
n m
1 1
 ]
n m
A partir del cual se tiene que el intervalo de confianza para la diferencia de
medias poblacionales  X - Y está dado por:
 X - Y  [( X - Y )  t0 S c
1 1
 ] al 100(1- α )% de confianza.
n m
Ejemplo 12
Se compararon dos marcas de cigarrillos, X e Y, respecto a su contenido
medio de nicotina en miligramos; dos muestras aleatorias de 21 cigarrillos de
cada marca, dieron estos resultados:
X = 14.3, n = 21, SX = 2.9
y
180
Y = 15.7, m = 21, SY = 3.8.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre los contenidos medios de nicotina para las dos marcas de cigarrillos. b)
¿Son iguales los contenidos medios de nicotina?
Solución
a) Primero determinamos si las varianzas son iguales con el intervalo de confianza
 S X2 / S Y2 S X2 / S Y2 
 X2
;
para la razón de varianzas: 2  

c 
Y
 d
Datos: n = m = 21,
S X2 = 2.92 = 8.41, SY2 = 3.82 = 14.44. Como 1 – α = 0.95,
entonces d = F20 , 20 , 0.975 = 2.46 y c = F20 , 20 , 0.025 = 1/ F20 , 20 , 0.975 = 1/ 2.46 =
0.407.
Reemplazando valores en el intervalo se tiene que:
 X2
8.41 / 14.44
8.41 / 14.44 
 
;
2
 = [0.24; 1.43] con el 95% de confianza.
Y
0.407
 2.46
Dado que el intervalo toma el valor 1, es decir
 X2
= 1, entonces  X2 =  Y2 .
 Y2
Considerando que las muestras son pequeñas y que las varianzas del contenido de
nicotina son iguales, el intervalo de confianza para la diferencia entre los
contenidos medios de nicotina para las dos marcas de cigarrillos está dado por:
 X - Y  [ ( X - Y )  t0
(n  1) S X2  (m  1) SY2
nm2
1 1

]
n m
Datos del problema:
X = 14.3, n = 21, SX = 2.9
Y = 15.7, m = 21, SY = 3.8.
y
Como n = m = 21,  los grados de libertad de la t son n + m – 2 = 21 + 21 – 2 =
40
Si 1 – α = 0.95,
 t0 = t40 , 0.975 = 2.021.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:
 X - Y  [(14.3 – 15.7)  2.021
(21  1)(2.9) 2  (21  1)(3.8) 2
21  21  2
  X - Y  [ (14.3 – 15.7)  2.021(1.0431) ]

1
1

]
21 21
 X - Y  [ -1.40 
2.11 ]
Por lo tanto:
 X - Y  [-3.51 , 0.71] mg. de nicotina con el 95% de confianza.
181
Rpta.
Interpretación: la diferencia entre los contenidos medios de nicotina para las
marcas de cigarrillos X e Y se encuentra comprendida entre -3.51 , 0.71 mg. con
el 95% de confianza.
b) Responder a la pregunta ¿Son iguales los contenidos medios de nicotina en los
cigarrillos X e Y? implica preguntar ¿ X = Y? o también ¿ X - Y = 0?
La diferencia  X - Y = 0 está incluida en el intervalo de confianza construido en
a), es decir  X - Y = 0
 X = Y. Por lo tanto, los contenidos medios de
o
nicotina en los cigarrillos X e Y son iguales.
Rpta.
B) Caso de varianzas heterogéneas (  X2 ≠  Y2 )
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable
aleatoria X con distribución N(X,  X2 ). Sea también Y1, Y2, ..., Ym una
muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución
N(Y,  Y2 ). Si las varianzas son diferentes, se cumple que:
T
 X  Y    X
2
X
 Y 
2
Y
S
S

n
m
~ tH
2
 S12 S22 
  
n
n2 
Donde: H   12
(valor entero) representa los grados de libertad.
2
 S12   S22 
   
 n1    n2 
n1  1 n2  1
Esta variable aleatoria depende de valores conocidos con la información
muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:
1 – α = P [ - t0  T  t0 ] ..................... (5)
Los valores t0 son simétricos, de modo tal que centralizan la probabilidad 1 α y se determinan como t0 = t

1 , H
2
, cuyos valores son ubicados en la tabla 3
de la distribución t de student.
Reemplazando la variable aleatoria T 
tenemos:
182
 X  Y    X
 Y 
S X2 S Y2

n
m
en (5)
1 – α = P [- t0  T  t0] = P [- t0 
 X  Y    X
 Y 
S X2 S Y2

n
m
 t0]
Trabajando con la desigualdad buscando dejar al centro el parámetro  X - Y,
de manera similar a los intervalos anteriores, la probabilidad queda como:
S X2 S Y2

  X - Y  ( X - Y ) + t0
n
m
1 – α = P [ ( X - Y ) - t0
S X2 S Y2

]
n
m
A partir del cual se tiene que el intervalo de confianza para la diferencia de
medias poblacionales  X - Y está dado por:
 X - Y  [( X - Y )  t0
S X2 S Y2

] al 100(1- α )% de confianza.
n
m
Ejemplo 12
En un estudio para determinar si hay diferencia en el salario semanal de los
hombres y las mujeres de una gran empresa, se toma una muestra de 18
hombres encontrándose un promedio de S/. 420 y una desviación estándar de
S/. 50, mientras que en una muestra de 15 mujeres se encontró un promedio
de S/. 360 y una desviación estándar de S/. 90. Se pide:
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre los salarios medios semanales de hombres y mujeres.
b) ¿Son iguales los salarios medios semanales de hombres y mujeres?
Solución
a) Primero determinamos si las varianzas de los salarios son iguales con el
intervalo de confianza para las varianzas:
Datos: nH = 18,
X M = S/. 360,
X H = S/. 420,
 S H2 / S M2 S H2 / S M2 
 H2

;


 M2
c 
 d
S H2 = 502 = 2500,
S M2 = 902 = 8100.
nM = 15,
Como 1 – α = 0.95,
entonces d = F17 , 14 , 0.975 = 2.90 y c = F17 , 14 , 0.025 = 1/ F14 , 17 , 0.975 = 1/ 2.75 =
0.364.
Reemplazando valores en el intervalo se tiene que:
183
 H2
2500 / 8100
2500 / 8100 
 
;
2
 = [0.11;
0.364
M
 2.90
0.85] con el 95% de
confianza.
Dado que el intervalo no toma el valor 1, es decir
 H2
≠ 1, entonces  H2 ≠
2
M
 M2 .
Considerando que las muestras son pequeñas y que las varianzas de los
salarios semanales de hombres y mujeres son diferentes, el intervalo de
confianza del 95% para la diferencia de los salarios medios de hombres y
mujeres está dado por:
 H - M
 [( X H - X M )  t0
S H2 S M2

]
n H nM
Donde t0 = tH, 0.975 = t20, 0.975 = 2.086.
2
2
 S H2 S M2 
 2500 8100 






n H nM 
18
15 


Donde: H =
=
= 20.98 ≡ 20
2
2
2
2
 2500 
 8100 
 S H2 
 S M2 








 18    15 
 n H    nM 
18  1
15  1
n H  1 nM  1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
2500 8100

 H - M  [(420 - 360)  2.086 x
] = [60  54.35]
18
15
Por lo tanto:  H - M  [5.65 ; 114.35] S/. con el 95 % de confianza.
Rpta.
Interpretación: la diferencia entre los salarios medios semanales de hombres y
mujeres se encuentra comprendido entre S/. 5.65 y S/. 114.35 con el 95% de
confianza.
b) Responder a la pregunta ¿Son iguales los salarios medios semanales de
hombres y mujeres? implica responder si ¿ H = M? o también ¿ H - M =
0?
La diferencia 
H
- M = 0 no está incluida en el intervalo de confianza
construido en a), es decir  H - M ≠ 0 o  H ≠ M. Por lo tanto, los salarios
medios semanales de hombres y mujeres son diferentes.
184
Rpta.
INTERVALOS DE CONFIANZA PARA UN SOLO PARÁMETRO
I.C. PARA LA MEDIA POBLACIONAL: μ
Caso
Intervalo
1. Cuando la muestra es aleatoria de X ~
N (μ, σ2) con σ2 conocida o n ≥ 30.
X Z
1
2. Cuando la muestra es aleatoria de X ~
N (μ, σ2) con σ2 desconocida, n < 30.
X t

(

n
2

(1 , n1)
2
(
)
S
)
n
I.C. PARA EL TOTAL POBLACIONAL: Nμ
A los I.C. para la media μ multiplicarlos por el tamaño de la población N.
I.C. PARA LA VARIANZA POBLACIONAL: σ2
Caso
Intervalo
La muestra es aleatoria de una población
normal.


 (n  1) S 2 (n  1) S 2 
, 2
σ ϵ  2

  (1  , n 1)  (  , n 1) 
2
2


2
I.C. PARA LA PROPORCIÓN POBLACIONAL: p
Caso
Intervalo
pˆ  Z
La muestra es aleatoria y su tamaño es
grande (n ≥ 30)
1

2
pˆ qˆ
n
I.C. PARA EL TOTAL POBLACIONAL: Np
Al I.C. para la proporción p multiplicarlo por el tamaño de la población N.
Tamaño de muestra para µ
n
Z 2 2
→ n 0
n0  0 2
n
E
1 0
N
Tamaño de muestra para p
ˆˆ
n0
Z 2 pq
→ n
n0  0 2
n 1
E
1 0
N
185
INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS
I.C. PARA LA RAZÓN DE VARIANCIAS: 12 /  22
Caso
Intervalo


S12 / S 22 
 12  S12 / S 22
Dos muestras aleatorias independientes de
,
ϵ

poblaciones normales.
 22  F 
F
1 , n 1, m 1
, n 1, m 1 
2
 2

I.C. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES: μ1 – μ2
Caso
Intervalo
1. Dos muestras aleatorias independientes,
 12  22
X1  X 2  Z 

de poblaciones normales con σ12 y σ22
1
n
n2
1
2
conocidas y n1 y n 2 ≥ 30.
2. Dos muestras aleatorias independientes
1 1
X1  X 2  t 
Sc2   
de poblaciones normales con σ12 y σ22
1 , n1  n 2  2
 n1 n2 
2
desconocidas pero iguales (varianzas
homogéneas) y n1 y n 2 < 30.
(n  1) S12  (n2  1) S22
Con Sc2  1
n1  n2  2
2
3. Dos muestras aleatorias independientes
S12 S21
X1  X 2  t 

de poblaciones normales con σ12 y σ22
1 , H
n1 n2
2
desconocidas
pero
diferentes
2
(varianzas heterogéneas) y n1 y n 2 <
 S12 S22 
  
30,
n
n2 
Con: H   12
, valor entero.
2
 S12   S22 
   
 n1    n2 
n1  1 n2  1
I.C. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES: p1 – p2
Caso
Intervalo
Dos muestras aleatorias independientes
con n1 y n2 ≥ 30
pˆ 1  pˆ 2  Z
pˆ 1 qˆ 1
1

2
186
n1

pˆ 21 qˆ 2
n2
5.11 PROBLEMAS RESUELTOS
1.
Demostrar que:
a) Las desigualdades µ - E ≤ x ≤ µ + E, son equivalentes a | x - µ | ≤ E
X 
b) Si 1    P(Z1 / 2  Z  Z1 / 2 ) y Z 
entonces:
/ n


 
1    P X  Z 
  X Z 
1
1
n
n 
2
2

Solución
a) En la desigualdad: µ - E ≤ x ≤ µ + E se resta µ en cada miembro y se
obtiene:
-E≤ x -µ≤ E
→
|x -µ|≤E
b) En la expresión 1    P(Z1 / 2  Z  Z1 / 2 ) se reemplaza Z por:
Z
X 
y se obtiene:
/ n
1 – α = P(Z1 / 2 
X 
 Z1 / 2 )
/ n
Multiplicando en la desigualdad anterior por  / n queda:


 
1 – α = P  Z 
 X   Z 
1
n 
2
 1 2 n
Restando X en la desigualdad:


 
1 – α = P  X  Z 
    X  Z 
1
1
n
n 
2
2

Multiplicando por -1 y manteniendo el sentido de la desigualdad se tiene:


 
1 – α = P X  Z 
   X Z 
1
1
n
n 
2
2

2.
Se desea estimar el peso total de una partida de 10,000 naranjas. Para ello se
selecciona una muestra aleatoria de 41 naranjas, la cual da una media de 200
gramos y una desviación estándar de 25 gramos. Calcule e interprete intervalos
de confianza del 95 % para:
187
a) El verdadero peso promedio (μ), el peso total (Nμ) y la varianza verdadera
(σ2) de los pesos de las naranjas.
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 13 gr. con el 99 % de confianza?
Solución
Datos: N = 10000 naranjas, n = 41, X = 200 gr. S = 25 gr. 1 – α = 0.95
a) Para hallar el intervalo de confianza para la media y el total, si 1 – α = 0.95
→ en la Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:

  X  Z


1

2
n
N n

, X Z 
1
N 1
n
2
N n
 …………. (1)
N 1 
Donde el error de estimación para la media es:
E= Z

1

2
n
N n
25 10000  41
= 7.64 gr.
 1.96
N 1
41 10000  1
Reemplazando en (1) se tiene:
µ ϵ [200 – 7.64 ;
confianza.
200 + 7.64] = [192.36 ; 207.64] gr. con el 95% de
Rpta.
Interpretación.- con el 95% de confianza, el verdadero peso medio de las
naranjas se encuentra entre 192.36 y 207.64 gr.
Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los
límites de la media por N = 10000, así:
Total = Nµ ϵ 10000 [192.36 ; 207.64] = [1’923600 ; 2’076400] gr. con el
95% de confianza.
Rpta.
Interpretación.- con el 95% de confianza, el verdadero peso total de las
naranjas se encuentra entre 1’923600 y 2’076400 gr.
El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 41 y 1 – α = 0.95, entonces en la Tabla 2:
2
a = x40
, 0.025 = 24.4
y
2
b = x40
, 0.975 = 59.3
Se tiene además la desviación estándar muestral S = 25
188
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (41  1)(25) 2 (41  1)(25) 2 
²  
,

59.3
24.4


Por lo tanto:
²  [421.59 ; 1024.59 ] (gr.)² con el 95% de confianza.
Rpta.
Interpretación: la varianza del peso de las naranjas se encuentra entre 421.59 y
1024.59 (gr.)² con el 95% de confianza.
Z 2 2
b) El tamaño de muestra está dado por: n0 
E2
Donde: | x - µ | = E = 13, 1 – α = 0.99 → en la Tabla 1, Z = Z0.995 = 2.575
y S = 25. Reemplazando en la fórmula para n se tiene:
n0 
2.575 2 25 2
= 24.5 ≡ 25 naranjas.
132
Rpta.
Interpretación.- para estimar el peso medio de las naranjas con el 99% de
confianza y un error máximo de 13 gramos se requiere de 25 naranjas.
3.
Un proceso está programado para embotellar la cantidad media de 750 mililitros
de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media
de 745 ml. y una desviación típica de 12 ml. Calcule e interprete intervalos de
confianza del 99 % para:
a) El verdadero contenido promedio (μ) de gaseosa en las botellas.
b) La varianza verdadera (σ2) del contenido de gaseosa en las botellas.
Solución
Datos: n = 41 botellas, X = 745 ml. S = 12 ml. 1 – α = 0.99
a) Para hallar el intervalo de confianza para la media, si 1 – α = 0.99 → En la
Tabla 1, Zo = Z0.995 = 2.575.
El intervalo de confianza para la media se obtiene con la expresión:

  X  Z


1

2
n
, X Z
 
1

2

n
…………. (1)
Donde el error de estimación para la media es:
189
E= Z

1

2
n
 2.575
12
= 4.83 ml.
41
Reemplazando en (1) se tiene:
µ ϵ [745 – 4.83 ;
confianza.
745 + 4.83] = [740.17 ; 749.83] ml. con el 99% de
Rpta.
Interpretación.- con el 99% de confianza, el verdadero contenido medio de
las botellas de gaseosa se encuentra entre 740.17 y 749.83 ml.
b) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 41 y 1 – α = 0.99, entonces en la Tabla 2:
2
a = x40
, 0.005 = 20.7
2
b = x40
, 0.995 = 66.8
y
Se tiene además la desviación estándar muestral S = 12
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (41  1)(12) 2 (41  1)(12) 2 
,

66.8
20.7


²  
Por lo tanto:
²  [86.23 ; 278.26] (ml.)² con el 99% de confianza.
Rpta.
Interpretación: con el 99% de confianza, la varianza del contenido de las botellas
de gaseosa se encuentra entre 421.59 y 1024.59 (ml.)².
4.
Una muestra de 75 clientes de cierta gasolinera indica que el número medio de
galones comprados es de X = 14.3 y la desviación estándar de S = 2.7 galones.
a) Encuentre E tal que tengamos un 95 % de confianza de que el error de
estimación es menor que E al usar X para estimar μ.
b) Construya un intervalo de confianza del 95 % para el número medio de
galones de gasolina comprados.
c) Construya un intervalo de confianza del 95 % para σ2.
d) Encuentre el tamaño de muestra necesario para lograr un 95 % de confianza
de que el error máximo de estimación sea menor que 0.5 galones.
Solución
190
Datos: n = 75 clientes, X = 14.3 galones, S = 2.7 galones, 1 – α = 0.95 → En
la Tabla 1, Zo = Z0.975 = 1.96.
a) El error de estimación para la media E es:
E= Z

1

2
n
 1.96
2.7
= 0.61 galones.
75
b) El intervalo de confianza para la media se obtiene con la expresión:

  X  Z


1

2
n
, X Z
 
1

2

n
…………. (1)
Reemplazando en (1) se tiene:
µ ϵ [14.3 – 0.61 ; 14.3 + 0.61] = [13.69 ; 14.91] galones con el 95% de
confianza.
Rpta.
Interpretación.- en la gasolinera, el verdadero consumo medio de gasolina se
encuentra entre 13.69 y 14.91 galones con el 95% de confianza.
c) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 75 y 1 – α = 0.95, entonces en la Tabla 2:
2
a = x74
, 0.025 = 52.1
y
2
b = x74
, 0.975 = 99.7
Se tiene además la desviación estándar muestral S = 2.7
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (75  1)(2.7) 2 (75  1)(2.7) 2 
²  
,

99
.
7
52.1


Por lo tanto:
²  [5.41 ; 10.35] (galones)² con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la varianza de la gasolina comprada
se encuentra entre 5.41 y 10.35 (galones)².
Z 2 2
d) El tamaño de muestra está dado por: n0 
E2
Donde: | x - µ | = E = 0.5 galones, 1 – α = 0.95 → en la Tabla 1, Z =
Z0.975 = 1.96 y S = 2.7. Reemplazando en la fórmula para n se tiene:
191
1.96 2 2.7 2
= 112 clientes.
n0 
0.52
Rpta.
Interpretación.- para estimar el consumo medio de gasolina con el 95% de
confianza y un error máximo de 0.5 galones se requiere una muestra de 112
clientes.
5.
Un proceso está programado para embolsar la cantidad media de 250 gramos de
café. Se toma una muestra aleatoria de 36 bolsas, resultando una media de 246.5
gramos y una desviación típica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio de
las bolsas con café.
b) ¿Se puede afirmar que no se está cumpliendo con el contenido medio en las
bolsas?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de
los pesos de las bolsas con café. ¿aceptaría usted que σ2 = 250 gr2 por bolsa?
Solución
Datos: µ = 250 gr., n = 36 bolsas, X = 246.5 gr., S = 12 gr., 1 – α = 0.95
a) Para hallar el intervalo de confianza para la media, si 1 – α = 0.95 → En la
Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:

  X  Z


1

2
n
, X Z
 
1

2

n
…………. (1)
Donde el error de estimación para la media es:
E= Z

1

2
n
 1.96
12
= 3.92 gr.
36
Reemplazando en (1) se tiene:
µ ϵ [246.5 – 3.92 ;
confianza.
246.5 + 3.92] = [242.58 ; 250.42] gr. con el 95% de
Rpta.
Interpretación.- con el 95% de confianza, el verdadero contenido medio de
las bolsas con café se encuentra entre 242.58 y 250.42 gr.
b) No se puede afirmar que no se está cumpliendo con el contenido medio en las
bolsas de café, puesto que µ = 250 gr., está en el intervalo de confianza
obtenido en a).
192
c) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 36 y 1 – α = 0.95, entonces en la Tabla 2:
2
a = x35
, 0.025 = 20.6
y
2
b = x35
, 0.975 = 53.2
Se tiene además la desviación estándar muestral S = 12.
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (36  1)(12) 2 (36  1)(12) 2 
²  
,

53.2
20.6


Por lo tanto:
²  [94.74 ; 244.66] (gr.)² con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la varianza de los pesos de las
bolsas con café se encuentra entre 94.74 y 244.66 (gr.)².
Nota: No aceptaría que σ2 = 250 gr2 por bolsa, ya que el resultado anterior
indica que es menor de 250 gr2.
6.
Para estimar la cantidad total de depósitos a la vista en dólares, un banco
comercial selecciona una muestra aleatoria de 36 cuentas. La muestra da una
media de $ 5,000 y una desviación estándar de $ 1,000. Suponiendo que el banco
tiene 12,000 cuentas a la vista. Calcule e interprete intervalos de confianza del
95 % para:
a) El verdadero depósito promedio en las cuentas a la vista.
b) La cantidad total en depósitos.
c) La desviación estándar verdadera de los depósitos en las cuentas a la vista.
d) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de $ 150 con el 95 % de confianza?
Solución
Datos: N = 12,000 cuentas, n = 36, X = $ 5,000, S = $ 1,000, 1 – α = 0.95
a) Para hallar el intervalo de confianza para la media, si 1 – α = 0.95 → En la
Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:
193

  X  Z


1

2
n
, X Z
 
1

2

n
…………. (1)
Donde el error de estimación para la media es:
E= Z

1

2
n
 1.96
1000
= $ 326.67. Reemplazando en (1) se tiene:
36
µ ϵ [5,000 – 326.67 ; 5,000 + 326.67] = [4,673.33 ; 5,326.67] $ con el 95%
de confianza. Rpta.
Interpretación.- con el 95% de confianza, el verdadero depósito medio a la
vista en las cuentas se encuentra entre 4,673.33 y 5,326.67 dólares.
b) Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los
límites de la media por N = 12,000, así:
Total = Nµ ϵ 12,000 [4,673.33 ; 5,326.67] = [56’079,960 ; 63’920,040] $
con el 95% de confianza.
Rpta.
Interpretación.- con el 95% de confianza, el verdadero total de depósitos a la
vista en las cuentas en dólares se encuentra entre $ 56’079,960 y 63’920,040.
c) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 36 y 1 – α = 0.95, entonces en la Tabla 2:
2
a = x35
, 0.025 = 20.6
y
2
b = x35
, 0.975 = 53.2
Se tiene además la desviación estándar muestral S = 1,000.
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (36  1)(1000 ) 2 (36  1)(1000 ) 2 
²  
,

53.2
20.6


Por lo tanto:
²  [657,894.74 ; 1’699,029.13] ($)² con el 95% de confianza.
  [811.11 ; 1,303.47] $ con el 95% de confianza.
194
Rpta.
Entonces:
Interpretación: con el 95% de confianza, la desviación estándar de los
depósitos a la vista en las cuentas se encuentra entre 811.11 y 1,303.47
dólares.
d) El tamaño de muestra está dado por: n0 
Z 2 2
E2
Donde: | x - µ | = E = $ 150, 1 – α = 0.95 → en la Tabla 1, Z = Z0.975 =
1.96 y S = 1,000. Reemplazando en la fórmula para n se tiene:
(1.96) 2 (1,000) 2
n0 
= 171 cuentas.
(150) 2
Rpta.
Interpretación.- para estimar el depósito medio a la vista, con el 95% de
confianza y un error máximo de $ 150 se requiere una muestra de 171
cuentas.
7.
De un área de la ciudad en la que habitan 500 familias se extrae una muestra
aleatoria de 50 familias, obteniéndose los siguientes datos sobre el número de
hijos por familia:
Hijos por familia (Xi)
Familias (ni)
0
1
2
3
4
5
20
10
7
6
4
3
Calcule e interprete intervalos de confianza del 95 % para estimar:
a) El número medio de hijos por familia en la ciudad.
b) El número total de hijos por familia en el área de la ciudad.
c) La proporción de familias con menos de 2 hijos en el área.
d) El total de familias con menos de 2 hijos en el área.
Solución
Con la información en la tabla se determina el promedio y la varianza muestral de
los hijos por familia así:
6
X
X n
i
i 1
n
i

0 x20  1x10  2 x7  3x6  4 x4  5 x3 73

= 1.46 hijos.
50
50
195
6
S2 
6
 ( X i  X ) 2 ni

i 1
n 1
X
i 1
n  nX 2
2
i i
n 1

231  50 (1.46) 2
= 2.54 hijos2 y S =
50  1
1.594.
6
X
i 1
n 0 2 x20  12 x10  2 2 x7  32 x6  4 2 x4  5 2 x3 = 231
2
i i
Otros datos: N = 500, n = 50, 1 – α = 0.95.
a) Para hallar el intervalo de confianza para la media y el total, si 1 – α = 0.95
→ en la Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:

  X  Z


1

n
2
N n

, X Z 
1
N 1
n
2
N n
 …………. (1)
N 1 
Donde el error de estimación para la media es:
E= Z

1

2
n
N n
1.594 500  50
 1.96
= 0.42 hijos.
N 1
500  1
50
Reemplazando en (1) se tiene:
µ ϵ [1.46 – 0.42 ; 1.46 + 0.42] = [1.04 ; 1.88] hijos / familia con el 95% de
confianza.
Rpta.
Interpretación.- con el 95% de confianza, el verdadero número medio de
hijos por familia se encuentra entre 1.04 y 1.88 hijos.
b) Para hallar el intervalo de confianza para el Total (Nμ) de hijos se multiplica
los límites de la media por N = 500 familias, así:
Total = Nµ ϵ 500 [1.04 ; 1.88] = [520 ; 940] hijos al 95% de confianza.
Rpta.
Interpretación.- el verdadero total de hijos en el área de la ciudad, se
encuentra entre 520 y 940 hijos, con el 95% de confianza.
c) Para determinar el intervalo de confianza para la proporción de familias con
menos de 2 hijos en el área, del enunciado y la tabla tomemos los datos:
N = 500,
n = 50,
→ en la Tabla 1,
X = 30 familias con menos de 2 hijos, Si 1 – α = 0.95
Z0 = Z 0.975 = 1.96.
Si p = proporción muestral de familias con menos de 2 hijos, entonces:
196
p
X 30

= 0.6,
n 50
q = 1 – p = 0.4. El intervalo de confianza para la
verdadera proporción poblacional P de familias con menos de 2 hijos, es:

Pp  Z 
1
2

pq
n
N n
, pZ 
1
N 1
2
pq N  n 

n N 1 
Reemplazando valores se tiene:
P
ϵ
1.96
[0.60
–
1.96
0.60 x0.40 500  50
50
500  1
;
0.60
+
0.60 x0.40 500  50
]
50
500  1
P ϵ [0.60 – 0.129 ; 0.60 + 0.129 ]
Por lo tanto:
P ϵ [ 0.471 ; 0.729 ] con el 99% de confianza.
Rpta.
Interpretación.- la verdadera proporción de familias con menos de 2 hijos en
el área de la ciudad, se encuentra entre 0.311 y 0.489 con el 95% de
confianza.
d) Para hallar el intervalo de confianza para el Total (NP) de familias con menos
de 2 hijos, se multiplica los límites de la proporción por N = 500 familias,
así:
Tot. = NP ϵ 500 [0.471; 0.729] = [236; 365] familias al 95% de confianza.
Rpta.
Interpretación.- el total de familias con menos de 2 hijos en el área de la
ciudad, se encuentra entre 236 y 365 familias, con el 95% de confianza.
8. En una muestra aleatoria de 1000 hogares de Lima Metropolitana (con 800 mil
consumidores de gas doméstico) se encontró que 650 están a favor de la reducción
del precio del gas doméstico.
a) Calcule e interprete un intervalo del 90% de confianza para la proporción y
otro para el total verdadero de hogares que están a favor de la reducción del
precio del gas doméstico.
b) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea
cometer un error máximo del 5%?
Solución
197
Datos: N = 800,000 consumidores de gas, n = 1,000, X = 650 a favor de la
reducción del precio del gas, 1 – α = 0.90.
a) Para determinar el intervalo de confianza para la proporción de hogares que
están a favor de la reducción del precio del gas doméstico, si 1 – α = 0.90 →
En la Tabla 1, Zo = Z0.95 = 1.645.
Si p = proporción muestral de hogares que están a favor de la reducción del
precio del gas doméstico, entonces: p 
X 650

= 0.65, q = 1 – p = 0.35.
n 1000
El intervalo de confianza para la verdadera proporción poblacional P de
hogares que están a favor de la reducción del precio del gas doméstico, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Se desecha el factor de corrección para poblaciones finitas porque la fracción
de muestreo n/N < 0.05.
Reemplazando valores se tiene:
P ϵ [0.65 – 1.645
0.65 x0.35
0.65 x0.35
; 0.65 + 1.645
]
1000
1000
P ϵ [0.65 – 0.025 ; 0.65 + 0.025]
Por lo tanto:
P ϵ [0.625 ; 0.675] con el 90% de confianza. Rpta.
Interpretación.- la verdadera proporción (porcentaje) de hogares que están a
favor de la reducción del precio del gas doméstico, se encuentra entre 0.625 y
0.675 (62.5% y 67.5%) con el 90% de confianza.
Para hallar el intervalo de confianza para el Total (NP) de hogares que están a
favor de la reducción del precio del gas doméstico, se multiplica los límites de
la proporción por N = 800,000 hogares, así:
Total = NP ϵ 800,000 [0.575 ;
0.625] = [460,000 ; 500,000] hogares con el
90% de confianza. Rpta.
Interpretación.- el total de hogares que están a favor de la reducción del precio
del gas doméstico en Lima Metropolitana, se encuentra entre 460,000 y
500,000 hogares, con el 90% de confianza.
b) Datos: p = 0.65, q = 0.35, E = |p - P| = 0.05 y según la Tabla 1 de la
distribución normal estándar, al 95% de confianza:
198
Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z 2 pq 1.96 2 x0.65 x0.35
n0 

 350 hogares.
E2
(0.05) 2
Rpta.
Interpretación.- para estimar la proporción de hogares que están a favor de la
reducción del precio del gas doméstico, con el 95% de confianza y un error
máximo del 5% se requiere una muestra de 350 hogares consumidores de gas.
9. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana
(con 1’400 000 hogares) indica que el 30.5 % de los hogares compra periódicos y
revistas.
a) Determine un intervalo de confianza del 95 % para la proporción y otro para el
total de hogares limeños que compra periódicos y revistas.
b) ¿Aceptaría Ud. que menos del 25 % de hogares limeños compra periódicos y
revistas?
c) Con un error del 2.5 % y una confianza del 95 %. ¿Qué tamaño de muestra es
necesario para estimar la proporción de hogares que compran periódicos y
revistas?
Solución
Datos: N = 1’400,000 hogares, n = 1,000, p = 0.305, q = 1 – p = 0.695.
a) Para determinar el intervalo de confianza para la proporción de hogares que
compra periódicos y revistas, si 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =
1.96.
Si p = 0.305 es la proporción muestral de hogares que compra periódicos y
revistas, entonces el intervalo de confianza para la verdadera proporción
poblacional P de hogares que compra periódicos y revistas, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Se desecha el factor de corrección para poblaciones finitas porque la fracción
de muestreo n/N < 0.05. Reemplazando valores se tiene:
P ϵ [0.305 – 1.96
0.305 x0.695
0.305 x0.695
; 0.305 + 1.96
]
1000
1000
P ϵ [0.305 – 0.029 ; 0.305 + 0.029]
Por lo tanto:
P ϵ [0.276 ; 0.334] con el 95% de confianza.
199
Rpta.
Interpretación.- la verdadera proporción (porcentaje) de hogares que compra
periódicos y revistas en Lima Metropolitana, se encuentra entre 0.276 y 0.334
(27.6% y 33.4%) con el 95% de confianza.
Para hallar el intervalo de confianza para el Total (NP) de hogares que compra
periódicos y revistas, se multiplica los límites de la proporción por N =
1’400,000 hogares, así:
Total = NP ϵ 1’400,000 [0.276 ; 0.334] = [386,400 ; 467,600] hogares con el
95% de confianza.
Rpta.
Interpretación.- el total de hogares que compra periódicos y revistas en Lima
Metropolitana, se encuentra entre 386,400 y 467,600 hogares, con el 95% de
confianza.
b) No aceptaría que menos del 25 % de hogares limeños compra periódicos y
revistas, puesto que se encuentra entre 27.6% y 33.4% (ver la parte a).
c) Datos: p = 0.305, q = 0.695, E = |p - P| = 0.025 y según la Tabla 1 de la
distribución normal estándar, al 95% de confianza: Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
n0 
Z 2 pq 1.96 2 x0.305 x0.695

 1,303 hogares. Rpta.
E2
(0.025) 2
Interpretación.- para estimar la proporción de hogares que compra periódicos
y revistas, con el 95% de confianza y un error máximo del 2.5% se requiere
una muestra de 1,303 hogares.
10. Una muestra aleatoria de 500 compradores de un centro comercial se encontró que
300 compran alimentos y bebidas.
a) Calcule e interprete un intervalo del 99% de confianza para la proporción
verdadera de compradores que adquieren alimentos y bebidas.
b) Con un 99% de confianza, ¿qué tamaño de muestra será necesario si desea
cometer un error máximo del 4%?
Solución
Datos: n = 500 compradores, X = 300 compran alimentos y bebidas.
200
a) Para hallar los límites de confianza para la proporción de compradores que
adquieren alimentos y bebidas, si 1 – α = 0.99 → En la Tabla 1, Zo = Z0.995 =
2.575.
Si p = proporción muestral de compradores que adquieren alimentos y bebidas,
entonces: p 
X 300

= 0.60,
n 500
q = 1 – p = 0.40.
El intervalo de confianza para la verdadera proporción poblacional P de
compradores que adquieren alimentos y bebidas, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Se desecha el factor de corrección para poblaciones finitas, asumiendo un
número grande de compradores, tal que la fracción de muestreo n/N < 0.05.
Reemplazando valores se tiene:
P ϵ [0.60 – 2.575
0.60 x0.40
0.65 x0.35
; 0.60 + 2.575
]
500
1000
P ϵ [0.60 – 0.056 ; 0.60 + 0.056]
Por lo tanto:
P ϵ [0.544 ; 0.656] con el 99% de confianza.
Rpta.
Interpretación.- con el 99% de confianza, la verdadera proporción (porcentaje)
de compradores que adquieren alimentos y bebidas en el centro comercial, se
encuentra entre 0.544 y 0.656 (54.4% y 65.6%).
b) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.04 y según la Tabla 1 de la
distribución normal estándar, al 99% de confianza:
Z = Z0. 995 = 2.575.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
n0 
Z 2 pq 2.575 2 x0.60 x0.40

 995 compradores.
E2
(0.04) 2
Rpta.
Interpretación.- para estimar la proporción de compradores que adquieren
alimentos y bebidas en el centro comercial, con el 99% de confianza y un error
máximo del 4% se requiere una muestra de 995 compradores.
11. Se tomó una muestra aleatoria de 800 mujeres casadas en Lima y se encontró que
560 están a favor del uso de la píldora del día siguiente.
201
a) Calcule e interprete un intervalo del 95% de confianza para la verdadera
proporción de mujeres casadas que están a favor del uso de la píldora del día
siguiente.
b) Con el 95 % de confianza, ¿Qué tamaño de muestra debe tomarse, si se desea
un error máximo del 3%?
Solución
Datos: n = 800 mujeres casadas, X = 560 a favor del uso de la píldora del día
siguiente.
a) Para hallar los límites de confianza para la proporción de mujeres casadas que
están a favor del uso de la píldora del día siguiente, si 1 – α = 0.95 → En la
Tabla 1, Zo = Z0.975 = 1.96.
Si p = proporción muestral de mujeres casadas que están a favor del uso de la
píldora del día siguiente, entonces: p 
X 560

= 0.70,
n 800
q = 1 – p = 0.30.
El intervalo de confianza para la verdadera proporción poblacional P de
mujeres casadas que están a favor del uso de la píldora del día siguiente, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Se desecha el factor de corrección para poblaciones finitas, asumiendo un
número grande de mujeres casadas en Lima, tal que la fracción de muestreo
n/N < 0.05.
Reemplazando valores se tiene:
P ϵ [0.70 – 1.96
0.70 x0.30
0.70 x0.30
; 0.70 + 1.96
]
800
800
P ϵ [0.70 – 0.032 ; 0.70 + 0.032]
Por lo tanto:
P ϵ [0.668 ; 0.732] con el 95% de confianza.
Rpta.
Interpretación.- la verdadera proporción (porcentaje) de mujeres casadas que
están a favor del uso de la píldora del día siguiente en Lima, se encuentra entre
0.668 y 0.732 (66.8% y 73.2%) con el 95% de confianza.
b) Datos: p = 0.70, q = 0.30, E = |p - P| = 0.03 y según la Tabla 1 al 95% de
confianza:
Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
202
n0 
Z 2 pq 1.96 2 x0.70 x0.30

 896 mujeres casadas.
E2
(0.03) 2
Rpta.
Interpretación.- con el 95% de confianza y un error máximo del 3% para
estimar la proporción de mujeres casadas que están a favor del uso de la píldora
del día siguiente, se requiere una muestra de 896 mujeres casadas.
12. Una “Encuesta de Opinión” realizada a 1000 ciudadanos de Lima Metropolitana
(con 5.5 millones de ciudadanos) indica que el 19.5 % de los ciudadanos juega la
tinka.
a) Determine un intervalo de confianza del 95 % para la proporción y otro para el
total de ciudadanos limeños que juegan la tinka.
b) Con un error del 3.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de
muestra necesario para estimar la proporción de ciudadanos que juega la
tinka?
Solución
Datos: N = 5’500,000 ciudadanos, n = 1,000, p = 0.195, q = 1 – p = 0.805.
a) Para determinar el intervalo de confianza para la proporción de ciudadanos
limeños que juegan la tinka, si 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =
1.96.
Si p = 0.195 es la proporción muestral de ciudadanos limeños que juegan la
tinka, entonces el intervalo de confianza para la verdadera proporción
poblacional P de ciudadanos limeños que juegan la tinka, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
Se desecha el factor de corrección para poblaciones finitas porque la fracción
de muestreo n/N < 0.05. Reemplazando valores se tiene:
P ϵ [0.195 – 1.96
0.195 x0.805
0.305 x0.695
; 0.195 + 1.96
]
1000
1000
P ϵ [0.195 – 0.025 ; 0.195 + 0.025]
Por lo tanto:
P ϵ [0.17 ; 0.22] con el 95% de confianza.
Rpta.
Interpretación.- con el 95% de confianza la verdadera proporción (porcentaje)
de ciudadanos limeños que juegan la tinka, se encuentra entre 0.17 y 0.22 (17%
y 22%).
203
Para hallar el intervalo de confianza para el Total (NP) de ciudadanos limeños
que juegan la tinka, se multiplica los límites de la proporción por N =
5’500,000 ciudadanos, así:
Total = NP ϵ 5’500,000 [0.17 ; 0.22] = [935,000 ; 1’210,000] ciudadanos con
el 95% de confianza.
Rpta.
Interpretación.- el total de ciudadanos limeños que juegan la tinka, se encuentra
entre 935,000 y 1’210,000 ciudadanos, con el 95% de confianza.
b) Datos: p = 0.195, q = 0.805, E = |p - P| = 0.035 y según la Tabla 1 de la
distribución normal estándar, al 95% de confianza:
Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z 2 pq 1.96 2 x0.195 x0.805
n0 

 492 ciudadanos.
E2
(0.035) 2
Rpta.
Interpretación.- para estimar la proporción de ciudadanos limeños que juegan
la tinka, con el 95% de confianza y un error máximo del 3.5% se requiere una
muestra de 492 ciudadanos.
13. En una muestra aleatoria de 600 compradores de un centro comercial se encontró
que 360 están a favor de un horario más amplio para las compras.
a) Calcule e interprete un intervalo del 95% de confianza para la proporción
verdadera de compradores que están a favor de un horario más amplio para
las compras.
b) ¿Esta evidencia es suficiente para concluir que menos de 2/3 de los
compradores están a favor de un horario más extenso? Explique.
c) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea
cometer un error máximo del 4.5%?
Solución
Datos: n = 600 compradores, X = 360 están a favor de un horario más amplio
para las compras.
a) Para hallar los límites de confianza para la proporción de compradores que
están a favor de un horario más amplio para las compras, si 1 – α = 0.95 → En
la Tabla 1, Zo = Z0.975 = 1.96.
204
Si p = proporción muestral de compradores que están a favor de un horario más
amplio para las compras, entonces: p 
X 360

= 0.60,
n 600
q = 1 – p = 0.40.
El intervalo de confianza para la verdadera proporción poblacional P de
compradores que están a favor de un horario más amplio para las compras, es:

Pp  Z 
1
2

pq
, pZ 
1
n
2
pq 

n 
No se considera el factor de corrección para poblaciones finitas, asumiendo un
número grande de compradores en el centro comercial, tal que la fracción de
muestreo n/N < 0.05.
Reemplazando valores se tiene:
P ϵ [0.60 – 1.96
0.60 x0.40
0.60 x0.40
; 0.60 + 1.96
]
600
600
P ϵ [0.60 – 0.039 ; 0.60 + 0.039]
Por lo tanto:
P ϵ [0.561 ; 0.639] con el 95% de confianza.
Rpta.
Interpretación.- la verdadera proporción (porcentaje) de compradores que están
a favor de un horario más amplio para las compras en el centro comercial, se
encuentra entre 0.561 y 0.639 (56.1% y 63.9%) con el 95% de confianza.
b) Se puede concluir que menos de 2/3 de los compradores están a favor de un
horario más extenso, puesto que P se encuentra entre 0.561 y 0.639 (ver parte
a).
c) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.045 y según la Tabla 1 al 95% de
confianza:
Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z 2 pq 1.96 2 x0.60 x0.40
n0 

 455 compradores.
E2
(0.045) 2
Rpta.
Interpretación.- con el 95% de confianza y un error máximo del 4.5% para
estimar la proporción de compradores que están a favor de un horario más
amplio para las compras en el centro comercial, se requiere una muestra de 455
compradores.
205
14. En un estudio para determinar el gasto medio mensual en arbitrios en las
ciudades A y B, se toma una muestra al azar de 200 hogares de A arrojando un
gasto medio de S/. 250 y una desviación estándar de 15. Una muestra al azar de
180 hogares de la ciudad B da una gasto medio de 235 y una desviación estándar
de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto
medio en las ciudades A y B.
b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?
Solución
Datos: nA = 200, X A = 250, SA = 15, nB = 180, X B = 235, SB = 10.
a) Un intervalo de confianza para la diferencia del gasto medio mensual en arbitrios
en las ciudades A y B viene dado por:

 A   B  ( X A  X B )  Z

1

X
AXB
, (X A  X B )  Z
2
1

X
AXB
2

 ...........

(1)
Si 1 – α = 0.99, entonces: Z0 = Z 0.995 = 2.575
X
AXB
  XB X A
S A2 S B2
(15) 2 (10) 2




= S/. 1.30
n A nB
200
180
Reemplazando valores en (1):
A - B ϵ [(250 – 235) – 2.575 (1.30) ; (250 – 235) + 2.575 (1.30)] = [15 ± 3.34]
Luego: A - B ϵ [11.66; 18.34] S/. con el 95% de confianza.
Rpta.
Interpretación: con el 99% de confianza, la diferencia del gasto medio mensual
en arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.
b) Responder a la pregunta ¿Es diferente el gasto medio mensual en arbitrios en las
ciudades A y B? implica responder si ¿ A ≠ B? o también ¿A - B ≠ 0?
Si apreciamos el intervalo de confianza construido en a) A - B no puede ser
cero, es decir A - B ≠ 0 o
A ≠ B. Por lo tanto, el gasto medio mensual en
arbitrios en ambas ciudades es diferente.
Rpta.
15. Un departamento de producción desea determinar si hay diferencia en el
rendimiento entre el turno diurno (A) y el nocturno (B). Una muestra aleatoria
de 80 obreros del turno diurno alcanza una producción media de 94.3 partes por
206
hora, con una desviación estándar de 14 partes por hora, mientras que otra
muestra de 60 obreros de la noche alcanza un promedio de 89.7 partes por hora,
con una desviación estándar de 17. Se pide:
a) Calcule e interprete un intervalo de confianza del 95% para la verdadera
diferencia de rendimientos medios de ambos turnos.
b) ¿Son diferentes los rendimientos medios de ambos turnos? ¿µA ≠ µB?
Explique
Solución
Datos: nA = 80, X A = 94.3 partes por hora, SA = 14, nB = 60, X B = 89.7, SB =
17.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
por:

 A   B  ( X A  X B )  Z

1

X
AXB
, (X A  X B )  Z
2
1

X
AXB
2

 ...........

(1)
Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96
X
AXB
S A2 S B2
(14) 2 (17) 2




= 2.7 partes por hora.
n A nB
80
60
Reemplazando valores en (1):
A - B ϵ [(94.3 – 89.7) – 1.96 (2.7) ; (94.3 – 89.7) + 1.96 (2.7)] = [4.6 ± 5.3]
Luego: A - B ϵ [-0.7; 9.9] partes por hora con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la diferencia de rendimientos medios del
turno diurno y nocturno se encuentra entre -0.7 y 9.9 partes por hora.
b) Responder a la pregunta ¿Son diferentes los rendimientos medios de ambos
turnos? Es responder si ¿ A ≠ B? o también ¿A - B ≠ 0?
Si apreciamos el intervalo de confianza construido en a) A - B toma el valor
cero, es decir A - B = 0 o
A = B. Por lo tanto, los rendimientos medios de
ambos turnos no son diferentes.
Rpta.
16. El departamento de marketing desea determinar si hay diferencia entre las ventas
mensuales realizadas por hombres y mujeres. Una muestra aleatoria de 60
hombres alcanza un promedio de 78 artefactos mensuales, con una desviación
207
estándar de 15; mientras que otra muestra de 50 mujeres arroja una venta media
de 85 artefactos mensuales, con una desviación estándar de 10 artefactos. Se
pide:
a) Construya un intervalo del 95% de confianza para la verdadera diferencia de
las ventas medias realizadas por hombres y mujeres.
b) ¿Son diferentes las ventas medias realizadas por hombres y mujeres? ¿µh ≠
µm?
Solución
Datos: nh = 60, X h = 78 artefactos, Sh = 15, nm = 50, X m = 85, Sm = 10.
a) Un intervalo de confianza para la diferencia de las ventas medias realizadas por
hombres y mujeres viene dado por:

 h   m  ( X h  X m )  Z

1

X
h Xm
, (X h  X m )  Z
2
1

X
h Xm
2



...........
(1)
Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96
X
h Xm

S h2 S m2
(15) 2 (10) 2



= 2.4 partes por hora.
nh nm
60
50
Reemplazando valores en (1):
h - m ϵ [(78 – 85) – 1.96 (2.4) ; (78 – 85) + 1.96 (2.4)] = [-7 ± 4.7]
Luego: h - m ϵ [-11.7; -2.3] artefactos con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la diferencia de las ventas medias
mensuales de hombres y mujeres se encuentra entre -11.7 y -2.3 artefactos.
b) Responder a la pregunta ¿Son diferentes las ventas medias realizadas por hombres
y mujeres? implica responder si ¿h ≠ m? o también ¿h - m ≠ 0?
Si apreciamos el intervalo de confianza construido en a) h - m no puede ser
cero, es decir h - m ≠ 0 o h ≠ m. Por lo tanto, si es diferente la venta medias
mensual de artefactos entre hombres y mujeres.
Rpta.
17. Para determinar el precio medio del kilo de pollo en las ciudades A y B, se toma
una muestra al azar de 120 hogares de A arrojando un precio medio de S/. 6.50 y
una desviación estándar de S/ 0.70. Una muestra al azar de 100 hogares de la
ciudad B da una precio medio de S/. 6.75 y una desviación estándar de S/. 0.90.
208
a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del
precio medio del pollo en las ciudades A y B.
b) ¿Es diferente el precio medio del pollo en las ciudades A y B?
Solución
Datos: nA = 120 hog., X A = S/. 6.50, SA = 0.70, nB = 100, X B = 6.75, SB =
0.90.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
por:

 A   B  ( X A  X B )  Z

1

X
AXB
, (X A  X B )  Z
2
1

X
AXB
2

 ...........

(1)
Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96
X
AXB

S A2 S B2
(0.7) 2 (0.9) 2



= S/. 0.11
n A nB
120
100
Reemplazando valores en (1):
A - B ϵ [(6.50 – 6.75) – 1.96 (0.11) ; (6.50 – 6.75) – 1.96 (0.11)] = [-0.25 ±
0.22]
Luego: A - B ϵ [-0.47; -0.03] S/. con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la diferencia del precio medio del pollo
en las ciudades A y B se encuentra entre S/. -0.47 y -0.03.
b) Responder a la pregunta ¿Es diferente el precio medio del pollo en las ciudades A
y B? es responder si ¿ A ≠ B? o también ¿A - B ≠ 0?
Si apreciamos el intervalo de confianza construido en a) A - B no toma el valor
cero, es decir A - B ≠ 0 o
ambas ciudades es diferente.
A ≠ B. Por lo tanto, el precio medio del pollo en
Rpta.
18. Muestras del pago mensual a los obreros en las ciudades 1 y 2 proporcionan los
siguientes datos:
n1 = 35, X 1 = $ 540,
S1 = $ 25,
y
n2 = 35, X 2 = $ 530,
S2 = $ 20.
a) Construya un intervalo del 95 % de confianza para la diferencia entre los
pagos medios a los obreros de las dos ciudades.
209
b) ¿Difieren los pagos medios a los obreros en las dos ciudades? Explique.
Solución
Datos: n1 = 35, X 1 = $ 540,
S1 = $ 25,
y
X 2 = $ 530,
n2 = 35,
S2 = $
20.
a) Un intervalo de confianza para la diferencia de pagos medios viene dado por:

1   2  ( X 1  X 2 )  Z

1

 X X , ( X1  X 2 )  Z
1
2
2

1

 X  X  ........... (1)
1
2
2

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96
 X X 
1
2
S12 S 22
(25) 2 (20) 2



= $ 5.41
n1 n2
35
35
Reemplazando valores en (1):
1 - 2 ϵ [(540 – 530) – 1.96 (5.41) ; (540 – 530) – 1.96 (5.41)] = [10 ± 10.60]
Luego: 1 - 2 ϵ [-0.60; 20.60] $ con el 95% de confianza.
Rpta.
Interpretación: la diferencia entre los pagos medios a los obreros de las dos
ciudades se encuentra entre $ -0.60 y 20.60 con el 95% de confianza.
b) Responder a la pregunta ¿Difieren los pagos medios a los obreros en las dos
ciudades? implica responder si ¿1 ≠ 2? o también ¿1 - 2 ≠ 0?
Si apreciamos el intervalo de confianza construido en a) 1 - 2 toma el valor
cero, es decir 1 - 2 = 0 o 1 = 2. Por lo tanto, los pagos medios a los obreros
en las dos ciudades no difieren.
Rpta.
19. Se compararon dos marcas de cigarrillos, 1 y 2, respecto a su contenido de
nicotina en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y
50 de la marca 2, dieron estos resultados:
n1 = 40 cigarros, X 1 = 14.3 mg., S1 = 2.9 y
n2 = 50, X 2 = 15.7,
S2 = 3.8.
a) Construya un intervalo del 99 % de confianza para la diferencia entre las
medias del contenido de nicotina para las dos marcas de cigarrillos.
b) ¿Difieren las dos marcas en su contenido medio de nicotina? Explique.
Solución
Datos: n1 = 40, X 1 = 14.3 mg., S1 = 2.9 y n2 = 50, X 2 = 15.7,
210
S2 = 3.8.
a) Un intervalo de confianza para la diferencia de contenido medio viene dado por:

1   2  ( X 1  X 2 )  Z

1

 X X , ( X1  X 2 )  Z
1
2
2

1

 X  X  ........... (1)
1
2
2

Si 1 – α = 0.99, entonces: Z0 = Z 0.995 = 2.575
 X X 
1
2
S12 S 22
(2.9) 2 (3.8) 2



= 0.71mg.
n1 n2
40
50
Reemplazando valores en (1):
1 - 2 ϵ [(14.3 – 15.7) – 2.575 (0.71) ; (14.3 – 15.7) + 2.575 (0.71)] = [-1.4 ±
1.83]
Luego: 1 - 2 ϵ [-3.23; 0.43] mg. con el 99% de confianza.
Rpta.
Interpretación: con el 99% de confianza, la diferencia entre las medias del
contenido de nicotina para las dos marcas de cigarrillos se encuentra entre -3.23 y
0.43 mg.
b) Responder a la pregunta ¿Difieren las dos marcas en su contenido medio de
nicotina? es responder si ¿1 ≠ 2? o también ¿1 - 2 ≠ 0?
El intervalo de confianza construido en a) 1 - 2 toma el valor cero, es decir 1 2 = 0 o 1 = 2. Por lo tanto, el contenido medio de nicotina para las dos marcas
no difiere.
Rpta.
20. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de
botas de cuero. De una muestra de 300 mujeres menores de 40 años, sólo 60
estuvieron interesadas, mientras que de 200 mujeres 40 años a más, 54
mostraron interés.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 años y las de 40
años a más que mostraron interés por la compra de botas de cuero.
b) ¿Es diferente la proporción de mujeres menores de 40 años y las de 40 años a
más que mostraron interés por la compra de botas de cuero? Explique.
Solución
Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a
más.
Datos:
n1 = 300,
X1 = 60,
n2 = 200
211
y
X2 = 54
a) El intervalo de confianza para la diferencia de proporciones de mujeres
menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por
la compra de botas de cuero, P1 - P2 está dado por:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.99, entonces Z0 = Z 0.995 = 2.575. Además:
p1 
X1
60
= 0.20 → q1 = 0.80

n1 300
y
p2 
X2
54
= 0.27 → q2 =

n2 200
0.73
 p p =
1
2
p1q1 p2 q2
(0.20)(0.80) (0.27)(0.73)
= 0.039



n1
n2
300
200
Z0  p1  p2 = 2.575 (0.039) = 0.1004
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.20 – 0.27) – 0.1004 ; (0.20 – 0.27) + 0.1004] = [-0.07 ± 0.1004]
P1 - P2  [-0.1704 ; 0.0304] con el 95% de confianza.
Rpta.
Interpretación: la diferencia de proporciones de mujeres menores de 40 años
(P1) y las de 40 años a más (P2) que mostraron interés por la compra de botas
de cuero, está entre -0.1704 y 0.0304 con el 99% de confianza.
b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las
de 40 años a más que mostraron interés por la compra de botas de cuero?
implica preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido en
a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no es diferente la
proporción de mujeres menores de 40 años y las de 40 años a más que mostraron
interés por la compra de botas de cuero.
Rpta.
21. A fin de determinar el nivel de aceptación de la gestión presidencial (X), se
entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto
del País (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;
Resto del País (2): n2 = 1200, X2 =
300
212
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de “limeños” y “no limeños” que están de
acuerdo con la gestión presidencial.
b) ¿Son diferentes las verdaderas proporciones de “limeños” y “no limeños” que
están de acuerdo con la gestión presidencial?
Solución
Datos: Lima M. (1): n1 = 800, X1 = 280; Resto del País (2): n2 = 1200, X2 =
300.
a) El intervalo de confianza para la diferencia de proporciones de “limeños” (P1)
y “no limeños” (P2) que están de acuerdo con la gestión presidencial es:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.95, entonces Z0 = Z 0.975 = 1.96. Además:
p1 
X 1 280
= 0.35 → q1 = 0.65

n1 800
y
p2 
X 2 300
= 0.25 → q2 =

n2 1200
0.75
 p p =
1
2
p1q1 p2 q2
(0.35)(0.65) (0.25)(0.75)
= 0.021



n1
n2
800
1200
Z0  p1  p2 = 1.96 (0.039) = 0.041
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.35 – 0.25) – 0.041 ; (0.35 – 0.25) + 0.041] = [0.10 ± 0.041]
P1 - P2  [0.059; 0.141] con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la diferencia de proporciones de
“limeños” y “no limeños” que están de acuerdo con la gestión presidencial,
está entre 0.059 y 0.141.
b) La pregunta ¿Son diferentes las verdaderas proporciones de “limeños” y “no
limeños” que están de acuerdo con la gestión presidencial? implica preguntar
si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza construido
en a), es diferente de cero, es decir P1 - P2 ≠ 0
o
P1 ≠ P2. Por lo tanto, si son
diferentes las verdaderas proporciones de “limeños” y “no limeños” que están de
acuerdo con la gestión presidencial.
213
Rpta.
22. En una muestra aleatoria de 400 hombres y 600 mujeres que ven cierto programa
de TV, 220 hombres y 300 mujeres dijeron que les gustaba.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de hombres y mujeres que les gusta el
programa.
b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de hombres
y mujeres que les gusta el programa?
Solución
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:
n1 = 400,
X1 = 220,
n2 = 600
y
X2 = 300
a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)
y de mujeres (P2) que les gusta el programa de TV, P1 - P2 está dado por:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.99, entonces Z0 = Z 0.995 = 2.575. Además:
p1 
X 1 220
= 0.55 → q1 = 0.45

n1 400
y
p2 
X 2 300
= 0.50 → q2 =

n2 600
0.50
 p p =
1
2
p1q1 p2 q2
(0.55)(0.45) (0.50)(0.50)
= 0.032



n1
n2
400
600
Z0  p1  p2 = 2.575 (0.032) = 0.083
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.55 – 0.50) – 0.083 ; (0.55 – 0.50) + 0.083] = [0.05 ± 0.083]
P1 - P2  [-0.033; 0.133] con el 99% de confianza.
Rpta.
Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres
(P2) que les gusta el programa de TV, está entre -0.033 y 0.133 con el 99% de
confianza.
b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones
de hombres y mujeres que les gusta el programa? implica preguntar si ¿P1 ≠
P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido
en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no son
214
diferentes las proporciones de hombres y mujeres que les gusta el programa.
Rpta.
23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 mujeres,
300 de las cuales están a favor de la titulación con tesis. En una muestra de 400
hombres, 240 indican que están a favor de lo mismo.
a) Halle un intervalo de confianza del 95% para la verdadera diferencia de
proporciones de alumnos y alumnas que están a favor de la titulación con
tesis.
b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de alumnos
y alumnas que están a favor de la titulación con tesis?
Solución
Sean: grupo 1 = alumnos (hombres) y grupo 2 = alumnas (mujeres).
Datos:
n1 = 400,
X1 = 240,
n2 = 600
y
X2 = 300
a) El intervalo de confianza para la diferencia de proporciones de alumnos (P1) y
de alumnas (P2) que están a favor de la titulación con tesis, P1 - P2 está dado
por:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.95, entonces Z0 = Z 0.975 = 1.96. Además:
p1 
X 1 240
= 0.60 → q1 = 0.40

n1 400
y
p2 
X 2 300
= 0.50 → q2 =

n2 600
0.50
 p p =
1
2
p1q1 p2 q2
(0.60)(0.40) (0.50)(0.50)
= 0.032



n1
n2
400
600
Z0  p1  p2 = 1.96 (0.032) = 0.063
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.60 – 0.50) – 0.063 ; (0.60 – 0.50) + 0.063] = [0.10 ± 0.063]
P1 - P2  [0.037; 0.163] con el 95% de confianza.
Rpta.
Interpretación: la diferencia de proporciones de alumnos (P1) y de alumnas
(P2) que están a favor de la titulación con tesis en la UNAC, está entre 0.037
y 0.163 con el 95% de confianza.
215
b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones
de alumnos y alumnas que están a favor de la titulación con tesis? implica
preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza
construido en a), no puede ser cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo
tanto, son diferentes las proporciones de alumnos y alumnas de la UNAC que
están a favor de la titulación con tesis.
Rpta.
24. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca
de perfume. En una muestra aleatoria de 500 hombres y 500 mujeres, 200
hombres y 160 mujeres dijeron que les gustaba el nuevo perfume.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las proporciones de hombres y mujeres que les gusta el nuevo perfume.
b) ¿Son diferentes las verdaderas proporciones de hombres y mujeres que
dijeron que les gustaba el nuevo perfume? Explique.
Solución
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:
n1 = 500,
X1 = 200,
n2 = 500
y
X2 = 160
a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)
y de mujeres (P2) que les gusta el el nuevo perfume, P1 - P2 está dado por:


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.95, entonces Z0 = Z 0.975 = 1.96. Además:
p1 
X 1 200
= 0.40 → q1 = 0.60

n1 500
y
p2 
X 2 160
= 0.32 → q2 =

n2 500
0.68
 p p =
1
2
p1q1 p2 q2
(0.40)(0.60) (0.32)(0.68)
= 0.030



n1
n2
500
500
Z0  p1  p2 = 1.96 (0.030) = 0.059
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.40 – 0.32) – 0.059 ; (0.40 – 0.32) + 0.059] = [0.08 ± 0.059]
P1 - P2  [0.021; 0.139] con el 95% de confianza.
216
Rpta.
Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres
(P2) que les gusta el nuevo perfume, está entre 0.021 y 0.139 con el 95% de
confianza.
b) La pregunta ¿Son diferentes las verdaderas proporciones de hombres y
mujeres que dijeron que les gustaba el nuevo perfume? implica preguntar si
¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza
construido en a), no puede ser cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo
tanto, si son diferentes las proporciones de hombres y mujeres que les gusta el
nuevo perfume.
Rpta.
25. Es ampliamente conocido que no cualquiera coopera respondiendo a
cuestionarios de los entrevistadores puerta por puerta. En un experimento para
determinar si las mujeres son más cooperadoras que los hombres, se obtuvieron
los siguientes resultados: Hombres: n1 = 175, X1 = 85;
Mujeres: n2 =
250, X2 = 150.
a) Determine un intervalo de confianza del 99 % para la diferencia de mujeres y
hombres cooperadores.
b) ¿Es diferente la proporción de mujeres y hombres cooperadores?
Solución
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos:
n1 = 175,
X1 = 84,
n2 = 250
y
X2 = 150
a) El intervalo de confianza para la diferencia de proporciones de mujeres (P2) y
de hombres (P1) que coopera respondiendo a cuestionarios de los
entrevistadores puerta por puerta, P2 – P1 está dado por:


P2  P1  ( p2  p1 )  Z   p2  p1 , ( p2  p1 )  Z   p2  p1  ............... (1)
1
1
2
2


Si 1 – α = 0.99, entonces Z0 = Z 0.995 = 2.575. Además:
p1 
X 1 84
= 0.48 → q1 = 0.52

n1 175
0.40
217
y
p2 
X 2 150
= 0.60 → q2 =

n2 250
 p  p = p  p =
2
1
1
2
p1q1 p2 q2
(0.48)(0.52) (0.60)(0.40)
= 0.049



n1
n2
175
250
Z0  p1  p2 = 2.575 (0.049) = 0.126
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.60 – 0.48) – 0.126; (0.60 – 0.48) + 0.126] = [0.12 ± 0.126]
P1 - P2  [-0.006; 0.246] con el 99% de confianza.
Rpta.
Interpretación: con el 99% de confianza, la diferencia de proporciones de
mujeres (P2) y de hombres (P1) que coopera respondiendo a cuestionarios de
los entrevistadores puerta por puerta, está entre -0.006 y 0.246.
b) La pregunta ¿Es diferente la proporción de mujeres y hombres cooperadores?
implica preguntar si ¿P2 ≠ P1? o también ¿P2 – P1 ≠ 0?
La diferencia P2 – P1 = 0 está incluida en el intervalo de confianza construido
en a), puede ser cero, es decir P2 – P1 = 0 o P2 = P1. Por lo tanto, no es
diferente la proporción de mujeres y hombres que cooperan respondiendo a
cuestionarios de los entrevistadores puerta por puerta.
Rpta.
26. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de
verano “Burberry”. De una muestra de 250 mujeres menores de 40 años, 150
estuvieron interesados, mientras que de 250 mujeres de 40 años a más, sólo 120
mostraron interés.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 años y las de 40
años a más que mostraron interés por los polos de verano “Burberry”.
b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de
40 años a más que mostraron interés por los polos de verano “Burberry”?
Explique.
Solución
Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a
más.
Datos:
n1 = 250,
X1 = 150,
n2 = 250
y
X2 = 120
a) El intervalo de confianza para la diferencia de proporciones de mujeres
menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por
los polos de verano “Burberry”, P1 - P2 está dado por:
218


P1  P2  ( p1  p2 )  Z   p1  p2 , ( p1  p2 )  Z   p1  p2  ............... (1)
1
1
2
2


Si 1 – α = 0.95, entonces Z0 = Z 0.975 = 1.96. Además:
p1 
X 1 150
= 0.60 → q1 = 0.40

n1 250
y
p2 
X 2 120
= 0.48 → q2 =

n2 250
0.52
 p p =
1
2
p1q1 p2 q2
(0.60)(0.40) (0.48)(0.52)
= 0.0443



n1
n2
250
250
Z0  p1  p2 = 1.96 (0.0443) = 0.087
Reemplazando valores en (1) se tiene que:
P1 - P2  [(0.60 – 0.48) – 0.087; (0.60 – 0.48) + 0.087] = [0.12 ± 0.087]
P1 - P2  [0.033; 0.207] con el 95% de confianza.
Rpta.
Interpretación: la diferencia de proporciones de mujeres menores de 40 años
(P1) y las de 40 años a más (P2) que mostraron interés por los polos de verano
“Burberry”, está entre 0.033 y 0.207 con el 99% de confianza.
b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las
de 40 años a más que mostraron interés por los polos de verano “Burberry”?
implica preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?
La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza construido
en a), no puede ser cero, es decir P1 - P2 ≠ 0
o
P1 ≠ P2. Por lo tanto, no es
diferente la proporción de mujeres menores de 40 años y las de 40 años a más que
mostraron interés por los polos de verano “Burberry”.
Rpta.
27. De los 2000 establecimientos pequeños de una ciudad se extrae una muestra
aleatoria de 25 establecimientos y se recolecta información sobre el número de
personas empleadas (X) por establecimiento, obteniéndose la siguiente
25
información:
 X i  138 y
i 1
25
X
i 1
2
i
 1145 .76 .
Calcule e interprete intervalos de confianza del 95 % para:
a) El número medio de empleados por establecimiento en la ciudad.
b) La varianza del número de empleados por establecimiento.
219
c) Para estimar en el futuro el número medio de empleados por establecimiento,
con un margen de error máximo de 0.9 empleados y una confianza del 95 %
¿qué tamaño mínimo de muestra será necesario?
Solución
Con la información dada se determina el promedio y la varianza muestral de los
empleados por establecimiento así:
25
X
X
i 1
n
i

138
= 5.52 empleados por establecimiento.
25
25
S2 
( X i  X )2
i 1
n 1
25

X
i 1
2
i
 nX 2

n 1
1145 .76  25 (5.52) 2
= 16 (empleados)2
25  1
S = 4 empleados. Otros datos: N = 2000 establecimientos, n = 25, 1 – α = 0.95.
a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1
de student (n < 30), si 1 – α = 0.95 → en la Tabla 3, t0 = t24 , 0.975 = 2.064.
El intervalo de confianza para la media se obtiene con la expresión:
  [ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
  [5.52 – 2.064 x
4
, 5.52 + 2.064 x
25
4
] = [5.52 ± 1.65]
25
Por lo tanto:   [3.87 ; 7.17] empleados con el 95% de confianza.
Rpta.
Interpretación: en la ciudad el verdadero número medio de empleados por
establecimiento pequeño, se encuentra entre 3.87 y 7.17 con el 95% de confianza.
b) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 25, S = 4 y 1 – α = 0.95, entonces en la Tabla 2:
2
a = x24
, 0.025 = 12.4
y
2
b = x24
, 0.975 = 39.4
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
220
 (25  1)(4) 2 (25  1)(4) 2 
²  
,

12.4
 39.4

Por lo tanto: ²  [9.75 ; 30.97 ] (emp.)² con el 95% de confianza.
Rpta.
Interpretación: la varianza del número de empleados por establecimiento
pequeño 9.75 y 30.97 (empleados)² con el 95% de confianza.
c) El tamaño de muestra está dado por: n0 
Z 2 2
E2
Donde: | x - µ | = E = 0.9, 1 – α = 0.95 → en la Tabla 1, Z = Z0.975 = 1.96
y S = 4. Reemplazando en la fórmula para n se tiene:
1.96 2 4 2
= 76 establecimientos.
n0 
0.9 2
Rpta.
Interpretación.- para estimar el número medio de empleados por
establecimiento, con el 95% de confianza y un error máximo de 0.9
empleados, se requiere de 76 establecimientos.
28. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16
onzas. Un inspector tomó una muestra que arrojó los siguientes pesos en onzas:
15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos de las cajas de cereal.
Solución
Con la información dada se determina el promedio y la varianza muestral de los
empleados por establecimiento así:
10
X
X
i 1
i
n

10
S2 
(X
i 1
i
159
= 15.9 onzas por caja.
10
10
 X )2
n 1

X
i 1
2
i
 nX 2
n 1

2528 .58  10 (15.9) 2
= 0.0533 (onzas)2
10  1
S = 0.231 onzas. Otros datos: n = 10 cajas, 1 – α = 0.90.
a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1
de student (n < 30), si 1 – α = 0.90 → en la Tabla 3, t0 = t9, 0.95 = 1.833.
221
El intervalo de confianza para la media se obtiene con la expresión:
  [ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
  [15.9 – 1.833 x
0.231
0.231
, 15.9 + 1.833 x
] = [15.9 ± 0.134]
10
10
Por lo tanto:   [15.766 ; 16.034] onzas con el 90% de confianza.
Rpta.
Interpretación: el verdadero peso medio de las cajas de cereal, se encuentra entre
15.766 y 16.034 onzas, con el 95% de confianza.
b) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 10, S = 0.231 y 1 – α = 0.90, entonces en la Tabla 2:
a = x92, 0.05 = 3.33
y
b = x92, 0.95 = 16.9
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (10  1)(0.231) 2 (10  1)(0.231) 2 
²  
,

16.9
3.33


Por lo tanto: ²  [0.0284;
0.1442] (onzas)² con el 90% de confianza.
Rpta.
Interpretación: con el 90% de confianza, la varianza del peso de las cajas de
cereal se encuentra entre 0.0284 y 0.1442 (onzas)².
29. Los pesos netos (grs.) de una muestra aleatoria de 10 latas de leche fueron los
siguientes:
259, 262, 259, 258, 256, 257, 257, 263, 258, 261
Calcule e interprete intervalos de confianza del 95 % para la media poblacional y
la varianza poblacional de los pesos netos.
Solución
El promedio y la varianza muestral de los empleados por establecimiento es:
222
10
X
X
i 1
n
i

2590
= 259 gr. por lata.
10
10
S2 
( X i  X )2
i 1
n 1
10

X
i 1
2
i
 nX 2

n 1
670858  10 (259) 2
= 5.3333 (gr.)2
10  1
S = 2.31 gr. Otros datos: n = 10 cajas, 1 – α = 0.95.
a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1
de student (n < 30), si 1 – α = 0.95 → en la Tabla 3, t0 = t9, 0.975 = 2.262.
El intervalo de confianza para la media se obtiene con la expresión:
  [ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
  [259 – 2.262 x
2.31
2.31
, 259 + 2.262 x
] = [259 ± 1.65]
10
10
Por lo tanto:   [257.35; 260.65] gr. con el 95% de confianza.
Rpta.
Interpretación: el verdadero peso medio de las de leche, se encuentra entre 257.35
y 260.65 gramos, con el 95% de confianza.
b) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 10, S = 2.31 y 1 – α = 0.95, entonces en la Tabla 2:
a = x92, 0.025 = 2.70
y
b = x92, 0.975 = 19.0
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (10  1)(2.31) 2 (10  1)(2.31) 2 
²  
,

19.0
2.70


Por lo tanto: ²  [2.53;
17.79] (gramos)² con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la varianza del peso de las latas de
leche se encuentra entre 2.53 y 17.79] (gramos)².
223
30. De un área de la ciudad en la que habitan 1000 familias se extrae una muestra
aleatoria de 20 familias y se recolecta información sobre el número de personas
(X) por familia, obteniéndose la siguiente información:
20
X
i 1
i
20
X
 105
i 1
2
i
 763
Calcule e interprete intervalos de confianza del 99 % para el(la) verdadero(a):
a) Número medio de personas por familia. ¿Aceptaría usted que el tamaño
medio de las familias es de 6 personas?
b) Número total de personas en el área.
c) La varianza del número de personas por familia en el área.
d) Para estimar en el futuro el número medio de personas por familia, con un
margen de error máximo de 0.6 personas y una confianza del 99 % ¿qué
tamaño mínimo de muestra será necesario?
Solución
Con la información dada se determina el promedio y la varianza muestral de los
empleados por establecimiento así:
20
X
X
i 1
i
n

20
S 
2
(X
i 1
i
105
= 5.25 persona por familia.
20
 X)
n 1
20
2

X
i 1
2
i
 nX 2
n 1
763  20 (5.25) 2

= 11.145 (personas)2
20  1
S = 3.34 personas. Otros datos: N = 1000 familias, n = 20, 1 – α = 0.99.
a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1
de student (n < 30), si 1 – α = 0.95 → en la Tabla 3, t0 = t19, 0.995 = 2.861.
El intervalo de confianza para la media se obtiene con la expresión:
  [ X - t0 S / n , X + t0 S / n ]
Reemplazando valores tenemos:
  [5.25 – 2.861 x
3.34
3.34
, 5.25 + 2.861 x
] = [5.25 ± 2.14]
20
20
Por lo tanto:   [3.11 ; 7.39] personas con el 99% de confianza.
Rpta.
224
Interpretación: en el área de la ciudad el verdadero número medio de personas por
familia, se encuentra entre 3.11 y 7.39 con el 99% de confianza.
b) Para hallar el intervalo de confianza para el total (Nμ) se multiplica los
límites de la media por N = 1000, así:
Total = Nµ ϵ 1000 [3.11 ; 7.39] = [3110 ; 7390] personas con el 99% de
confianza.
Rpta.
Interpretación.- con el 99% de confianza, el verdadero total de personas en el
área de la ciudad se encuentra entre 3110 y 7390 personas.
c) El intervalo de confianza para la varianza está dado por:
 (n  1) S 2 (n  1) S 2 
,
²  

b
a


Como n = 20, S = 3.34 y 1 – α = 0.99, entonces en la Tabla 2:
2
a = x19
, 0.005 = 6.84
y
2
b = x19
, 0.995 = 38.6
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
 (20  1)(3.34) 2 (20  1)(3.34) 2 
²  
,

38.6
6.84


Luego: ²  [5.49 ; 30.99 ] (personas)² con el 99% de confianza.
Rpta.
Interpretación: la varianza del número de personas por familia se encuentra entre
5.49 y 30.99 (personas)² con el 99% de confianza.
d) El tamaño de muestra está dado por: n0 
Z 2 2
E2
Donde: E = | x - µ | = 0.6, 1 – α = 0.99 → en la Tabla 1, Z = Z0.995 =
2.575 y S = 3.34. Reemplazando en la fórmula para n se tiene:
(2.575) 2 (3.34) 2
n0 
= 205.
(0.6) 2
Como f = n0 / N = 205 / 1000 = 0.205 > 0.05 es necesario ajustar el tamaño
de muestra así:
225
n
n0
205

= 170 familias
n0
205
1
1
1000
N
Rpta.
Interpretación.- para estimar el número medio de personas por familia, con
el 99% de confianza y un error máximo de 0.6 personas, se requiere de 170
familias.
31. Muestras del pago semanal a los obreros (1) y obreras (2) proporcionan los
siguientes datos: n1 = 15, x1 = $ 135, S1 = $ 25
y
n2 = 15, x 2 = $ 125,
S2 = $ 15. Calcule e interprete intervalos de confianza del 95% para:
a) La razón de varianzas de los pagos semanales a obreros y obreras. ¿Son
iguales las varianzas de los pagos semanales a obreros y obreras?
b) La diferencia entre los pagos medios semanales a obreros y obreras. ¿Son
diferentes los pagos medios semanales a obreros y obreras? Explique.
Solución
 12  S12 / S 22 S12 / S 22 
;
a) Intervalo de confianza para la razón de varianzas: 2 ϵ 

c 
2  d
Datos: n1 = n2 = 15, S12 = 252 = 625, S 22 = 152 = 225. Como 1 – α = 0.95,
entonces en la tabla 4: d = F14, 14, 0.975 = 2.98 y c = F14, 14, 0.025 = 1/ F14, 14, 0.975 = 1/
2.98 = 0.336.
Reemplazando valores en el intervalo se tiene que:
 12  625 / 225
625 / 225 
;
ϵ
= [0.93; 8.27] con el 95% de confianza.
2
0.336 
 2  2.98
Interpretación.- con el 95% de confianza, la razón de varianzas de los pagos
semanales a obreros y obreras, se encuentra entre 0.93 y 8.27.
Preguntar sí: ¿Son iguales las varianzas de los pagos semanales a obreros y
obreras? Es similar a preguntar sí: ¿  12 =  22 o
 12
= 1? La respuesta es sí, ya
 22
que el intervalo para la razón de varianzas toma el valor 1, es decir
 12
= 1,
 22
entonces  12 =  22 (las varianzas de los pagos semanales a obreros y obreras son
iguales)
226
b) Considerando que las muestras son pequeñas y que las varianzas de los pagos
semanales a obreros y obreras son iguales, el intervalo de confianza para la
diferencia entre los de los pagos semanales a obreros y obreras está dado por:
1 - 2 ϵ [( x1 - x 2 )  t0
(n1  1)S12  (n2  1)S 22
n1  n2  2
1 1

]
n1 n2
Datos del problema:
n1 = 15, x1 = $ 135, S1 = $ 25
y
n2 = 15, x 2 = $ 125, S2 = $ 15.
Los grados de libertad de la t son n1 + n2 – 2 = 15 + 15 – 2 = 28.
Si 1 – α = 0.95,
 En la tabla 3, t0 = t28, 0.975 = 2.048.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:
1 - 2 ϵ [(135 – 125)  2.048
(15  1)(25) 2  (15  1)(15) 2
15  15  2
1 1

]
15 15
 1 - 2 ϵ [10  2.048(7.53) ]  1 - 2 ϵ [10  15.42 ]
Por lo tanto:
1 - 2 ϵ [-5.42 ; 25.42] $ con el 95% de confianza.
Rpta.
Interpretación: la diferencia entre los pagos semanales a obreros y obreras, se
encuentra comprendida entre $ -5.42 y 25.42 con el 95% de confianza.
Preguntar sí, ¿Son diferentes los pagos medios semanales a obreros y
obreras? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La respuesta es no,
ya que el intervalo para su diferencia de medias toma el valor cero, es decir,
1 - 2 = 0 o 1 = 2. Entonces, los pagos medios semanales a obreros y
obreras son iguales.
32. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para
secretarias, aprenden taquigrafía por dos métodos diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio
123 palabras por minuto con una desviación estándar de 15 palabras, mientras
que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de
10 palabras. Calcule e interprete intervalos de confianza del 99 % para:
a) La verdadera razón de varianzas de los 2 grupos. ¿Son heterogéneas las
varianzas de ambos grupos?
b) La diferencia de medias de palabras por minuto de ambos métodos. ¿Es
diferente el promedio de palabras por minuto para los dos métodos?
227
Solución
Datos: n1 = 16, x1 = 123, S1 = 15
y
n2 = 16, x 2 = 110, S2 = 10.
a) Intervalo de confianza para la razón de varianzas:
 12  S12 / S 22 S12 / S 22 
;
ϵ

c 
 22  d
Si: n1 = n2 = 16, S12 = 152 = 225, S 22 = 102 = 100. Como 1 – α = 0.99, entonces
en la tabla 4: d = F15, 15, 0.995 = 4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/ 4.07 =
0.246.
Reemplazando valores en el intervalo se tiene que:
 12  225 / 100
225 / 100 
ϵ
= [0.55; 9.15] con el 99% de confianza.
;
2
0.246 
 2  4.07
Interpretación.- con el 99% de confianza, la razón de varianzas de las palabras por
minuto de ambos grupos, se encuentra entre 0.55 y 9.15.
Preguntar sí: ¿Son heterogéneas las varianzas de ambos grupos? Es similar a
preguntar sí: ¿  12 ≠  22 o
 12
≠ 1?
 22
La respuesta es no, ya que el intervalo para la razón de varianzas toma el valor 1,
es decir
 12
= 1, entonces  12 =  22 (las varianzas son homogéneas o iguales)
2
2
b) Considerando que las muestras son pequeñas y que las varianzas de las palabras
por minuto de ambos grupos son iguales, el intervalo de confianza para la
diferencia de medias de palabras por minuto de los dos métodos está dado por:
1 - 2 ϵ [( x1 - x 2 )  t0
(n1  1)S12  (n2  1)S 22
n1  n2  2
1 1

]
n1 n2
Datos del problema:
n1 = 16, x1 = 123, S1 = 15
y
n2 = 16, x 2 = 110, S2 = 10.
Los grados de libertad de la t son n1 + n2 – 2 = 16 + 16 – 2 = 30.
Si 1 – α = 0.99,
 En la tabla 3, t0 = t30, 0.995 = 2.75.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:
1 - 2 ϵ [(123 – 110)  2.75
(16  1)(15) 2  (16  1)(10) 2
16  16  2
 1 - 2 ϵ [13  2.75(4.51) ]  1 - 2 ϵ [13  12.4]
228
1 1
 ]
16 16
Por lo tanto:
1 - 2 ϵ [0.6 ; 25.4] palabras por minuto con el 95% de confianza.
Rpta.
Interpretación: la diferencia de medias de los dos métodos, se encuentra
comprendida entre 0.6 y 25.4 palabras por minuto con el 95% de confianza.
Preguntar sí, ¿Es diferente el promedio de palabras por minuto para los 2
métodos? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La respuesta es
sí, ya que el intervalo para su diferencia de medias no toma el valor cero, es
decir, 1 - 2 ≠ 0 o 1 ≠ 2. Entonces, el promedio de palabras por minuto
para ambos métodos sí es diferente.
33. Para determinar el costo medio de la enseñanza en las universidades 1 y 2, se
toma una muestra al azar de 21 alumnos de la universidad 1 arrojando un costo
medio de S/. 675 y una desviación estándar de S/ 90. Una muestra al azar de 21
alumnos de la universidad 2 da una costo medio de S/. 650 y una desviación
estándar de S/. 50. Calcule e interprete intervalos de confianza del 95% para:
a) La razón de varianzas de los costos de enseñanza en las universidades 1 y 2.
¿Son diferentes las varianzas de los costos de enseñanza en las 2
universidades?
b) La diferencia del costo medio de la enseñanza en las 2 universidades. ¿Son
diferentes los costos medios de la enseñanza en las universidades 1 y 2?
Solución
Datos: n1 = 21, x1 = S/. 675, S1 = 90
y
n2 = 21, x 2 = 650, S2 = 50.
 12  S12 / S 22 S12 / S 22 
;
a) Intervalo de confianza para la razón de varianzas: 2 ϵ 

c 
2  d
Si: n1 = n2 = 21, S12 = 902 = 8100, S 22 = 502 = 2500. Como 1 – α = 0.95,
entonces en la tabla 4: d = F20, 20, 0.975 = 2.46 y c = F20, 20, 0.025 = 1/ F20, 20, 0.975 = 1/
2.46 = 0.407.
Reemplazando valores en el intervalo se tiene que:
 12  8100 / 2500
8100 / 2500 
;
ϵ
2
 = [1.32; 7.96] con el 95% de confianza.
0.407
 2  2.46
229
Interpretación.- con el 95% de confianza, la razón de varianzas de los costos de
enseñanza en las universidades 1 y 2, se encuentra entre 1.32 y 7.96.
Preguntar sí: ¿Son diferentes las varianzas de los costos de enseñanza en las 2
universidades? Es similar a preguntar sí: ¿  12 ≠  22 o
 12
≠ 1?
 22
La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor
1, es decir
 12
≠ 1, entonces  12 ≠  22 (las varianzas de los costos de enseñanza
2
2
en las 2 universidades son diferentes o heterogéneas)
b) Considerando que las muestras son pequeñas y que las varianzas de los costos de
enseñanza en las 2 universidades son diferentes, el intervalo de confianza para la
diferencia de medias de los costos de enseñanza en las 2 universidades está dado
por:
S12 S 22

]
n1 n2
1 - 2 ϵ [( x1 - x 2 )  t0
Datos del problema:
n1 = 21, x1 = S/. 675, S12 = 8100 y
n2 = 21, x 2 = 650, S 22 = 2500.
Si 1 – α = 0.95,  en la tabla 3: t0 = tH, 0.975 = t31, 0.975 = 2.04.
2
2
 S12 S 22 
 8100 2500 






n1 n2 
21
21 


Donde: H =
=
= 31.27 ≡ 31
2
2
2
2
 8100 
 2500 
 S12 
 S 22 




 
 
 21    21 
 n1    n2 
21  1
21  1
n1  1
n2  1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
8100 2500

1 - 2 ϵ [(675 - 650)  2.04 x
] = [25  45.83]
21
21
Por lo tanto: 1 - 2 ϵ [-20.83 ; 70.83] S/. con el 95 % de confianza. Rpta.
Interpretación: con el 95% de confianza, la diferencia de los costos medios de
enseñanza en las universidades 1 y 2 se encuentra comprendido entre S/. -20.83
y S/. 70.83.
Preguntar sí: ¿Son diferentes los costos medios de la enseñanza en las
universidades 1 y 2? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La
230
respuesta es no, ya que el intervalo para su diferencia de medias toma el valor
cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, los costos medios de la
enseñanza en las universidades 1 y 2 no son diferentes, son iguales.
34. Dos máquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10
y
n2 = 12, x 2 = 495, S2 = 4.
Calcule e interprete intervalos de confianza del 99% para:
a) La razón de varianzas de los pesos de las bolsas con detergente de ambas
máquinas. ¿Son diferentes las varianzas de los pesos de las bolsas con
detergente de ambas máquinas?
b) La diferencia de los pesos medios de las bolsas con detergente de ambas
máquinas. ¿Son diferentes los pesos medios de las bolsas con detergente de
ambas máquinas?
Solución
Datos: n1 = 12, x1 = 505, S1 = 10
y
n2 = 12, x 2 = 495, S2 = 4.
a) Intervalo de confianza para la razón de varianzas:
 12  S12 / S 22 S12 / S 22 
;
ϵ

c 
 22  d
Si: n1 = n2 = 12, S12 = 102 = 100, S 22 = 42 = 16. Como 1 – α = 0.99, entonces en
la tabla 4: d = F11, 11, 0.995 = 5.32 y c = F11, 11, 0.005 = 1/ F11, 11, 0.995 = 1/ 5.32 = 0.188.
Reemplazando valores en el intervalo se tiene que:
 12 100 / 16
100 / 16 
ϵ
= [1.17; 33.24] con el 99% de confianza.
;
2
0.188 
 2  5.32
Interpretación.- con el 99% de confianza, la razón de varianzas de los pesos de las
bolsas con detergente de ambas máquinas, se encuentra entre 1.17 y 33.24.
Preguntar sí: ¿Son diferentes las varianzas de los pesos de las bolsas con
detergente de ambas máquinas? Es similar a preguntar sí: ¿ 
1?
231
2
1
≠
2
2
 12
o
≠
 22
La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor
 12
1, es decir 2 ≠ 1, entonces  12 ≠  22 (las varianzas de los pesos de las bolsas
2
con detergente de ambas máquinas son diferentes o heterogéneas)
b) Considerando que las muestras son pequeñas y que las varianzas de los pesos de
las bolsas con detergente de ambas máquinas son diferentes, el intervalo de
confianza para la diferencia de medias de los pesos de las bolsas con detergente
de ambas máquinas está dado por:
S12 S 22

]
n1 n2
1 - 2 ϵ [( x1 - x 2 )  t0
Datos del problema:
n1 = 12, x1 = 505, S12 = 100 y
n2 = 12, x 2 = 495, S 22 = 16.
Si 1 – α = 0.99,  en la tabla 3: t0 = tH, 0.995 = t14, 0.995 = 2.977.
2
2
 S12 S 22 
100
16





 

n1 n2 
12 12 


Donde: H =
=
= 14.43 ≡ 14
2
2
2
2
 100 
 16 
 S12 
 S 22 


 
 
 
12
12


n
n
 1   2 
 
12  1 12  1
n1  1
n2  1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
100 16
 ] = [10  9.26]
1 - 2 ϵ [(505 - 495)  2.977 x
12 12
Por lo tanto: 1 - 2 ϵ [0.74 ; 19.26] gr. con el 99 % de confianza. Rpta.
Interpretación: con el 99% de confianza, la diferencia de los pesos medios de las
bolsas con detergente de ambas máquinas se encuentra comprendido entre 0.74 y
19.26 gramos.
Preguntar sí: ¿Son diferentes los pesos medios de las bolsas con detergente de
ambas máquinas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La
respuesta es sí, ya que el intervalo para su diferencia de medias no toma el
valor cero, es decir, 1 - 2 ≠ 0 o 1 ≠ 2. Entonces, los pesos medios de las
bolsas con detergente de ambas máquinas sí son diferentes.
232
35. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración
en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos
resultados:
n1 = 16,
x1 = 49,658, S1 = 2,150
y
x 2 = 48,125,
n2 = 16,
S2 =
1,875.
Calcule e interprete intervalos de confianza del 99% para:
a) La razón de varianzas de la duración de las llantas de ambas marcas. ¿Son
diferentes las varianzas de la duración de las llantas de ambas marcas?
b) La diferencia de las duraciones medias de las llantas de ambas marcas. ¿Son
diferentes las duraciones medias de las llantas de ambas marcas?
Solución
Datos:
n1 = 16,
x1 = 49,658, S1 = 2,150
y
n2 = 16,
x2
=
48,125, S2 = 1875.
a) Intervalo de confianza para la razón de varianzas:
 12  S12 / S 22 S12 / S 22 
;
ϵ

c 
 22  d
Si: n1 = n2 = 16, S12 = 4’622,500, S 22 = 3’515,625. Como 1 – α = 0.99,
entonces en la tabla 4: d = F15, 15, 0.995 = 4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/
4.07 = 0.246.
Reemplazando valores en el intervalo se tiene que:
 12
4622500 / 3515625 
 4622500 / 3515625
ϵ 
;
2
 = [0.32; 5.34] con el
4.07
0.246
2

99% de confianza.
Interpretación.- con el 99% de confianza, la razón de varianzas de la duración de
las llantas de ambas marcas, se encuentra entre 0.32 y 5.34.
Preguntar sí: ¿Son diferentes las varianzas de la duración de las llantas de ambas
marcas? Es similar a preguntar sí: ¿  ≠ 
2
1
2
2
 12
o
≠ 1?
 22
La respuesta es no, ya que el intervalo para la razón de varianzas toma el valor 1,
 12
es decir 2 = 1, entonces  12 =  22 (las varianzas de la duración de las llantas
2
de ambas marcas son homogéneas o iguales).
233
b) Considerando que las muestras son pequeñas y que las varianzas de la duración de
las llantas de ambas marcas son iguales, el intervalo de confianza para la
diferencia de medias de la duración de las llantas de ambas marcas está dado por:
1 - 2 ϵ [( x1 - x 2 )  t0
(n1  1)S12  (n2  1)S 22
n1  n2  2
1 1

]
n1 n2
Datos del problema:
n1 = 16, x1 = 49,658, S1 = 2,150
y
n2 = 16,
x 2 = 48,125, S2 = 1,875.
Los grados de libertad de la t son n1 + n2 – 2 = 16 + 16 – 2 = 30.
Si 1 – α = 0.99,
 En la tabla 3, t0 = t30, 0.995 = 2.75.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:
1
-
2
ϵ
[(49,658
(16  1)(2150 ) 2  (16  1)(1875) 2
16  16  2
–
48,125)

2.75
1 1

]
16 16
 1 - 2 ϵ [1533  2.75(713.18) ]  1 - 2 ϵ [1533  1961.25]
Por lo tanto:
1 - 2 ϵ [-428.25 ; 3594.25] Km. con el 99% de confianza.
Rpta.
Interpretación: con el 99% de confianza, la diferencia de duraciones medias de las
llantas de las marcas 1 y 2, se encuentra comprendida entre -428.25 ; 3594.25
Km.
Preguntar sí, ¿Son diferentes las duraciones medias de las llantas de ambas
marcas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0?
La respuesta es no, ya que el intervalo para su diferencia de medias toma el
valor cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, las duraciones medias de
las llantas de ambas marcas no son diferentes, son iguales.
234
5.12 PROBLEMAS PROPUESTOS
1.
Demuestre que:
a) Las desigualdades µ - E < x < µ + E, son equivalentes a | x - µ | < E
b) Si 1    P(t1 / 2  T  t1 / 2 ) y T  ( x   ) n / s entonces:
s
s
1    P( x  t1 / 2
   x  t1 / 2
)
n
n
2.
Se desea estimar el peso total de una partida de 10,000 manzanas. Para ello se
selecciona una muestra aleatoria de 50 manzanas, la cual da una media de 300
gramos y una desviación estándar de 25 gramos. Calcule e interprete intervalos
de confianza del 95 % para:
a) El verdadero peso medio de las manzanas y el peso total (Nμ).
b) La verdadera varianza (σ2) de los pesos de las manzanas.
c) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 8 gramos con el 95 %
3.
Se toma una muestra al azar de 45 alumnos, sin reposición de una clase de
estadística de 221 alumnos que dan una calificación final media de 70 puntos y
una desviación típica de 9 puntos. Determine el intervalo de confianza del 95 %
para la media y la varianza de las calificaciones.
4.
Un proceso está programado para embolsar la cantidad media de 500 gramos de
frejol. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
496.5 gramos y una desviación típica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio
de las bolsas de frejol. ¿Se puede afirmar que no se está cumpliendo con el
contenido medio en las bolsas de frejol?
b) ¿Qué tamaño de muestra debe tomarse, si se desea que X difiera de µ en
menos de 3 gramos con el 95 % de confianza?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de
los pesos de las bolsas con frejol.
5.
Una universidad grande quiere estimar el número medio de días de enfermedad
de los estudiantes durante un año; una muestra de 50 estudiantes indica que
235
x = 3.2 días y S = 5.2 días. Calcule e interprete intervalos de confianza del 95%
para:
a) La media μ y la varianza σ2.
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 10 gr. con el 95 % de confianza?
6.
Una muestra de 50 animales experimentales reciben una cierta clase de ración
por un período de 2 semanas. Sus aumentos de pesos arrojan los valores x =
480 gr. y S = 30 gr. Calcule e interprete intervalos de confianza del 99% para:
a) La media μ y la varianza σ2.
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 13 gr. con el 99 % de confianza?
7.
Se acaba de lanzar al mercado una nueva marca de cigarrillos; un estudio en 35
cigarros, para determinar su contenido medio de nicotina dio x = 25.4 mg. y S =
1.9 mg. Calcule e interprete intervalos de confianza del 95% para:
a) El verdadero contenido medio μ de nicotina y la verdadera varianza (σ2) del
contenido de nicotina.
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 13 mg. con el 95 % de confianza?
8.
De los 500 establecimientos pequeños de una ciudad, se ha tomado una muestra
aleatoria de 50, obteniéndose los siguientes datos sobre el número de empleados
por establecimiento:
Empleados por establecimiento (Xi)
0
1
2
3
4
5
Establecimientos (ni)
10
15
12
6
4
3
Calcule e interprete intervalos de confianza del 99 % para:
a) El número medio de empleados por establecimiento en la ciudad.
b) El total de empleados en los establecimientos pequeños de la ciudad.
c) La proporción de establecimientos pequeños con 2 ó más empleados.
d) El total de establecimientos pequeños que emplean a 2 ó más personas.
236
9.
Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana
(con 1.4 millones de hogares) indica que el 35 % de los hogares tiene acceso a
internet. Calcule e interprete un intervalo de confianza del 95 % para:
a) La proporción de hogares limeños que tiene acceso a internet;
b) El total de hogares limeños que tiene acceso a internet;
c) Con un error del 2.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de
muestra necesario para estimar la proporción de hogares que tiene acceso a
internet?
10. En una muestra aleatoria de 400 hinchas del fútbol peruano (de un total de 15
millones) se encontró que 140 opinan que Perú clasifica al mundial de fútbol.
a) Calcule e interprete un intervalo del 99% de confianza para la proporción
verdadera y el total de hinchas que opinan que Perú clasifica al mundial de
fútbol.
b) Con un 99% de confianza y un error máximo del 3%, ¿qué tamaño de muestra
será necesario para estimar la proporción de hinchas que opinan que Perú
clasifica al mundial de fútbol?
11. De una población de 4.5 millones de ciudadanos, se selecciona una muestra
aleatoria de 2,000 y se halla que 520 están de acuerdo con la gestión del actual
presidente. Calcule e interprete intervalos de confianza del 95 % para:
a) La fracción de la población de ciudadanos que están de acuerdo con la gestión
del actual presidente.
b) El total de votantes que están de acuerdo con la gestión del presidente.
c) Con un 95% de confianza y un error máximo del 4%, ¿qué tamaño de muestra
será necesario para estimar la proporción de ciudadanos que están de acuerdo
con la gestión del actual presidente?
12. De una población de 100,000 fumadores, se selecciona una muestra aleatoria de
1,000 fumadores y se encuentra que 350 tienen preferencia por la marca A.
Calcule e interprete intervalos de confianza del 90 % para:
a) La proporción de la población de fumadores que prefieren la marca A.
b) El total de fumadores que prefieren la marca A.
237
c) Con el 95 % de confianza, ¿Qué tamaño de muestra debe tomarse, si se desea
un error máximo del 5%?
13. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana
(con 1.4 millones de hogares) indica que el 16.3 % de los hogares usa tele cable.
a) Determine un intervalo de confianza del 95 % para la proporción y otro para
el total de hogares limeños que usan tele cable.
b) Con un error del 2.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de
muestra necesario para estimar la proporción de hogares que usa tele cable?
14. De una población de 1’500000 ciudadanos de una región, se selecciona una
muestra aleatoria de 2,000 ciudadanos y se halla que 1,140 están contentos con
el actual presidente regional.
a) Calcule e interprete intervalos de confianza del 90 % para la fracción de la
población de ciudadanos y otro para el total que están a favor del actual
presidente regional.
b) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea
cometer un error máximo del 5%?
15. En un estudio para determinar el gasto medio mensual en luz en las ciudades A y
B, se toma una muestra al azar de 250 hogares de A arrojando un gasto medio de
S/. 120 y una desviación estándar de 15. Una muestra al azar de 200 hogares de
la ciudad B da una gasto medio de 105 y una desviación estándar de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto
medio mensual en luz en las ciudades A y B.
b) ¿Será diferente el gasto medio mensual en luz en las ciudades A y B?
16. Para determinar el costo medio de la enseñanza en las universidades A y B, se
toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo
medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al azar de 121
alumnos de la universidad B da una costo medio de S/. 675 y una desviación
estándar de S/. 90.
a) Calcule e interprete intervalos de confianza del 95% para la diferencia del
costo medio de la enseñanza en las universidades A y B.
b) ¿Será diferente el costo medio de la enseñanza en las universidades A y B?
238
17. Una muestra al azar de 200 pilas para calculadoras de la marca A muestra una
vida media de 240 horas y una desviación estándar de 10 horas. Una muestra al
azar de 120 pilas de la marca B da una vida media de 225 horas y una desviación
estándar de 9 horas.
a) Determine un intervalo de confianza del 99 % para la diferencia de la vida
media de las pilas A y B.
b) ¿Será diferente la duración media de las pilas A y B? Explique.
18. Dos grupos escogidos al azar, cada uno de 40 alumnas, de una escuela para
secretarias, aprenden taquigrafía por dos sistemas diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el primer grupo obtiene en
promedio 120 palabras por minuto con una desviación estándar de 11 palabras,
mientras que el segundo grupo promedia 115 palabras por minuto con una
desviación estándar de 10 palabras.
a) Determine un intervalo de confianza del 95 % para la diferencia de medias de
palabras por minuto con los dos métodos.
b) ¿Serán diferentes las medias de palabras por minuto con los 2 métodos?
Explique.
19. En un estudio para determinar el gasto medio semanal en alimentos en las
ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la ciudad 1
arrojando un gasto medio de S/. 150 y una desviación estándar de 15. Una
muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 135 y una
desviación estándar de 10.
a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del
gasto medio en las ciudades 1 y 2.
b) ¿Será igual el gasto medio semanal en alimentos en las ciudades 1 y 2?
20. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2;
muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron
estos resultados: X 1 = 160, n1 = 200, S1 = 60
S2 = 50.
239
y
X 2 = 150, n2 = 150,
a) Calcule e interprete un intervalo del 95 % de confianza para la verdadera
diferencia entre los gastos medios mensuales en educación de las familias de
las dos ciudades;
b) ¿Difieren los gastos medios en educación de ambas ciudades? Explique
21. En una muestra aleatoria de 400 adultos, 220 están de acuerdo con la gestión
presidencial. Mientras que en una muestra de 600 jóvenes, 300 están de acuerdo
con la gestión presidencial.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de adultos y jóvenes que están de acuerdo
con la gestión presidencial.
b) ¿Se puede afirmar que hay una diferencia entre las verdaderas proporciones
de adultos y jóvenes que están de acuerdo con la gestión presidencial?
22. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de
casacas de cuero. De una muestra de 300 mujeres de 40 años a más, 75
estuvieron interesadas, mientras que de 200 mujeres menores 40 años, 80
mostraron interés.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 años y las de 40
años a más que mostraron interés por la compra de casacas de cuero.
b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de
40 años a más que mostraron interés por la compra de casacas de cuero.
Explique.
23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 hombres,
300 de las cuales están a favor del cambio curricular. En una muestra de 400
mujeres, 240 indican que están a favor de lo mismo.
a) Determine un intervalo de confianza del 99 % para la proporción de alumnas
que están a favor del cambio curricular.
b) ¿Se puede afirmar que hay diferencia entre las verdaderas proporciones de
alumnos y alumnas que están a favor del cambio curricular?
24. Se entrevistaron dos grupos de hombres respecto a su interés en una nueva
rasuradora eléctrica que tiene cuatro navajas. De una muestra de 60 hombres
240
menores de 40 años, sólo 12 estuvieron interesados, mientras que de 40 hombres
mayores 40 años, sólo 5 mostraron interés.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de hombres menores de 40 años y mayores
de 40 años que mostraron interés.
b) ¿Existe diferencia entre las verdaderas proporciones de hombres menores de
40 años y mayores de 40 años que mostraron interés? Explique.
25. Se entrevistaron dos grupos de mujeres respecto a su interés por la transmisión
de encuentros de voleibol por TV. De una muestra de 120 mujeres de 40 años a
más, sólo 30 estuvieron interesadas, mientras que de 100 mujeres menores 40
años, sólo 40 mostraron interés.
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de mujeres menores de 40 años y las de 40
años a más que mostraron interés.
b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de
40 años a más que mostraron interés. Explique.
26. Es ampliamente conocido que no cualquiera coopera respondiendo a los
cuestionarios de los entrevistadores puerta por puerta. En un experimento para
determinar si las personas mayores (1) son más cooperadoras que los jóvenes
(2), se obtuvieron los siguientes resultados:
Mayores (1): n1 = 250, X1 = 150;
Jóvenes (2): n2 = 200, X2 = 110
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia
entre las verdaderas proporciones de personas mayores y de jóvenes que
cooperaron con los entrevistadores.
b) ¿Existe diferencia entre las proporciones de mayores y de jóvenes que
cooperan? Explique.
27. Se entrevistaron a un grupo de hombres en las ciudades de Cusco y Puno
respecto a su interés por la compra de abrigos de lana. De una muestra de 400
cusqueños, sólo 160 estuvieron interesados, mientras que de 300 puneños, sólo
90 mostraron interés.
241
a) Calcule e interprete un intervalo del 99 % de confianza para la diferencia
entre las verdaderas proporciones de cusqueños y puneños que mostraron
interés por la compra de abrigos de lana.
b) ¿Existe diferencia entre la proporción de cusqueños y puneños que mostraron
interés por la compra de abrigos de lana? Explique.
28. Las cajas de un cereal producido por una fábrica deben tener un contenido de
160 gramos. Un inspector tomó una muestra que arrojó los siguientes pesos en
gramos:
157, 157, 163, 158, 161, 159, 162, 159, 158, 156
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos.
29. Los pesos netos (grs.) de diez latas de conserva fueron los siguientes:
159, 162, 159, 158, 156,157, 157, 163, 158, 161
Calcule e interprete intervalos de confianza del 90 % para la media poblacional y
la varianza poblacional de los pesos netos.
30. De las 1500 micro empresas de una ciudad se extrae una muestra aleatoria de 20
y se recolecta información sobre el número de personas empleadas (X) por
empresa, obteniéndose la siguiente información:
20
20
 X i  210
X
i 1
i 1
2
i
 1526
Calcule e interprete intervalos de confianza del 95 % para el(la) verdadero(a):
a) Número medio de empleados por micro empresa en la ciudad. ¿Aceptaría
usted que el tamaño medio de las microempresas es de 7 empleados?
b) Número total de empleados en las micro empresas.
c) La varianza del número de empleados por micro empresa.
d) Para estimar en el futuro el número medio de empleados por establecimiento,
con un margen de error máximo de 0.8 empleados y una confianza del 95 %
¿qué tamaño mínimo de muestra será necesario?
31. Los contenidos netos (ml.) de una muestra aleatoria de 10 frascos de yogurt
fueron los siguientes: 248, 254, 249, 252, 250, 253, 250, 249, 247, 248
Calcule e interprete intervalos de confianza del 99 %
242
a) Para la media poblacional de los contenidos netos en los frascos.
b) La varianza poblacional de los contenidos netos en los frascos.
c) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en
menos de 1.5 ml. con el 99 % de confianza?
32. La producción de 13 obreros de la jornada diurna, dio un promedio de 82 piezas
con una desviación estándar de 10, mientras que para 11 obreros de la jornada
nocturna, dio un promedio de 74 con una desviación estándar de 7. Calcule e
interprete intervalos de confianza del 95% para:
a) La razón de varianzas de la producción de ambas jornadas. ¿Serán
heterogéneas las varianzas de ambos grupos?
b) La diferencia de la producción media de ambos grupos. ¿Son diferentes las
producciones medias de ambas jornadas?
33. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno
diurno, dio un promedio de 112 con una desviación estándar de 6; mientras que
para 15 estudiantes del turno nocturno, dio un promedio de 105 con una
desviación estándar de 15. Calcule e interprete intervalos de confianza del 99 %
para:
a) La verdadera razón de varianzas de los cocientes de inteligencia de los
alumnos de ambos turnos. ¿Son heterogéneas las varianzas de los 2 turnos?
b) La verdadera diferencia de las medias de los cocientes de inteligencia de los
alumnos de ambos turnos. ¿Son diferentes los cocientes medios de
inteligencia de los 2 grupos?
34. Dos máquinas producen diariamente mil latas de conservas cada una
independientemente. Mediante muestra aleatoria sin reemplazo de 16 latas
tomadas de cada máquina se han obtenido los siguientes resultados sobre el peso
de las latas (en gramos): n1 = 16,
x1 = 495, S1 = 5
y
n2 = 16,
x2 =
505, S2 = 7.
Calcule e interprete intervalos de confianza del 99% para:
a) La razón de varianzas de los pesos de las latas de conservas de ambas
máquinas. ¿Son diferentes las varianzas de los pesos de las latas de conservas
de ambas máquinas?
243
b) La diferencia de los pesos medios de las latas de conservas de ambas
máquinas. ¿Son diferentes los pesos medios de las latas de conservas de
ambas máquinas?
35. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad
particular realizada por las empresas de dos ciudades. Mediante muestras
aleatorias de 20 empresas tomadas en cada ciudad se han obtenido los siguientes
resultados:
n1 = 20,
x1 = 458, S1 = 25
y
n2 = 20,
x 2 = 385, S2 = 15.
Calcule e interprete intervalos de confianza del 95% para:
a) La razón de varianzas de los gastos mensuales en seguridad particular
realizada por las empresas de ambas ciudades. ¿Son diferentes las varianzas
de los gastos mensuales en seguridad particular realizada por las empresas de
ambas ciudades?
b) La diferencia de los gastos medios mensuales en seguridad particular
realizada por las empresas de ambas ciudades. ¿Son diferentes los gastos
medios mensuales en seguridad particular realizada por las empresas de
ambas ciudades?
244
Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS
PARAMÉTRICAS
“El pensamiento estadístico será un día tan necesario para el
ciudadano eficiente como la capacidad de leer y escribir.” H.G. Wells
CONTENIDO
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
6.9
6.10
Prueba de hipótesis para la media (con varianza conocida).
Prueba de hipótesis para la media (con varianza desconocida).
Prueba de hipótesis acerca de una varianza.
Prueba de hipótesis para la razón de varianzas.
Prueba de hipótesis acerca de dos medias (varianzas conocidas).
Prueba de hipótesis acerca de dos medias (varianzas desconocidas).
Prueba de hipótesis para la proporción.
Prueba de hipótesis para la diferencia de proporciones.
Ejercicios resueltos.
Ejercicios propuestos.
En el capítulo anterior se ha desarrollado los diferentes aspectos relacionados con la
estimación, que han permitido establecer las bases para de una manera sencilla hacer el
contraste, prueba o docimasia de hipótesis. Prueba que es fundamental en la investigación
científica cuando se usa el modelo hipotético-deductivo, ya que frente a un problema de la
realidad tiene que formularse una hipótesis, cuyo contraste pasa muchas veces por el uso
de la estadística.
En este capítulo, se presenta los aspectos fundamentales de las pruebas de hipótesis, así
como la propuesta de contrastes de hipótesis estadísticas referidas a parámetros como: la
media, la varianza, la razón de varianzas, la diferencia de medias, la proporción y la
diferencia de proporciones.
Hipótesis Estadística
Es una aseveración que se hace acerca del valor del parámetro o los valores de los
parámetros de una población.
Ejemplo 1.El contenido medio de las bolsas de arroz es de  = 1 000 gr., la tasa de desempleo es del
12% (P = 0.12), las notas tienen distribución normal con  = 12 y  = 2.1 etc.
245
Planteamiento del Problema
Contrastar una hipótesis estadística es juzgar si cierta propiedad supuesta para una
población es compatible con lo observado en una muestra de ella. Es decir que:
La prueba estadística de una hipótesis es una regla que cuando los valores muestrales
son observados nos conducen a aceptar o rechazar la hipótesis bajo consideración.
Ejemplo 2.La “Compañía Agrícola Yapatera S.A.” embolsa arroz con un contenido medio de 1 000
gr. El proceso de llenado tiene distribución N ( = 1 000 gr. ,  = 3 gr.). Por razones
imprevisibles el proceso de llenado se desajusta a veces produciendo un aumento o
disminución del llenado medio sin variar la desviación estándar. Para contrastar si en
cierto momento el proceso se ha desajustado, se toma una muestra al azar de n = 5 bolsas
con arroz. Se pesan las bolsas obteniendo los siguientes datos:
1 005, 1 006, 1 004, 1 005 y 1 006 gr.
¿Podemos decir que el proceso de llenado se ha desajustado?
Si el proceso no se ha desajustado al ser X ~ N (1 000 , 9)
 X ~ N (1 000, 9 / 5) = N (1 000 , 1.8 ).
Calculando X = (1 005 + 1 006 + 1 004 + 1 005 + 1 006) / 5 = 1 005.2 gr.
El valor X = 1 005.2 gr. está muy alejado del valor central  = 1 000 gr. Para verlo
formalmente, estandaricemos la variable.
Z
X   1005 .2  1000

= 3.87. Es decir, se aleja más de 3.8 veces la desviación
X
1.342
estándar de la media. Por todo ello debemos pensar que el proceso se ha desajustado ya
que de ser correcto, la probabilidad de que una muestra de tamaño 5 tome como media 1
005.2 gr. es muy pequeña. Esta probabilidad es:
P( X ≥ 1 005.2) = P(Z ≥ 3.87) = 1 – P(Z  3.87) = 1 – 0.99995 = 0.00005 . Sumamente
menor al 0.005%.
Estos son los elementos fundamentales a tener en cuenta para el contraste de hipótesis, así
como su relación con los intervalos de confianza.
Para el ejemplo anterior   [1 001.5 , 1 008.9] gr. con el 95% de confianza.
246
Como  = 1 000 no pertenece al intervalo de confianza, entonces nos lleva a confirmar la
hipótesis de que  es diferente de 1 000 gr. y que se ha producido un desajuste en el
proceso de llenado de las bolsas con arroz.
Tipos de Hipótesis
Para efectuar el contraste de hipótesis se formula dos tipos de hipótesis: la nula y la
alternativa.
Hipótesis Nula .- se denota por H0 y es la hipótesis que se contrasta. Generalmente se
establece en forma exacta. Es la hipótesis que mantendremos hasta que los datos
demuestren su falsedad. Ejemplo: H0 : θ = θ0 .
La hipótesis nula refleja el valor que ha tenido el parámetro en un momento determinado,
pero pueda que haya cambiado dando lugar a la hipótesis alternativa.
Hipótesis Alternativa .- se denota por H1 o Ha y generalmente es especificada con menos
precisión. Es la suposición contraria a la que se quiere contrastar, que se acepta en caso la
hipótesis nula se rechace. Ejemplo: H1 : θ < θ0 , θ > θ0 o θ ≠ θ0 .
Al efectuar el contraste, hablamos de probar la hipótesis nula contra la hipótesis
alternativa, bajo el supuesto tentativo que la hipótesis nula es cierta. Ello porque la
hipótesis nula refleja el comportamiento que ha tenido (tiene o seguirá teniendo) el
parámetro, hasta que los datos demuestren su falsedad.
Tipos de Pruebas
Hay dos tipos principales de pruebas: las pruebas unilaterales y la prueba bilateral.
Cada una se identifica por la forma en que se formula H1.
1.
Pruebas Unilaterales o de una Cola
 Prueba de la cola inferior o prueba del lado izquierdo (cola izquierda)
Ho : θ = θ0
H1 : θ < θ0
Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha
disminuido.
247
 Prueba de la cola superior o prueba del lado derecho (cola derecha)
Ho : θ = θ0
H1 : θ > θ0
Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha
aumentado.
2.
Prueba Bilateral o de dos Colas
Ho : θ = θ0
H1 : θ ≠ θ 0
Este tipo de prueba se emplea, en caso de que el valor que se prueba no sea
verdadero, entonces, todos los demás valores son posibles.
Tipo de Errores
 Error tipo I: se comete al rechazar la hipótesis nula Ho cuando ésta es verdadera.
 = Nivel de significación = P (Error Tipo I) = P [Rechazar Ho / Ho es verdadera
Los valores más comunes de  son 0.05 y 0.01; porque el error debe ser bajo. Si
tuviéramos un nivel de confianza del 95% entonces, el nivel de significación sería
del 5%. Significaría que en 5 de cada 100 pruebas nos estaríamos equivocando al
rechazar Ho cuando esta es cierta.
 Error de tipo II: se comete cuando se acepta una hipótesis Ho siendo esta falsa.
La probabilidad de cometer este error la denotamos con la letra β.
β = P [Aceptar Ho / Ho es falsa ]
248
Decisión
(muestral)
Aceptar Ho
Rechazar Ho
Ho es verdadera
No hay error
Error tipo I
Ho es falsa
Error tipo II
No hay error
Los errores tipo I y tipo II se relacionan. Una disminución en la probabilidad de uno,
por lo general tiene como resultado un aumento en la probabilidad del otro.
La decisión de aceptar o rechazar la hipótesis bajo consideración H0 se hace
basándose en pruebas de muestras, por ello escogemos una función ˆ de las n
observaciones, ˆ = G(X1,
X2, …. , Xn ) como estadística de prueba, cuya
distribución por muestreo sea conocida en el supuesto (tentativo) que la hipótesis
nula H0 :  = 0 es cierta.
Las reglas de decisión sobre la aceptación o rechazo de H0 , se hace respecto al rango
de ˆ y un resultado particular ˆ de la muestra. Esto se hace hallando un valor ˆ C
llamado valor crítico de la estadística de prueba (a veces hay más de un valor
crítico) la cual divide al rango de ˆ en dos regiones: la región crítica o de rechazo
(R,C) y la región de aceptación (R.A). Si ˆ

R.C. rechazamos H0. Si ˆ

R.A.
aceptamos H0.
Región Crítica o de Rechazo
Es la región que contiene lo valores para los cuales se rechaza la hipótesis H0 bajo
consideración. Es la región del rango de ˆ que de acuerdo con una prueba prescrita,
conduce al rechazo de la hipótesis bajo consideración.
249
Región de Aceptación
Es la región que contiene lo valores para los cuales se acepta la hipótesis H0 bajo
consideración.
Pasos para el Contraste de Hipótesis
1.
Formular las hipótesis de acuerdo al problema.
H0 :
θ = θ0
H1 :
θ ≠ θ0
o
θ < θ0
o
θ > θ0
2.
Escoger el nivel de significación .
3.
Escoger la prueba estadística apropiada (Z, t, chi-cuadrado, F, etc.) cuya distribución
por muestreo sea conocida en el supuesto tentativo de que H0 es cierta. Esta prueba
estadística, debe ser función del estimador y del parámetro, al igual que en la
construcción de intervalos de confianza.
4.
Establecer la región crítica. Para ello tomar en cuenta la distribución de la prueba
estadística escogida.
5.
Calcular el valor de la prueba estadística, con la información de una muestra aleatoria
de tamaño n y bajo el supuesto que H0 es cierta.
6.
Conclusión: Si el valor calculado de la prueba estadística pertenece a la región
crítica, entonces rechazamos H0 y aceptamos H1. En caso contrario, si el valor
calculado de la prueba estadística pertenece a la región de aceptación, entonces
aceptamos H0 y rechazamos H1.
A continuación, utilizando los resultados de las distribuciones muestrales y de los
intervalos de confianza, veremos la aplicación de las pruebas de hipótesis para los
parámetros poblacionales como la media, diferencia de medias, la varianza, la
igualdad de varianzas, la proporción y la diferencia de proporciones. Cuyas
estadísticas de prueba van a estar referidas a distribuciones como la normal estándar,
t de student, chi cuadrado y F respectivamente.
Veamos cada una de ellas.
250
6.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza conocida)

Sea X la media de una muestra aleatoria de tamaño n seleccionada de una
población con media  y con varianza 2 supuestamente conocida.
Si la población es normal N(, 2), entonces, la distribución de la estadística

X es exactamente normal N(, 2/n). Si la población no es normal, para

cualquier valor de n  30, la distribución de X es aproximadamente normal
N(, 2/n). Si se necesita el factor de corrección para poblaciones finitas se usa
(N –n) / (n-1)
Entonces, la estadística para la prueba acerca de  con varianza 2 conocida es:

X
, cuya distribución es exacta o aproximadamente normal estándar
Z
/ n
N(0,1), según sea la población normal o no.
Si se supone verdadera la hipótesis nula: Ho:  = o, la estadística especificada

X  0
por esta hipótesis es entonces: Z 
/ n
A. Prueba bilateral o de dos colas
1. Hipótesis:
Ho:  = o ,
H1:   0
2. Escoger el nivel de significación: 

X
3. Estadística de prueba: Z 
, cuya distribución es normal N(0,1).
/ n
4. Región crítica: determinar el valor Z1-/2 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:
PZ  Z1 / 2    / 2 o PZ  Z1 / 2    / 2
En consecuencia, la región crítica en el rango de variación de Z es:
R.C.  Z  Z1 / 2 o Z  Z1 / 2 
Por otro lado, la probabilidad de aceptar H0 cuando se supone verdadera es:
P Z1 / 2  Z  Z1 / 2   1  
Resultando la región de aceptación: R.A.   Z1 / 2  Z  Z1 / 2 
251

5. Hallar Z calc
x  0

con la información muestral y suponiendo que Ho es
/ n
cierta.
6. Decisión: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).
No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .

Nota (Región crítica en X )



Si X es estimador de , se cumple H1:   0 cuando X < a o X > b
R.C  X  a o X  b

Si se sustituye Z  ( X   0 ) /( / n ) en RC resulta la región crítica en el rango

de variación X con: a  0  Z1 / 2 ( / n ) ,
y
b   0  Z1 / 2 ( / n )

La región de aceptación es el intervalo en X :

R. A.  [ a  X  b]


La regla de decisión es: Si x es el valor de X obtenido a partir de una muestra


aleatoria, se rechazará H0 con un riesgo , si x R.C. (o si x R. A.)
No se rechazará H0 en caso contrario.
B. Prueba unilateral de la cola derecha
1. Hipótesis:
Ho:  = o ,
H1:  > 0
2. Escoger el nivel de significación: 

X
3. Estadística de prueba: Z 
, cuya distribución es normal N(0,1).
/ n
4. Región crítica: determinar el valor Z1 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:
PZ  Z1 | H 0 :   0 verdadera  
En consecuencia, la región crítica en el rango de variación de Z es:
R.C.  {Z  Z1 }
252
R.A.  {Z  Z1 } .
La región de aceptación es:

5. Hallar Z calc
x  0

con la información muestral y suponiendo que Ho es
/ n
cierta.
6. Decisión: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).
No se rechaza H0 en caso contrario.

Nota: (Región Crítica en X )


Si X es estimador de , se cumple H1:  > 0 cuando X > b1

R.C.  { X  b1} donde: b1   0  z1 ( / n )

La región de aceptación es el intervalo: R. A.  { X  b1}


La regla de decisión es: Siendo x el valor de X obtenido a partir de una muestra


aleatoria de tamaño n, se rechazará H0 con un riesgo , si x R.C. (o si x R.A. ).
No se rechazará H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
Ho:  = o ,
1. Hipótesis:
H1:  < 0
2. Escoger el nivel de significación: 

X
3. Estadística de prueba: Z 
, cuya distribución es normal N(0,1).
/ n
4. Región crítica: determinar el valor Z1 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:
PZ   Z1 / Ho :   0 verdadera  
En consecuencia, la región crítica en el rango de variación de Z es:
R.C.  Z   Z1 
R.A.  Z   Z1 
La región de aceptación es:

5. Hallar Z calc
x  0

con la muestra y bajo el supuesto que Ho es cierta.
/ n
6. Decisión: se rechaza H0 con riesgo igual a , si Z calc R.C. (o si Z calc R.A. ).
253
No se rechaza H0 en caso contrario.

Nota: (Región crítica en X )


Si X es estimador de , se cumple H1:  < 0 cuando X < a1

RC  { X  a1} donde:
a1 =  0  Z1 ( / n )

Región de aceptación: RA  { X  a1}


Regla de decisión es: Si X es un valor de X obtenido a partir de una muestra


aleatoria de tamaño n, rechazará H0 con un riesgo  si x R.C. . (o si x R.A. ).
No se rechazará H0 en caso contrario.
Nota: Regla de decisión con el Intervalo de Confianza
La prueba de la hipótesis nula Ho:  = 0 contra H1:   0 a un nivel de
significación dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parámetro  y luego rechazar la hipótesis nula Ho:  = 0 si es que 0
 I .C.


En efecto, si x es un valor de X , no se rechaza Ho:  = 0 si el valor

Zcalc ϵ R.A. = [-Z1-α/2, Z1-α/2] donde Z calc  ( x  0 ) /( / n )

o, si
 Z1 / 2 
x  0

 Z1 / 2
n


 

,  0  z1 / 2
Esto es, no se rechaza Ho:  = 0 si x  R. A.   0  z1 / 2
n
n 

o equivalentemente si  0 se encuentra en el intervalo de confianza (I.C.) del 100(1 -
 
 

, x Z1 / 2
) % para :  0  I .C.   x Z1 / 2
n
n 


Por tanto, se rechaza H0 con riesgo , si x  R. A.
o si
0  I .C.
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Zcalc, de manera que:
254
 Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 3.Un proceso de empaquetar un producto está controlado, si el peso medio del
producto empaquetado es 400 gr. Si en una muestra aleatoria de 100 paquetes del
producto se ha encontrado que el peso medio es de 395 gramos. Suponga que el peso
de los productos empaquetados se distribuye normalmente con desviación estándar
de 20 gramos.
a) ¿Se podría concluir que el proceso está fuera de control al 5% de significación?
Halle P-valor.
b) Construya un intervalo de confianza del 95% para el peso medio del producto
empaquetado. ¿Aceptaría usted que  = 400 gr. (proceso controlado)?
Solución
a) Sea X la variable aleatoria definida como el peso de los paquetes del producto.
Se supone que la distribución de X es N(, (20)2).
1. Hipótesis: H0:  = 400 (proceso controlado) H1:   400 (proceso fuera de
control).
2. Nivel de significación:  = 0.05.
3. Estadística de prueba: Población normal con varianza conocida, la estadística es

X
cuya distribución es normal N(0,1).
Z
/ n
4. Región crítica: Si la hipótesis nula H0 es cierta, para  = 0.05 y la alternativa

bilateral, en la distribución de Z  ( X  400) /(20 / 100 ) , se encuentra el valor
crítico: Z1-/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC  Z calc  1.96 o Z calc  1.96

5. Cálculos, de los datos se tiene: n = 100,
Entonces:
255
x  395,
  20

Z calc
x  0 395  400


 2.5
2
/ n
6. Decisión: Puesto que Zcalc = -2.5  R.C. , debemos rechazar H0 y concluir con
un 5% de significación que el proceso de empaquetado no está controlado.
P-valor = P[|Z| > |-2.5|] = P[|Z| > 2.5] = 2 P[Z < -2.5] = 2(0.00621) = 0.01242.
Como el valor-P = 0.01242 <  = 0.05 se rechaza Ho y se acepta H1:   400 y se
concluye también con un 5% de significación que el proceso de empaquetado no
está controlado.

Nota: En el rango de variación de X , la región crítica es:




R.C.  { X  400  1.96 x2 o X  400  1.96 x2}  { X  396.08 o X  403.92}

Por el hecho que x  395 R.C. , se debe rechazar H0 y concluir con un riesgo de 5
% que el proceso de empaquetado no está controlado.
Cálculos utilizando Minitab (versión 15.0 en español)
Del menú escoger Estadísticas → Estadísticas básicas → 1Z Z de 1 muestra y
aparece la Ventana Z de 1 muestra (prueba e intervalo de confianza) siguiente:
256
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 100 y en
Media: 395 (la media muestral). Escribir la Desviación estándar: 20.
Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en
columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 400.
Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna:
no es igual a. Luego escoger Aceptar y Aceptar
En la hoja de Sesión aparecen los resultados siguientes:
Z de una muestra
Prueba de mu = 400 vs. no = 400
La desviación estándar supuesta = 20
N
100
Media del
Error
estándar
2.00
Media
395.00
IC de 95%
(391.08, 398.92)
Z
-2.50
P
0.012
Aparecen los resultados antes obtenidos: Zcalc = -2.5, el valor-P = 0.012 y el
intervalo de confianza del 95% para la media µ obtenido a continuación en b).
b) El intervalo de confianza del 95% para el peso medio  del producto empaquetado
viene dado por:

  X  Z


1

2
n
, X Z
 
1

2

n
…………. (1)
Datos: n = 100, X = 395, σ = 20, 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =
1.96.
El error de estimación para la media es:
E= Z

1

2
n
 1.96
20
= 3.92 gr.
100
Reemplazando en (1) se tiene:
µ ϵ [395 – 3.92 ; 395 + 3.92] = [391.08 ; 398.92] gr. con el 95% de confianza.
No se acepta que  = 400 gr. porque no pertenece al intervalo de confianza, por lo
tanto, se debe rechazar H0 y concluir con un 95 % de confianza que el proceso de
empaquetado no está controlado.
257
6.2
PRUEBA DE HIPÓTESIS
desconocida)
PARA
LA
MEDIA
(con
varianza
Población no normal
Si la población no tiene distribución normal y si la varianza es desconocida, para
probar hipótesis acerca de la media , sólo si, el tamaño de la muestra es grande

X  0
(n  30), se suele utilizar la estadística: Z 
/ n
N(0,1)
Luego, las regiones críticas de las pruebas de Ho:  = 0 contra cualquiera de las
tres alternativas H1:  > 0
H1:  < 0
o
o
H1:   0 son las mismas
(aproximadamente) de la sección anterior.
Población normal
Si la población tiene distribución normal N(,2), donde  y 2 son parámetros
desconocidas, para 2 ≤ n < 30 la estadística de la prueba acerca de la media  es:

x 
T
S/ n
Si se

t n 1
supone verdadera la hipótesis nula, Ho:  = o , la
estadística

x  0
especificada por esta hipótesis es: T 
S/ n
Nota: La estructura de la prueba es idéntica que en el caso de  conocida ,
salvo que el valor de 
se estima por S y la distribución normal estándar se
sustituye por la distribución t de Student con n-1 grados de libertad.
A. Prueba bilateral o de dos colas
1. Hipótesis:
Ho:  = o,
H1:   0
2. Escoger el nivel de significación: 

x 
3. Estadística de prueba: T 
S/ n

t n 1
4. Región crítica: determinar los valores  t1 / 2, n 1 , tales que la probabilidad de
rechazar Ho cuando se supone verdadera sea:
258
P(T  t1 / 2,n1 )   / 2 o P(T  t1 / 2, n 1 )   / 2
.
En consecuencia, la región crítica en el rango de variación de T es:
R.C.  {T  t1 / 2,n1 o T  t1 / 2,n1}
La región de aceptación es: R. A.  {t1 / 2, n1  T  t1 / 2, n1}

5. Hallar Tcalc
x  0

con la información muestral y suponiendo que Ho es
S/ n
cierta.
6. Decisión: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo igual .
B. Prueba unilateral de la cola derecha
Ho:  = o,
1. Hipótesis:
H1:  > 0
2. Escoger el nivel de significación: 

x 
3. Estadística de prueba: T 
S/ n

t n 1
4. Región crítica: determinar el valor t1 , n 1 tal que la probabilidad de rechazar
H0 cuando se supone verdadera sea:
P [T  t1 , n1 | H 0 :    0 verdadera]  
En consecuencia, la región crítica en el rango de variación de T es:
R.C.  {T  t1 , n1}
La región de aceptación es:
R. A.  {T  t1 , n1} .

5. Hallar Tcalc
x  0

con la información muestral y suponiendo que Ho es
S/ n
cierta.
6. Decisión: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis:
Ho:  = o ,
H1:  < 0
259
2. Escoger el nivel de significación: 

x 
3. Estadística de prueba: T 
S/ n

t n 1
4. Región crítica: determinar el valor - t1 , n 1 tal que la probabilidad de rechazar
H0 cuando se supone verdadera sea:
P [T  t1 , n1 | H 0 :    0 verdadera]  
En consecuencia, la región crítica en el rango de variación de T es:
R.C. = {T < -t1 - α, n -1}
La región de aceptación es: R.A. = {T > -t1 - α, n -1}

5. Hallar Tcalc
x  0

con la información muestral y suponiendo que Ho es
S/ n
cierta.
6. Decisión: se rechaza H0 con riesgo igual a , si Tcalc R.C. (o si Tcalc R.A. ).
No se rechaza H0 en caso contrario.
Nota: Regla de decisión con el Intervalo de Confianza
La prueba de la hipótesis nula Ho:  = 0 contra H1:   0 a un nivel de
significación dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parámetro  y luego rechazar la hipótesis nula Ho:  = 0 si es que 0
 I .C.
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Tcalc, de manera que:
 Para dos colas: P = P[|Tn-1| > |Tcalc|] = P[Tn-1 < -|Tcalc|] + P[Tn-1 > |Tcalc|] =
= 2 P[Tn-1 < -|Tcalc|] = 2 P[Tn-1 > |Tcalc|]
 Para cola a la derecha: P = P[Tn-1 > Tcalc]
 Para cola a la izquierda: P = P[Tn-1 < Tcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
260
Ejemplo 4.Un fabricante produce un cable de alambre de cierto tipo, que tiene una resistencia a la
ruptura no mayor de 300 kg. Se descubre un proceso nuevo y más barato que desea
emplearse, siempre que el cable así producido tenga una resistencia media a la ruptura
mayor de 300 kg. Si una muestra aleatoria de 25 cables producidos con el nuevo proceso
ha dado una media 304.5 kg. y una desviación estándar S = 10 kg. ¿Debería el fabricante
adoptar el nuevo proceso, si está dispuesto a asumir un error tipo I del 5%? Hallar el Pvalor.
Solución
1. Hipótesis: H0:  ≤ 300 (proceso antiguo)
H1:  > 300 (proceso nuevo).
2. Nivel de significación:  = 0.05.
3. Estadística de prueba:

x 
T
S/ n

t 24
4. Región crítica: para  = 0.05 y la alternativa unilateral derecha, se encuentra el
valor crítico en la Tabla 3: t1-, n-1 = t0.95, 24 = 1.711
Luego, la región crítica en la variable T está dada por: R.C = {T > 1.711}

5. Cálculos, de los datos se tiene: n = 25,
x = 304.5 Kg.
S = 10 y  = 300

Entonces: Tcalc
x  304.5  300
= 2.25


S/ n
10 / 25
6. Decisión: puesto que Tcalc = 2.25 ϵ R.C., debemos rechazar H0 y concluir con un
5% de significación que conviene adoptar el nuevo proceso.
P-valor = P[T24 > 2.25] = 1 - P[T24 ≤ 2.25] = 1 – x
………… (1)
Como en la tabla 3, T de student, para 24 grados de libertad, no está el valor 2.25,
pero éste se encuentra entre los valores 2.064 (con probabilidad 0.975) y 2.492 (con
probabilidad 0.99) se determina x interpolando de la siguiente manera:
Tα
P
2.064 0.975
2.25
x

2.492 0.990 
2.492  2.064 2.25  2.064  28.53 = 0.186

0.990  0.975
x  0.975
x  0.975
28.53x - 27.82 = 0.186 
261
x = 0.982
Reemplazando x = 0.982 en (1) se obtiene: P-valor = 1 – 0.982 = 0.018
Rpta.
Como el valor-P = 0.018 <  = 0.05 se rechaza Ho y se acepta H1:  > 300. Por lo
tanto, se concluye también con un 5% de significación que es conveniente adoptar el
nuevo proceso.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 1t t de 1 muestra y
aparece la Ventana t de 1 muestra (prueba e intervalo de confianza) siguiente:
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 25 y en
Media: 304.5 (la media muestral). Escribir la Desviación estándar: 10 (desviación
estándar muestral).
Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en
columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 300.
Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna:
mayor que. Luego escoger Aceptar y Aceptar
En la hoja de Sesión aparecen los resultados siguientes:
262
T de una muestra
Prueba de mu = 300 vs. > 300
N
25
Media
304.50
Media del
Error
estándar
2.00
Desv.Est.
10.00
95% Límite
inferior
301.08
T
2.25
P
0.017
Para prueba bilateral:
N
25
Media Desv.Est.
304.50
10.00
Errorestándar
2.00
IC de 95%
(300.37, 308.63)
Aparecen los resultados antes obtenidos: Tcalc = 2.25, el valor-P = 0.017 (ligeramente
diferente al 0.018 encontrado con aproximación usando la Tabla 3) y el intervalo de
confianza del 95% para la media µ obtenido a continuación.
Nota.Si se construye el intervalo de confianza del 95% para la media , con 1 – α = 0.95
→ en la Tabla 3, t0 = t24 , 0.975 = 2.064. Además: n = 25, X = 304.5 Kg. y S = 10.
El intervalo de confianza para la media es:   [ X - t0 S / n , X + t0 S / n ]
Luego:   [304.5 – 2.064 x
10
10
, 304.5 + 2.064 x
] = [304.5 ± 4.128]
25
25
Por lo tanto:   [300.37 ; 308.63] Kg. con el 95% de confianza.
En consecuencia, se rechaza H0:  = 300 kilos porque no pertenece al intervalo de
confianza y se acepta H1:  > 300 Kg. siendo conveniente adoptar el nuevo proceso
con un 95% de confianza.
6.3 PRUEBA DE HIPÓTESIS ACERCA DE UNA VARIANZA
Sea Xk, X2, ...., Xn una muestra aleatoria de tamaño n, seleccionada de una
población normal con media  y varianza 2, parámetros desconocidos, y sea la
n
varianza muestral, S 2 
( X
i 1
i
 X )2
n 1
Entonces, la variable aleatoria,  2 
(n  1)S 2

263
2
  n21
Esta estadística se utiliza para probar hipótesis acerca de una varianza. Si se supone
verdadera la hipótesis nula Ho: σ2 =  02 , la estadística es:
2 
2

El valor  calc
(n  1) S 2
 02
(n  1) S 2
 02
  n21
que resulta de la muestra aleatoria, se usa para la prueba
de H0, contra una alternativa unilateral o bilateral.
A. Prueba bilateral o de dos colas
1. Hipótesis:
Ho: σ2 =  02 ,
H1: σ2   02
2. Escoger el nivel de significación: 
3. Estadística de prueba:  2 
(n  1)S 2

2
  n21
4. Región crítica: determinar los valores X 2 / 2 , n 1 y X12 / 2 , n 1 , tales que la
probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea:
P [  2  2 / 2,n1 ]   / 2
o P [  2  2 / 2,n1 ]   / 2
La Región crítica de la prueba es: R.C. = {X2 <  2 / 2,n1 o X2 > 12 / 2,n1 }
La región de aceptación es: R.A. = {  2 / 2,n1 ≤ X2 ≤ 12 / 2,n1 }
2

5. Hallar  calc
(n  1) S 2
 02
con la información muestral y suponiendo que Ho es
cierta.
2
2
 R.C. (o si  calc
 R. A. ).
6. Decisión: se rechaza H0 con riesgo igual a , si  calc
No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es
.
264
B. Prueba unilateral de la cola derecha
Ho: σ2 =  02 , H1: σ2 >  02
1. Hipótesis:
2. Escoger el nivel de significación: 
3. Estadística de prueba:  2 
(n  1)S 2

2
  n21
4. Región crítica: determinar el valor X12 , n 1 tal que la probabilidad de rechazar
P[  2  12 ,n1 ]  
H0 cuando se supone verdadera sea:
La Región crítica de la prueba es: R.C. = {X2 > 12 , n1 }
12 , n1
La región de aceptación es:
5. Hallar 
2
calc

(n  1) S 2
 02
R.A. = {X2 < 12 , n1 }
con la muestra y suponiendo que Ho es cierta.
2
2
 R.C. (o si  calc
 R. A. ).
6. Decisión: se rechaza H0 con riesgo igual a ,  calc
No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis:
Ho: σ2 =  02 , H1: σ2 <  02
2. Escoger el nivel de significación: 
3. Estadística de prueba:  2 
(n  1)S 2

2
  n21
4. Región crítica: determinar el valor  2 ,n1 tal que la probabilidad de rechazar H0
cuando se supone verdadera sea:
265
P[  2  2, n1 ]  
La Región crítica de la prueba es: R.C. = {X2 < 2, n1 }
R.A. = {X2 > 2, n1 }
La región de aceptación es:
5. Hallar 
2
calc

(n  1) S 2
 02
con la muestra y suponiendo que Ho es cierta.
2
2
 R.C. (o si  calc
 R. A. ).
6. Decisión: se rechaza H0 con riesgo igual a ,  calc
No se rechaza H0 en caso contrario.
Nota: Regla de decisión con el Intervalo de Confianza
La prueba de la hipótesis nula Ho: σ2 =  02 contra H1: σ2 ≠  02 a un nivel de
significación dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 )% para el parámetro σ2 y luego rechazar la hipótesis nula Ho: σ2 =  02 si es que  02
 I .C. Caso contrario, si  02 ϵ I.C. se “acepta” la hipótesis nula Ho: σ2 =  02 .
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
2
mínima para rechazar Ho), a partir del valor  calc
, de manera que:
 Para dos colas:
2
2
Si  calc
< n – 1 → P = 2 P[  n21 <  calc
]
2
2
2
Si  calc
> n – 1 → P = 2 P[  n21 >  calc
] = 2 {1 - P[  n21 <  calc
]}
2
 Para cola a la derecha: P = P[  n21 >  calc
]
2
 Para cola a la izquierda: P = P[  n21 <  calc
]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
266
Ejemplo 5.En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las
longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos
elegidos al azar del proceso de producción se han encontrado las siguientes
longitudes en milímetros: 71, 66, 64, 72, 69, 67, 70, 68, 65, 69
Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es
2.00 mm? Use el nivel de significación  = 0.05, y suponga que la distribución de las
longitudes es normal. Halle el valor-P.
Solución:
1. Hipótesis : H 0 :  2  4,
H1 :  2  4
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 10, y suponiendo verdadera la
hipótesis
(n  1)S 2
H 0 :   4 , la estadística de prueba:  
  92
4
2
2
4. Región crítica: Para  = 0.05 y para un contraste bilateral, en la tabla 2 de chicuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.025, 9  2.70 y 12 / 2,n1   02.975.9  19.02
Luego, la región crítica es: R.C. {X2 < 2.70 o X2 > 19.02}
5. Cálculos: De los datos de la muestra resulta S2 = 6.77, entonces,

2
calc
(n  1)S 2 9S 2 9 (6.77)



 15.23
4
4
4
2
6. Decisión: Como  calc
= 15.23  R.A. se acepta H 0 :  2  4 y concluimos que la
desviación estándar es de 2 mm. con el 5% de significación.
Rpta.
2
 Como la prueba es bilateral y  calc
= 15.23 > n – 1 = 9 el valor-P se obtiene así:
2
P = 2 {1 - P[  n21 <  calc
]} = 2 {1 - P[  92 < 15.23]} = 2 {1 - x} ……. (1)
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor 15.23,
pero éste se encuentra entre los valores 14.7 (con probabilidad 0.90) y 16.9 (con
probabilidad 0.95) se determina p interpolando de la siguiente manera:
267
X2α
P
14.7
0.90
15.23
x
16.9

0.95 
16.9  14.7 15.23  14.7

0.95  0.90
x  0.90
44x – 39.6 = 0.53


44 =
0.53
x  0.90
x = 0.912
Reemplazando x = 0.9815 en (1) se obtiene:
P = P-valor = 2{1 – 0.912} = 0.176
Rpta.
Como el valor-P = 0.176 >  = 0.05 se acepta H 0 :  2  4 . Por lo tanto, se concluye
también con un 5% de significación que la desviación estándar es de 2 mm.
Cálculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), columna C1 definir la variable Longitud
(de los tornillos) e ingresar los 10 valores de la muestra.
Del menú escoger Estadísticas → Estadísticas básicas → σ2 1 varianza y aparece
la Ventana 1 varianza siguiente:
En vez de ingresar desviación estándar, escoger ingresar varianza.
Como los datos muestrales aparecen en la columna C1 Longitud, se escoge
Muestras en columnas: y se selecciona en dicho recuadro la columna C1 Longitud.
268
Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y
escribir el Tamaño de muestra: y la Varianza de la muestra: correspondientes.
Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hipótesis y escribir en Varianza hipotética: 4.
Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna: no
es igual a. Luego escoger Aceptar y Aceptar
En la hoja de Sesión aparecen los resultados siguientes:
Prueba e IC para una varianza: Longitud
Método
Hipótesis nula
Hipótesis alterna
Sigma-cuadrado = 4
Sigma cuadrado no = 4
El método estándar se utiliza sólo para la distribución normal.
El método ajustado se utiliza para cualquier distribución continua.
Estadísticas
Variable
Longitud
N
10
Desv.Est.
2.60
Varianza
6.77
Intervalos de confianza de 95%
IC para
Variable Método
Desv.Est.
Longitud Estándar (1.79, 4.75)
Ajustado (1.93, 3.98)
IC para
varianza
(3.20, 22.55)
(3.73, 15.85)
Pruebas
Variable
Longitud
Método
Estándar
Ajustado
Chicuadrada
15.23
26.47
GL
9.00
15.65
Valor P
0.170
0.084
2
Aparecen los resultados antes obtenidos:  calc
= 15.23, el valor-P = 0.17
(ligeramente diferente al 0.176 encontrado con aproximación usando la Tabla 2) y el
intervalo de confianza del 95% para la varianza analizado a continuación.
Nota.Si se construye el intervalo de confianza del 95% para la varianza σ2, éste resultará
ser: σ2 ϵ [3.20; 22.55] mm2 con el 95% de confianza.
En consecuencia, se acepta H 0 :  2  4 porque pertenece al intervalo de confianza.
Por lo tanto, se concluye también que la desviación estándar es de 2 mm. con un 95%
de confianza.
269
6.4 PRUEBA DE HIPÓTESIS PARA LA RAZÓN DE VARIANZAS
Sean S12 y S 22 las varianzas de dos muestras aleatorias independientes de
tamaños respectivos n1 y n2, escogidas de dos poblaciones normales con
varianzas respectivas  12 y  22 . Entonces, la estadística,
F
S12 /  12
 f n1 1, n2 1
S 22 /  22
tiene distribución de probabilidad F con grados de libertad n1 – 1 y n2 – 1. Esta
estadística se utiliza para probar igualdad de varianzas.
Si se supone verdadera la hipótesis nula Ho:  12   22
estadística de la prueba es: F 
Su valor Fcalc 
o
 12 /  22 = 1, la
S12
 f n1 1, n2 1
S 22
S12
que resulta de dos muestras aleatorias, se utiliza para
S 22
probar la hipótesis nula Ho contra cualquiera alternativa unilateral o bilateral.
A. Prueba bilateral o de dos colas
1. Hipótesis:
Ho : 12   22 ,
H1 :  12   22
2. Escoger el nivel de significación: 
3. Estadística de prueba: F 
S12 /  12
 f n 11, n2 1
S 22 /  22
4. Región crítica: determinar los valores f  / 2 , n 11, n 21 y X 12 / 2 , n 11, n 21 , tales que la
probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea:
P[ F  f / 2, n 11, n 21 ]   / 2 o P[ F  f1 / 2, n 11, n 21 ]   / 2
La Región crítica es: R.C. = {F < f  / 2, n 11, n 21 o F > f1 / 2, n 11, n 21 }
La región de aceptación es: R.A. = { f  / 2, n 11, n 21 ≤ F ≤ f1 / 2, n 11, n 21 }
5. Hallar Fcalc
S12
 2 con la información muestral y suponiendo que Ho es cierta.
S2
6. Decisión: se rechaza H0 con riesgo igual a , si Fcalc R.C. (o si Fcalc R.A. ).
No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
270
B. Prueba unilateral de la cola derecha
1. Hipótesis:
Ho: 12   22 ,
H1 :  12   22
2. Escoger el nivel de significación: 
3. Estadística de prueba: F 
S12 /  12
 f n 11, n2 1
S 22 /  22
4. Región crítica: determinar el valor f1 , n 11, n 21 tal que la probabilidad de
rechazar H0 cuando se supone verdadera sea:
P[ F  f1 , n 11, n 21 ]  
La Región crítica de la prueba es: R.C. = {F > f1 , n 11, n 21 }
f1 , n 11, n 21
La región de aceptación es:
5. Hallar Fcalc 
R.A. = {F < f1 , n 11, n 21 }
S12
con la muestra y suponiendo que Ho es cierta.
S 22
6. Decisión: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ).
No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis:
Ho : 12   22 ,
H1 :  12   22
2. Escoger el nivel de significación: 
3. Estadística de prueba: F 
S12 /  12
 f n 11, n2 1
S 22 /  22
271
4. Región crítica: determinar el valor f  , n 11, n 21 tal que la probabilidad de
rechazar H0 cuando se supone verdadera sea:
P [ F  f , n 11, n 21 ]  
La Región crítica de la prueba es: R.C. = {F < f  , n 11, n 21 }
R.A. = {F > f  , n 11, n 21 }
La región de aceptación es:
5. Hallar Fcalc
S12
 2 con la muestra y suponiendo que Ho es cierta.
S2
6. Decisión: se rechaza H0 con riesgo igual a , Fcalc R.C. (o si Fcalc R.A. ).
No se rechaza H0 en caso contrario.
Nota: Regla de decisión con el Intervalo de Confianza
La prueba de la hipótesis nula Ho:  12   22 o  12 /  22 = 1 contra H1 :  12   22 o
 12 /  22 ≠ 1 a un nivel de significación dado , equivale a determinar el intervalo
de confianza (I.C.) del 100(1 - )% para la razón de varianzas  12 /  22 y luego
rechazar la hipótesis nula Ho:  12   22 si es que  12 /  22 = 1  I .C. Por el
contrario, si  12 /  22 = 1 ϵ I.C. se “acepta” la hipótesis nula Ho:  12   22 .
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Fcalc , de manera que:
 Para dos colas:
Si Fcalc < 1 → P = 2 P[ f n 11, n 21 < Fcalc ]
Si Fcalc > 1 → P = 2 P[ f n 11, n 21 > Fcalc ] = 2 {1 - P[ f n 11, n 21 < Fcalc ]}
 Para cola a la derecha: P = P[ f n 11, n 21 > Fcalc ]
 Para cola a la izquierda: P = P[ f n 11, n 21 < Fcalc ]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 6.Una compañía diseña un nuevo proceso de moldeo para reducir la variabilidad en el
diámetro de las piezas producidas. Se cree que la varianza del nuevo proceso es
menor que la varianza del proceso antiguo. Para una muestra de 8 piezas del proceso
272
antiguo y una muestra de 6 piezas del proceso nuevo se obtienen los siguientes
diámetros en milímetros:
Antiguo (1): 17, 23, 21, 18, 22, 20, 21, 19
Nuevo (2): 13, 16, 14, 12, 15, 14
¿Confirman estos datos que la varianza de los diámetros con el nuevo proceso es
menor que con el proceso antiguo? Suponga poblaciones normales y use  = 0.05
Solución
Sean X1 y X2 las variables que representan los diámetros de las piezas con el proceso
antiguo y nuevo respectivamente. Las dos poblaciones se distribuyen normalmente
con varianzas desconocidas.
1.
Hipótesis: H0:  12 =  22
H1:  12 >  22
2.
Nivel de significación:  = 0.05
3.
Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera
la hipótesis nula Ho, para n1 = 8 y n2 = 6, la estadística de prueba es:
S12
F  2  f 7 ,5
S2
4.
Región crítica: para  = 0.05 y la prueba unilateral derecha, f7,5, 0.95 = 4.88 es:
R.C. = {F > 4.88}
5.
Cálculos: con los datos de la muestra se obtiene:
S12 = 4.125, S 22 = 2 y Fcalc 
6.
S12 4.125

= 2.0625
2
S 22
Decisión. Como Fcalc = 2.0625  R.A. se acepta Ho y concluimos que la
varianza de los diámetros con el nuevo proceso no es menor que con el proceso
antiguo, sino las dos varianzas son iguales con el 5% de significación.
Nota. Si se construye el intervalo de confianza del 95% para la razón de varianzas, éste
resultará ser:  12 /  22 ϵ [0.301; 10.91] con el 95% de confianza.
Entonces, se acepta que  12 /  22 = 1, porque pertenece al intervalo de confianza.
Por lo tanto, se concluye que  12   22 con el 95% de confianza, es decir que la
varianza de los diámetros con el nuevo proceso es igual a la del proceso antiguo.
 Para hallar el valor-P, como Fcalc = 2.0625 > 1 se obtiene así:
273
P = 2 P[f7,5 > 2.0625] = 2{1 - P[f7,5 ≤ 2.0625]} > 0.10 (en Excel = 0.4428).
Rpta.
Ya que en la Tabla 4, de la distribución F, para 7 y 5 grados de libertad la
probabilidad acumulada hasta 2.0625 es menor a 0.95 (en Excel es 0.7786).
Como P = 0.4428 >  = 0.05, se acepta la hipótesis nula y se concluye también
con el 5% de significación, que la varianza de los diámetros con el nuevo proceso
no es menor que con el proceso antiguo, sino las varianzas son iguales.
Cálculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), en la columna C1 definir la variable
diámetro Antiguo-1 e ingresar los 8 valores de la muestra y en la columna C2
definir la variable diámetro Nuevo-2 e ingresar los 6 valores de la muestra.
Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas y
aparece la Ventana 2 varianzas siguiente:
Como los datos muestrales aparecen en las columnas C1 y C2, se escoge Muestras
en diferentes columnas y se selecciona en el recuadro de Primera: la columna C1
Antiguo-1 y en el recuadro de Segunda: la columna C2 Nuevo-2.
Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y
escribir el Tamaño de muestra: y la Varianza: (de la muestra) correspondiente a la
Primera: y Segunda: muestra. Lo que sigue es igual para ambos casos.
274
Escoger Opciones… → Nivel de confianza: 95.0. Colocar un Título: (del gráfico)
Varianza antigua vs Varianza nueva. Luego escoger Aceptar y Aceptar
En la hoja de Sesión aparecen los resultados siguientes:
Prueba de varianzas iguales: Antiguo-1, Nuevo-2
Intervalos de confianza de Bonferroni de 95% para desviaciones
estándares
Antiguo-1
Nuevo-2
N
8
6
Inferior
1.27062
0.82920
Desv.Est.
2.03101
1.41421
Superior
4.65199
4.04599
Prueba F (distribución normal)
Estadística de prueba = 2.06, valor p = 0.443
Prueba de Levene (cualquier distribución continua)
Estadística de prueba = 1.25, valor p = 0.286
Aparecen los resultados antes obtenidos: Fcalc = 2.0625 y el valor-P = 0.4428. Si se
observan los intervalos de confianza de Bonferroni, en la gráfica de Varianza antigua
vs Varianza nueva, se puede apreciar que estos se entre cruzan, indicando que las
varianzas (y desviaciones estándar) son iguales.
Varianza antigua vs Varianza Nueva
Prueba F
Estadística de prueba
Valor P
Antiguo-1
2.06
0.443
Prueba de Levene
Estadística de prueba
Valor P
Nuevo-2
1
2
3
4
5
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Antiguo-1
Nuevo-2
12
14
16
18
Datos
20
275
22
24
1.25
0.286
6.5 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas
conocidas)
Sean X
1
y X
2
las medias de dos muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones
independientes, con medias 1 y 2 y varianzas 12 y 22 conocidas.
Si las dos poblaciones son normales, entonces, las estadísticas X 1 y X 2 tienen
respectivamente distribución normal N(1, 12 ,/n1) y N(2,  22 ,/n2) para n1 > 2,
y n2 > 2. Entonces: X
1
- X
tiene distribución normal N(1 - 2;
2
12 /n1+  22 /n2).
Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente
grandes (n1 > 30 y n2 > 30), entonces, X
1
- X
2
tiene aproximadamente
distribución normal N(1 - 2; 12 /n1+  22 /n2).
Según sean las dos poblaciones normales o no, la estadística de prueba es:
Z
X 1  X 2  (1   2 )
 12
n1

 22
→ N(0,1).
n2
Si suponemos verdadera la hipótesis nula H0: 1 = 2 ó 1 - 2 = 0, la
estadística de prueba es: Z 
X1  X 2
 12
n1
Su valor Zcalc =
X1  X 2
 12
n1

 22

 22
 N (0,1)
n2
que resulta de dos muestras independientes, se
n2
utiliza para probar Ho: 1 = 2 contra cualquiera de las hipótesis alternativas
H1: 1  2 ó H1: 1 > 2 ó H1: 1 < 2
La estructura de la prueba es similar a los casos descritos usando la
distribución Z.
A. Prueba bilateral o de dos colas
Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1  2 o 1 - 2 ≠ 0, la región
crítica en el rango de variación de Z es:
R.C. = {Z < - Z1-/2 o Z > Z1-/2}
276
B. Prueba unilateral de la cola derecha
Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 > 2 o 1 - 2 > 0, la región
critica en la variación de Z es:
R.C. = {Z > Z1- }
C. Prueba unilateral de la cola izquierda
Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 < 2 o 1 - 2 < 0, la región
critica en la variación de Z es:
R.C. = {Z < - Z1- }
Nota 1.- Cuando las hipótesis son de la forma:
1) H0: 1 - 2 = d0 contra H1: 1 - 2  d0
2) H0: 1 - 2 = d0 contra H1: 1 - 2 > d0
3) H0: 1 - 2 = d0 contra H1: 1 - 2 < d0
La estadística de la prueba es:
Z
X 1  X 2  d0
 12
n1

 22
n2
Cuya distribución es aproximadamente normal N(0, 1) según sean las dos
poblaciones normales o no.
Se rechaza H0 con riesgo igual a , si Z calc R.C. (o si
Z calc R.A. ). No se
rechaza H0 en caso contrario.
Nota 2.Se usa el intervalo de confianza I.C. al 100(1– α)% para la diferencia de medias 1 2, a fin de verificar si las medias son iguales (cuando se cumple que 1 - 2 = 0 ϵ
I.C.) o su diferencia asume un valor determinado (si ocurre que 1 - 2 = d0 ϵ I.C.).
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Zcalc, de manera que:
 Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
277
Ejemplo 7.Un fabricante quiere comparar los tiempos de proceso de dos marcas de máquinas A
y B, para fabricar un tipo de artículo. Al observar dos muestras aleatorias de 60
artículos procesados por A y B respectivamente, encuentra que las medias
respectivas son 1,230 y 1,190 segundos. Suponga A = 120 y B = 90 segundos.
a) Al nivel de significación del 5%, ¿se puede inferir que la máquina B es más
rápida que la máquina A? Hallar el valor P.
b) Al nivel de significación del 5%, ¿se puede inferir que la media de B es menor
que la media de A en menos de 7 segundos? Hallar el valor P.
Solución
Sean XA y XB los tiempos de proceso con las máquinas A y B respectivamente y A,
B sus medias respectivas. Se desconocen las distribuciones de probabilidades de
XA y XB, pero las muestras son grandes (nA = nB = 60 > 30). Para determinar si la
máquina B es más rápida que la A, se comparan sus tiempos promedios de proceso:
A > B.
a) 1. Hipótesis: H0: A = B contra H1: A > B
2. Nivel de significación: = 0.05.
3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
XA XB
Z
 A2
nA

 B2
 N (0, 1)
nB
4. Región Crítica. Para = 0.05 y una prueba unilateral de la cola derecha, en la
Tabla 1, distribución de Z se encuentra el valor Z0.95 = 1.645. Luego, la región
crítica es:
R.C. = {Z > 1.645}
5. Cálculos, de los datos se tiene:
nA = nB = 60,
x A = 1230, x B = 1190, A = 120 y B = 90
E.S. = Error estándar =
Z calc 
 A2
nA

 B2
nB
120 2 90 2


= 19.365
60
60
x A  x B 1,230  1,190

 2.07
ES
19.365
278
6. Decisión: ya que Zcalc = 2.07  R.C., debemos rechazar Ho y concluir con el 5%
de significación que el equipo B utiliza menos tiempo en el proceso de
fabricación.
El valor P para la cola derecha es:
P = P[Z > Zcalc] = P[Z > 2.07] = 1 – Ф(2.07) = 1 – 0.98077 = 0.01923 Rpta.
Como P = 0.01923 < = 0.05, entonces se rechaza la Ho y se acepta H1: A > B.
Se concluye también con el 5% de significación que el equipo B utiliza menos
tiempo promedio en el proceso de fabricación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza) siguiente:
Recordar que cuando las muestras son grandes t se aproxima a la normal estándar.
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:, la
Media: y la Desviación estándar: correspondiente a la Primera: y Segunda:
muestra respectivamente.
279
Nota: Si los datos muestrales aparecen en columnas, se escoge Muestras en
diferentes columnas: y se ingresa la Primera: y Segunda: columna en el
recuadro correspondiente. Lo que sigue es igual para ambos casos.
Escoger Opciones… → Nivel de confianza: 95.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hipótesis alterna: mayor que. Luego escoger Aceptar y
Aceptar.
En la hoja de Sesión aparecen los resultados siguientes:
Prueba T de dos muestras e IC
Muestra
1
2
N
60
60
Media
1230
1190.0
Desv.Est.
120
90.0
Media del
Error
estándar
15
12
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 40.0
Límite inferior 95% de la diferencia: 7.9
Prueba T de diferencia = 0 (vs. >):
Valor T = 2.07 Valor P = 0.021 GL = 109
Aparecen los resultados antes obtenidos: Zcalc = 2.07 = T y el valor-P = 0.021
(muy próximo al 0.01923 encontrado con Z).
b) Probar que la media de B es menor que la media de A en menos de 7 segundos, es
equivalente a plantear: B < A - 7 o B - A < – 7 o A - B > 7.
Se debe probar H0: A - B = 7 contra H1: A - B > 7.
Si H0 es verdadera, la estadística de la prueba es: Z 
(X A  X B )  7
 A2
nA

 B2
 N (0,1)
nB
La región crítica de la prueba unilateral de la cola derecha al nivel  = 0.05 es 260
misma del caso a):
Z calc 
R.C. = {Z > 1.645 }
( x1  x 2 )  7 (1,230  1,190)  7

 1.7
ES
19.365
Ya que Zcalc = 1.7  R.C., debemos rechazar Ho y concluir que el tiempo
promedio que utiliza la máquina B en el proceso es menor que el tiempo promedio
de A en menos de 7 segundos.
280
El valor P para la cola derecha es:
P = P[Z > Zcalc] = P[Z > 1.7] = 1 – Ф(1.7) = 1 – 0.95543 = 0.04457 Rpta.
Como P = 0.04457 < = 0.05, entonces se rechaza la Ho y se acepta H1: A - B >
7. Se concluye también, con el 5% de significación, que el tiempo promedio que
utiliza la máquina B en el proceso es menor que el tiempo promedio de A en
menos de 7’’.
Cálculos utilizando Minitab
Los pasos son idénticos hasta antes de escoger Opciones… → Nivel de
confianza: 95.0. En Diferencia de la prueba: escribir 7. Escoger en Hipótesis
alterna: mayor que. Luego escoger Aceptar y Aceptar.
En la hoja de Sesión aparecen los resultados siguientes:
Prueba T de dos muestras e IC
Muestra
1
2
N
60
60
Media
1230
1190.0
Desv.Est.
120
90.0
Media del
Error
estándar
15
12
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 40.0
Límite inferior 95% de la diferencia: 7.9
Prueba T de diferencia = 7 (vs. >):
Valor T = 1.70 Valor P = 0.046 GL = 109
Aparecen los resultados antes obtenidos: Zcalc = 1.70 = T y el valor-P = 0.046
(muy próximo al 0.04457 encontrado con Z).
6.6 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas
desconocidas)
Si las dos muestras aleatorias independientes de tamaños n1 y n2 se seleccionan
respectivamente de dos poblaciones cuyas distribuciones no son normales con
varianzas  12 y  22 supuestas desconocidas, entonces, siempre que los tamaños de
las muestras sean grandes; n1  30 y n2  30 los parámetros  12 y  22 se estiman
respectivamente por S12 y S22 .
281
Para probar la hipótesis nula H0 : 1  2  0 contra una alternativa bilateral o
unilateral, se utiliza la estadística: Z 
X
1

 X 2  ( 1  2 )
S12 / n1  S22 / n2
 N (0,1)
Las regiones críticas y las reglas de decisión para las pruebas de la hipótesis nula
H0 : 1  2  0 (o H0 : 1  2  d0 ) contra una alternativa unilateral o bilateral
son las mismas del método con varianzas conocidas.
Sean X 1 y X 2 las medias y S12 y S22 las varianzas de dos muestras aleatorias
independientes pequeñas (n1 < 30 y n2 < 30 respectivamente) seleccionadas de dos
poblaciones normales con medias 1 y 2 y varianzas  12 y  22 desconocidas.
Estas varianzas desconocidas presentan dos casos, ya que pueden ser iguales
(homogéneas) o diferentes (heterogéneas) cuya prueba se realiza mediante el test
de hipótesis para la razón de varianzas del acápite 6.4. Veamos ambos casos.
A. Varianzas desconocidas pero iguales ( 12   22 )
Si las poblaciones son normales, independientes, y con varianzas desconocidas
pero iguales 12   22 =  2 , entonces, la estadística de prueba es:
T
X
1

 X 2  ( 1  2 )
Sc2 Sc2

n1 n2
 tn1  n2 2
donde el estimador de la varianza común  2 es: Sc2 
 n1  1 S12  (n2  1)S22
n1  n2  2
Si la hipótesis nula H0 : 1  2 es verdadera, entonces, la estadística.
T
Su valor: t 
calc
X1  X 2
S c2 S c2

n1 n2
 t n1  n2 2
x1  x 2
 n1  1 S12  (n2  1)S22  1 

 n1
n1  n2  2
1

n2 
que resulta de dos muestras aleatorias, se usa para probar H0 con una alternativa
unilateral o bilateral.
282
La estructura de la prueba es similar a la usada con la distribución de t.
1. Prueba bilateral o de dos colas
Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo;

R.C. = T  t1 / 2, n1  n2 2 o T  t1 / 2, n1  n2 2

2. Prueba unilateral de cola a la derecha
Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo
R.C. = {T  t1 .n1  n2 2 }
3. Prueba unilateral de cola a la izquierda
Si se prueba H0 : 1  2 contra H1 : 1  2 la región crítica es el intervalo.
R.C. = {T   t1 , n1 n2 2 }
Ejemplo 8
Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración
en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos
resultados:
n1 = 16,
x1 = 49,658, S1 = 2,150
y
n2 = 16,
x 2 = 48,125,
S2 =
1,875.
Con el 1% de significación, probar si son diferentes las duraciones medias de las
llantas de ambas marcas. Hallar el valor-P.
Solución
Datos: n1 = 16,
x1 = 49,658, S1 = 2,150 y n2 = 16,
x 2 = 48,125, S2 =
1875.
 Primero se debe probar si las varianzas de las duraciones de las llantas de ambas
marcas son iguales o no.
Hipótesis: H 0 :  12   22 ,
H 1 :  12   22 ,
 = 0.01
Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera
la hipótesis nula Ho, para n1 = 16 y n2 = 16, la estadística de prueba es:
S12
F  2  f15,15
S2
283
Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 4 de la
distribución F, se obtiene los valores críticos: f15, 15, 0.995 = 4.07; f15, 15, 0.005 = 1 /
4.07 = 0.246.
Entonces:
R.C. = {F < 0.246 o F > 4.07}
Cálculos: con los datos de la muestra se obtiene: Fcalc 
S12 2150 2

= 1.31
S 22 1875 2
Decisión: como Fcalc = 1.31  R.A. se acepta Ho y concluimos que las
varianzas de las duraciones de las llantas de ambas marcas son iguales, con el
1% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas
y aparece la Ventana 2 varianzas.
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 16 y 16,
así como la Varianza: (de la muestra) 4622500 y 3515625 correspondiente a la
Primera: y Segunda: muestra respectivamente.
Escoger Opciones… → Nivel de confianza: 95.0. Luego escoger Aceptar y
Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba de varianzas iguales
Intervalos de confianza
desviaciones estándares
Muestra
1
2
N
16
16
Inferior
1524.27
1329.31
de
Desv.Est.
2150
1875
Bonferroni
de
95%
para
Superior
3564.60
3108.66
Prueba F (distribución normal)
Estadística de prueba = 1.31, valor p = 0.603
Aparece el Fcalc = 1.31 antes obtenido y el valor-P = 0.603 >  = 0.01 y se
concluye también que las varianzas de las duraciones de las llantas de ambas
marcas son iguales, con el 1% de significación.
 A continuación se prueba si son diferentes las duraciones medias de las llantas
de ambas marcas.
Hipótesis: H0 : 1  2 contra H1 : 1  2
284
 = 0.01
La estadística de prueba es: T 
X1  X 2
S c2 S c2

n1 n2
 t16162  t 30
Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 3: t30, 0.995 = 2.75.
R.C. = {T < -2.75 o T > 2.75}
Con la información muestral: n1 = 16, x1 = 49,658, S1 = 2,150
x 2 = 48,125,
16,
y
n2 =
S2 = 1875; y bajo el supuesto que Ho es cierta se
determina:
Sc2 
 n1 1 S12  (n2 1)S22  15x21502  15x18752
tcalc 
n1  n2  2
x1  x 2
 Sc2 Sc2 
  
 n1 n2 

16  16  2
49658  48125
 4069062.5 4069062.5 



16
16


= 4’069062.5
 2.15
Decisión: como tcalc = 2.15  R.A. se acepta Ho y se concluye que las
duraciones medias de las llantas de ambas marcas no son diferentes.
 Para dos colas: P = 2P[T30 > 2.15] = 2[1 – P(T30 ≤ 2.15)] = 2[1 – x] …….. (1)
En la Tabla 3, T de student, no está el valor 2.15, se determina x interpolando
así:
Tα
P
2.042 0.975
2.15
x
2.457 0.990

2.457  2.042 2.15  2.042  27.67 = 0.108

0.990  0.975
x  0.975
x  0.975

27.67x – 26.975 = 0.108 
x = 0.9789
Reemplazando x = 0.9789 en (1) se obtiene:
P-valor = 2 [1 – 0.9789] = 0.0422
Rpta.
Como el valor-P = 0.0422 >  = 0.01 se acepta Ho y se concluye también que
las duraciones medias de las llantas de ambas marcas son iguales, con el 1% de
significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza)
siguiente:
285
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:, la
Media: y la Desviación estándar: correspondiente a la Primera: y Segunda:
muestra respectivamente. Seleccionar Asumir varianzas iguales.
Escoger Opciones… → Nivel de confianza: 95.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar
y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba T de dos muestras e IC
Muestra
1
2
N
16
16
Media
49658
48125
Desv.Est.
2150
1875
Media del
Error
estándar
538
469
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 1533
IC de 95% para la diferencia: (76, 2990)
Prueba T de diferencia = 0 (vs. no =): Valor T = 2.15
Valor P = 0.040 GL = 30
Ambos utilizan Desv.Est. agrupada = 2017.1917
Aparecen los resultados antes obtenidos tcalc = 2.15 y el valor-P = 0.040 >  =
0.01 y se concluye también que las duraciones medias de las llantas de ambas
marcas son iguales, con el 1% de significación.
286
B. Varianzas desconocidas supuestas distintas  12   22
Si las varianzas de las dos poblaciones normales independientes son desconocidas
supuestas diferentes, entonces, la estadística de prueba usada es:
T
X
1

 X 2  (1  2 )
S12 S22

n1 n2
 tH
2
 S12 S22 
  
n
n2 
Donde: H   12
representa los grados de libertad.
2
 S12   S22 
   
 n1    n2 
n1  1 n2  1
Dado que H rara vez es un entero, se toma la parte entera (entero mayor de H).
La prueba de hipótesis es similar a las trabajadas anteriormente con la
distribución t.
Ejemplo 9
Dos máquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10
n2 = 12, x 2 = 495, S2 = 4.
y
Asumiendo distribución normal para el peso de las bolsas, con el 1% de
significación ¿son diferentes los pesos medios de las bolsas con detergente de
ambas máquinas? Hallar el valor-P.
Solución
Datos: n1 = 12, x1 = 505, S1 = 10
y
n2 = 12, x 2 = 495, S2 = 4.
 Primero se debe probar si las varianzas de los pesos de las bolsas con detergente
de ambas máquinas son iguales o no.
Hipótesis: H 0 :  12   22 ,
H 1 :  12   22 ,
 = 0.01
Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera
la hipótesis nula Ho, para n1 = 12 y n2 = 12, la estadística de prueba es:
S12
F  2  f11,11
S2
287
Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 4 de la
distribución F se obtiene los valores críticos: f11, 11, 0.995 = 5.32; f11, 11, 0.005 = 1 /
5.32 = 0.188.
R.C. = {F < 0.188 o F > 5.32}
Cálculos: con los datos de la muestra se obtiene: Fcalc 
S12 100

= 6.25
S 22 16
Decisión: Como Fcalc = 6.25  R.C. se rechaza Ho y concluimos que las
varianzas de los pesos de las bolsas con detergente de ambas máquinas son
diferentes (  12   22 ), con el 1% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → σ21 σ22 2 varianzas
y aparece la Ventana 2 varianzas.
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 12 y 12,
así como la Varianza: (de la muestra) 100 y 16 correspondiente a la Primera: y
Segunda: muestra respectivamente.
Escoger Opciones… → Nivel de confianza: 99.0. Luego escoger Aceptar y
Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba de varianzas iguales
Intervalos de confianza de Bonferroni de 99% para
desviaciones estándares
Muestra
1
2
N
12
12
Inferior
6.18776
2.47510
Desv.Est.
10
4
Superior
22.1991
8.8796
Prueba F (distribución normal)
Estadística de prueba = 6.25, valor p = 0.005
Aparece el Fcalc = 6.25 antes obtenido y el valor-P = 0.005 <  = 0.01 y se
concluye también que las varianzas de los pesos de las bolsas con detergente de
ambas máquinas son diferentes (  12   22 ), con el 1% de significación.
 A continuación se prueba si son diferentes los pesos medios de las bolsas con
detergente de ambas máquinas.
Hipótesis: H0 : 1  2 contra H1 : 1  2
288
 = 0.01
La estadística de prueba es: T 
X1  X 2
S12 S 22

n1 n2
 t H  t14
2
2
 S12 S 22 
 100 16 






 12 12 
 n1 n2 
Donde: H =
=
= 14.43 ≡ 14
2
2
2 2
2 2
100
16


 
 S1 
 S2 


 
 
 
12
12


n
n
 1   2 
 
12  1 12  1
n1  1
n2  1
Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 3: t14, 0.995 = 2.977
R.C. = {T < -2.977 o T > 2.977}
Datos del problema:
n1 = 12, x1 = 505, S12 = 100 y
Tcalc 
X1  X 2
2
1
2
2
S
S

n1 n2

n2 = 12, x 2 = 495, S 22 = 16.
505  495
= 3.22
100 16

12 12
Decisión: como tcalc = 3.22  R.C. se rechaza Ho y se acepta H1 : 1  2 . Se
concluye que los pesos medios de las bolsas con detergente de ambas máquinas
sí son diferentes, al 1% de significación.
 Para dos colas: P = 2P[T14 > 3.22] = 2[1 – P(T30 ≤ 3.22)] = 2[1 – 0.9969] =
0.0062
Como el valor-P (hallado interpolando en T) = 0.0062 <  = 0.01 se rechaza Ho
y se concluye también que los pesos medios de las bolsas con detergente de
ambas máquinas son diferentes, al 1% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y
aparece la Ventana t de 2 muestras (prueba e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:, la
Media: y la Desviación estándar: correspondiente a la Primera: y Segunda:
muestra respectivamente. No seleccionar Asumir varianzas iguales.
Escoger Opciones… → Nivel de confianza: 99.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar
y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
289
Prueba T de dos muestras e IC
Muestra
1
2
N
12
12
Media
505.0
495.00
Desv.Est.
10.0
4.00
Media del
Error
estándar
2.9
1.2
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 10.00
IC de 99% para la diferencia: (0.74, 19.26)
Prueba T de diferencia = 0 (vs. no =): Valor T = 3.22
Valor P = 0.006 GL = 14
Aparecen los resultados antes obtenidos tcalc = 3.22, los grados de libertad igual a
14 y el valor-P = 0.006 <  = 0.01 y se concluye también que los pesos medios
de las bolsas con detergente de ambas máquinas son diferentes, al 1% de
significación.
6.7 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN
Suponga que se dispone de una muestra aleatoria de n observaciones, obtenida
de una población con una proporción p de éxitos (elementos que poseen un
atributo particular). Si el número de observaciones de la muestra es grande y la
proporción muestral observada es p̂ , para realizar contrastes acerca de p se
sigue los siguientes pasos:
1. Hipótesis:
H0: p = p0
H1: p ≠ p0
o
H1: p > p0,
o
H1: p < p0,
2. Escoger el nivel de significación: 
3. Estadística de prueba: Z 
pˆ  p
→ N(0, 1)
pq
n
4. La Región crítica de la prueba es:

R.C. = {Z < Zα/2 = - Z1- α/2 o Z > Z1- α/2 } para H1: p ≠ p0

R.C. = {Z > Z1-α}

R.C. = {Z < Zα = -Z1-α} para H1: p < p0
para H1: p > p0
5. Con la información muestral y suponiendo que H0: p = p0 es cierta, hallar:
Z calc 
290
pˆ  p0
p0 q0
n
Donde
pˆ 
X # de éxitos en la muestra

= proporción de elementos que
n
n
poseen un atributo particular en la muestra.
6. Decisión: se rechaza H0 con riesgo igual a , Z calc R.C. (o si Z calc R.A. ). No
se rechaza H0 en caso contrario.
Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Zcalc, de manera que:
 Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
Ejemplo 10
Una muestra aleatoria de 800 clientes de supermercados, 378 fueron capaces de decir
el precio correcto de un artículo inmediatamente después de ponerlo en el carro.
Contrastar, al nivel de significación del 10%, la hipótesis nula de que al menos la
mitad de los compradores son capaces de decir el precio correcto, frente a la
alternativa de que la proporción poblacional es menor de la mitad. Asimismo, hallar
el p-valor.
Solución
Denotemos por p la proporción poblacional de compradores capaces de decir el
precio correcto en estas circunstancias. Queremos contrastar las hipótesis:
 H0: p ≥ p0 = 0.50
 = 0.10 → Zα = -Z1-α = -Z0.90 = -1.28
H1: p < 0.50
La región crítica es R.C. = {Z < -1.28}
Datos: p0 = 0.50,
n = 800,
X = 378
pˆ  378 / 800  0.4725
El estadístico del contraste es, entonces,
Z calc 
pˆ  p0 0.4725  0.50

= -1.56
p0 q0
0.5 x0.5
800
n
291
Decisión: como Zcalc = –1.64 ϵ R.C. se rechaza la hipótesis nula con el 10% de
significación. Se concluye que menos de la mitad de los compradores son capaces de
decir el precio correcto.
 P = P[Z < Zcalc] = P[Z < -1.56] = Ф(-1.56) = 0.05938
Rpta.
Como el valor-P = 0.06 <  = 0.10 se rechaza la hipótesis nula y se concluye
también que menos de la mitad de los compradores son capaces de decir el precio
correcto, con el 10% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 1P 1proporción y
aparece la Ventana 1 proporción (prueba e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir el Número de eventos: 378 (número
de éxitos) y el Número de ensayos: 800 (tamaño de la muestra).
Nota: Si los datos muestrales aparecen en una columna (1 para cada éxito y 0 para
cada fracaso), se escoge Muestras en columnas: y se ingresa dicha columna. Lo que
sigue es igual para ambos casos.
Marcar Realizar prueba de hipótesis y escribir en Proporción hipotética: 0.50.
Escoger Opciones… → Nivel de confianza: 90. Escoger en Hipótesis alterna: menor que.
Seleccionar Utilice la prueba y el intervalo basado en la distribución normal. Luego escoger
Aceptar y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba e IC para una proporción
Prueba de p = 0.5 vs. p < 0.5
Muestra
1
X
378
N
800
Muestra p
0.472500
Límite
superior 90%
0.495121
Valor Z
-1.56
Valor P
0.060
Uso de la aproximación normal.
Aparecen los resultados antes obtenidos Zcalc = -1.56 y el valor-P = 0.06 <  = 0.10 entonces se
rechaza la hipótesis nula y se concluye también que menos de la mitad de los compradores son
capaces de decir el precio correcto, con el 10% de significación.
292
6.8 PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES
Contrastar las hipótesis: Ho: p1 = p2 = p
o
p1 - p2 = 0
Contra:
H1: p1 < p2
o
H1: p1 > p2
o
H1: p1 ≠ p2
H1: p1 - p2 ≠ 0
o
H1: p1 - p2 > 0
o
H1: p1 - p2 < 0
Donde: p1 y p2 son parámetros, siendo estos parámetros las proporciones de
éxito de dos poblaciones binomiales.
La estadística de prueba en la cual se basa los criterios de decisión es la
variable aleatoria: pˆ 1  pˆ 2 ; que tiene distribución normal, esto se cumple para
muestras grandes la cual se aproxima a la distribución normal estándar.
Z
pˆ 1  pˆ 2  ( p1  p2 )
→ N(0, 1)
p1q1 p2 q2

n1
n2
Si se selecciona muestras aleatorias independientes de tamaño n1 y n2 de una
población binomial, se calcula la proporción de éxitos p̂1 y p̂2 de cada
muestra: pˆ 1 
X1
n1
pˆ 2 
y
X2
. Donde:
n2
X1: Es el número de éxitos en la muestra de tamaño n1
X2: Es el número de éxitos en la muestra de tamaño n2
El valor de la normal estándar Z, cuando Ho es verdadera y n1, n2 son grandes
es:
Z
pˆ 1  pˆ 2

p1q1 p2 q2

n1
n2
pˆ 1  pˆ 2
1 1
pq  
 n1 n2 
Para calcular Z, se estima el valor de p que aparece dentro del radical así:
pˆ 
X1  X 2
n1  n2
→ q̂ = 1- p̂
Entonces el valor de la estadística Z, es: Z calc 
pˆ 1  pˆ 2
1 1 
pˆ qˆ   
 n1 n2 
Luego usando los puntos críticos de la curva normal estándar se puede hallar
la región crítica para cada hipótesis alternativa.
293
PASOS PARA PROBAR LA HIPOTESIS DE DOS PROPORCIONES,
CUANDO LAS MUESTRAS SON GRANDES:
1. Ho: p1 = p2
H1:
o
p1 - p2 = 0
puede ser una de las alternativas.
H1: p1 < p2
o
H1: p1 > p2
o
H1: p1 ≠ p2
H1: p1 - p2 < 0
o
H1: p1 - p2 > 0
o
H1: p1 - p2 ≠ 0
2. Escoger un nivel de significación .
3. La estadística de prueba es la variable aleatoria Pˆ1  Pˆ2 , que tiene una
distribución aproximadamente normal cuando n1 y n2 son grandes. Es decir:
pˆ 1  pˆ 2
→ N(0, 1)
p1q1 p2 q2

n1
n2
Z
Suponiendo que Ho es verdadera.
4. Región Critica:

R.C. = {Z < Zα/2 = - Z1- α/2 o Z > Z1- α/2 } para H1: p1 ≠ p2

R.C. = {Z > Z1-α}
para H1: p1 > p2

R.C. = {Z < Zα = -Z1-α}
para H1: p1 < p2
5. Para los cálculos se halla:
pˆ 1 
X1
,
n1
pˆ 2 
Luego: Z calc 
X2
n2
pˆ 
y
X1  X 2
n1  n2
pˆ 1  pˆ 2
1 1 
pˆ qˆ   
 n1 n2 
6. Decisión: Rechazar: Ho; si Z pertenece a la región crítica; en caso contrario
aceptar Ho.
Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Zcalc, de manera que:
 Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.
294
Ejemplo 11
De una muestra aleatoria de 203 anuncios publicitados en revistas británicas,
52 eran humorísticos. De una muestra aleatoria independiente de 270 anuncios
publicados en revistas americanas, 56 eran humorísticos. Contrastar, frente a
una alternativa bilateral, la hipótesis nula de que las proporciones de anuncios
cómicos de las revistas británicas y americanas son iguales, con el 5% de
significación. Hallar p-valor.
Solución
Sea las proporciones poblacionales de anuncios humorísticos en revistas
británicas y americanas: p1 y p2, entonces se desea probar las hipótesis:
 Ho: p1 = p2
H1: p1 ≠ p2
y
con α = 0.05 → Z1 – α/2 = Z0.975 = 1.96
La región crítica es R.C. = {Z < -1.96 o Z > 1.96}
pˆ 1 
Datos: n1 = 203, X1 = 52,
pˆ 2 
X2
56
= 0.207,

n2 270
pˆ 
X 1 52
= 0.256,

n1 203
n2 = 270, X2 = 56,
X1  X 2
52  56
108
= 0.228 y q̂ =


n1  n2
2 0 3 2 7 0 4 7 3
0.772
El estadístico del contraste es:
Z calc 
pˆ 1  pˆ 2
1 1 
pˆ qˆ   
 n1 n2 

0.256  0.207
1 
 1
0.228 x0.772 

 203 270 
= 1.25
Decisión: como Zcalc = 1.25 ϵ R.A. no se rechaza la hipótesis nula con el 5% de
significación. Se concluye que las proporciones de anuncios cómicos de las
revistas británicas y americanas son iguales.
 P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = = 2 P[Z < -1.25] =
= 2 Ф(-1.25) = 2 (0.10565) = 0.2113
La hipótesis nula
Rpta.
de que las proporciones poblacionales de anuncios
humorísticos son la misma puede rechazarse para niveles de significación
mayores que 20.8%.
Como el valor-P = 0.2113 >  = 0.05 no se rechaza la hipótesis nula y se
concluye también que las proporciones de anuncios cómicos de las revistas
británicas y americanas son iguales, con el 5% de significación.
295
Cálculos utilizando Minitab
Del menú escoger Estadísticas → Estadísticas básicas → 2P 2proporciones y
aparece la Ventana 2 proporciones (prueba e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir para la Primera: y Segunda:
muestra en Eventos: 52 y 108 (número de éxitos) y en Ensayos: 203 y 403 (tamaño
de la muestra).
Nota: Si los datos muestrales aparecen en diferentes columnas (1 para cada éxito y 0
para cada fracaso), se escoge Muestras en diferentes columnas: y se ingresa dichas
columnas en Primera: y Segunda:. Lo que sigue es igual para ambos casos.
Escoger Opciones… → Nivel de confianza: 95. Dejar Diferencia de la prueba: 0.0. Escoger en
Hipótesis alterna: no es igual a. Seleccionar Utilice el cálculo agrupado de p para la prueba.
Luego escoger Aceptar y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba e IC para dos proporciones
Muestra
1
2
X
52
56
N
203
270
Diferencia = p
Estimado de la
IC de 95% para
Prueba para la
0.211
Muestra p
0.256158
0.207407
(1) - p (2)
diferencia: 0.0487502
la diferencia: (-0.0283508, 0.125851)
diferencia = 0 vs. no = 0: Z = 1.25 Valor P =
Prueba exacta de Fisher: Valor P = 0.225
Aparecen los resultados antes obtenidos Zcalc = 1.25 y el valor-P = 0.211 >  = 0.05 entonces no se
rechaza la hipótesis nula y se concluye también que las proporciones de anuncios cómicos de las
revistas británicas y americanas son iguales, con el 5% de significación.
296
PRUEBAS DE HIPÓTESIS PARA UN SOLO PARÁMETRO
H1:
μ > μ0
μ < μ0
μ ≠ μ0
μ > μ0
μ < μ0
μ ≠ μ0
H1:
σ >  02
2
σ2 <  02
σ2 ≠  02
H1:
μ > μ0
μ < μ0
μ ≠ μ0
P.H. PARA LA MEDIA POBLACIONAL H0 : μ = μ0
Caso
Estadístico de prueba
Rechazar H0 si:
Cuando la muestra es aleatoria de X ~
Zc > Z1 – α
X  0
2
2
Z

c
N (μ, σ ) con σ conocida o n ≥ 30.
Zc < Zα
/ n
|Zc| > Z1 – α/2
Cuando la muestra es aleatoria de X ~
Tc > t1 – α
X  0
Tc 
 tn 1
N (μ, σ2) con σ2 desconocida, n < 30.
Tc < tα
S/ n
|Tc| > t1 – α/2
P.H. PARA LA VARIANZA POBLACIONAL H0 : σ2 =  02
Caso
Estadístico de prueba
Rechazar H0 si:
2
La muestra es aleatoria de una población
χ2c > χ21 – α
(n  1)S
2
2
C 
  n 1
normal o aproximadamente normal.
χ2c < χ2α
2
0
χ2c < χ2 α/2 o
χ2c > χ21 – α/2
P.H. PARA LA PROPORCIÓN POBLACIONAL H0 : p = p0
Caso
Estadístico de prueba
La muestra es aleatoria y su tamaño es
pˆ  p0
Zc 
grande (n ≥ 30)
p0q0
n
Rechazar H0 si:
Zc > Z1 – α
Zc < Zα
|Zc| > Z1 – α/2
PRUEBAS DE HIPÓTESIS PARA DOS PARÁMETROS
H1:
 12 >  22
 12 <  22
 12 ≠  22
P.H. PARA LA IGUALDAD DE VARIANZAS POBLACIONALES H0 :  12 =  22
Caso
Estadístico de prueba
Rechazar H0 si:
2
Dos muestras aleatorias independientes de
Fc > f1 – α
S1
F


f
c
n

1
,
n

1
poblaciones normales.
Fc < fα
1
2
S22
Fc <f α/2 o
Fc > f1 – α/2
P.H. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES H0 : μ1 - μ2 = μ0
H1:
Caso
Estadístico de prueba
Rechazar H0 si:
μ1 - μ2 > μ0 1. Se toman dos muestras aleatorias
Zc > Z1 – α
X 1  X 2  0
Z

c
μ1 - μ2 < μ0
independientes, de poblaciones
Zc < Zα
 12  22
2
2

μ1 - μ2 ≠ μ0
|Zc| > Z1 – α/2
normales con  1
y 2
n1 n2
conocidas o n1 y n 2 ≥ 30.
μ1 - μ2 > μ0 2. Se toman dos muestras aleatorias
Tc > t1 – α
X 1  X 2  0
T


t
c
n

n

2
1
2
μ1 - μ2 < μ0
independientes de poblaciones
Tc < tα
1
2 1
2
2


μ1 - μ2 ≠ μ0
|Tc| > t1 – α/2
Sp  
normales, con  1
y 2
n
n
2 
 1
desconocidas pero
iguales
(varianzas homogéneas).
297
μ1 - μ2 > μ0 3.
Dos
muestras
aleatorias
X 1  X 2  0
 tH
μ1 - μ2 < μ0
independientes de poblaciones Tc 
2
2
S
S
1
 2
μ1 - μ2 ≠ μ0
normales con  12 y  22
n1 n2
desconocidas pero diferentes
2
 S12 S22 
(varianzas heterogéneas).
  
n
n2 
Con: H   12
2
 S12   S22 
   
 n1    n2 
n1  1 n2  1
Tc > t1 – α
Tc < tα
|Tc| > t1 – α/2
P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = 0
H1:
Caso
Estadístico de prueba
Rechazar H0 si:
p1 - p2 > 0 Dos muestras aleatorias independienZc > Z1 – α
pˆ1  pˆ 2
Z

c
p1 - p2 < 0 tes con n1 y n2 ≥ 30.
Zc < Zα
1 1
p1 - p2 ≠ 0
|Zc| > Z1 – α/2
pˆ qˆ   
n1 pˆ 1  n2 pˆ 2
Con pˆ 
n1 n2 

n1  n2
P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = p0
H1:
Caso
Estadístico de prueba
Rechazar H0 si:
p1 - p2 > p0 Dos muestras aleatorias independienZc > Z1 – α
pˆ1  pˆ 2  p0
Z

c
p1 - p2 < p0 tes con n1 y n2 ≥ 30.
Zc < Zα
pˆ1qˆ1 pˆ 2qˆ2

p1 - p2 ≠ p0
|Zc| > Z1 – α/2
n1
n2
298
6.9 PROBLEMAS RESUELTOS
1.
Las bolsas de cierta marca de gelatina indican un contenido medio de 250
gramos. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
246.5 gramos y una desviación típica de 12 gramos.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las bolsas? Hallar p-valor.
b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0.05. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el peso de las bolsas de gelatina.
1. Hipótesis: H0:  = 250 gr.
H1:   250
2. Nivel de significación:  = 0.05.
3. Estadística de prueba: para muestras grandes (n ≥ 30) es:

X
cuya distribución es N(0,1).
Z
/ n
4. Región crítica: para  = 0.05 y la alternativa bilateral, en la Tabla 1 de la
distribución normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 =
1.96
Luego, la región crítica en la variable Z está dada por:
RC  Z calc  1.96 o Z calc  1.96

5. Cálculos, de los datos se tiene: n = 36,
x  246.5,
ˆ  S  12 ,  =
250.
Entonces:

Z calc 
x 

n

246.5  250
 1.75
12
36
6. Decisión: Puesto que Zcalc = -1.75 ϵ R.A., no debemos rechazar H0 y
concluir con un 5% de significación que se está cumpliendo con el
contenido medio en las bolsas de gelatina.
 P-valor = P[|Z| > |-1.75|] = P[|Z| > 1.75] = 2 P[Z < -1.75] = 2(0.04006) =
0.0801.
299
Como el valor-P = 0.0801 >  = 0.05 no se rechaza Ho y se concluye también
con un 5% de significación que se está cumpliendo con el contenido medio en
las bolsas de gelatina.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
H1: σ2  250
1. Hipótesis : H0: σ2 = 250
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 36, y suponiendo
verdadera
2 
la
(n  1)S 2
2
hipótesis

H0,
la
estadística
de
prueba
es:
(n  1)S 2
2
  35
250
4. Región crítica: Para  = 0.05 y para un contraste bilateral, en la tabla 2 de
chi-cuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.025, 35  20.6 y 12 / 2,n1   02.975.35  53.2
Luego, la región crítica es: R.C. {X2 < 20.6 o X2 > 53.2}
5. Cálculos: De los datos de la muestra resulta S2 = 122 = 144, entonces,
2
 calc

(n  1)S 2 35S 2 35 (144)


 20.2
250
250
250
2
6. Decisión: Como  calc
= 20.2  R.C. se rechaza H0: σ2 = 250 y concluimos
que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa,
con el 5% de significación.
2
 Como la prueba es bilateral y  calc
= 20.2 < n – 1 = 35 el valor-P se obtiene
así:
2
2
P = 2 P[  n21 <  calc
] = 2 P[  35
< 20.2] = 2 x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 35 grados de libertad, no está el
valor 20.2, pero éste se encuentra entre los valores 18.5 (con probabilidad
0.01) y 20.6 (con probabilidad 0.025) se determina x interpolando de la
siguiente manera:
X2
P
18.5
0.01
20.2
x

20.6  18.5 20.2  18.5  140 = 1.7

0.025  0.01
x  0.01
x  0.01
300
20.6
0.025

140 x – 1.40 = 1.70

x = 0.02214
Reemplazando x = 0.02214 en (1) se obtiene:
P = P-valor = 2{0.02214} = 0.0443
Rpta.
Como el valor-P = 0.0443 <  = 0.05 se rechaza H0: σ2 = 250. Por lo tanto, se
concluye también con un 5% de significación que la varianza de las bolsas de
gelatina es diferente a 250 gr2 por bolsa.
2.
En un estudio para determinar si ha disminuido el tiempo de vida (en horas) del
artículo producido por una empresa, se tomó una muestra aleatoria de 31
artículos, encontrándose los resultados siguientes: x = 45020 horas y S = 171
horas.
a) Aceptaría usted que el verdadero tiempo promedio de vida de los artículos de
la empresa es menor de 45 090 horas. Use  = 0.01 y determine p-valor.
b) ¿Aceptaría usted que σ ≠ 200 horas por artículo? Use α = 0.05. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el tiempo de vida del artículo.
1. Hipótesis: H0:  = 45090 horas
H1:  < 45090
2. Nivel de significación:  = 0.01.
3. Estadística de prueba: para muestras grandes (n ≥ 30) es:

X
cuya distribución es N(0,1).
Z
/ n
4. Región crítica: para  = 0.01 y la alternativa unilateral izquierda, en la
Tabla 1 de la distribución normal estándar, se encuentra el valor crítico:
Z = -Z1- → Z0.01 = -Z0.99 = -2.33.
Luego, la región crítica está dada por: R.C = {Zcalc < -2.33}

x  45020 ,
5. De los datos se tiene: n = 31,
ˆ  S  171 ,  = 45090.

Entonces: Z calc
x 
45020  45090


 2.28 ϵ R.A.
/ n
171 / 31
6. Decisión: se acepta H0, se concluye al 1% de significación que el tiempo
promedio de vida de los artículos de la empresa es igual a 45 090 horas.
 P-valor = P = P[Z < -2.28] = 0.0113. Rpta.
301
Como P = 0.0113 >  = 0.01 se acepta Ho y se concluye también con  =
0.01 que el tiempo medio de vida de los artículos de la empresa es de 45 090
horas.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ = 200 → σ2 = 40000
H1: σ  200
→
H1: σ2 
40000
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 31, y suponiendo
verdadera
2 
H0,
(n  1)S 2
2

la
estadística
de
prueba
es:
(31  1)S 2
2
  30
40000
4. Región crítica: Para  = 0.05 y para un contraste bilateral, en la tabla 2 de
chi-cuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.025, 30  16.8 y 12 / 2,n1   02.975.30  47.0
Luego, la región crítica es: R.C. {X2 < 16.8 o X2 > 47.0}
5. Cálculos: De los datos de la muestra resulta S2 = 1712 = 29 241, entonces,
2
 calc

(n  1)S 2 30S 2 30 (29241)


 21.9
40000
40000
40000
2
6. Decisión: Como  calc
= 21.9  R.A. no se rechaza H0: σ = 200 y
concluimos que la desviación estándar del tiempo de vida de los artículos
de la empresa es igual a 200 horas, con el 5% de significación.
2
 Como la prueba es bilateral y  calc
= 21.9 < n – 1 = 30 el valor-P se obtiene
así:
2
2
P = 2 P[  n21 <  calc
] = 2 P[  30
< 21.9] = 2 x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no está el
valor 21.9, se determina x interpolando de la siguiente manera:
X2
P
20.6
0.10
21.9
x

23.4  20.6 21.9  20.6  28 = 1.3

0.20  0.10
x  0.10
x  0.10
302
23.4

0.20
28 x – 2.8 = 1.3

x = 0.1464
Reemplazando x = 0.1464 en (1) se obtiene:
P = P-valor = 2{0.1464} = 0.2928
Rpta.
Como el valor-P = 0.2928 >  = 0.05 se acepta H0: σ = 200. Por lo tanto, se
concluye también con un 5% de significación que la desviación estándar del
tiempo de vida de los artículos de la empresa es igual a 200 horas.
3.
Un proceso está programado para embolsar la cantidad media de 500 gramos de
sal. Se toma una muestra aleatoria de 41 bolsas, resultando una media de 495 gr.
y una desviación típica de 12 gr.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las bolsas de sal? Halle p-valor.
b) ¿Aceptaría usted que σ2 < 200 gr2 por bolsa? Use α = 0.01. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el contenido de sal en las bolsas.
1. Hipótesis: H0:  = 500 gr.
H1:  ≠ 500
2. Nivel de significación:  = 0.05
3. Estadística de prueba: para muestras grandes (n ≥ 30) es:

X
cuya distribución es N(0,1).
Z
/ n
4. Región crítica: para  = 0.05 y la alternativa bilateral, en la Tabla 1 de la
normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC  Z calc  1.96 o Z calc  1.96

x  495,
5. De los datos se tiene: n = 41,
ˆ  S  12 ,  = 500.

Entonces: Z calc
x 
495  500


 2.32 ϵ R.C.
 / n 12 / 31
6. Decisión: se rechaza H0 y se acepta H1:  ≠ 500, se concluye al 5% de
significación que no se está cumpliendo con el contenido medio en las
bolsas de sal.
 P-valor = P[|Z| > |-2.32|] = P[|Z| > 2.32] = 2 P[Z < -2.32] = 2(0.01017) =
0.02034.
Rpta.
303
Como P = 0.02034 <  = 0.05 se rechaza Ho y se concluye también con  =
0.05, que no se está cumpliendo con el contenido medio en las bolsas de sal.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 200 gr2
H1: σ2 < 200 gr2
2. Nivel de significación:  = 0.01
3. Estadística de prueba: población normal, con n = 41, y suponiendo
verdadera
 
2
(n  1)S 2
2
H0,
la
estadística
de
prueba
es:
(41  1)S 2
2

  40
200
4. Región crítica: Para  = 0.01 y para un contraste unilateral izquierdo, en la
tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente:
2, n1   02.01, 40  22.2
Luego, la región crítica es: R.C. {X2 < 22.2}
5. Cálculos: De los datos de la muestra resulta S2 = 122 = 144, entonces,

2
calc
(n  1)S 2 40S 2 40 (144)



 28.8
200
200
200
2
6. Decisión: Como  calc
= 28.8  R.A. no se rechaza H0: σ2 = 200 y
concluimos que la varianza del contenido en las bolsas de sal es igual a
200 gr2, con el 1% de significación.
 Como la prueba es unilateral a la izquierda el valor-P se obtiene así:
2
2
P = P[  n21 <  calc
] = P[  40
< 28.8] = x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no está el
valor 28.8, se determina x interpolando de la siguiente manera:
X2
P
26.5
0.05
28.8
x

29.1  26.5 28.8  26.5  52 = 2.3

0.10  0.05
x  0.05
x  0.05
29.1
0.10

52 x – 2.6 = 2.3

x = 0.0942
Reemplazando x = 0.0942 en (1) se obtiene: P = P-valor = 0.0942
304
Rpta.
Como el valor-P = 0.0942 >  = 0.05 se acepta H0: σ2 = 200. Por lo tanto, se
concluye también con el 1% de significación, que la varianza del contenido
en las bolsas de sal es igual a 200 gr2.
4.
Una muestra de 50 animales experimentales reciben una cierta clase de ración
por un período de 2 semanas. Sus aumentos de pesos arrojan los valores x =
420 gr. y S = 60 gr.
a) ¿Hay razón para creer que el aumento de peso neto medio poblacional es
mayor a 410 gr? Use α = 0.01. Halle p-valor.
b) Con α = 0.01 ¿Será rechazada la hipótesis σ2 = 2500 gr2 a favor de σ2 >
2500? Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el aumento de peso en los animales.
1. Hipótesis: H0:  = 410 gr.
H1:  > 410
2. Nivel de significación:  = 0.01
3. Estadística de prueba: para muestras grandes (n ≥ 30) es:

X
cuya distribución es N(0,1).
Z
/ n
4. Región crítica: para  = 0.01 y la alternativa unilateral derecha, en la Tabla
1 de la normal estándar, se encuentra el valor crítico: Z1- = Z0.99 = 2.33
Luego, la región crítica en la variable Z está dada por:
RC  Z calc  2.33

x  420,
5. De los datos se tiene: n = 50,
ˆ  S  60 ,  = 410.

Entonces: Z calc
x 
420  410


 1.18 ϵ R.A.
 / n 60 / 50
6. Decisión: no se rechaza H0:  = 410 y se concluye al 1% de significación,
que el aumento de peso neto medio de los animales es igual a 410 gr.
 P = P[Z > 1.18] = 1 - P[Z ≤ 1.18] = 1 – 0.881 = 0.119
Rpta.
Como valor-P = 0.119 >  = 0.01 no se rechaza Ho y se concluye también
con  = 0.01, que el aumento de peso neto medio de los animales es igual a
430 gr.
305
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 2500 gr2
H1: σ2 > 2500 gr2
2. Nivel de significación:  = 0.01
3. Estadística de prueba: población normal, con n = 50, y suponiendo
verdadera
2 
(n  1)S 2
2
H0,

la
estadística
de
prueba
es:
(50  1)S 2
2
  49
2500
4. Región crítica: Para  = 0.01 y para el contraste unilateral derecho, en la
tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente:
12 , n1   02.99, 49  74.9
Luego, la región crítica es: R.C. {X2 > 74.9}
5. Cálculos: De los datos de la muestra resulta S2 = 602 = 3600, entonces,
2
 calc

(n  1)S 2 49S 2 49 (3600)


 70.6
2500
2500
2500
2
6. Decisión: Como  calc
= 70.6  R.A. no se rechaza H0: σ2 = 2500 y se
concluye que la varianza del aumento del peso neto de los animales es
igual a 2500 gr2, con el 1% de significación.
 Como la prueba es unilateral a la derecha el valor-P se obtiene así:
2
2
2
P = P[  n21 >  calc
] = P[  49
> 70.6] = 1 - P[  49
≤ 70.6] = 1 - x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 49 grados de libertad, no está el
valor 70.6, se determina x interpolando de la siguiente manera:
X2
70.2
P
0.975
x

74.9  70.2 70.6  70.2

0.99  0.975
x  0.975
0.99

313.3 x – 305.5 = 0.4
70.6

313.3 =
0.4
x  0.975
74.9
Reemplazando x = 0.9763 en (1) se obtiene:
P = P-valor = 1 – 0.9763 = 0.0237
306
Rpta.

x = 0.9763
Como el valor-P = 0.0237 >  = 0.01 se acepta H0: σ2 = 2500. Por lo tanto, se
concluye también con el 1% de significación, que la varianza del aumento del
peso neto de los animales es igual a 2500 gr2.
5.
Una universidad grande quiere estimar el número medio de días de enfermedad
de los estudiantes durante un año; una muestra de 50 estudiantes indica que
x = 3.2 días y S = 5.2 días.
a) ¿Hay razón para creer que el verdadero número medio de días de enfermedad
es diferente a 6 días? Use α = 0.05. Halle p-valor.
b) Con α = 0.01 ¿Será rechazada la hipótesis σ2 = 50 a favor de σ2 < 50? Halle
p-valor.
Solución
a) Sea X la variable aleatoria definida como el número de días de enfermedad de
los estudiantes durante un año.
1. Hipótesis: H0:  = 6 días
H1:  ≠ 6
2. Nivel de significación:  = 0.05

X
3. Estadística de prueba: para n ≥ 30 es: Z 
→ N(0,1).
/ n
4. Región crítica: para  = 0.05 y la alternativa bilateral, en la Tabla 1 de la
normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC  Z calc  1.96 o Z calc  1.96

x  3.2,
5. De los datos se tiene: n = 50,
ˆ  S  5.2 ,
 =
6.

Entonces: Z calc
x 
3.2  6


 3.81 ϵ R.C.
 / n 5.2 / 50
6. Decisión: se rechaza H0 y se acepta H1:  ≠ 6, se concluye con el 5% de
significación, que el número medio de días de enfermedad de los
estudiantes es diferente a 6 días (de acuerdo a los resultados estimados es
de 3.2 días).
307
 P = P[|Z| > |-3.81|] = P[|Z| > 3.81] = 2 P[Z < -3.81] = 2(0.000) = 0.000.
Rpta.
Como P = 0.000 <  = 0.05 se rechaza Ho y se concluye también con  =
0.05, que el número medio de días de enfermedad de los estudiantes es
diferente a 6.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 50 días2
H1: σ2 < 50 días2
2. Nivel de significación:  = 0.01
3. Estadística de prueba: población normal, con n = 50, y suponiendo
verdadera
2 
(n  1)S 2
2
H0,

la
estadística
de
prueba
es:
(50  1)S 2
2
  49
50
4. Región crítica: para  = 0.01 y el contraste unilateral izquierdo, en la tabla
2 de chi-cuadrado se encuentran el valor crítico siguiente:
2, n1   02.01, 49  28.9
Luego, la región crítica es: R.C. {X2 < 28.9}
5. Cálculos: De los datos de la muestra resulta S2 = 5.22 = 27.04, entonces,
2
 calc

(n  1)S 2 49S 2 49 (27.04)


 26.5
50
50
50
2
6. Decisión: Como  calc
= 26.5  R.C. se rechaza H0: σ2 = 50 y concluimos
que la varianza del número de días de enfermedad de los estudiantes es
diferente a 50 días2, con el 1% de significación (de acuerdo a los
resultados estimados es de 27.04 días2).
 Como la prueba es unilateral a la izquierda el valor-P se obtiene interpolando:
2
2
P = P[  n21 <  calc
] = P[  49
< 26.5] = 0.0041
Como el valor-P = 0.0041 <  = 0.01 se rechaza H0: σ2 = 50. Por lo tanto, se
concluye también con el 1% de significación, que la varianza del número de
días de enfermedad de los estudiantes es diferente a 50 días2.
308
6.
Las calificaciones de diez estudiantes en un examen de estadística fueron: 43,
61, 67, 70, 74, 76, 79, 85, 94 y 81. Suponga que estas calificaciones proceden de
una población normal.
a) Ponga a prueba H0: μ = 70 contra H1: μ ≠ 70, con un nivel de significación del
5%. Halle p-valor.
b) Ponga a prueba H0: σ2 = 500 contra H1: σ2 ≠ 500, con un nivel de
significación de 0.05. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como las calificaciones de los alumnos.
1. Hipótesis: H0: μ = 70
H1: μ ≠ 70
2. Nivel de significación:  = 0.05.

x 
3. Estadística de prueba: T 
S/ n

t9
4. Región crítica: para  = 0.05 y la alternativa bilateral, se encuentra el valor
crítico en la Tabla 3: t1-/2, n-1 = t0.975, 9 = 2.262
Luego, la región crítica en la variable T es: R.C = {T < -2.262 o T >
2.262}

5. Cálculos, con los datos se obtiene: n = 10,
x = 73,
S = 14.08 y
μ=
70

Entonces: Tcalc
x 
73  70
= 0.67


S / n 14.08 / 10
6. Decisión: puesto que Tcalc = 0.67 ϵ R.A., se acepta H0 y se concluye con un
5% de significación que la nota promedio de los alumnos es de 70 puntos.
 Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T9| > |0.67|] = 2 P[T9 > 0.67] = 2{1 - P[T9 ≤ 0.67]} = 2 (1 – 0.75) = 0.50
Rpta.
Ya que en la tabla 3, T de student, para 9 grados de libertad, al valor 0.67 =
0.70, le corresponde una probabilidad acumulada de 0.75.
Como el valor-P = 0.50 >  = 0.05, se acepta Ho: μ = 70 y se concluye
también, con un 5% de significación, que la nota promedio de los alumnos es
de 70 puntos.
309
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 500
H1: σ2 ≠ 500
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 10, y suponiendo
verdadera
2 
(n  1)S 2
2
H0,

la
estadística
de
prueba
es:
(10  1)S 2
  92
500
4. Región crítica: Para  = 0.05 y para un contraste bilateral, en la tabla 2 de
chi-cuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.025, 9  2.70 y 12 / 2,n1   02.975.9  19.0
Luego, la región crítica es: R.C. {X2 < 2.70 o X2 > 19.0}
5. Cálculos: De los datos de la muestra resulta S2 = 14.082 = 198.25,
entonces,
2
 calc

(n  1)S 2 9S 2 9 (198.25)


 3.57
500
500
500
2
6. Decisión: Como  calc
= 3.57  R.A. no se rechaza H0: σ2 = 500 y se
concluye que la varianza de las notas de los alumnos es igual a 500
puntos2, con el 5% de significación.
2
 Como la prueba es bilateral y  calc
= 3.57 < n – 1 = 9 el valor-P se obtiene
así:
2
P = 2 P[  n21 <  calc
] = 2 P[  92 < 3.57] = 2 x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el
valor 3.57, se determina x interpolando de la siguiente manera:
X2
P
3.33
0.05
3.57
x

4.17  3.33 3.57  3.33  16.8 = 0.24

0.10  0.05
x  0.05
x  0.05
4.17
0.10

16.8 x – 0.84 = 0.24
Reemplazando x = 0.064 en (1) se obtiene:
P = P-valor = 2{0.064} = 0.128
Rpta.
310

x = 0.064
Como el valor-P = 0.128 >  = 0.05 se acepta H0: σ2 = 500. Por lo tanto, se
concluye también con un 5% de significación, que la varianza de las notas de
los alumnos es igual a 500 puntos2.
7.
Los pesos de los paquetes de arroz embolsado es de 15 Kg. Una muestra
aleatoria de 8 paquetes da una media de 15.3 Kg. y una desviación típica de
1.211 Kg. Suponga que los pesos se distribuyen normalmente.
a) Con una significación del 5 % pruebe si el verdadero peso medio de los
paquetes de arroz es distinto de 15 Kg. Halle p-value.
b) Ponga a prueba H0: σ2 = 5 contra H1: σ2 ≠ 5, con un α = 0.05. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el peso de los paquetes de arroz.
1. Hipótesis: H0: μ = 15
H1: μ ≠ 15
2. Nivel de significación:  = 0.05.

x 
3. Estadística de prueba: T 
S/ n

t7
4. Región crítica: para  = 0.05 y la alternativa bilateral, se encuentra el valor
crítico en la Tabla 3: t1-/2, n-1 = t0.975, 7 = 2.365
Luego, la región crítica en la variable T es: R.C = {T < -2.365 o T >
2.365}

5. Cálculos, con los datos se obtiene: n = 8,
x = 15.3,
S = 1.211 y
μ=
15

Entonces: Tcalc
x 
15.3  15
= 0.70


S / n 1.211 / 8
6. Decisión: puesto que Tcalc = 0.70 ϵ R.A., se acepta H0 y se concluye con un
5% de significación que el peso medio de los paquetes de arroz es igual a
15 Kg.
 Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T7| > |0.70|] = 2 P[T7 > 0.70] = 2{1 - P[T7 ≤ 0.70]} = 2 (1 – 0.75) = 0.50
Rpta.
Ya que en la tabla 3, T de student, para 7 grados de libertad, al valor 0.70, le
corresponde una probabilidad acumulada cercana a 0.75.
311
Como el valor-P = 0.50 >  = 0.05, se acepta Ho: μ = 15 y se concluye
también, con un 5% de significación, que el peso medio de los paquetes de
arroz es igual a 15 Kg.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 5
H1: σ2 ≠ 5
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 8, y suponiendo
verdadera
 
2
(n  1)S 2
2
H0,
la
estadística
de
prueba
es:
(8  1)S 2

  72
5
4. Región crítica: Para  = 0.05 y para un contraste bilateral, en la tabla 2 de
chi-cuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.025, 7  1.69 y 12 / 2,n1   02.975.7  16.0
Luego, la región crítica es: R.C. {X2 < 1.69 o X2 > 16.0}
5. Cálculos: De los datos de la muestra resulta S2 = 1.2112 = 1.467, entonces,

2
calc
(n  1)S 2 7S 2 7 (1.467)



 2.05
5
5
5
2
6. Decisión: Como  calc
= 2.05  R.A. no se rechaza H0: σ2 = 5 y se
concluye que la varianza de los pesos de los paquetes de arroz es igual a 5
Kg2, con el 5% de significación.
2
 Como la prueba es bilateral y  calc
= 2.05 < n – 1 = 7 el valor-P se obtiene
así:
2
P = 2 P[  n21 <  calc
] = 2 P[  72 < 2.05] = 2 x ……. (1)
Como en la tabla 2, de chi-cuadrado, para 7 grados de libertad, no está el
valor 2.05, se determina x interpolando de la siguiente manera:
X2
1.69
P
0.025
2.05
x

2.17  1.69 2.05  1.69

0.05  0.025 x  0.025
0.36
x  0.025
312

19.2 =
2.17
0.05

19.2 x – 0.48 = 0.36

x = 0.044
Reemplazando x = 0.044 en (1) se obtiene:
P = P-valor = 2{0.044} = 0.088
Rpta.
Como el valor-P = 0.088 >  = 0.05 se acepta H0: σ2 = 5. Por lo tanto, se
concluye también con un 5% de significación, que la varianza de los pesos de
los paquetes de arroz es igual a 5 Kg2.
8.
Se prueba una muestra aleatoria de 5 fusibles de cierta marca para determinar el
punto medio de ruptura. Los puntos de ruptura medidos en amperes fueron: 28,
32, 30, 24 y 36.
a) ¿Hay razón para creer que el verdadero punto medio de ruptura es mayor de
22 amperes? Use α = 0.01. Halle p-valor.
b) Con α = 0.01, ¿Será rechazada la hipótesis σ2 = 30 amp2 a favor de σ2 < 30?
Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el punto de ruptura de los fusibles.
1. Hipótesis: H0: μ = 22 amperes
H1: μ > 22
2. Nivel de significación:  = 0.01.

x 
3. Estadística de prueba: T 
S/ n

t7
4. Región crítica: para  = 0.01 y la alternativa unilateral derecha, se
encuentra el valor crítico en la Tabla 3: t1-, n-1 = t0.99, 4 = 3.747
Luego, la región crítica en la variable T es: R.C = {T > 3.747}

5. Cálculos, con los datos se obtiene: n = 5,
x = 30,
S = 4.472 y
μ=
22

Entonces: Tcalc
x 
30  22
= 4.0


S / n 4.472 / 5
6. Decisión: puesto que Tcalc = 4.0 ϵ R.C., se rechaza H0 y se concluye con el
1% de significación que el punto medio de ruptura es mayor de 22
amperes.
 Siendo la prueba unilateral derecha, entonces p-valor = P es:
P = P[T4 > Tcalc] = P[T4 > 4.0] = {1 - P[T4 ≤ 4.0]} = (1 – 0.9915) = 0.0085 Rpta.
313
Ya que en la tabla 3, T de student, para 4 grados de libertad, no está el valor
4.0, se interpola y obtiene una probabilidad acumulada de 0.9915.
Como el valor-P = 0.0085 <  = 0.01, se rechaza Ho: μ = 22 y se concluye
también, con el 1% de significación, que el punto medio de ruptura de los
fusibles es mayor de 22 amperes.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 30 amp2
H1: σ2 < 30
2. Nivel de significación:  = 0.01
3. Estadística de prueba: población normal, con n = 5, y suponiendo
verdadera
2 
(n  1)S 2
2
H0,

la
estadística
de
prueba
es:
(5  1)S 2
  42
30
4. Región crítica: Para  = 0.01 y para un contraste de la cola izquierda, en la
tabla 2 de chi-cuadrado se encuentra el siguiente valor crítico:
2, n1   02.01. 4  0.297
Luego, la región crítica es: R.C. {X2 < 0.297}
5. Cálculos: De los datos de la muestra resulta S2 = 20, entonces,
2
 calc

(n  1)S 2 4S 2 4 (20)


 2.67
30
30
30
2
6. Decisión: Como  calc
= 2.67  R.A. no se rechaza H0: σ2 = 30 y se
concluye que la varianza de los puntos de ruptura de los fusibles es igual a
30 amp2, con el 1% de significación.
2
 Como la prueba es unilateral izquierda y  calc
= 2.67, el valor-P se obtiene
así:
2
P = P[  n21 <  calc
] = P[  42 < 2.67] = 0.3857
Rpta.
Ya que en la tabla 2, de chi-cuadrado, para 4 grados de libertad, no está el
valor 2.67, se interpola y obtiene una probabilidad acumulada de 0.3857
Como el valor-P = 0.3857 >  = 0.01 se acepta H0: σ2 = 30. Por lo tanto, se
concluye también con el 1% de significación, que la varianza de los puntos de
ruptura de los fusibles es igual a 30 amp2.
314
9.
Un fabricante sostiene que sus autos consumen en promedio 2.50 galones de
gasolina cada 100 Km. Un vendedor de la compañía comprueba el consumo de
gasolina de 25 autos y encuentra que el consumo medio es de 2.61 galones cada
100 Km. con una desviación estándar de 0.25 galones.
a) ¿puede dudarse de lo sustentado por el fabricante? Use α = 0.01. Halle pvalor.
b) ¿Será rechazada la hipótesis σ2 ≠ 0.38? Use α = 0.01. Halle p-valor.
Solución
a) Sea X la variable definida como el número galones consumidos cada 100 Km.
1. Hipótesis: H0: μ = 2.5 galones
H1: μ ≠ 2.5
2. Nivel de significación:  = 0.01.

x 
3. Estadística de prueba: T 
S/ n

t 24
4. Región crítica: para  = 0.01 y la prueba es bilateral, se encuentra el valor
crítico en la Tabla 3: t1-/2, n-1 = t0.995, 24 = 2.797
Luego, la región crítica en la variable T es: R.C = {T < -2.797 o T >
2.797 }

5. Cálculos, con los datos se obtiene: n = 25,
x = 2.61,
S = 0.25 y
μ=
2.5

Entonces: Tcalc
x 
2.61  2.50
= 2.2


S / n 0.25 / 25
6. Decisión: puesto que Tcalc = 2.2 ϵ R.A., no se rechaza H0 y se concluye con
el 1% de significación que el consumo medio de gasolina en los autos es
de 2.5 galones cada 100 Km. y no puede dudarse de lo sustentado por el
fabricante.
 Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T24| > |2.2|] = 2 P[T24 > 2.2] = 2{1 - P[T24 ≤ 2.2]} = 2 (1 – 0.98) = 0.04
Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no está el valor
2.2, se interpola y obtiene una probabilidad acumulada de 0.98.
315
Como el valor-P = 0.04 >  = 0.01, no se rechaza Ho: μ = 2.5 y se concluye
también, con el 1% de significación, que el consumo medio de gasolina en los
autos es de 2.5 galones cada 100 Km.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 0.38 galones2
H1: σ2 ≠ 0.38
2. Nivel de significación:  = 0.01
3. Estadística de prueba: población normal, con n = 5, y suponiendo
verdadera
2 
H0,
(n  1)S 2
2

la
estadística
de
prueba
es:
(25  1)S 2
2
  24
0.38
4. Región crítica: Para  = 0.01 y para un contraste bilateral, en la tabla 2 de
chi-cuadrado se encuentran los siguientes valores críticos:
2 / 2,n1   02.005, 24  9.89 y 12 / 2,n1   02.995. 24  45.6
Luego, la región crítica es: R.C. {X2 < 9.89 o X2 > 45.6}
5. Cálculos: De los datos de la muestra resulta S2 = 0.252 = 0.0625, entonces,
2
 calc

(n  1)S 2 24S 2 24 (0.0625)


 3.95
0.38
0.38
0.38
2
6. Decisión: Como  calc
= 3.95  R.C. se rechaza H0: σ2 = 0.38 y se
concluye que la varianza del consumo de gasolina en los autos por cada
100 Km. es diferente a 0.38 galones2, con el 1% de significación.
2
 Como la prueba es bilateral y  calc
= 3.95 < n – 1 = 24 el valor-P se obtiene
así:
2
2
P = 2 P[  n21 <  calc
] = 2 P[  24
< 3.95] = 2 (0.00) = 0.000
Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor
3.95, tiene una probabilidad acumulada menor de 0.0005 ≡ 0.000
Como el valor-P = 0.000 <  = 0.01 se rechaza H0: σ2 = 0.38. Por lo tanto, se
concluye también con el 1% de significación, que la varianza del consumo de
gasolina en los autos por cada 100 Km. es diferente a 0.38 galones2.
316
10. Una muestra de 25 clientes de cierta gasolinera indica que el número medio de
galones comprados a la semana es de x = 14.3 y la desviación estándar de S =
2.7 galones.
a) Con el 5 % de significación. ¿Hay razón para creer que el verdadero número
medio de galones comprados a la semana por cliente es menor de 15.6?
Determine el p-valor.
b) Con α = 0.05 ¿Aceptaría usted que σ2 > 4.1? Determine el p-valor.
Solución
a) Sea X la variable definida como el número de galones de gasolina comprados
a la semana por un cliente.
1. Hipótesis: H0: μ = 15.6 galones
H1: μ < 15.6
2. Nivel de significación:  = 0.05.

x 
3. Estadística de prueba: T 
S/ n

t 24
4. Región crítica: para  = 0.05 y la prueba de la cola izquierda, se encuentra
el valor crítico en la Tabla 3: t, n-1 = -t1-, n-1 → t0.05, 24 = -t0.95, 24 = -1.711.
Luego, la región crítica en la variable T es: R.C = {T < -1.711}

5. Cálculos, con los datos se obtiene: n = 25,
x = 14.3,
S = 2.7 y
μ=
15.6

Entonces: Tcalc
x  14.3  15.6
= -2.41


S/ n
2.7 / 25
6. Decisión: puesto que Tcalc = -2.41 ϵ R.C., se rechaza H0 y se concluye con
el 5% de significación, que el consumo medio semanal de gasolina por
cliente es menor a 15.6 galones.
 Siendo la prueba unilateral izquierda, entonces p-valor = P es:
P = P[T24 < -2.41] = 1 - P[T24 ≤ 2.41] = 1 – 0.987 = 0.013 Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no está el valor
2.41, se interpola y obtiene una probabilidad acumulada de 0.987.
Como el valor-P = 0.013 <  = 0.05, rechaza Ho: μ = 15.6 y se concluye
también, con el 5% de significación, que el consumo medio semanal de
gasolina por cliente es menor a 15.6 galones.
317
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: σ2 = 4.1 galones2
H1: σ2 > 4.1
2. Nivel de significación:  = 0.05
3. Estadística de prueba: población normal, con n = 25, y suponiendo
verdadera
2 
(n  1)S 2
2
H0,

la
estadística
de
prueba
es:
(25  1)S 2
2
  24
4.1
4. Región crítica: Para  = 0.05 y para un contraste unilateral derecho, en la
tabla 2 de chi-cuadrado se encuentran el siguiente valor crítico:
12 ,n1   02.95, 24  36.4
Luego, la región crítica es: R.C. {X2 > 36.4}
5. Cálculos: De los datos de la muestra resulta S2 = 2.72 = 7.29, entonces,
2
 calc

(n  1)S 2 24S 2 24 (7.29)


 42.7
4.1
4.1
4.1
2
6. Decisión: Como  calc
= 42.7  R.C. se rechaza H0: σ2 = 4.1 y se concluye
que la varianza de las compras de gasolina por cliente es mayor de 4.1
galones2, con el 5% de significación.
 Como la prueba es unilateral derecha el valor-P se obtiene así:
2
2
2
P = P[  n21 >  calc
] = P[  24
> 42.7] = 1 - P[  24
≤ 42.7] = 1- 0.99 = 0.01
Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor
42.7, tiene una probabilidad acumulada cercana a 0.99.
Como el valor-P = 0.01 <  = 0.05 se rechaza H0: σ2 = 4.1. Por lo tanto, se
concluye también con el 5% de significación, que la varianza de las compras
de gasolina por cliente es mayor de 4.1 galones2.
11. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración
en Km. Dos muestras aleatorias de 31 llantas de cada marca, dieron estos
resultados:
x1 = 46300, n1 = 31, S1 = 5000
y
x 2 = 48100, n2 = 31, S2 = 6100.
¿Son diferentes las duraciones medias de las llantas de ambas marcas? Use α =
0.01. Determine p-valor.
318
Solución
Sean X1 y X2 la duración (en Km.) de las llantas marca 1 y 2 respectivamente y
1, 2 sus respectivas medias. Se desconoce la distribución de probabilidades de
X1 y X2, pero las muestras son grandes (n1 = n2 = 31 > 30). Para determinar si
son diferentes las duraciones medias de las llantas de ambas marcas, se
comparan sus duraciones medias: 1 ≠ 2.
1. Hipótesis: H0: 1 = 2 contra H1: 1 ≠ 2
2. Nivel de significación: = 0.01.
3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
Z
X1  X 2
 12
n1

 22
 N (0, 1)
n2
4. Región Crítica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la
normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.995 = 2.575
Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc < -2.575 o Zcalc > 2.575}
5. Cálculos, de los datos se tiene:
n1 = 31,
x1 = 46300, S1 = 5000
y
n2 = 31,
x 2 = 48100, S2 =
6100.
E.S. = Error estándar =
Z calc 
S12 S 22
5000 2 6100 2



= 1416.61
n1 n2
31
31
x1  x 2 46300  48100

 1.27
ES
1416.61
6. Decisión: ya que Zcalc = -1.27  R.A., no se rechaza Ho y se concluye con el
1% de significación, que la duración media de las llantas marca 1 y 2 es la
misma.
 El valor P para la prueba bilateral es:
P = P[|Z| > |-1.27|] = P[|Z| > 1.27] = 2P[Z < -1.27] = 2(0.10204) = 0.2041
Rpta.
319
Como P = 2041 >  = 0.01 no se rechaza Ho y se concluye también que la
duración media de las llantas de marcas es la misma, con el 1% de
significación.
12. Muestras del pago por hora para los choferes de camiones en las ciudades 1 y 2
proporcionan los siguientes datos:
n1 = 35,
x1 = $ 5.30, S1 = $ 0.16
y
n2 = 40,
x 2 = $ 5.40, S2 = $
0.15.
Con un nivel de significación del 1 %, probar si el pago medio por hora a los
choferes de camión de la ciudad 1 es menor que el pago medio por hora a los
choferes de camión de la ciudad 2. Hallar p-valor.
Solución
Sean X1 y X2 el pago por hora a los choferes de camión en las ciudades 1 y 2
respectivamente y 1, 2 sus respectivas medias. Se desconoce las distribución
de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para
probar si el pago medio por hora a los choferes de camión de la ciudad 1 es
menor que el pago medio por hora a los choferes de la ciudad 2, se compara: 1
< 2.
1. Hipótesis: H0: 1 = 2 contra H1: 1 < 2
2. Nivel de significación: = 0.01.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
Z
X1  X 2
 12
n1

 22
 N (0, 1)
n2
4. Región Crítica. Para = 0.01 y la alternativa unilateral izquierda, en la Tabla 1
de la normal estándar, el valor crítico es: Z = -Z1- → Z0.01 = -Z0.99 = -2.33.
Luego, la región crítica está dada por: R.C = {Zcalc < -2.33}
5. Cálculos, de los datos se tiene:
x1 = $ 5.30, n1 = 35, S1 = $ 0.16
0.15.
320
y
x 2 = $ 5.40, n2 = 40, S2 = $
E.S. = Error estándar =
S12 S 22
0.16 2 0.15 2



= 0.036
n1 n2
35
40
Z calc 
x1  x 2 5.30  5.40

 2.78
ES
0.036
6. Decisión: ya que Zcalc = -2.78  R.C., se rechaza Ho y se concluye con el 1%
de significación, que el pago medio por hora a los choferes de camión de la
ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2.
 El valor P para la prueba unilateral izquierda es:
P = P[Z < -2.78] = 0.0027
Rpta.
Como P = 0.0027 <  = 0.01 se rechaza Ho y se concluye también que el
pago medio por hora a los choferes de camión de la ciudad 1 es menor que el
pago medio por hora a los choferes de la ciudad 2, con el 1% de significación.
13. En un estudio para determinar el gasto medio semanal en alimentos en los
hogares de las ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la
ciudad 1 arrojando un gasto medio de S/. 150 y una desviación estándar de 35.
Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 140 y
una desviación estándar de 30. Probar si es diferente el gasto medio semanal en
alimentos en las ciudades 1 y 2. Use α = 0.05. Hallar p-valor.
Solución
Sean X1 y X2 el gasto semanal en alimentos en los hogares de las ciudades 1 y 2
respectivamente y 1, 2 sus respectivas medias. Se desconoce la distribución
de probabilidades de
X1 y X2, pero las muestras son grandes (n1 y n2 > 30).
Para determinar si es diferente el gasto medio semanal en alimentos en ambas
ciudades, se comparan sus gastos medios: 1 ≠ 2.
1. Hipótesis: H0: 1 = 2 vs H1: 1 ≠ 2
2. Nivel de significación: = 0.05.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
Z
X1  X 2
 12
n1

 22
n2
321
 N (0, 1)
4. Región Crítica. Para = 0.05 y la alternativa bilateral, en la Tabla 1 de la
normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc < -1.96 o Zcalc > 1.96}
5. Cálculos, de los datos se tiene:
n1 = 200, x1 = 150,
S1 = 35
E.S. = Error estándar =
y
n2 = 180, x 2 = 140,
S2 = 30.
S12 S 22
35 2 30 2



= 3.34
n1 n2
200 180
Z calc 
x1  x 2 150  140
= 2.99

ES
3.34
6. Decisión: ya que Zcalc = 2.99  R.C., se rechaza Ho y se concluye con el 5%
de significación, que el gasto medio semanal en alimentos en las ciudades 1 y
2 es diferente.
 El valor P para la prueba bilateral es:
P = P[|Z| > |2.99|] = P[|Z| > 2.99] = 2Ф(-2.99) = 2(0.00139) = 0.00278
Rpta.
Como P = 0.00278 <  = 0.05 se rechaza Ho y se concluye también que el
gasto medio semanal en alimentos de ambas ciudades es diferente, con el 5%
de significación.
14. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2;
muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron
estos resultados: n1 = 200,
X 1 = 160, S1 = 60
y
n2 = 150, X 2 = 150,
S2 = 50.
Use α = 0.05, para determinar si el gasto medio mensual en educación de la
ciudad 1 es mayor que el gasto medio mensual en educación de la ciudad 2.
Hallar el p-valor.
Solución
Sean X1 y X2 el gasto mensual en educación realizado por las familias de las
ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce
las distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1
y n2 > 30). Para determinar si el gasto medio mensual en educación de la ciudad
322
1 es mayor que el gasto medio mensual en educación de la ciudad 2, se
comparan sus gastos medios: 1 > 2.
1. Hipótesis: H0: 1 = 2 contra H1: 1 > 2
2. Nivel de significación: = 0.05.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
Z
X1  X 2
 12
n1

 22
 N (0, 1)
n2
4. Región Crítica. Para = 0.05 y la alternativa unilateral derecha, en la Tabla 1
de la normal estándar, se encuentra el valor crítico: Z1- = Z0.95 = 1.645.
Luego, la región crítica en la variable Z está dada por: RC = { Zcalc > 1.645}
5. Cálculos, de los datos se tiene:
n1 = 200, X 1 = 160, S1 = 60
E.S. = Error estándar =
y
n2 = 150, X 2 = 150, S2 = 50.
S12 S 22
60 2 50 2



= 5.89
n1 n2
200 150
Z calc 
x1  x 2 200  150
= 1.70

ES
5.89
6. Decisión: ya que Zcalc = 1.70  R.C., se rechaza Ho y se concluye con el 5%
de significación, que el gasto medio mensual en educación de la ciudad 1 es
mayor que el gasto medio mensual en educación de la ciudad 2.
 El valor P para la prueba unilateral derecha es:
P = P[Z > 1.70] = 1 – Ф(1.70) =1 – 0.95543 = 0.04457
Rpta.
Como P = 0.04457 <  = 0.05 se rechaza Ho y se concluye también que el
gasto medio mensual en educación de la ciudad 1 es mayor que el gasto
medio mensual en educación de la ciudad 2, con el 5% de significación.
15. Para determinar el costo medio mensual de la enseñanza en las universidades A
y B, se toma una muestra al azar de 121 alumnos de la universidad A arrojando
un costo medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al
azar de 121 alumnos de la universidad B da una costo medio de S/. 675 y una
desviación estándar de S/. 90. Con α = 0.01, probar si es diferente el costo medio
mensual de la enseñanza en las universidades A y B. Hallar p-valor.
323
Solución
Sean XA y XB el costo mensual de la enseñanza en las universidades A y B
respectivamente y A, B sus respectivas medias. Se desconoce la distribución
de probabilidades de
XA y XB, pero las muestras son grandes (nA y nB > 30).
Para determinar si es diferente el costo medio mensual de la enseñanza en ambas
universidades, se comparan sus gastos medios: A ≠ B.
1. Hipótesis: H0: A = B vs H1: A ≠ B
2. Nivel de significación: = 0.01.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras
grandes, la estadística apropiada es:
Z
XA XB
 A2
nA

 B2
 N (0, 1)
nB
4. Región Crítica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la
normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.995 = 2.575
Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc < -2.575 o Zcalc > 2.575}
5. Cálculos, de los datos se tiene:
nA = 121, x A = 650,
SA = 70
E.S. = Error estándar =
y
nB = 121, x B = 675,
SB = 90.
S A2 S B2
70 2 90 2



= 10.37
n A nB
121 121
Z calc 
x A  x B 650  675
= -2.41

ES
10.37
6. Decisión: ya que Zcalc = -2.41  R.A., no se rechaza Ho y se concluye con el
1% de significación, que es igual el costo medio mensual de la enseñanza en
las universidades A y B.
 El valor P para la prueba bilateral es:
P = P[|Z| > |-2.41|] = P[|Z| > 2.41] = 2Ф(-2.41) = 2(0.00798) = 0.01596
Rpta.
324
Como P = 0.01596 >  = 0.01 se acepta Ho y se concluye también que el
costo medio mensual de la enseñanza en ambas universidades es igual, con el
1% de significación.
16. La producción de 13 obreros de la jornada diurna, dio un promedio de 82 piezas
con una desviación estándar de 10, mientras que para 11 obreros de la jornada
nocturna, dio un promedio de 74 con una desviación estándar de 7. Con el 5% de
significación (α = 0.05), probar si:
a) ¿Son heterogéneas las varianzas de ambos turnos? Halle p-valor.
b) ¿Es diferente la producción media de los dos turnos? Halle p-valor.
Solución
Sean X1 y X2 las variables que representan el número de piezas producidas en
los turnos diurno (1) y nocturno (2) respectivamente. Asumiendo que las dos
poblaciones se distribuyen normalmente con varianzas desconocidas y las
muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son
heterogéneas, para según ello probar si las medias son diferentes.
Datos: n1 = 13, X 1 = 82, S1 = 10
a) 1. Hipótesis: H0:  12 =  22
y
n2 = 11, X 2 = 74, S2 = 7.
H1:  12 ≠  22
2. Nivel de significación:  = 0.05
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = 13 y n2 = 11, la estadística de prueba es:
F
S12
 f12,10
S 22
4. Región crítica. Para  = 0.05 y la prueba bilateral en la Tabla 4, los valores
críticos F son: f12, 10, 0.025 = 1/ f10, 12, 0.975 = 1/ 3.37 = 0.297 y f12, 10, 0.975 =
3.62.
R.C. = {F < 0.297 o F > 3.62}
5. Cálculos: con los datos de la muestra se obtiene:
S12 = 100, S 22 = 49 y Fcalc 
S12 100

= 2.04
49
S 22
325
6. Decisión. Como Fcalc = 2.04  R.A. se acepta Ho y concluimos que las
varianzas del número de piezas producidas en los turnos diurno y nocturno
son iguales (homogéneas), con el 5% de significación.
 El valor P para la prueba bilateral y como Fcalc = 2.04 > 1 se obtiene así:
P = 2 P[f12,10 > 2.04] = 2 {1 - P[f12,10 ≤ 2.04]} > 0.10 (en Excel 0.2674).
Rpta.
Ya que en la Tabla 4 de la F, para 12 y 10 grados de libertad, la probabilidad
acumulada hasta 2.04 es menor a 0.95 (en Excel es 0.8663).
Como P > 0.10 >  = 0.05, se acepta la hipótesis nula y se concluye también
que las varianzas del número de piezas producidas en los turnos diurno y
nocturno son homogéneas, con el 5% de significación.
b) A continuación se prueba si es diferente la producción media de los dos
turnos.
1. Hipótesis: H0: 1 = 2
y
H1: 1 ≠ 2
2. Nivel de significación:  = 0.05
3. La estadística de prueba cuando las varianzas son homogéneas es:
T
X1  X 2
S c2 S c2

n1 n2
 t13112  t 22
4. Región crítica, para  = 0.05 y la prueba bilateral, en la Tabla 3: t22, 0.975 =
2.074. Entonces:
R.C. = {T < -2.0745 o T > 2.074}
5. Con la información muestral: n1 = 13, X 1 = 82, S1 = 10 y n2 = 11, X 2 =
74, S2 = 7; y bajo el supuesto que Ho es cierta se determina:
S
2
c
n1  1 S12  (n2  1)S22 13x102  11x72



tcalc 
n1  n2  2
x1  x 2
 Sc2 Sc2 
  
 n1 n2 

13  11  2
82  74
 83.59 83.59 
 13  11 


= 83.59
 2.14
6. Decisión: como tcalc = 2.14  R.C. se rechaza Ho y se concluye con el 5%
de significación, que la producción media de los dos turnos son diferentes.
326
 Para dos colas: P = 2P[T22 > 2.14] = 2[1 – P(T22 ≤ 2.14)] = 2[1 – x] …….. (1)
En la Tabla 3, T de student, no está el valor 2.15, se determina x interpolando
así:
Tα
P
2.074 0.975
2.14
x

2.508  2.074 2.14  2.074

0.990  0.975
x  0.975

28.93x – 28.21 = 0.066

28.93 =
0.066
x  0.975
2.508
0.990
 x = 0.9774
Reemplazando x = 0.9774 en (1) se obtiene:
P-valor = 2 [1 – 0.9774] = 0.0452
Rpta.
Como el valor-P = 0.0452 <  = 0.05 se rechaza Ho y se concluye también
que la producción media de los dos turnos son diferentes, con el 5% de
significación.
17. Dos máquinas enlatan café independientemente. Mediante muestras aleatorias
sin reemplazo, de latas con café tomadas de cada máquina, se han obtenido los
siguientes resultados sobre el peso de las latas (en gramos):
n1 = 16, X 1 = 495, S1 = 9
y
n2 = 16,
X 2 = 505, S2 = 5.
a) ¿Son diferentes las varianzas de los pesos de las latas con café de ambas
máquinas? Use  = 0.05. Halle p-valor.
b) ¿Es mayor el peso medio de las latas con café de la máquina 2 que el de la
máquina 1? Use  = 0.01 y determine p-valor.
Solución
Sean X1 y X2 las variables que representan el peso de las latas con café (en gr.)
de las máquinas 1 y 2 respectivamente. Asumiendo que las dos poblaciones se
distribuyen normalmente con varianzas desconocidas y las muestras son
pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son diferentes, para
según ello probar si es mayor el peso medio de las latas con café de la máquina 2
que el de la máquina 1.
Datos: n1 = 16, X 1 = 495, S1 = 9
a) 1. Hipótesis: H0:  12 =  22
y
n2 = 16,
H1:  12 ≠  22
327
X 2 = 505, S2 = 5.
2. Nivel de significación:  = 0.05
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = n2 = 16, la estadística de prueba es:
F
S12
 f15,15
S 22
4. Región crítica. Para  = 0.05 y la prueba bilateral en la Tabla 4, los valores
críticos F son: f15, 15, 0.025 = 1/ f15, 15, 0.975 = 1/ 2.86 = 0.35 y f15, 15, 0.995 =
2.86.
R.C. = {F < 0.35 o F > 2.86}
5. Cálculos: con los datos de la muestra se obtiene:
S12 = 81, S 22 = 25 y Fcalc 
S12 81

= 3.24
S 22 25
6. Decisión. Como Fcalc = 3.24  R.C. se rechaza Ho y concluimos que las
varianzas de los pesos de las latas con café de ambas máquinas son
diferentes (heterogéneas), con el 5% de significación.
 El valor P para la prueba bilateral y como Fcalc = 3.24 > 1 se obtiene así:
P = 2 P[f15,15 > 3.24] = 2 {1 - P[f15,15 ≤ 3.24]} = 2{1 – x} ……. (1)
Como en la Tabla 4 de la distribución F, para 15 y 15 grados de libertad, no
está el valor 3.24, pero éste se encuentra entre los valores 2.86 (con
probabilidad 0.975) y 3.52 (con probabilidad 0.99) para hallar x se interpola
así:
Fα
P
2.86
0.975
3.24
x

3.52  2.86 3.24  2.86  44 = 0.38

0.99  0.975
x  0.975
x  0.975
3.52
0.99

44 x – 42.9 = 0.38  x = 0.984
Reemplazando x = 0.984 en (1) se tiene:
P = 2 {1 – 0.984} = 0.032
Rpta.
Como P = 0.032 <  = 0.05, se rechaza la hipótesis nula y se concluye
también que las varianzas de los pesos de las latas con café de ambas
máquinas son diferentes (heterogéneas), con el 5% de significación.
328
b) A continuación se prueba si el peso medio de las latas con café de la máquina
2, es mayor que el peso medio de las latas con café de la máquina 1.
1. Hipótesis: H0: 1 = 2
H1: 2 > 1
y
2. Nivel de significación:  = 0.01
3. La estadística de prueba cuando las varianzas son heterogéneas es:
T
X 2  X1
S12 S 22

n1 n2
 t H  t 23
2
2
 S12 S 22 
 81 25 



  
n1 n2 
 16 16 

Donde: H =
=
= 23.45 ≡ 23
2
2
2
2
 81 
 25 
 S12 
 S 22 
 
 
 
 
 16    16 
 n1    n2 
16  1 16  1
n1  1
n2  1
4. Región crítica, para  = 0.01 y la prueba unilateral derecha, en la Tabla 3 el
valor crítico es: t23, 0.99 = 2.50. Entonces:
R.C. = {T > 2.50}
5. Con la información muestral: n1 = 16, X 1 = 495, S1 = 9, n2 = 16, X 2 =
505, S2 = 5; y bajo el supuesto que Ho es cierta se determina:
tcalc 
X 2  X1
S12 S22

n1 n2

505  495
 3.89
81 25

16 16
6. Decisión: como tcalc = 3.89  R.C. se rechaza Ho y se concluye con el 1%
de significación, que el peso medio de las latas con café de la máquina 2 es
mayor que el peso medio de las latas con café de la máquina 1.
 Para la cola del lado derecho:
P = P[T23 > 3.89] = 1 - P[T23 ≤ 3.89] < 0.0005
(en Excel 0.0004)
Rpta.
Ya que en la Tabla 3 de la T, para 23 grados de libertad, la probabilidad
acumulada hasta 3.89 es mayor a 0.9995 (en Excel es 0.9996).
Como el valor-P < 0.0005 <  = 0.01 se rechaza Ho y se concluye también
que el peso medio de las latas con café de la máquina 2 es mayor que el peso
medio de las latas con café de la máquina 1, con el 1% de significación.
329
18. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno
diurno, dio un promedio de 112 con una desviación estándar de 6; mientras que
para 15 estudiantes del turno nocturno, dio un promedio de 105 con una
desviación estándar de 15. Con el 1% de significación pruebe sí:
a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.
b) ¿Son diferentes los cocientes medios de inteligencia de los 2 turnos? Halle pvalor.
Solución
Sean X1 y X2 las variables que representan el cociente de inteligencia de los
alumnos del turno diurno (1) y del turno nocturno (2) respectivamente.
Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas
desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las
varianzas son heterogéneas, para según ello probar si son diferentes los cocientes
medios de inteligencia de los 2 turnos.
Datos: n1 = 15, X 1 = 112, S1 = 6
a) 1. Hipótesis: H0:  12 =  22
y
n2 = 15,
X 2 = 105, S2 = 15.
H1:  12 ≠  22
2. Nivel de significación:  = 0.01
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = n2 = 15, la estadística de prueba es:
F
S12
 f14,14
S 22
4. Región crítica. Para  = 0.01 y la prueba bilateral en la Tabla 4, los valores
críticos F son: f14, 14, 0.005 = 1/ f14, 14, 0.995 = 1/ 4.30 = 0.233 y f14, 14, 0.995 =
4.30.
R.C. = {F < 0.233 o F > 4.30}
5. Cálculos: con los datos de la muestra se obtiene:
S12 = 36, S 22 = 225 y Fcalc 
S12
36

= 0.16
2
S 2 225
6. Decisión. Como Fcalc = 0.16  R.C. se rechaza Ho y concluimos que las
varianzas de los cocientes de inteligencia de los 2 turnos son diferentes
(heterogéneas), con el 1% de significación.
330
 El valor P para la prueba bilateral y como Fcalc = 0.16 < 1 se obtiene así:
P = 2 P[f14,14 < 0.16] = 2 P[1/ f14,14 ≥ 1/ 0.16] = 2 P[f14,14 ≥ 6.25] =
= 2 {1 - P[f14,14 ≤ 6.25]} < 0.01 (en Excel 0.0016).
Rpta.
Ya que en la Tabla 4 de la F, para 14 y 14 grados de libertad, la probabilidad
acumulada hasta 6.25 es mayor a 0.995 (en Excel es 0.9992).
Como P < 0.01 <  = 0.01, se rechaza la hipótesis nula y se concluye también
que las varianzas de los cocientes de inteligencia de ambos turnos son
diferentes (heterogéneas), con el 1% de significación.
b) A continuación se prueba si son diferentes los cocientes medios de
inteligencia de los 2 turnos.
1. Hipótesis: H0: 1 = 2
H1: 1 ≠ 2
y
2. Nivel de significación:  = 0.01
3. La estadística de prueba cuando las varianzas son heterogéneas es:
T
X1  X 2
S12 S 22

n1 n2
 t H  t18
2
2
 S12 S 22 
36
225





 

n1 n2 
15 15 


Donde: H =
=
= 18.37 ≡ 18
2
2
2
2
 36 
 225 
 S12 
 S 22 
 


 
 
15
15




n
n
 1   2 

15  1
15  1
n1  1
n2  1
4. Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 3 el valor
crítico es: t18, 0.995 = 2.878. Entonces:
R.C. = {T < -2.878 o T > 2.878}
5. Con la información muestral: n1 = 15, X 1 = 112, S1 = 6, n2 = 15, X 2 =
105, S2 = 15; y bajo el supuesto que Ho es cierta se determina:
tcalc 
X1  X 2
2
1
2
2
S
S

n1 n2

112  105
 1.68
36 225

15 15
6. Decisión: como tcalc = 1.68  R.A. se acepta Ho y se concluye con el 1%
de significación, que los cocientes medios de inteligencia de los 2 turnos
son iguales.
331
 Para dos colas: P = 2P[T18 > 1.68] = 2[1 – P(T18 ≤ 1.68)] = 2[1 – x] …….. (1)
En la Tabla 3, T de student, con 18 grados de libertad, no está el valor 1.68,
se determina x interpolando así:
Tα
P
1.330 0.90
1.68

x
1.734  1.330 1.68  1.330  8.08 = 0.35

0.95  0.90
x  0.90
x  0.90

1.734 0.95
8.08x – 7.272 = 0.35
 x = 0.943
Reemplazando x = 0.943 en (1) se obtiene:
P-valor = 2[1 – 0.943] = 0.114
Rpta.
Como el valor-P = 0.114 >  = 0.01 no se rechaza Ho y se concluye también
que los cocientes medios de inteligencia de ambos turnos son iguales, con el
1% de significación.
19. Muestras del sueldo de hombres (1) y mujeres (2) de una compañía
proporcionan los siguientes datos:
n1 = 20, X 1 = $ 540, S1 = $ 16
y
n2 = 20, X 2 = $ 530, S2 = $ 15.
a) ¿Son heterogéneas las varianzas de los sueldos de ambos grupos? Use  =
0.01. Halle p-valor.
b) Con un nivel de significación del 5%, probar si el sueldo medio de las
mujeres es menor que el de los hombres. Hallar p-valor.
Solución
Sean X1 y X2 las variables que representan el sueldo de los hombres (1) y de las
mujeres (2) respectivamente. Asumiendo que las dos poblaciones se distribuyen
normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 <
30) primero se prueba si las varianzas son heterogéneas, para según ello probar
si el sueldo medio de las mujeres es menor que el de los hombres.
Datos: n1 = 20,
X 1 = $ 540, S1 = $ 16
y
15.
a) 1. Hipótesis: H0:  12 =  22
H1:  12 ≠  22
2. Nivel de significación:  = 0.01
332
n2 = 20,
X 2 = $ 530, S2 = $
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = n2 = 20, la estadística de prueba es:
S12
F  2  f19,19
S2
4. Región crítica. Para  = 0.01 y la prueba bilateral en la Tabla 4, los valores
críticos F son: f19, 19, 0.005 = 1/ f19, 19, 0.995 = 1/ 3.43 = 0.292 y f19, 19, 0.995 =
3.43.
R.C. = {F < 0.292 o F > 3.43}
5. Cálculos: con los datos de la muestra se obtiene:
2
1
2
2
S = 256, S = 225 y Fcalc
S12 256
 2 
= 1.14
S 2 225
6. Decisión. Como Fcalc = 1.14  R.A. no se rechaza Ho y concluimos que
las varianzas de los sueldos de ambos grupos son iguales (homogéneas),
con el 1% de significación.
 El valor P para la prueba bilateral y como Fcalc = 1.14 > 1 se obtiene así:
P = 2 P[f19,19 > 1.14] = 2 {1 - P[f19,19 ≤ 1.14]} > 0.10 (en Excel 0.778).
Rpta.
Ya que en la Tabla 4 de la F, para 19 y 19 grados de libertad, la probabilidad
acumulada hasta 1.14 es menor a 0.95 (en Excel es 0.611).
Como P > 0.10 >  = 0.01, no se rechaza la hipótesis nula y se concluye
también que las varianzas de los sueldos de ambos grupos son iguales
(homogéneas), con el 1% de significación.
b) A continuación se prueba si el sueldo medio de las mujeres es menor que el
de los hombres.
1. Hipótesis: H0: 1 = 2
y
H1: 2 < 1
2. Nivel de significación:  = 0.05
3. La estadística de prueba cuando las varianzas son homogéneas es:
T
X 2  X1
S c2 S c2

n1 n2
 t 20 202  t 38
4. Región crítica, para  = 0.05 y la prueba unilateral izquierda, en la Tabla 3:
t38, 0.05 = - t38, 0.95 = -1.686. Entonces:
333
R.C. = {T < -1.686}
5. Con la información muestral: n1 = 20,
X 1 = $ 540, S1 = $ 16, n2 = 20,
X 2 = $ 530, S2 = $ 15; y bajo el supuesto que Ho es cierta se determina:
Sc2 
 n1 1 S12  (n2  1)S22  19 x162  19 x152
tcalc 
n1  n2  2
X 2  X1
 Sc2 Sc2 
  
 n1 n2 

20  20  2
= 240.5
530  540
 2.04
240.5 240.5

20
20
6. Decisión: como tcalc = -2.04  R.C. se rechaza Ho y se concluye con el 5%
de significación, que el sueldo medio de las mujeres es menor que el
sueldo medio de los hombres.
 Para la prueba unilateral izquierda:
P = P[T38 < -2.04] = 1 – P(T38 ≤ 2.04) = 1 – 0.976 = 0.024
Rpta.
Como el valor-P = 0.024 <  = 0.05 se rechaza Ho y se concluye también que
el sueldo medio de las mujeres, es menor que el sueldo medio de los hombres,
con el 5% de significación.
20. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad
particular realizada por las empresas comerciales de dos ciudades. Mediante
muestras aleatorias sin reemplazo de 20 empresas tomadas en cada ciudad se han
obtenido los siguientes resultados:
n1 = 20,
x1 = 402, S1 = 25
y
n2 = 20,
x 2 = 385, S2 = 15.
a) ¿Son diferentes las varianzas de los gastos mensuales en seguridad particular
realizada por las empresas comerciales de las dos ciudades? Use  = 0.05.
Halle p-valor.
b) ¿Son diferentes los gastos medios mensuales en seguridad particular realizada
por las empresas comerciales de ambas ciudades? Use  = 0.05 y halle pvalor.
Solución
Sean X1 y X2 las variables que representan los gastos mensuales en seguridad
particular de las empresas comerciales en las ciudades 1 y 2 respectivamente.
Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas
334
desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las
varianzas son diferentes; para según ello, probar si son diferentes los gastos
medios mensuales en seguridad particular de las empresas comerciales de ambas
ciudades.
n1 = 20,
x1 = 402, S1 = 25
y
a) 1. Hipótesis: H0:  12 =  22
n2 = 20,
x 2 = 385, S2 = 15.
H1:  12 ≠  22
2. Nivel de significación:  = 0.05
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = n2 = 20, la estadística de prueba es:
S12
F  2  f19,19
S2
4. Región crítica. Para  = 0.05 y la prueba bilateral en la Tabla 4, los valores
críticos F son: f19, 19, 0.025 = 1/ f19, 19, 0.975 = 1/ 2.53 = 0.395 y f15, 15, 0.995 =
2.53.
R.C. = {F < 0.395 o F > 2.53}
5. Cálculos: con los datos de la muestra se obtiene:
2
1
2
2
S = 625, S = 225 y Fcalc
S12 625
 2 
= 2.78
S 2 225
6. Decisión. Como Fcalc = 2.78  R.C. se rechaza Ho y concluimos que las
varianzas de los gastos mensuales en seguridad particular realizada por las
empresas comerciales de las dos ciudades son diferentes (heterogéneas),
con el 5% de significación.
 El valor P para la prueba bilateral y como Fcalc = 2.78 > 1 se obtiene así:
P = 2 P[f19,19 > 2.78] = 2 {1 - P[f19,19 ≤ 2.78]} = 2{1 – x} ……. (1)
Como en la Tabla 4 de la distribución F, para 19 y 19 grados de libertad, no
está el valor 2.78, pero éste se encuentra entre los valores 2.53 (con
probabilidad 0.975) y 3.03 (con probabilidad 0.99) para hallar x se interpola
así:
Fα
P
2.53
0.975
2.78
x

3.03  2.53 2.78  2.53  33.33 = 0.25

0.99  0.975
x  0.975
x  0.975
335
3.03
0.99

33.33 x – 32.5 = 0.25  x = 0.983
Reemplazando x = 0.983 en (1) se tiene:
P = 2 {1 – 0.983} = 0.034
Rpta.
Como P = 0.034 <  = 0.05, se rechaza la hipótesis nula y se concluye
también que las varianzas de los gastos mensuales en seguridad particular
realizada por las empresas comerciales de ambas ciudades son diferentes
(heterogéneas), con el 5% de significación.
b) A continuación se prueba si son diferentes los gastos medios mensuales en
seguridad particular de las empresas comerciales de ambas ciudades.
1. Hipótesis: H0: 1 = 2
H1: 2 ≠ 1
y
2. Nivel de significación:  = 0.05
3. La estadística de prueba cuando las varianzas son heterogéneas es:
T
X1  X 2
 t H  t 31
S12 S 22

n1 n2
2
2
 S12 S 22 
625
225








n1 n2 
20
20 


Donde: H =
=
= 31.11 ≡ 31
2
2
2
2
 625 
 225 
 S12 
 S 22 




 
 
20
20




n
n
 1   2 

20  1
20  1
n1  1
n2  1
4. Región crítica, para  = 0.05 y la prueba bilateral, en la Tabla 3 el valor
crítico es: t31, 0.975 = 2.04. Entonces:
R.C. = {T < -2.04 o T > 2.04 }
5. Con la información muestral: n1 = 20,
20,
x 2 = 385,
x1 = 402, S1 = 25
y
n2 =
S2 = 15; y bajo el supuesto que Ho es cierta se
determina:
tcalc 
X1  X 2
S12 S22

n1 n2

402  385
 2.61
625 225

20 20
6. Decisión: como tcalc = 2.61  R.C. se rechaza Ho y se concluye con el 5%
de significación, que los gastos medios mensuales en seguridad particular
de las empresas comerciales de ambas ciudades son diferentes.
 Para dos colas: P = 2P[T31 > 2.61] = 2[1 – P(T31 ≤ 2.61)] = 2[1 – x] …….. (1)
336
En la Tabla 3, T de student, con 31 grados de libertad, no está el valor 2.61,
pero éste se encuentra entre los valores 2.453 (con probabilidad 0.99) y 2.744
(con probabilidad 0.995) para hallar x se interpola así:
Tα
P
2.453 0.990
2.61
x

2.744  2.453 2.610  2.453

0.995  0.990
x  0.990

58.2 x – 57.618 = 0.157

58.2 =
0.157
x  0.990
2.744
0.995
 x = 0.993
Reemplazando x = 0.993 en (1) se obtiene:
P-valor = 2[1 – 0.993] = 0.014
Rpta.
Como el valor-P = 0.014 <  = 0.05 se rechaza Ho y se concluye también que
los gastos medios mensuales en seguridad particular de las empresas
comerciales de ambas ciudades son diferentes, con el 1% de significación.
21. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana
(con 1’700 000 hogares) indica que el 30.5 % de los hogares compra periódicos
y revistas. Aceptaría Ud. que menos del 34 % de hogares limeños compra
periódicos y revistas? Use α = 0.05. Halle p-valor.
Solución
Denotemos
con p la proporción (%) poblacional de hogares que compra
periódicos y revistas. Se quiere contrastar las hipótesis si menos del 34 % (0.34)
de hogares limeños compra periódicos y revistas.
1. Hipótesis: H0: p ≥ p0 = 0.34,
H1: p < 0.34
2. Nivel de significación:  = 0.05
3. Estadística de prueba: Z 
pˆ  p0
 N (0,1)
p0 q0
n
4. Región crítica, para  = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el
valor crítico es: Zα = -Z1-α = -Z0.95 = -1.645. Entonces:
5. Con la información muestral: n = 1000,
Ho: p = p0 = 0.34 es cierta, se determina:
337
R.C. = {Z < -1.645}
pˆ  0.305 y bajo el supuesto que
Z calc 
pˆ  p0 0.305  0.34

= -2.33
p0 q0
0.34 x0.66
1000
n
6. Decisión: como Zcalc = –2.33 ϵ R.C. se rechaza la hipótesis nula y se concluye
con el 5% de significación, que menos del 34 % (p < 0.34) de hogares
limeños compra periódicos y revistas (la estimación muestral indica que es el
30.5%).
 P = P[Z < Zcalc] = P[Z < -2.33] = Ф(-2.33) = 0.0099
Rpta.
Como el valor-P = 0.0099 <  = 0.05 se rechaza la hipótesis nula y se concluye
también que menos del 34 % de hogares limeños compra periódicos y revistas,
con el 5% de significación.
22. Una “Encuesta de Opinión” realizada en 800 hogares de Lima Metropolitana
(con 1.7 millones de hogares) 644 hogares indicaron que tienen abastecimiento
de agua de la red pública dentro de la vivienda. ¿Aceptaría usted que la
verdadera proporción de hogares que tienen abastecimiento de agua de la red
pública dentro de la vivienda difiere de 0.75 (75%)? Use α = 0.01. Halle p-valor.
Solución
Denotemos
con p la proporción (%) poblacional de hogares que tienen
abastecimiento de agua de la red pública dentro de la vivienda. Se quiere
contrastar las hipótesis si la proporción de hogares que tienen abastecimiento de
agua de la red pública dentro de la vivienda difiere de 0.75 o 75% (p ≠ 0.75).
H1: p ≠ 0.75
1. Hipótesis: H0: p = p0 = 0.75,
2. Nivel de significación:  = 0.01
3. Estadística de prueba: Z 
pˆ  p0
 N (0,1)
p0 q0
n
4. Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 1 el valor
crítico es: Z1-α/2 = Z0.995 = 2.575. Entonces:
R.C. = {Z < -2.575 o Z >
2.575}
5. Con la información muestral: n = 800, X = 644, pˆ 
X 644

= 0.805 y
n 800
bajo el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:
338
Z calc 
pˆ  p0 0.805  0.75

= 3.59
p0 q0
0.75 x0.25
800
n
6. Decisión: como Zcalc = 3.59 ϵ R.C. se rechaza la hipótesis nula y se concluye
con el 1% de significación, que la proporción de hogares que tienen
abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.75
o 75% (la estimación muestral señala que es 0.805 o el 80.5%).
 Como la prueba es bilateral, el valor-P se determina así:
P = P[|Z| > |Zcalc|] = P[|Z| > 3.59] = 2Ф(-3.59) = 2(0.00017) = 0.00034
Rpta.
Como el valor-P = 0.00034 <  = 0.01 se rechaza la hipótesis nula y se
concluye también que la proporción de hogares que tienen abastecimiento de
agua de la red pública dentro de la vivienda difiere de 0.75 o 75%, con el 1% de
significación.
23. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima
Metropolitana, 400 indicaron que hay problemas de seguridad. ¿Indica esta
evidencia que más del 75 % de los ciudadanos limeños perciben que hay
problemas de seguridad? Use el nivel de significación de 0.05. Halle p-valor.
Explique el error tipo II.
Solución
Denotemos
con p la proporción (%) poblacional de ciudadanos de Lima
Metropolitana que indican que hay problemas de seguridad. Se quiere contrastar
las hipótesis si más del 75 % (p > 0.75) de los ciudadanos limeños perciben que
hay problemas de seguridad.
1. Hipótesis: H0: p = p0 = 0.75,
H1: p > 0.75
2. Nivel de significación:  = 0.05
3. Estadística de prueba: Z 
pˆ  p0
 N (0,1)
p0 q0
n
4. Región crítica, para  = 0.05 y la prueba unilateral derecha, en la Tabla 1 el
valor crítico es: Z1-α = Z0.95 = 1.645. Entonces:
339
R.C. = {Z > 1.645}
5. Con la información muestral: n = 500, X = 400, pˆ 
X 400

= 0.80 y bajo
n 800
el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:
Z calc 
pˆ  p0
0.80  0.75

= 2.58
p0 q0
0.75 x0.25
500
n
6. Decisión: como Zcalc = 2.58 ϵ R.C. se rechaza la hipótesis nula y se concluye
con el 5% de significación, que más del 75 % (p > 0.75) de los ciudadanos
limeños perciben que hay problemas de seguridad (la estimación muestral
señala que es 0.80 o el 80%).
 Como la prueba es unilateral derecha, el valor-P se determina así:
P = P[Z > Zcalc] = P[Z > 2.58] = 1 – Ф(2.58) = 1 – 0.99506 = 0.00494
Rpta.
Como el valor-P = 0.00494 <  = 0.05 se rechaza la hipótesis nula y se
concluye también que más del 75 % (p > 0.75) de los ciudadanos limeños
perciben que hay problemas de seguridad, con el 1% de significación.
 Error tipo II.- consiste en aceptar Ho (que el 75% de los ciudadanos limeños
percibe que hay problemas de seguridad) cuando es falsa (este porcentaje
realmente es de más del 75%).
24. Se tomó una muestra aleatoria de 300 compradores en un centro comercial y se
encontró que 182 están a favor de un horario más amplio para las compras.
¿Esta evidencia es suficiente para concluir que menos del 65 % de los
compradores están a favor de un horario más extenso? Use un nivel de
significación de 0.05. Halle p-valor.
Solución
Denotemos con p la proporción (%) poblacional de compradores en el centro
comercial que responden que están a favor de un horario más amplio para las
compras. Se quiere probar las hipótesis si menos del 65 % (p < 0.65) de los
compradores están a favor de un horario más extenso en el centro comercial.
1. Hipótesis: H0: p = p0 = 0.65,
H1: p < 0.65
2. Nivel de significación:  = 0.05
340
3. Estadística de prueba: Z 
pˆ  p0
 N (0,1)
p0 q0
n
4. Región crítica, para  = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el
valor crítico es: Zα = -Z1-α = -Z0.95 = -1.645. Entonces:
R.C. = {Z < -1.645}
5. Con la información muestral: n = 300, X = 182, pˆ 
X 182

= 0.607 y
n 300
bajo el supuesto que Ho: p = p0 = 0.65 es cierta, se determina:
Z calc 
pˆ  p0 0.607  0.65

= -1.56
p0 q0
0.65 x0.35
300
n
6. Decisión: como Zcalc = -1.56 ϵ R.A. no se rechaza la hipótesis nula y se
concluye con el 5% de significación, que el 65 % (p = 0.65) de los
compradores están a favor de un horario más extenso en el centro comercial.
 Como la prueba es unilateral izquierda, el valor-P se determina así:
P = P[Z < Zcalc] = P[Z < -1.56] = Ф(-1.56) = 0.05938
Rpta.
Como el valor-P = 0.05938 >  = 0.05 no se rechaza la hipótesis nula y se
concluye también que el 65 % (p = 0.65) de los compradores están a favor de
un horario más extenso en el centro comercial, con el 5% de significación.
25. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima
Metropolitana, 375 indicaron que no están de acuerdo con el servicio militar
obligatorio.
¿Indica esta evidencia que menos del 80 % de los ciudadanos no están de
acuerdo con el servicio militar obligatorio? Use el nivel de significación de 0.01.
Halle p-valor.
Solución
Denotemos con p la proporción (%) poblacional de ciudadanos entrevistados
que responden que indican que no están de acuerdo con el servicio militar
obligatorio. Se quiere probar las hipótesis si menos del 80% (p < 0.80) de los
ciudadanos no están de acuerdo con el servicio militar obligatorio.
1. Hipótesis: H0: p = p0 = 0.80,
H1: p < 0.80
2. Nivel de significación:  = 0.01
341
3. Estadística de prueba: Z 
pˆ  p0
 N (0,1)
p0 q0
n
4. Región crítica, para  = 0.01 y la prueba unilateral izquierda, en la Tabla 1 el
valor crítico es: Zα = -Z1-α = -Z0.99 = -2.33. Entonces:
5. Con la información muestral: n = 500, X = 375, pˆ 
R.C. = {Z < -2.33}
X 375

= 0.75 y bajo
n 500
el supuesto que Ho: p = p0 = 0.80 es cierta, se determina:
Z calc 
pˆ  p0
0.75  0.80

= -2.80
p0 q0
0.80 x0.20
500
n
6. Decisión: como Zcalc = -2.80 ϵ R.C. se rechaza la hipótesis nula y se concluye
con el 1% de significación, que menos del 80% (p < 0.80) de los ciudadanos
no están de acuerdo con el servicio militar obligatorio.
 Como la prueba es unilateral izquierda, el valor-P se determina así:
P = P[Z < Zcalc] = P[Z < -2.80] = Ф(-2.80 ) = 0.00256 Rpta.
Como el valor-P = 0.00256 <  = 0.01 se rechaza la hipótesis nula y se
concluye también que menos del 80% (p < 0.80) de los ciudadanos no están de
acuerdo con el servicio militar obligatorio, con el 1% de significación.
26. A fin de determinar el nivel de aceptación de una revista de negocios, se
entrevistaron dos grupos de empresarios: de Lima Metropolitana (1) y del Resto
del País (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;
Resto del País (2): n2 = 1200, X2 =
300.
Con α = 0.05 ¿Son diferentes las verdaderas proporciones de empresarios
“limeños” y “no limeños” que aceptan la revista de negocios? Determine pvalor.
Solución
Sean p1 y p2, las proporciones poblacionales de empresarios de Lima
Metropolitana (1) y del Resto del País (2) que aceptan la revista de negocios.
Entonces, se desea probar si son diferentes las verdaderas proporciones de
empresarios “limeños” y “no limeños” que aceptan la revista de negocios.
342
 1. Hipótesis: Ho: p1 = p2
y
H1: p1 ≠ p2
2. Nivel de significación:  = 0.05
3. Estadística de prueba: Z 
pˆ 1  pˆ 2  ( p1  p2 )
→ N(0, 1)
p1q1 p 2 q2

n1
n2
4. Región crítica, para  = 0.05 y la prueba bilateral, en la Tabla 1 el valor
crítico es: Z1-α/2 = Z0.975 = 1.96. Entonces:
R.C. = {Z < -1.96 o Z > 1.96}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 800,
pˆ 1 
X1 = 280,
= 0.25, pˆ 
Z calc 
X 1 280
X
300
= 0.35, n2 = 1200, X2 = 300, pˆ 2  2 

n1 800
n2 1200
X 1  X 2 280  300
580
= 0.29 y q̂ = 0.71; se determina:


n1  n2
800  1200 2000
pˆ 1  pˆ 2
1 1
pˆ qˆ   
 n1 n2 

0.35  0.25
1 
 1
0.29 x0.71

 800 1200 
= 4.83
6. Decisión: como Zcalc = 4.83 ϵ R.C. se rechaza la hipótesis nula con el 5% de
significación. Se concluye que son diferentes las verdaderas proporciones de
empresarios “limeños” y “no limeños” que aceptan la revista de negocios.
 P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -4.83] =
= 2 Ф(-4.83) < 0.0001 (en Excel 0.0000014).
Rpta.
Ya que en la Tabla 1 de la distribución normal estándar, la probabilidad
acumulada hasta -4.83 es menor a 0.0001 (en Excel es 0.00000068).
Como P < 0.0001 <  = 0.01, se rechaza la hipótesis nula y se concluye también
que son diferentes las verdaderas proporciones de empresarios “limeños” y “no
limeños” que aceptan la revista de negocios, con el 5% de significación.
27. En una muestra aleatoria de 400 adultos, 220 están de acuerdo con la gestión
presidencial. Mientras que en una muestra de 600 jóvenes, 300 están de acuerdo
con la gestión presidencial. ¿Se puede afirmar que la verdadera proporción de
adultos que está de acuerdo con la gestión presidencial, es mayor que la
proporción de jóvenes que está de acuerdo con dicha gestión? Use α = 0.05.
Halle p-valor.
Solución
343
Sean p1 y p2, las proporciones poblacionales de adultos (1) y de jóvenes (2) que
están de acuerdo con la gestión presidencial. Entonces, se desea probar si la
verdadera proporción de adultos que está de acuerdo con la gestión presidencial,
es mayor que la proporción de jóvenes que está de acuerdo con dicha gestión.
 1. Hipótesis: Ho: p1 = p2
y
H1: p1 > p2
2. Nivel de significación:  = 0.05
3. Estadística de prueba: Z 
pˆ 1  pˆ 2  ( p1  p2 )
→ N(0, 1)
p1q1 p 2 q2

n1
n2
4. Región crítica, para  = 0.05 y la prueba unilateral derecha, en la Tabla 1 el
valor crítico es: Z1-α = Z0.95 = 1.645. Entonces:
R.C. = {Z > 1.645}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 400,
X1 = 220,
0.50, pˆ 
Z calc 
pˆ 1 
X 1 220
X
300
= 0.55, n2 = 600, X2 = 300, pˆ 2  2 
=

n1 400
n2 600
X 1  X 2 220  300 520
= 0.52 y q̂ = 0.48; se determina:


n1  n2
400  600 1000
pˆ 1  pˆ 2
1 1
pˆ qˆ   
 n1 n2 

0.55  0.50
1 
 1
0.52 x0.48

 400 600 
= 1.55
6. Decisión: como Zcalc = 1.55 ϵ R.A. no se rechaza la hipótesis nula con el 5%
de significación. Se concluye que son iguales las verdaderas proporciones de
adultos y de jóvenes que están de acuerdo con la gestión presidencial.
 Para la prueba es unilateral derecha:
P = P[Z > Zcalc] = P[Z > 1.55] = 1 – Ф(1.55) = 1 – 0.93943 = 0.06057
Rpta.
Como P = 0.06057 >  = 0.05, se “acepta” la hipótesis nula y se concluye
también que son iguales las verdaderas proporciones de adultos y de jóvenes que
están de acuerdo con la gestión presidencial, con el 5% de significación.
28. De los alumnos de la UNAC se toma una muestra aleatoria de 300 mujeres, 150
de las cuales están a favor de la titulación con tesis. En una muestra de 200
hombres, 120 indican que están a favor de lo mismo. ¿Se puede afirmar que hay
una diferencia significativa entre las verdaderas proporciones de alumnos y
alumnas que están a favor de la titulación con tesis? Use α = 0.01. Halle p-valor
344
Solución
Sean p1 y p2, las proporciones poblacionales de estudiantes hombres (1) y
mujeres (2) que están a favor de la titulación con tesis. Entonces, se desea probar
si son diferentes las verdaderas proporciones de alumnos y alumnas que están a
favor de la titulación con tesis.
 1. Hipótesis: Ho: p1 = p2
y
H1: p1 ≠ p2
2. Nivel de significación:  = 0.01
3. Estadística de prueba: Z 
pˆ 1  pˆ 2  ( p1  p2 )
→ N(0, 1)
p1q1 p 2 q2

n1
n2
4. Región crítica, para  = 0.01 y la prueba bilateral, en la Tabla 1 el valor
crítico es: Z1-α/2 = Z0.995 = 2.575. Entonces:
R.C. = {Z < -2.575 o Z >
2.575}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 200,
X1 = 120,
pˆ 1 
X 1 120
X
150
= 0.60, n2 = 300, X2 = 150, pˆ 2  2 
=

n1 200
n2 300
0.50,
pˆ 
X 1  X 2 120  150 270
= 0.54 y q̂ = 0.46; se determina:


n1  n2
200  300 500
Z calc 
pˆ 1  pˆ 2
1 1
pˆ qˆ   
 n1 n2 

0.60  0.50
1 
 1
0.54 x0.46

 200 300 
= 2.20
6. Decisión: como Zcalc = 2.20 ϵ R.A. no se rechaza la hipótesis nula con el 1%
de significación. Se concluye que son iguales las verdaderas proporciones de
alumnos y alumnas que están a favor de la titulación con tesis.
 P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.20] =
= 2 Ф(-2.20) = 2 (0.0139) = 0.0278
Rpta.
Como P = 0.0278 >  = 0.01, se “acepta” la hipótesis nula y se concluye
también que son iguales las verdaderas proporciones de alumnos y alumnas que
están a favor de la titulación con tesis, con el 1% de significación.
29. Una empresa desea determinar la proporción de hogares que adquiere su
producto en las ciudades 1 y 2. Una muestra al azar de 600 hogares en cada
345
ciudad arroja que 288 lo adquiere en la ciudad 1 y 252 en la ciudad 2. ¿Será la
proporción de hogares que adquiere el producto en la ciudad 2 menor que la
proporción de hogares que adquiere el producto en la ciudad 1? Use  = 0.01.
Halle p-valor.
Solución
Sean p1 y p2, las proporciones poblacionales de hogares que adquiere el producto
en las ciudades 1 y 2 respectivamente. Entonces, se desea probar si la verdadera
proporción de hogares que adquiere el producto en la ciudad 2 menor que la
proporción de hogares que adquiere el producto en la ciudad 1.
 1. Hipótesis: Ho: p1 = p2
y
H1: p2 < p1
2. Nivel de significación:  = 0.01
3. Estadística de prueba: Z 
pˆ 2  pˆ 1  ( p2  p1 )
→ N(0, 1)
p1q1 p 2 q2

n1
n2
4. Región crítica, para  = 0.01 y la prueba unilateral, en la Tabla 1 el valor
crítico es: Zα = -Z1-α = -Z0.99 = -2.33. Entonces:
R.C. = {Z < -2.33}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 600,
X1 = 288,
0.42, pˆ 
Z calc 
pˆ 1 
X 1 288
X
252
= 0.48, n2 = 600, X2 = 252, pˆ 2  2 
=

n1 600
n2 600
X 1  X 2 288  252 540
= 0.45 y q̂ = 0.55; se determina:


n1  n2
600  600 1200
pˆ 2  pˆ 1
1 1
pˆ qˆ   
 n1 n2 

0.42  0.48
1 
 1
0.45 x0.55

 600 600 
= -2.09
6. Decisión: como Zcalc = -2.09 ϵ R.A. no se rechaza la hipótesis nula con el 1%
de significación; y se concluye que las verdaderas proporciones poblacionales
de hogares que adquiere el producto en las ciudades 1 y 2 son iguales.
 Para la prueba es unilateral izquierda:
P = P[Z < Zcalc] = P[Z < -2.09] = Ф(-2.09) = 0.01831
Rpta.
Como P = 0.01831 >  = 0.01, se “acepta” la hipótesis nula y se concluye
también que las proporciones poblacionales de hogares que adquiere el producto
en las ciudades 1 y 2 son iguales, con el 5% de significación.
346
30. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de
verano “Sol y mar”. De una muestra de 250 mujeres menores de 40 años, 150
estuvieron interesados, mientras que de 250 mujeres de 40 años a más, sólo 120
mostraron interés. Con el 5% de significación, ¿existe diferencia entre la
proporción de mujeres menores de 40 años y las de 40 años a más que mostraron
interés por los polos de verano “Sol y mar”? Halle p-valor.
Solución
Sean p1 y p2, las proporciones poblacionales de mujeres menores de 40 años (1)
y las mujeres de 40 años a más (2) que muestran interés por los polos de verano
“Sol y mar”. Entonces, se desea probar si son diferentes ambas proporciones .
 1. Hipótesis: Ho: p1 = p2
H1: p1 ≠ p2
y
2. Nivel de significación:  = 0.05
3. Estadística de prueba: Z 
pˆ 1  pˆ 2  ( p1  p2 )
→ N(0, 1)
p1q1 p 2 q2

n1
n2
4. Región crítica, para  = 0.05 y la prueba bilateral, en la Tabla 1 el valor
crítico es: Z1-α/2 = Z0.975 = 1.96. Entonces:
R.C. = {Z < -1.96 o Z > 1.96}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 250,
X1 = 150,
0.48, pˆ 
Z calc 
pˆ 1 
X 1 150
X
120
= 0.60, n2 = 250, X2 = 120, pˆ 2  2 
=

n1 250
n2 250
X 1  X 2 150  120 270
= 0.54 y q̂ = 0.46; se determina:


n1  n2
250  250 500
pˆ 1  pˆ 2
1 1
pˆ qˆ   
 n1 n2 

0.60  0.48
1 
 1
0.54 x0.46 

 250 250 
= 2.69
6. Decisión: como Zcalc = 2.69 ϵ R.C. se rechaza la hipótesis nula con el 5% de
significación; y se concluye que son diferentes las verdaderas proporciones de
mujeres menores de 40 años y las de 40 años a más que mostraron interés por
los polos de verano “Sol y mar”.
 P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.69] = 2 Ф(-2.69) = 2 (0.00357)
= 0.00714. Como P = 0.00714 <  = 0.05, se rechaza la hipótesis nula y se
concluye también que son diferentes las verdaderas proporciones .
347
6.10 PROBLEMAS PROPUESTOS
1.
Un proceso está programado para embotellar la cantidad media de 750 mililitros
de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media
de 745 ml. y una desviación típica de 12 ml.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las botellas de gaseosa? Halle p-valor.
2.
¿Aceptaría usted que σ2 < 200 ml2 por botella? Use α = 0.05. Halle p-valor.
Un proceso está programado para embolsar la cantidad media de 250 gramos
de café. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
253.5 gramos y una desviación típica de 13 gramos.
a) ¿Se puede afirmar que el contenido medio en las bolsas de café es mayor de
250 gramos? Use α = 0.05. Halle p-valor.
b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0.05. Halle p-valor.
3.
Un proceso está programado para embolsar la cantidad media de 500 gramos de
frejol. Se toma una muestra aleatoria de 35 bolsas, resultando una media de
496.5 gramos y una desviación típica de 15 gramos.
a) Al 5% de significación ¿se puede afirmar que el contenido medio en las
bolsas de frejol es menor de 500 gramos? Halle p-valor.
b) ¿Aceptaría usted que σ2 > 300 gr2 por bolsa? Use α = 0.05. Halle p-valor.
4.
Se tiene la siguiente prueba de hipótesis: Ho: µ ≥ 100 y H1: µ < 100.
Una muestra de 50 elementos produce una media muestral de 95.5 y una
desviación estándar muestral de 12.
a) Realice la prueba de hipótesis usando α = 0.05. Halle p-valor.
b) Ponga a prueba H0: σ2 = 120 contra H1: σ2 ≠ 120, use α = 0.05. Halle p-valor.
5.
Un proceso está programado para embolsar la cantidad media de 1000 gramos
de lenteja. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
996.5 gramos y una desviación típica de 10 gramos.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en la bolsa? Halle p-valor.
b) ¿Aceptaría usted que σ2 ≠ 250 gr2 por bolsa? Use α = 0.05. Halle p-valor.
348
6.
Los pesos de diez estudiantes (en Kg.) fueron: 60, 44, 66, 71, 75, 75, 80, 84, 93
y 82. Suponga que estos pesos proceden de una población normal.
a) Ponga a prueba H0: μ = 70 Kg. contra H1: μ ≠ 70, con un α = 0.05. Halle pvalor.
b) Ponga a prueba H0: σ2 = 80 Kg2 contra H1: σ2 > 80, use α = 0.05. Halle pvalor.
7.
Los pesos netos (grs.) de las bolsas de detergente es de 250. Una muestra
aleatoria de 10 bolsas dio estos pesos: 248, 251, 248, 247, 245, 246, 246, 252,
247, 250.
a) Será la media poblacional de los pesos netos menor a 250gr. Use α = 0.01.
Halle p-valor.
b) Ponga a prueba H0: σ2 = 15 contra H1: σ2 ≠ 15, con un α = 0.05. Halle p-valor.
8.
Las latas de duraznos de la Compañía “La dulzura” deben contener un peso neto
de 16 onzas, pero hay una gran variabilidad. Una muestra aleatoria de seis latas
revela los pesos netos siguientes en onzas: 15.1, 16.1, 15.8, 15.4, 16.1 y 15.1.
a) Use α = 0.01 para determinar si el verdadero peso neto de las latas de
duraznos es menor de 16 onzas. Determine p-valor.
b) ¿Aceptaría usted que σ2 < 1.25 gr2 por bolsa? Use α = 0.05. Halle p-valor.
9.
Se prueba una muestra aleatoria de 9 bolsas de cierta marca para determinar el
peso medio de llenado. Los pesos de las bolsas, en onzas, fueron: 18, 22, 25, 20,
19, 26, 21, 24 y 23.
a) ¿Hay razón para creer que el verdadero peso medio de llenado es mayor de 18
onzas? Use α = 0.01. Halle p-valor.
b) ¿Será rechazada la hipótesis σ2 > 3.5 onzas2? Use α = 0.05. Halle p-valor.
10. Los pesos en kilos de una muestra aleatoria de 8 cajas de galleta son: 14.6, 12.5,
15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Suponiendo que los pesos se distribuyen
normalmente.
a) Con una significación del 5 % pruebe si el peso medio de las cajas de galleta
es distinto de 14 Kg. Halle p-valor.
b) Ponga a prueba H0: σ2 = 5 contra H1: σ2 ≠ 5, con un nivel de significación de
0.05. Halle p-valor.
349
11. Un departamento de producción desea determinar si hay diferencia en el
rendimiento entre el turno diurno y el nocturno. Una muestra aleatoria de 80
obreros del turno diurno alcanza una producción media de 94.3 partes por hora,
con una desviación estándar de 14 partes por hora, mientras que otra muestra de
60 obreros de la noche alcanza un promedio de 89.7 partes por hora, con una
desviación estándar de 17. Se pide probar si es diferente el rendimiento medio de
ambos turnos. Use α = 0.05. Hallar p-valor.
12. En un estudio para determinar el costo medio de los televisores en las ciudades
A y B, se toma una muestra al azar de 200 hogares de A arrojando un costo
medio de $ 250 y una desviación estándar de 15. Una muestra al azar de 180
hogares de la ciudad B da una costo medio de $ 235 y una desviación estándar
de 10.
Con α = 0.01, probar si el costo medio de los televisores en las ciudades A es
mayor que el costo medio de los televisores en la ciudad B. Hallar p-valor.
13. El departamento de marketing desea determinar si hay diferencia entre las ventas
mensuales promedio realizadas por hombres y mujeres. Una muestra aleatoria de
80 mujeres arroja una venta media de 95 artefactos mensuales, con una
desviación estándar de 14 artefactos, mientras que otra muestra de 60 hombres
alcanza un promedio de 89 artefactos mensuales, con una desviación estándar de
17.
Con α = 0.05, ¿son diferentes las ventas medias realizadas por hombres y
mujeres (µm ≠ µh)? Determine el p-valor.
14. En un estudio para determinar el gasto medio mensual de los hogares en frutas
para las ciudades A y B, se toma una muestra al azar de 100 hogares de A
arrojando un gasto medio de S/. 82 y una desviación estándar de 15. Una
muestra al azar de 100 hogares de la ciudad B da una gasto medio de 75 y una
desviación estándar de 10.
Use α = 0.01, para probar si el gasto medio mensual en frutas en la ciudad B es
menor que el gasto medio en A. Halle p-valor.
15. Se comparan dos marcas de cigarrillos, 1 y 2, respecto a su contenido de nicotina
en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y 50 de la
350
marca 2, dieron estos resultados: x1 = 14.3, n1 = 40, S1 = 2.9
y
x2 =
15.7, n2 = 50, S2 = 3.8. ¿Es diferente el contenido medio de nicotina de las
dos marcas? Use α = 0.01. Halle p-valor.
16. Dos máquinas embotellan jugo independientemente. Mediante muestra aleatoria
sin reemplazo de botellas tomadas de cada máquina se han obtenido los
siguientes resultados sobre el contenido de las botellas (en ml.):
n1 = 16, X 1 = 495, S1 = 5
y
n2 = 16,
X 2 = 505, S2 = 7.
a) ¿Son diferentes las varianzas de los contenidos de las botellas con jugo de
ambas máquinas? Use  = 0.05. Halle p-valor.
b) ¿Son diferentes los contenidos medios de las botellas con gaseosa de ambas
máquinas? Use  = 0.01 y determine p-valor.
17. Se ha llevado a cabo un estudio para analizar los gastos mensuales en publicidad
(en dólares) realizado por las empresas comerciales de dos ciudades. Mediante
muestras aleatorias sin reemplazo tomadas independientemente en cada ciudad
se han obtenido los siguientes resultados:
n1 = 20, X 1 = $ 950, S1 = 95
y
n2 = 18, X 2 = $ 850, S2 = 60.
a) ¿Son heterogéneas las varianzas de los gastos mensuales en publicidad de
ambas ciudades? Use  = 0.01. Halle p-valor.
b) Con un nivel de significación del 5 %, probar si los gastos mensuales en
publicidad de las empresas de la ciudad 1 es mayor que el de las empresas de
la ciudad 2. Hallar p-valor.
18. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para
secretarias, aprenden taquigrafía por dos métodos diferentes y luego se les
somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio
123 palabras por minuto con una desviación estándar de 15 palabras, mientras
que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de
10 palabras. Con el 1% de significación probar si:
a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.
b) ¿Es diferente el promedio de palabras por minuto para los dos métodos? Halle
p-valor.
351
19. Se ha llevado a cabo un estudio para analizar los gastos mensuales (S/.) en
alquiler de local realizado por las empresas comerciales de dos ciudades
grandes.
Mediante
muestras
aleatorias
sin
reemplazo
tomadas
independientemente en cada ciudad se han obtenido los siguientes resultados:
n1 = 20, x1 = 938, S1 = 96
y
n2 = 20,
x 2 = 856, S2 = 62.
a) ¿Son diferentes las varianzas de los gastos mensuales en alquiler de ambas
ciudades? Use  = 0.05. Halle p-valor.
b) Con un nivel de significación del 5 %, probar si los gastos mensuales en
alquiler de las empresas de la ciudad 1 es menor que el de las empresas de la
ciudad 2. Hallar p-valor.
20. Dos máquinas embolsan diariamente detergente de manera independiente.
Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han
obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):
n1 = 12, x1 = 505, S1 = 10
n2 = 12, x 2 = 495, S2 = 4.
y
Con el 1% de significación probar si:
a) ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de
ambas máquinas? Halle p-valor.
b) ¿Son diferentes los pesos medios de las bolsas con detergente de ambas
máquinas? Halle p-valor.
21. De una población de 100,000 fumadores de cigarro, se selecciona una muestra
aleatoria de 800 fumadores y se encuentra que 240 tienen preferencia por la
marca A. ¿Esta evidencia es suficiente para concluir que más del 25 % de los
fumadores de cigarro prefieren la marca A? Use un nivel de significación del
1%. Halle p-valor.
22. En una muestra aleatoria de 500 de los 100 000 ciudadanos de un distrito se
encontró que 200 están de acuerdo con la gestión del alcalde. Indica esta
evidencia que menos del 45% de los ciudadanos están de acuerdo con la gestión
del alcalde. Use un nivel de significación del 5%. Halle p-valor.
23. De una muestra aleatoria de 500 hombres entrevistados, 125 indicaron que ven
fútbol los lunes en la noche por televisión. ¿Indica esta evidencia que más del 20
% de los televidentes hombres ven el fútbol los lunes por la noche? Use el nivel
de significación de 0.01. Halle p-valor.
352
24. En una muestra aleatoria de 600 de los 20000 hogares de un distrito se encontró
que 240 consumen leche. Indica esta evidencia que menos del 45% de los
hogares consumen leche. Use un nivel de significación del 5%. Halle p-valor.
Explique el error tipo I.
25. De una muestra aleatoria de 800 ciudadanos entrevistados en Lima
Metropolitana, 200 indicaron que no están de acuerdo con el voto electrónico.
¿Indica esta evidencia que más del 20 % de los ciudadanos no están de acuerdo
con el voto electrónico? Use el nivel de significación de 0.01. Halle p-valor.
26. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca
de perfume. En una muestra aleatoria de 400 hombres y 600 mujeres, 220
hombres y 300 mujeres dijeron que les gustaba el nuevo perfume. Con el 1% de
significación, ¿existe diferencia entre las verdaderas proporciones de hombres y
mujeres que dijeron que les gustaba el nuevo perfume? Halle p-valor.
27. De los alumnos de la UNAC se toma una muestra aleatoria de 600 hombres, 300
de las cuales están a favor del cambio curricular. En una muestra de 400
mujeres, 240 indican que están a favor de lo mismo. ¿Se puede afirmar que es
menor la proporción de hombres que están a favor del cambio curricular, que la
proporción de mujeres a favor del cambio curricular? Use α = 0.01. Halle pvalor.
28. A fin de determinar el nivel de aceptación de la gestión presidencial, se
entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto
del País (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280;
Resto del País (2): n2 = 1200, X2 =
300
Con α = 0.05 ¿Existe diferencia entre las verdaderas proporciones de “limeños”
y “no limeños” que están de acuerdo con la gestión presidencial? Determine pvalor.
29. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de
casacas de cuero. De una muestra de 300 mujeres de 40 años a más, 75
estuvieron interesadas, mientras que de 200 mujeres menores 40 años, 80
mostraron interés. Con el 5% de significación, ¿será mayor la proporción de
353
mujeres menores de 40 años interesadas en la compra de casacas de cuero, que la
proporción de las de 40 años a más interesadas en dicha compra. Halle p-valor.
30. En una muestra aleatoria
de 400 jóvenes, 220 están de acuerdo con la
suscripción de los Tratados de Libre Comercio (TLC’s). Mientras que en una
muestra de 600 adultos, 300 están de acuerdo con la suscripción de TLC’s.
a) ¿Está Ud. de acuerdo que más del 50% de jóvenes está de acuerdo con la
suscripción de TLC’s? Use α = 0.01. Halle p-valor.
b) ¿Se puede afirmar que hay una diferencia significativa entre las verdaderas
proporciones de jóvenes y adultos que están de acuerdo con la suscripción de
TLC’s? Use α = 0.05. Halle p-valor.
354
Capítulo 7. PRUEBAS DE HIPÓTESIS NO
PARAMÉTRICAS
“Ser culto, es el único modo de ser libre”
José Martí
CONTENIDO
7.1
7.2
7.3
7.4
7.5
7.6
7.7
Uso de la distribución Chi-cuadrado. Test de independencia.
Test de bondad de ajuste.
Test de Wilcoxon.
Test de signos.
Test de la mediana.
Ejercicios resueltos.
Ejercicios propuestos.
En este capítulo, se presenta algunos métodos para la realización de pruebas
estadísticas no paramétricas, las mismas que no requieren la verificación de algunos
supuestos como la normalidad y homogeneidad de varianzas, para la realización de
pruebas paramétricas.
Los métodos no paramétricos son una serie de procedimientos que no requieren
supuestos acerca de la distribución de probabilidad por ello son llamados métodos de
libre distribución y son empleados con datos medidos en escala nominal u ordinal,
asi como con datos de intervalo o razón sin suponer distribución alguna.
Entre las ventajas del uso de los métodos no paramétricos se tiene:
-
Se emplean cuando se desconoce la distribución de la población estudiada.
-
Las hipótesis se formulan sin considerar valores para los parámetros.
-
Se usa en datos de escala nominal u ordinal.
-
Se usan cuando las muestras son pequeñas (n < 30).
Las desventajas de estos métodos son:
-
Se vuelven complicadas para muestras grandes.
-
Se desperdicia información usando métodos no paramétricos si se puede emplear
procedimientos paramétricos.
A continuación se desarrollan las principales pruebas estadísticas no paramétricas
con sus correspondientes aplicaciones.
355
7.1
USO DE LA DISTRIBUCIÓN CHI-CUADRADO. TEST DE
INDEPENDENCIA
En muchos estudios surge el interés por determinar si existe alguna relación de
dependencia entre variables cualitativas, cuyos resultados son presentados en
tablas de contingencia de f filas por c columnas. Las categorías (cualidades,
atributos o modalidades) de las variables se presentan en los márgenes superior
e izquierdo, en las casillas se presenta las frecuencias observadas para las
distintas combinaciones y los totales en los márgenes derecho e inferior.
Suponga que se desea determinar si las variables A y B son dependientes. Sean
Ai las categorías de A (i = 1, 2, …., f) y Bj las categorías de B (j = 1, 2, …., c)
las que se muestra en la tabla de contingencia pxq siguiente:
Obs.
B1
….
Bj
….
Bc
∑
A1
O11
….
O1j
….
O1c
O1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Ai
Oi1
….
Oij
….
Oic
Oi.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Af
Of1
….
Ofj
….
Ofc
Of.
∑
O.1
….
O.j
….
O.c
n
.
.
.
.
.
.
.
.
.
.
.
.
En la tabla anterior se muestra también las frecuencias observadas Oij, los
c
totales de cada fila Oi. =  Oij , los totales de cada columna O.j =
j 1
c
f
j 1
i 1
total de observaciones para el estudio n   O j   Oi  .
Los pasos a seguir para la prueba de hipótesis son:
1. Hipótesis:
Ho: A y B son variables independientes
H1: A y B son variables dependientes
356
f
O
i 1
ij
y el
2. Escoger el nivel de significación: 
f
c
3. Estadística de prueba:  2  
(Oij  eij ) 2
eij
i 1 j 1
Donde eij 
Oi  x O j
n
  (2f 1)(c 1)
son las frecuencias esperadas obtenidas con las
frecuencias observadas, suponiendo que Ho es cierta, es decir que A y B son
independientes. Las frecuencias esperadas se muestran en la tabla de
contingencia pxq siguiente:
Esp.
B1
….
Bj
….
Bc
∑
A1
e11
….
e1j
….
e1c
O1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Ai
ei1
….
eij
….
eic
Oi.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Af
ef1
….
efj
….
efc
Of.
∑
O.1
….
O.j
….
O.c
n
.
.
.
.
.
.
.
.
.
.
.
.
4. Región crítica: hallar el valor crítico 12 , ( f 1) (c 1) tal que la probabilidad de
rechazar H0 cuando se supone cierta sea:
P [  2  12 ,( f 1)(c1) ]  
La Región crítica de la prueba es: R.C. = {X2 > 12 , ( f 1) (c 1) }
12 , ( f 1) (c 1)
357
La región de aceptación es: R.A. = {X2 < 12 , ( f 1) (c 1) }
5. Hallar 
f
2
calc
c
 
(Oij  eij ) 2
i 1 j 1
eij
con las tablas anteriores.
2
 R.C. (o si
6. Decisión: se rechaza H0 con riesgo igual a , si  calc
2
 calc
 R. A. ). No se rechaza H0 en caso contrario. Si se rechaza Ho se dice
que la prueba es significativa con riesgo cuyo valor es .
Ejemplo 1
En un estudio realizado con los alumnos de la asignatura de Estadística Básica de
la FCE-UNAC, el año 2012, se usa el índice de masa corporal (peso/talla2) para
determinar la condición del peso del alumno (delgado, normal o con sobrepeso) y
ver si existe alguna relación de dependencia con el sexo (hombre o mujer) del
estudiante.
Los resultados observados obtenidos con el SPSS v21, se muestran en la
siguiente tabla:
Tabla de contingencia CONDICIÓN DEL PESO * SEXO
Valores Observados
CONDICIÓN DEL
PESO
SEXO
Total
Hombre
Mujer
Delgado
0
7
7
Normal
33
66
99
Sobrepeso
5
9
14
Total
38
82
120
Con el 5% de significación probar si hay una relación de dependencia entre la
condición del peso del alumno y su sexo (género).
Solución
1. H0: La condición del peso de los estudiantes es independiente del género de
este. (NO existe relación entre la condición del peso y el género del
estudiante).
H1: La condición del peso de los estudiantes depende del género de este
(Existe relación entre la condición del peso y el genero del estudiante).
358
2. Nivel de significación:  = 0.05
3
2
3. Estadística de prueba:   
2
(Oij  eij ) 2
eij
i 1 j 1
  22
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X 12 , ( f 1) (c 1) = X 02.95 , 2 = 5.99. Entonces, R.C. = {X2 > 5.99}
Distribution Plot
Chi-Square, df=2
0.5
Density
0.4
0.3
0.2
0.1
0.0
0.05
0
5.99
X
Valor crítico de chi-cuadrado en Minitab
2
5. Hallar  calc
con la tabla de valores observados y la de valores esperados
siguiente:
Tabla de contingencia CONDICIÓN DEL PESO * SEXO
Valores Esperados
CONDICIÓN DEL
PESO
SEXO
Total
Hombre
Mujer
Delgado
2.2
4.8
7
Normal
31.4
67.6
99
Sobrepeso
4.4
9.6
14
Total
38
82
120
Los valores esperados se obtienen con los totales observados así:
Hombre-delgado = 7x38 / 120 = 2.2; Mujer-delgada = 7x82 / 120 = 4.8
Hombre-normal = 99x38 / 120 = 31.4; Mujer-normal = 99x82 / 120 = 67.6
Hombre-sobrep = 14x38 / 120 = 4.4; Mujer-sobrep = 14x82 / 120 = 9.6
359

3
2
calc
2
 
(Oij  eij ) 2
i 1 j 1

eij

(0  2.2) 2 (7  4.8) 2 (33  31.4) 2



2.2
4.8
31.4
(66  67.6) 2 (5  4.4) 2 (9  9.6) 2
= 3.45


67.6
4.4
9.6
2
 3.45  R. A. , con el 5% de significación no se rechaza
6. Decisión: como  calc
H0, por lo tanto la condición del peso de los estudiantes es independiente del
género de este. (NO existe relación entre la condición del peso y el género
del estudiante).
Estando definidas las variables sexo y condición del peso, los resultados en el
programa SPSS se obtienen así:
Analizar → Estadísticos descriptivos → Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable condición del
peso y en Columnas: la variable sexo.
En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados y las Pruebas de
chi-cuadrado siguientes:
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica
(bilateral)
a
2
,176
Razón de verosimilitudes
5,561
2
,062
Asociación lineal por
1,724
1
,189
Chi-cuadrado de Pearson
3,477
lineal
N de casos válidos
120
a. 3 casillas (50,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 2,22.
Los resultados son similares, pues chi-cuadrado = 3.477, es equivalente al
2
 calc
 3.45 y como el valor-P = Sig. = 0.176 >  = 0.05 no se rechaza Ho y se
concluye también que la condición del peso de los estudiantes es independiente
del género, es decir no hay diferencias significativas entre el sexo y el peso de
los alumnos, con el 5% de significación.
360
De manera similar en el programa Minitab, definir las columnas para la
variables sexo y condición (del peso). Escoger del menú Estadísticas →
Tablas → Tabulación cruzada y chi-cuadrada. En Para filas: seleccionar
condición y en Para columnas: sexo, tal como se aprecia a continuación:
Con el botón chi-cuadrada … escoger Análisis de chi-cuadrada. Luego
Aceptar, Aceptar y en la ventana de Sesión aprece el resultado siguiente:
Estadísticas tabuladas: Condición, Sexo
Filas: Condición
Delgado
Normal
Sobrepeso
Todo
Columnas: Sexo
Hombre
Mujer
Todo
0
33
5
38
7
66
9
82
7
99
14
120
Contenido de la celda:
Conteo
Chi-cuadrada de Pearson = 3.477, GL = 2, Valor P = 0.176
Chi-cuadrada de la tasa de verosimilitud = 5.561, GL =
2, Valor P = 0.062
* NOTA * 3 celdas con conteos esperados menores que 5
Resultados similares a los ya encontrados.
361
7.2 TEST DE BONDAD DE AJUSTE
Esta prueba es utilizada cuando se desea verficar si es razonable que los datos
observados de una variable, siguen una distribución de probabilidades
determinada con p parámetros.
Los pasos a seguir para la prueba de hipótesis son:
1. Hipótesis:
Ho: Los datos se ajustan a un modelo de probabilidades
H1: Los datos no se ajustan al modelo de probabilidades
2. Escoger el nivel de significación: 
(Oi  ei ) 2
3. Estadística de prueba:   
  (2k  p 1)
ei
i 1
k
2
Los datos se presentan en una tabla de frecuencias, con k categorías o
intervalos Ai, con sus correspondientes frecuencias observadas Oi y
frecuencias esperadas ei = npi. Las probabilidades pi = P(Ai) se obtienen con
el modelo de probabilidades al que se ajustan los datos. La tabla es:
Ai
Oi
ei
(Oi – ei)2 /ei
A1
O1
e1
(O1 – e1)2 /e1
A2
O2
e2
(O2 – e2)2 /e2
.
.
.
.
.
.
.
.
.
.
.
.
Ak
Ok
ek
(Ok – ek)2 /ek
∑
n
n
∑ (Oi – ei)2 /ei
12 , k  p 1
362
4. Región crítica: hallar el valor crítico 12 , k  p 1 tal que la probabilidad de
P [  2  12 , k  p1 ]  
rechazar H0 cuando se supone cierta sea:
La región crítica es: R.C. = {X2 < 12 , k  p 1 }
k
2
5. Hallar  calc

i 1
(Oi  ei ) 2
con la anterior tabla de frecuencias.
ei
2
 R.C.
6. Decisión: se rechaza H0 con con el 100 % de significación, si  calc
No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba
es significativa con riesgo cuyo valor es .
Ejemplo 2
Con el fin de estudiar si un dado está o no equilibrado, se arroja el dado 300 veces
en forma independiente, obteniéndose los siguientes resultados:
Resultado
1
2
3
4
5
6
Oi
55
42
53
46
47
57
Con el 5% de significación se puede decir que el dado no esta equilibrado.
Solución
1. Hipótesis:
Ho: El dado está equilibrado → P(i) = 1/6, i = 1, 2, …, 6
H1: El dado no está equilibrado → P(i) ≠ 1/6, i = 1, 2, …, 6
2. Nivel de significación:  = 0.05
(Oi  ei ) 2
3. Estadística de prueba:   
  621
ei
i 1
6
2
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
12 , k  p 1 = X 02.95 , 5 = 11.1. Entonces, R.C. = {X2 > 11.1}
2
5. Hallar  calc
con la información muestral n = 300 y bajo el supuesto que Ho
es cierta, es decir, pi = 1/6, por lo tanto las frecuencias esperadas son ei =
npi = 300x1/6 = 50. La Tabla de frecuencias observadas y esperadas es:
Resultado
1
2
3
4
5
6
Oi
55
42
53
46
47
57
ei
50
50
50
50
50
50
363

(Oi  ei ) 2
(55  50) 2 (42  50) 2 (53  50) 2 (46  50) 2
=
+




ei
50
50
50
50
i 1
6
2
calc

(47  50) 2 (57  50) 2
= 3.44

50
50
2
 3.44  R. A. , con el 5% de significación no se rechaza
6. Decisión: como  calc
H0, por lo tanto, se concluye que el dado está equilibrado.
7.3 TEST DE WILCOXON
Es una prueba de RANGOS CON SIGNOS propuesta por Wilcoxon (1945) y se
usa para contrastar una hipótesis referida al valor de la mediana de la población
(Me). Para la verificación de la hipótesis no se hace ningún supuesto sobre la
distribución de la población y las observaciones Xi requieren al menos una escala
de intervalo ya que la prueba toma la diferencia entre cada valor muestral y el
valor hipotético de la mediana.
Los pasos a seguir en la prueba son:
1. Hipótesis:
Ho: Me = Me0
H1: Me ≠ Me0 o Me < Me0 o Me > Me0
2. Escoger el nivel de significación: 
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: buscar los valores críticos en la Tabla 5, de Wilcoxon para n ≤
40 y  = 0.05 o 0.01.
5. Determinar la W de Wilcoxon con la información muestral y bajo el
supuesto que Ho es cierta, mediante el siguiente procedimiento:
a) Hallar las diferencias di = Xi – Me0 con el signo correspondiente. Si
alguna diferencia es cero, la observación asociada se elimina y el tamaño
efectivo de la muestra disminuye.
b) Ranquear las diferencias di en forma ascendente, sin tomar en cuenta el
signo (en valor absoluto). Si dos o más diferencias son iguales se asume
el rango promedio de esas diferencias empatadas.
c) Asignar los signos de las diferencias di a sus respectivos rangos.
d) Obtener la suma de los rangos para las diferencias positivas y para las
negativas por separado. La suma de los rangos positivos = Wcalc, es el
364
valor calculado del estadístico de prueba y sirve para hallar el valor-P y
compararlo con el nivel de significación .
e) Si el tamaño de muestra es grande el valor-P se obtiene mediante la
aproximación a la distribución Normal con:
Z calc 
Con W 
(W  0.5)  W
W
 N (0, 1)
n(n  1)(2n  1)
n(n  1)
y W 
24
4
6. Decisión: se rechaza H0 con el 100 % de significación, si Wcalc  R.C. No
se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
Otra forma de establecer la regla de decisión, es calculando el valor P, a
partir del valor Zcalc, de manera que:
 Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 3
Una muestra de los salarios semanales (S/.) de 15 obreros arroja los siguientes
resultados: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y
250. Probar si la mediana de los salarios es diferente de S/. 300. Use α = 0.05.
Solución
1. Hipótesis:
Ho: Me = 300
H1: Me ≠ 300
2. Nivel de significación:  = 0.05
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: para n = 15 y  = 0.05, en la tabla 5, de Wilcoxon la región
crítica es: R.C. = {W < 25 o W > 95} → R.A. = {25 ≤ W ≤ 95}
5. Determinar la
W de Wilcoxon con la información muestral y bajo el
supuesto que Ho es cierta, mediante el siguiente procedimiento:
365
Obreros
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Salarios
(Xi)
303
297
375
273
321
413
233
285
276
329
306
290
380
305
250
Total
Diferencias Rango de
di = Xi – 300
|di|
3
1.5
-3
1.5
75
13
-27
9
21
7
113
15
-67
12
-15
6
-24
8
29
10
6
4
-10
5
80
14
5
3
-50
11
Rangos con signo
(+)
(-)
1.5
1.5
13
9
7
15
12
6
8
10
4
5
14
3
11
67.5
52.5
Wcalc = suma de los rangos positivos = 67.5
6. Decisión: como Wcalc = 67.5 ϵ R.A., con el 5% de significación no se rechaza H0
y por lo tanto la mediana de los salarios es de S/. 300.
Para la aproximación a la distribución normal, con n = 15 se obtiene:
W 
n(n  1)(2n  1)
15(16)(31)
n(n  1) 15(16)
= 60 y  W 
= 17.61


4
4
24
24
Z calc 
(W  0.5)  W
W

(67.5  0.5)  60
= 0.40. Para dos colas, el valor-P es:
17.61
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -0.40] = 2(0.3446) = 0.69.
Como el valor-P = 0.69 >  = 0.05, con el 5% de significación no se rechaza H0.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del
menú Estadísticas → No paramétricos → 1W Wilcoxon de 1 muestra. Al abrir
la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana de la
prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna: escoger no es
igual a. Finalmente escoger Aceptar, tal como se aprecia a continuación:
366
En la ventana de Sesión aprece el resultado siguiente:
Prueba de clasificación con signos de Wilcoxon: Salarios (Xi)
Prueba de la mediana = 300.0 vs. La mediana no = 300.0
N
15
Salarios (Xi)
Número
de
prueba
15
Estadística
de Wilcoxon
67.5
P
0.691
Mediana
estimada
304.0
Resultados y conclusiones similares a los antes obtenidos: W = 67.5 y P = 0.691.
El Minitab proporciona el intervalo de confianza del 95% para la mediana:
IC de clasificación con signos de Wilcoxon: Salarios (Xi)
Salarios (Xi)
N
15
Mediana
estimada
304.0
Confianza
lograda
95.0
Intervalo de
confianza
Inferior Superior
281.0
339.0
Como la mediana hipotética cae en el intervalo de confianza, también se acepta que
la mediana de los salarios es S/. 300.
7.4 TEST DE SIGNOS
Es una prueba basada en los signos que surgen de la diferencia de comparar los
datos de una población con respecto a su mediana o entre sí (en investigación
de mercados para identificar la preferencia hacia una de dos marcas de un
producto).
367
PRUEBA PARA COMPARAR LOS VALORES CON LA MEDIANA
Los pasos a seguir en la prueba son:
1. Hipótesis:
Ho: Me = Me0
H1: Me ≠ Me0 o Me < Me0 o Me > Me0
2. Escoger el nivel de significación: 
3. La estadística de prueba S = número de veces que se repite el signo menos
frecuente. S se basa en la distribución Binomial con probabilidad de éxito ½ ya
que la probabilidad que un valor sea mayor o menor que la mediana es ½.
4. Región crítica: buscar el valor crítico en la Tabla 6, de valores críticos para la
prueba del signo S: n ≤ 25 y  = 0.01 o 0.05. La hipótesis nula se rechaza si S
es menor o igual al valor de la tabla.
5. Determinar S = número de veces que se repite el signo menos frecuente, con
la información muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
a) Aplicar un signo más (+) a cada valor observado en la muestra mayor que
la mediana hipotética Me0 y un signo menos (-) a cada valor menor. Si
algún valor es igual a la mediana hipotética Me0, no se aplica signo
alguno y el tamaño efectivo de la muestra disminuye.
b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es
el valor calculado del estadístico de prueba y sirve para hallar el valor-P
y compararlo con el nivel de significación .
c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante
la aproximación Normal de la Binomial S = X = número de veces que se
repite el signo menos frecuente con p = q = 0.5.
Si S = X → N(0.5n, 0.25n) entonces Z calc 
( X  0.5)  0.5n
 N (0, 1)
0.5 n
6. Decisión: se rechaza H0 con el 100 % de significación, si S calc  R.C. No se
rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es
significativa con riesgo cuyo valor es .
Otra forma de establecer la regla de decisión, es calculando el valor P, a
partir del valor Zcalc, de manera que:
368
 Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 4
Para la muestra de los salarios semanales (S/.) de 15 obreros del ejemplo 3,
siguientes: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y
250. Probar si la mediana de los salarios es diferente de S/. 300. Use α = 0.05.
Solución
1. Hipótesis:
Ho: Me = 300
H1: Me ≠ 300
2. Nivel de significación:  = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos
frecuente.
4. Región crítica: para n = 15 y  = 0.05, en la tabla 6 de valores críticos para
la prueba del signo, la región crítica es: R.C. = {S ≤ 3} → R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
Obreros
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Salarios
(Xi)
303
297
375
273
321
413
233
285
276
329
306
290
380
305
250
Signo Diferencia
Xi – 300
+
+
+
+
+
+
+
+
369
Scalc = número de veces que se repite el signo menos frecuente = 7.
6. Decisión: como Scalc = 7 ϵ R.A., con el 5% de significación no se rechaza H0 y
por lo tanto la mediana de los salarios es de S/. 300.
Para la aproximación a la distribución normal de S = X = número de veces que
se repite el signo menos frecuente, con n = 15, p = q = 0.5 se obtiene:
Z calc 
( X  0.5)  0.5n (7  0.5)  0.5x15
= 0.00

0.5 n
0.5 15
Para dos colas, el valor-P es:
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < 0.0] = 2(0.5000) = 1.0000.
Como el valor-P = 1.00 >  = 0.05, con el 5% de significación no se rechaza H0.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del
menú Estadísticas → No paramétricos → 1± Señal de 1 muestra.
Al abrir la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana
de la prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna:
escoger no es igual a. Finalmente escoger Aceptar, tal como se aprecia a
continuación:
En la ventana de Sesión aprece el resultado siguiente:
370
Prueba de signos para mediana: Salarios (Xi)
Prueba del signo de la mediana =
Salarios (Xi)
N
15
Debajo
7
Igual
0
300.0 vs. no = 300.0
Arriba
8
P
1.0000
Mediana
303.0
Resultados y conclusiones similares a los obtenidos: S = Debajo = 7 y P = 1.0000.
El Minitab proporciona también el siguiente intervalo de confianza del 95% para la
mediana:
IC de signos: Salarios
Intervalo de confianza del signo para la mediana
Salarios
N
15
Mediana
303.0
Confianza
lograda
0.8815
0.9500
0.9648
Intervalo de
confianza
Inferior Superior
285.0
321.0
279.4
326.0
276.0
329.0
Posición
5
NLI
4
Como la mediana hipotética cae en el intervalo de confianza, también se acepta que
la mediana de los salarios es S/. 300.
PRUEBA PARA COMPARAR LOS VALORES ENTRE SI
En investigación de mercados sirve para identificar la preferencia hacia una de
dos marcas de un producto (se asigna signo positivo cuando la preferencia es por
la marca de interés y signo negativo en caso contrario), también para hacer
comparaciones entre los valores de los grupos A y B (asignando signo positivo
cuando el valor de A es superior al valor de B y signo negativo en caso contrario,
si son iguales se descarta las observaciones y n disminuye).
Probar si las preferencias son iguales para ambas marcas o que el número de
signos positivos es igual al número de signos negativos es equivalente a probar si
p = 0.50.
Los pasos a seguir en la prueba son:
1. Hipótesis:
Ho: p = 0.50
H1: p ≠ 0.50 o p < 0.50 o p > 0.50.
2. Escoger el nivel de significación: 
371
3. La estadística de prueba S = número de veces que se repite el signo menos
frecuente. S se basa en la distribución Binomial con probabilidad de éxito ½ ya
que la probabilidad que se prefiera una u otra marca (o que un valor sea mayor
o menor que otro) es ½.
4. Región crítica: buscar el valor crítico en la Tabla 6 para la prueba del signo S. La
hipótesis nula se rechaza si S es menor o igual al valor de la tabla.
5. Determinar S = número de veces que se repite el signo menos frecuente, con
la información muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
a) Si se comparan dos marcas de un bien o servicio: aplicar signo positivo
(+) cuando la preferencia es por la marca de interés y signo negativo (-)
en caso contrario.
Si se hace comparaciones entre los valores de los grupos A y B asignar
signo positivo (+) cuando el valor de A es superior al valor de B y signo
negativo (-) en caso contrario.
Si son iguales los valores no se aplica signo alguno, se descarta las
observaciones y el tamaño efectivo de la muestra disminuye.
b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es
el valor calculado del estadístico de prueba y sirve para hallar el valor-P
y compararlo con el nivel de significación .
c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante
la aproximación Normal de la Binomial S = X = número de veces que se
repite el signo menos frecuente con p = q = 0.5.
Si S = X → N(0.5n, 0.25n) entonces Z calc 
( X  0.5)  0.5n
 N (0, 1)
0.5 n
6. Decisión: se rechaza H0 con el 100 % de significación, si S calc  R.C. por lo
tanto no son iguales las preferencias por ambos productos o los valores
comparados de los grupos A y B no son iguales.
Otra forma de establecer la regla de decisión, es calculando el valor P, a
partir del valor Zcalc, de manera que:
 Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
 Para cola a la derecha: P = P[Z > Zcalc]
 Para cola a la izquierda: P = P[Z < Zcalc]
372
Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 5
En un estudio para determinar si la marca de frugo B es más preferida por las amas
de casa que la marca A, se hizo degustar aleatoriamente las marcas A y B a 16 amas
de casa siendo sus preferencias las siguientes: B, B, B, B, A, B, B, B, B, B, B, A, B,
B, A y B. Con el 5% de significación pruebe si la preferencia de las amas de casa
por la marca de frugo A es inferior a la marca B.
Solución
1. Hipótesis: si la preferencia de las amas de casa por las marcas de frugo A y
B es la misma es equivalente a postular Ho: p = 0.50 frente a la alternativa
que la preferencia por la marca A es inferior a la marca B, H1: p < 0.50
2. Nivel de significación:  = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos
frecuente.
4. Región crítica: para n = 16 y  = 0.05, en la tabla 6 de valores críticos para
la prueba del signo, la región crítica es: R.C. = {S ≤ 3} → R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
Ama de casa
Frugo preferido
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
B
B
B
B
A
B
B
B
B
B
B
A
B
B
A
B
373
Signo
+
+
+
+
+
+
+
+
+
+
+
+
+
Scalc = número de veces que se repite el signo menos frecuente = 3.
6. Decisión: como Scalc = 3 ϵ R.C., con el 5% de significación se rechaza H0 y por lo
tanto se acepta que la preferencia por la marca A es inferior a la marca B.
7.5 TEST DE LA MEDIANA
En el acápite 6.5 y 6.6 se trataron las pruebas estadísticas paramétricas Z o T para
la verificación de la igualdad de medias de dos poblaciones, extrayendo muestras
independientes de dichas poblaciones con varianzas conocidas o desconocidas.
La prueba de la mediana es la contraparte no paramétrica para la verificación de
la igualdad de medianas de dos poblaciones, extrayendo muestras independientes.
La escala de medida de la variable es cuando menos ordinal.
El procedimiento a seguir en la prueba es el siguiente:
1. Hipótesis:
Ho: Me1 = Me2
H1: Me1 ≠ Me2 o Me1 > Me2 o Me1 < Me2
2. Escoger el nivel de significación: 
2
2
3. Estadística de prueba:   
2
(Oij  eij ) 2
i 1 j 1
eij
  [21, 1 )
Donde Oij son las frecuencias observadas y eij son las frecuencias esperadas
obtenidas con las frecuencias observadas, suponiendo que Ho es cierta.
4. Región crítica: hallar el valor crítico  [21, 1 ] tal que la probabilidad de
rechazar H0 cuando se supone cierta sea:
P [  2  [21,1 ] ]  
La Región crítica de la prueba es: R.C. = {X2 >  [21, 1 ] }
2
5. Determinar  calc
, con la información muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
a) Calcular la mediana común Me con toda la información de las dos muestras.
b) Para cada muestra determinar el número de observaciones que son menores
o iguales a la mediana común y las que son mayores a dicha mediana y las
frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
374
Muestra
1
2
Total
≤ Me
O11
O21
O.1
Muestra
1
2
Total
≤ Me
e11
e21
O.1
(Oij  eij ) 2
> Me
Total
O12
O1.
O22
O2.
O..2
n
Oi  x O j
c) Hallar las frecuencias esperadas eij 
y colocarlas en la tabla:
n
2
2
2
 
d) Determinar  calc
> Me
e12
e22
O..2
Total
O1.
O2.
n
eij
i 1 j 1
2
 R.C. No se rechaza
6. Decisión: se rechaza H0 con riesgo igual a  si si  calc
H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa
con riesgo cuyo valor es .
Ejemplo 6
Con la información del número de unidades vendidas por hombres y mujeres en
la tabla, determinar si la mediana del número de unidades vendidas por las
mujeres es mayor que la mediana de las unidades vendidas por los hombres. Usar
el 5% de significación.
Hombres (1)
39
43
25
31
45
44
26
25
23
24
38
25
20
Mujeres (2)
30
28
32
48
42
35
48
21
40
30
40
45
28
Solución
1. Hipótesis:
Ho: Me2 = Me1
y
H1: Me2 > Me1
375
2. Nivel de significación:  = 0.05.
2
2
3. Estadística de prueba:  2  
(Oij  eij ) 2
eij
i 1 j 1
  [21, 1 )
4. Región crítica: el valor crítico es  [21, 0.95] = 3.84 y R.C. = {X2 > 3.84}.
2
5. Determinar  calc
, con la información muestral y bajo el supuesto que Ho es
cierta, de la siguiente manera:
a) Con toda la información de las dos muestras se calcula la mediana común y
resulta Me = 31.5.
b) Para cada muestra se determina el número de observaciones que son
menores o iguales (orden 1) a la mediana común 31.5 y las que son
mayores (orden 2) a dicha mediana:
Unid. Vendidas
39
43
25
31
45
44
26
25
23
24
38
25
20
30
28
32
48
42
35
48
21
40
30
40
45
28
Me = 31.5
Sexo
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
376
Orden
2
2
1
1
2
2
1
1
1
1
2
1
1
1
1
2
2
2
2
2
1
2
1
2
2
1
Las frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
Muestra
1 = hombres
2 = Mujeres
Total
≤ Me (Ord. 1)
8
5
O.1 = 13
Muestra
1 = hombres
2 = Mujeres
Total
≤ Me (Ord. 1)
6.5
6.5
O.1 = 13
2
2 (O  e ) 2
ij
ij
> Me (Ord. 2)
Total
5
O1. = 13
8
O2. = 13
O.2 =13
n = 26
Oi  x O j
c) Hallar las frecuencias esperadas eij 
y colocarlas en la tabla:
n
2
 
d) Determinar:  calc
i 1 j 1
2
 calc

> Me (Ord. 2)
6.5
6.5
O.2 =13
Total
O1. = 13
O2. = 13
n = 26
eij
(8  6.5) 2 (5  6.5) 2 (5  6.5) 2 (8  6.5) 2



 = 1.385
6.5
6.5
6.5
6.5
P-valor = P( 12 > 1.385) = 1 - P( 12 ≤ 1.385) = 1 – 0.761 = 0.239.
2
6. Decisión: como  calc
= 1.38 ϵ R.A. y P-valor = 0.239 >  = 0.05, no se
rechaza H0 por lo tanto con el 5% de significación se acepta que la mediana
del número de unidades vendidas por las mujeres y los hombres son iguales.
377
En el programa Minitab, definir las variables Unidades vendidas y Sexo con
sus datos. Escoger del menú Estadísticas → No paramétricos → Prueba de
la mediana de Mood. Al abrir la ventana de diálogo, en Respuesta:
seleccionar Unid. vendidas, en Factor: seleccionar Sexo. Finalmente escoger
Aceptar, tal como se aprecia en la ventana de diálogo de la página anterior.
En la ventana de Sesión aprece el resultado siguiente:
Prueba de mediana de Mood: Unid. vendidas en funcion de Sexo
Prueba de la mediana de Mood para Unid. vendidas
Chi-cuadrada = 1.38
GL = 1
P = 0.239
ICs de 95.0% individuales
Sexo
1
2
N<=
8
5
N>
5
8
Mediana
26.0
35.0
Q3-Q1
16.5
14.5
-+---------+---------+---------+----(--*----------------------------)
(----------*---------------)
-+---------+---------+---------+----25.0
30.0
35.0
40.0
Mediana general = 31.5
Un IC de 95.0% para la mediana(1) - mediana(2): (-15.8,8.4)
2
Resultados y conclusiones similares a los obtenidos:  calc
= 1.38 y P = 0.239. Por
lo tanto con el 5% de significación se acepta que la mediana del número de
unidades vendidas por las mujeres y los hombres son iguales.
378
7.7 PROBLEMAS RESUELTOS
1.
En el estudio realizado con los alumnos de la asignatura de Estadística Básica de
la FCE-UNAC, el año 2012, con el 5% de significación probar si existe relación
entre el hobby (pasatiempo) del alumno y su sexo (género). Los resultados
observados obtenidos con el SPSS v21, se muestran en la siguiente tabla:
Tabla de contingencia HOBBY * SEXO
Valores Observados
SEXO
HOBBY
Total
Hombre
Mujer
Deportes
18
6
24
Música
12
33
45
Baile
1
9
10
TV / Cine
2
27
29
Otros
Total
5
38
7
82
12
120
Solución
1. H0: El hobby de los estudiantes es independiente del género de este. (NO
existe relación entre el hobby y el género del estudiante).
H1: El hobby de los estudiantes depende del género de este (Existe relación
entre el hobby y el genero del estudiante).
2. Nivel de significación:  = 0.05
5
2
3. Estadística de prueba:   
2
(Oij  eij ) 2
eij
i 1 j 1
  42
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X 12 , ( f 1) (c 1) = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}
2
5. Hallar  calc
con la tabla de valores observados y la de valores esperados.
Tabla de contingencia HOBBY * SEXO
Valores Esperados
SEXO
HOBBY
Total
Hombre
Mujer
Deportes
7.6
16.4
24
Música
14.3
30.8
45
Baile
3.2
6.8
10
TV / Cine
9.2
19.8
29
Otros
Total
3.8
38
8.2
82
12
120
379
Los valores esperados se obtienen con los totales observados así:
Hombre-deportes = 24x38 / 120 = 7.6; Mujer-deportes = 24x82 / 120 = 16.4
Hombre-música = 45x38 / 120 = 14.3; Mujer-música = 45x82 / 120 = 30.8
Hombre-baile = 10x38 / 120 = 3.2; Mujer-baile = 10x82 / 120 = 6.8
Hombre-tv/cine= 29x38 / 120 = 9.2; Mujer-tv/cine = 29x82 / 120 = 19.8
Hombre-otros = 12x38 / 120 = 3.8; Mujer-otros = 12x82 / 120 = 8.2
2
Para hallar  calc
ordenamos los valores observados y esperados en la tabla:
Hobby-sexo
Deporte-hombre
Música-hombre
Baile-hombre
Tv/cine-hombre
Otros-hombre
Deporte-mujer
Música-mujer
Baile-mujer
Tv/cine-mujer
Otros-mujer
Oij
eij
(Oij - eij)2/ eij
18
12
1
2
5
6
33
9
27
7
7.6
14.3
3.2
9.2
3.8
16.4
30.8
6.8
19.8
8.2
14.232
0.355
1.482
5.619
0.379
6.595
0.165
0.687
2.604
0.176
2
 calc

∑
5
2
2
 
Luego  calc
i 1 j 1
(Oij  eij )
eij
32.293
2
= 32.293
2
6. Decisión: como  calc
= 32.293 ϵ R.C., con el 5% de significación se rechaza
H0, por lo tanto el hobby de los estudiantes depende del género de este.
(Existe relación entre el hobby y el género del estudiante).
Estando definidas las variables sexo y hobby, los resultados en el programa
SPSS se obtienen así:
Analizar → Estadísticos descriptivos → Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable hobby y en
Columnas: la variable sexo.
En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados del enunciado y
las Pruebas de chi-cuadrado siguientes:
380
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica
(bilateral)
a
4
,000
Razón de verosimilitudes
33,297
4
,000
Asociación lineal por
12,191
1
,000
Chi-cuadrado de Pearson
32,293
lineal
N de casos válidos
120
a. 2 casillas (20,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 3,17.
2
Los resultados son similares, pues  calc
= 32.293, y como el valor-P = Sig. =
0.000 <  = 0.05 se rechaza Ho y se concluye también, con el 5% de
significación, que el hobby de los estudiantes depende del género.
2.
En el estudio realizado con los alumnos de la asignatura de Estadística Básica de
la FCE-UNAC, el año 2012, con el 5% de significación probar si hay una
relación de dependencia entre la importancia de sus estudios para el alumno y su
sexo (género). Los resultados observados obtenidos con el SPSS v21, se
muestran en la siguiente tabla:
Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO
Valores Observados
SEXO
IMPORTANCIA DE TUS
Total
Hombre
Mujer
Poca
0
1
1
Media
2
4
6
Mucha
21
43
64
Muchísima
15
34
49
Total
38
82
120
ESTUDIOS
Solución
1. H0: No existe relación entre la importancia de los estudios y el género del
estudiante (son independientes).
H1: Existe relación entre la importancia de los estudios y el genero del
estudiante.
2. Nivel de significación:  = 0.05
381
4
2
3. Estadística de prueba:   
2
(Oij  eij ) 2
eij
i 1 j 1
  32
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X 12 , ( f 1) (c 1) = X 02.95 , 3 = 7.81. Entonces, R.C. = {X2 > 7.81}
2
5. Hallar  calc
con la tabla de valores observados y la de valores esperados.
Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO
Valores Esperados
SEXO
IMPORTANCIA DE TUS
Total
Hombre
Mujer
Poca
0.3
0.7
1
Media
1.9
4.1
6
Mucha
20.3
43.7
64
Muchísima
15.5
35.5
49
38
82
120
ESTUDIOS
Total
Los valores esperados se obtienen con los totales observados así:
Hombre-poca = 1x38 / 120 = 0.3; Mujer-poca = 1x82 / 120 = 0.7
Hombre-media = 6x38 / 120 = 1.9; Mujer-media = 6x82 / 120 = 4.1
Hombre-mucha = 64x38 / 120 = 20.3; Mujer-mucha = 64x82 / 120 = 43.7
Hombre-muchísima = 49x38 / 120 = 15.5; Mujer-muchísima = 49x82 / 120 =
35.5
2
Para hallar  calc
ordenamos los valores observados y esperados en la tabla:
Oij
Imp.estudio-sexo
Poca-hombre
Media-hombre
Mucha-hombre
Muchisima-hombre
Poca-mujer
Media-mujer
Mucha-mujer
Muchísima-mujer
eij
0
2
21
15
1
4
43
34
0.3
1.9
20.3
15.5
0.7
4.1
43.7
33.5
2
 calc

∑
Luego 
4
2
calc
2
 
i 1 j 1
(Oij  eij ) 2
eij
= 0.535
382
(Oij - eij)2/ eij
0.317
0.005
0.027
0.017
0.147
0.002
0.012
0.008
0.535
2
6. Decisión: como  calc
= 0.535 ϵ R.A., con el 5% de significación no se rechaza
H0, por lo tanto la importancia de los estudios es independiente del género del
alumno. (La importancia de los estudios no depende del género del alumno).
Estando definidas las variables importancia de los estudios y sexo, los
resultados en el programa SPSS son la Tabla de contingencia de valores
observados del enunciado y las Pruebas de chi-cuadrado siguientes:
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica
(bilateral)
a
3
,911
Razón de verosimilitudes
,833
3
,842
Asociación lineal por lineal
,000
1
,996
Chi-cuadrado de Pearson
N de casos válidos
,535
120
a. 4 casillas (50,0%) tienen una frecuencia esperada inferior a 5.
Resultados similares a los obtenidos, es decir que la importancia de los
estudios es independiente del género del alumno, con el 5% de significación.
3.
En una encuesta de Mason y Lind (1998) respecto a los ingresos de
representantes industriales que trabajan por su cuenta o son empleados de
empresas pequeñas, medianas o grandes, se encontró los siguientes resultados:
Valores Observados
TIPO DE
EMPRESA
Cuenta propia
Pequeñas
Medianas
Grandes
Total
< 20
9
12
40
89
150
INGRESOS (miles $)
20 - 40
> 40
11
10
10
13
45
50
104
107
170
180
Total
30
35
135
300
500
Examine la hipótesis de que no existe relación entre el nivel de ingreso de los
representantes industriales y el nivel de su empleo (trabajando por su cuenta o
empleados en empresas pequeñas, medianas o grandes). Realice la prueba al
nivel 0.05.
Solución
1. H0: No existe relación entre el nivel de ingreso de los representantes
industriales y el nivel de su empleo (son independientes).
383
H1: Existe relación entre el nivel de ingreso de los representantes industriales
y el nivel de su empleo.
2. Nivel de significación:  = 0.05
4
3
3. Estadística de prueba:   
2
(Oij  eij ) 2
i 1 j 1
eij
  62
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X 12 , ( f 1) (c 1) = X 02.95 , 6 = 12.6. Entonces, R.C. = {X2 > 12.6}
2
5. Hallar  calc
con la tabla de valores observados y la de valores esperados.
Valores Esperados
TIPO DE
EMPRESA
Cuenta propia
Pequeñas
Medianas
Grandes
Total
INGRESOS
20 - 40
> 40
10.2
10.8
11.9
12.6
45.9
48.6
102.0
108.0
170
180
< 20
9.0
10.5
40.5
90.0
150
Total
30
35
135
300
500
Los valores esperados se obtienen con los totales observados así:
Cuenta propia: 30x150/500 = 9.0, 30x170/500 = 10.2, 30x180/500 = 10.8
Pequeñas: 35x150/500 = 10.5, 35x170/500 = 11.9, 35x180/500 = 12.6
Medianas: 135x150/500 = 40.5, 135x170/500 = 45.9, 135x180/500 =48.6
Grandes: 300x150/500 = 90, 300x170/500 = 102, 300x180/500 = 108
2
Para hallar  calc
ordenamos los valores observados y esperados en la tabla:
Tipo emp.-ingresos
C. propia - < 20
Pequeña - < 20
Mediana - < 20
Grande - < 20
C. propia - 20 a 40
Pequeña - 20 a 40
Mediana - 20 a 40
Grande - 20 a 40
C. propia - > 20
Pequeña - > 20
Mediana - > 20
Grande - > 20
Oij
eij
9
12
40
89
11
10
45
104
10
13
50
107
9.0
10.5
40.5
90.0
10.2
11.9
45.9
102.0
10.8
12.6
48.6
108.0
2
 calc

∑
384
(Oij - eij)2/ eij
0.000
0.214
0.006
0.011
0.063
0.303
0.018
0.039
0.059
0.013
0.040
0.009
0.776
Luego 
4
2
calc
3
 
(Oij  eij ) 2
i 1 j 1
eij
= 0.776
2
6. Decisión: como  calc
= 0.776 ϵ R.A., con el 5% de significación no se rechaza
H0, por lo tanto el nivel de ingreso de los representantes industriales es
independiente del nivel de su empleo (El nivel de ingreso de los
representantes industriales no depende del tipo de empresa donde labora).
4.
Los datos de partes defectuosas procedente de tres proveedores [Anderson y
Otros (2004)] son los siguientes:
Valores Observados:
CALIDAD DE
PARTES
Buena
Defectos pequeños
Defectos graves
Total
PROVEEDOR
B
C
170
135
18
6
7
9
195
150
A
90
3
7
100
Total
395
27
23
445
Use α = 0.05 y demuestre si hay independencia entre proveedor y calidad de las
partes. ¿Qué dice el resultado de su análisis al departamento de compras?
Solución
1. H0: No existe relación entre el proveedor y la calidad de las partes ofrecidas
(son independientes).
H1: Existe relación entre el proveedor y la calidad de las partes ofrecidas.
2. Nivel de significación:  = 0.05
3
3
3. Estadística de prueba:   
2
(Oij  eij ) 2
eij
i 1 j 1
  42
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X 12 , ( f 1) (c 1) = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}
2
5. Hallar  calc
con la tabla de valores observados y la de valores esperados.
Valores Esperados
CALIDAD DE
PARTES
Buena
Defectos pequeños
Defectos graves
Total
A
88.8
6.1
5.2
100
PROVEEDOR
B
C
173.1
133.1
11.8
9.1
10.1
7.8
195
150
385
Total
395
27
23
445
Los valores esperados se obtienen con los totales observados así:
Buena: 395x100/445 = 88.8, 395x195/445 = 173.1, 395x150/445 = 133.1
Def. pequeños.: 27x100/445 = 6.1, 27x195/445 = 11.8, 27x150/445 = 9.1
Def. graves.: 23x100/445 = 5.2, 23x195/445 = 10.1, 23x150/445 = 7.8
2
Para hallar  calc
ordenamos los valores observados y esperados en la tabla:
Oij
Calidad - proveedor
Buena - A
Def. peq. - A
Def. grave - A
Buena - B
Def. peq. - B
Def. grave - B
Buena - C
Def. peq. - C
Def. grave - C
eij
90
3
7
170
18
7
135
6
9
88.8
6.1
5.2
173.1
11.8
10.1
133.1
9.1
7.8
2
 calc

∑
Luego 
3
2
calc
3
 
i 1 j 1
(Oij  eij ) 2
(Oij - eij)2/ eij
0.017
1.551
0.649
0.055
3.216
0.940
0.026
1.057
0.201
7.712
= 7.712
eij
2
6. Decisión: como  calc
= 7.712 ϵ R.A., con el 5% de significación no se rechaza
H0, por lo tanto la calidad de las partes ofrecidas es independiente del
proveedor (La calidad de las partes ofrecidas no depende del proveedor). Se
recomienda al departamento de compras
5.
El experimento de lanzar 4 monedas al aire se repite 500 veces, el resultado de
observar el número de sellos es el siguiente:
N° de sellos (Xi)
0
1
2
3
4
Total
Frecuencias (ni = Oi)
25
129
192
118
36
500
Con el 5% de significación, ¿se ajusta el juego al azar?
Solución
1. Hipótesis:
Ho: El juego se ajusta al azar → X ~ B(4, 0.5)
H1: El juego no se ajusta al azar (X no es binomial)
2. Nivel de significación:  = 0.05
5
3. Estadística de prueba:  2  
i 1
(Oi  ei ) 2
  521
ei
386
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
12 , k  p 1 = X 02.95 , 4 = 9.49. Entonces, R.C. = {X2 > 9.49}
2
5. Hallar  calc
con la información experimental n = 500 y bajo el supuesto que
Ho es cierta, es decir X ~ B(4, 0.5), luego:
P(0) = 4C0 (0.5)4 = 0.0625
P(1) = 4C1 (0.5)4 = 0.2500
P(2) = 4C2 (0.5)4 = 0.3750
P(3) = 4C3 (0.5)4 = 0.2500
P(4) = 4C4 (0.5)4 = 0.0625
Por lo tanto las frecuencias esperadas son ei = npi = 500 pi. La Tabla de
frecuencias observadas y esperadas es:
N° Sellos (Xi)

0
1
2
3
4
Oi
25
129
192
118
36
pi
0.0625
0.2500
0.3750
0.2500
0.0625
ei = npi
31.25
125.00
187.50
125.00
31.25
(Oi  ei ) 2
(25  31.25) 2 (129  125) 2 (192  187 .5) 2
=




ei
31.25
125
187 .5
i 1
5
2
calc
(118  125) 2 (36  31.25) 2
= 2.6


125
31.25
2
 2.6  R. A. , con el 5% de significación no se rechaza
6. Decisión: como  calc
H0, por lo tanto, se concluye que el juego se ajusta al azar.
6.
Los 120 alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año
2012, opinaron sobre la importancia de su físico, con los siguientes resultados:
Imp. del físico
Alumnos (ni = Oi)
Poca
Media
Mucha
Muchísima
Total
19
48
46
7
120
Con el 5% de significación probar si existe diferencia significativa entre la
importancia del físico de los alumnos.
Solución
1. Hipótesis: Ho: No hay diferencia en la importancia del físico de los alumnos
H1: Si hay diferencia en la importancia del físico de los alumnos
2. Nivel de significación:  = 0.05
387
(Oi  ei ) 2
3. Estadística de prueba:   
  421
ei
i 1
4
2
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
12 , k  p 1 = X 02.95 , 3 = 7.81. Entonces, R.C. = {X2 > 7.81}
2
5. Hallar  calc
con la información observada de los 120 alumnos y bajo el
supuesto que Ho es cierta (la importancia del físico es la misma para los
alumnos) es decir, con la misma frecuencia esperada igual a 120/5 = 24. La
Tabla de frecuencias observadas y esperadas es:
Imp. del físico

Poca
Media
Mucha
Muchísima
Oi
19
48
46
7
ei
24
24
24
24
(Oi  ei ) 2

ei
i 1
4
2
calc
(19  24) 2 (48  24) 2 (46  24) 2 (7  24) 2
=
=



24
24
24
24
2
 calc
= 57.25
2
6. Decisión: como  calc
= 57.25 ϵ R.C., con el 5% de significación se rechaza
H0, por lo tanto, se concluye que si existe diferencia significativa entre la
importancia del físico de los alumnos.
7.
Las notas de los 120 alumnos de la asignatura de Estadística Básica de la FCEUNAC, el año 2012, fueron las siguientes:
NOTAS
Xi
ni
7-8
7.5
2
8-9
8.5
6
9 - 10
9.5
7
10 - 11
10.5
21
11 - 12
11.5
33
12 - 13
12.5
22
13 - 14
13.5
19
14 - 15
14.5
7
15 - 16
15.5
3
Probar si las notas se distribuyen normalmente. Use α = 0.05.
Solución
1. Hipótesis: Ho: Las notas de los alumnos se distribuyen normalmente
H1: Las notas de los alumnos no se distribuyen normalmente
388
2. Nivel de significación:  = 0.05
9
3. Estadística de prueba:  2  
i 1
(Oi  ei ) 2
  92 21
ei
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
12 , k  p 1 = X 02.95 , 6 = 12.6. Entonces, R.C. = {X2 > 12.6}
5. Hallar
2
 calc
con la información observada de los 120 alumnos.
La nota promedio de los alumnos es: ˆ 
X n
i
n
i

1412
 11.77
120
La varianza de las notas es:
ˆ
2
X

2
i
ni  nˆ 2
n 1

116950  120(11.77) 2
 2.82 → σ = 1.679
120  1
Bajo el supuesto que Ho es cierta, X = notas ~ N(11.77, 2.82), luego:
Z
X  11.77
 N (0, 1) permite calcular las probabilidades pi para los 9
1.679
intervalos considerados así:
P(X ≤ 8) = P(Z ≤ -2.25) = Ф(-2.25) = 0.01222
P(8 ≤ X < 9) = P(-2.25 ≤ Z < -1.65) = Ф(-1.65) – Ф(-2.25) =
= 0.04947 - 0.01222 = 0.03725.
P(9 ≤ X < 10) = P(-1.65 ≤ Z < -1.05) = Ф(-1.05) – Ф(-1.65) =
= 0.14686 - 0.04947 = 0.09739.
P(10 ≤ X < 11) = P(-1.05 ≤ Z < -0.46) = Ф(-0.46) – Ф(-1.05) =
= 0.32276 - 0.14686 = 0.17590.
P(11 ≤ X < 12) = P(-0.46 ≤ Z < 0.14) = Ф(0.14) – Ф(-0.46) =
= 0.55567 - 0.32276 = 0.23291.
P(12 ≤ X < 13) = P(0.14 ≤ Z < 0.73) = Ф(0.73) – Ф(0.14) =
= 0.76730 - 0.55567 = 0.21163.
P(13 ≤ X < 14) = P(0.73 ≤ Z < 1.33) = Ф(1.33) – Ф(0.73) =
= 0.90824 - 0.76730 = 0.14094.
P(14 ≤ X < 15) = P(1.33 ≤ Z < 1.92) = Ф(1.92) – Ф(1.33) =
= 0.97257 - 0.90824 = 0.06433.
P(X ≥ 15) = P(Z ≥ 1.92) = 1 – Ф(1.92) = 1 - 0.97257 = 0.02743.
389
Las probabilidades pi y las frecuencias esperadas ei = n pi = 120 pi se
presentan en la siguiente tabla:
NOTAS
7-8
8-9
9 - 10
10 - 11
11 - 12
12 - 13
13 - 14
14 - 15
15 - 16
Total
Xi
7.5
8.5
9.5
10.5
11.5
12.5
13.5
14.5
15.5
ni = O i
2
6
7
21
33
22
19
7
3
120
pi
0.01222
0.03725
0.09739
0.17590
0.23291
0.21163
0.14094
0.06433
0.02743
1.00000
ei = npi
1.5
4.5
11.7
21.1
27.9
25.4
16.9
7.7
3.3
120.0
(Oi - ei)2/ei
0.1942
0.5237
1.8796
0.0006
0.9127
0.4540
0.2576
0.0671
0.0258
4.3152
En la última columna se tiene:
9
2
 calc

i 1
(Oi  ei ) 2
= 4.32
ei
2
6. Decisión: como  calc
= 4.32 ϵ R.A., con el 5% de significación no se rechaza
H0, por lo tanto, se concluye que las notas de los alumnos se distribuyen
normalmente.
8.
Una muestra de los gastos de estudio mensual (S/.) de 16 alumnos arroja los
siguientes resultados: 120, 210, 100, 150, 120, 200, 200, 180, 250, 300, 250,
140, 300, 200, 160 y 300. Probar si la mediana de los gastos de estudio es
diferente de S/. 220. Use α = 0.05.
Solución
1. Hipótesis:
Ho: Me = 220
H1: Me ≠ 220
2. Nivel de significación:  = 0.05
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: para n = 16 y  = 0.05, en la tabla 5, de Wilcoxon la región
crítica es: R.C. = {W < 29 o W > 107} → R.A. = {29 ≤ W ≤ 107}
5. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto
que Ho es cierta, tal como se aprecia en la tabla de la página siguiente.
Wcalc = suma de los rangos positivos = 45.5
390
Gastos
(Xi)
Alumnos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
120
210
100
150
120
200
200
180
250
300
250
140
300
200
160
300
Total
Diferencia
Rango de
di = Xi |di|
220
-100
14.5
-10
1
-120
16
-70
9
-100
14.5
-20
3
-20
3
-40
7
30
5.5
80
11.5
30
5.5
-80
11.5
80
11.5
-20
3
-60
8
80
11.5
Rangos con signo
(+)
(-)
14.5
1
16
9
14.5
3
3
7
5.5
11.5
5.5
11.5
11.5
3
8
11.5
45.5
90.5
6. Decisión: como Wcalc = 45.5 ϵ R.A., con el 5% de significación no se rechaza
H0 y por lo tanto la mediana de los gastos de estudio es de S/. 220.
9.
En el problema 8, use la prueba de los signos para probar si la mediana de los
gastos de estudio es diferente de S/. 220. Use α = 0.05.
Solución
1. Hipótesis:
Ho: Me = 220
H1: Me ≠ 220
2. Nivel de significación:  = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos
frecuente.
4. Región crítica: para n = 16 y  = 0.05, en la tabla 6 de valores críticos para
la prueba del signo, la región crítica es: R.C. = {S ≤ 3} → R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
391
Signo Diferencia
di = Xi - 220
1
120
2
210
3
100
4
150
5
120
6
200
7
200
8
180
9
250
+
10
300
+
11
250
+
12
140
13
300
+
14
200
15
160
16
300
+
Scalc = número de veces que se repite el signo menos frecuente = 5.
Alumnos
Gastos (Xi)
6. Decisión: como Scalc = 5 ϵ R.A., con el 5% de significación no se rechaza H0 y
por lo tanto la mediana de los salarios es de S/. 220.
10. Con la información del peso de los hombres y mujeres en la tabla, determinar si
la mediana del peso de los hombres es mayor que la mediana del peso de las
mujeres. Usar el 5% de significación.
Hombres (1)
68
55
70
73
58
59
74
65
66
69
Mujeres (2)
54
42
54
51
43
64
56
47
52
65
Solución
1. Hipótesis:
Ho: Me1 = Me2
y
H1: Me1 > Me2
2. Nivel de significación:  = 0.05.
392
2
2
3. Estadística de prueba:   
2
(Oij  eij ) 2
i 1 j 1
eij
  [21, 1 )
4. Región crítica: el valor crítico es  [21, 0.95] = 3.84 y R.C. = {X2 > 3.84}.
2
5. Determinar  calc
, con la información muestral y bajo el supuesto que Ho es
cierta, de la siguiente manera:
a) Con toda la información de las dos muestras se calcula la mediana común y
resulta Me = 58.5.
b) Para cada muestra se determina el número de observaciones que son
menores o iguales (orden 1) a la mediana común 58.5 y las que son
mayores (orden 2) a dicha mediana:
Peso
Sexo
Orden
68
1
2
55
1
1
70
1
2
73
1
2
58
1
1
59
1
2
74
1
2
65
1
2
66
1
2
69
1
2
54
2
1
42
2
1
54
2
1
51
2
1
43
2
1
64
2
2
56
2
1
47
2
1
52
2
1
65
2
2
Me = 58.5
Las frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
Muestra
1 = hombres
2 = Mujeres
Total
≤ Me (Ord. 1)
2
8
O.1 = 10
393
> Me (Ord. 2)
8
2
O.2 =10
Total
O1. = 10
O2. = 10
n = 20
c) Hallar las frecuencias esperadas eij 
Muestra
1 = hombres
2 = Mujeres
Total
≤ Me (Ord. 1)
5
5
O.1 = 10
2
2 (O  e ) 2
ij
ij
2
 
d) Determinar:  calc

n
y colocarlas en la tabla:
> Me (Ord. 2)
5
5
O.2 =10
Total
O1. = 10
O2. = 10
n = 20
eij
i 1 j 1
2
calc
Oi  x O j
(2  5) 2 (8  5) 2 (8  5) 2 (2  5) 2




 = 7.20
5
5
5
5
P-valor = P( 12 > 7.20) = 1 - P( 12 ≤ 7.20) = 1 – 0.993 = 0.007.
2
6. Decisión: como  calc
= 7.20 ϵ R.C. y P-valor = 0.007 <  = 0.05, se rechaza
H0 y se acepta H1, por lo tanto con el 5% de significación se aceta que la
mediana del peso de los hombres es mayor que la mediana del peso de las
mujeres.
Los resultados en el Minitab para la prueba de medianas es el siguiente:
Prueba de mediana de Mood: Peso en funcion de Sexo
Prueba de la mediana de Mood para Peso
Chi-cuadrada = 7.20
GL = 1
P = 0.007
ICs de 95.0% individuales
Sexo
1
2
N<=
2
8
N>
8
2
Mediana
67.0
53.0
Q3-Q1
12.0
12.0
-----+---------+---------+---------+(-----------*----)
(----------*-------)
-----+---------+---------+---------+49.0
56.0
63.0
70.0
Mediana general = 58.5
Un IC de 95.0% para la mediana(1) - mediana(2): (3.0,23.0)
394
7.8 PROBLEMAS PROPUESTOS
1.
En el estudio realizado con los alumnos de la asignatura de Estadística Básica de
la FCE-UNAC, el año 2012, con el 5% de significación probar si existe relación
entre la importancia del aspecto físico del alumno y su sexo (género). Los
resultados observados obtenidos, se muestran en la siguiente tabla:
Tabla de contingencia IMPORTANCIA DE TU FÍSICO * SEXO
IMPORTANCIA DE
TU FÍSICO
2.
SEXO
Total
Hombre
Mujer
Poca
12
7
19
Media
14
34
48
Mucha
10
36
46
Muchísima
2
5
7
Total
38
82
120
En el estudio realizado con los alumnos de la asignatura de Estadística Básica de
la FCE-UNAC, el año 2012, con el 5% de significación probar si hay una
relación de dependencia entre la especialización profesional del alumno de
economía y su sexo (género). Los resultados observados obtenidos con el SPSS
v21, se muestran en la siguiente tabla:
Tabla de contingencia ESPECIALIZACIÓN * SEXO
SEXO
3.
Total
ESPECIALIZACIÓN
Hombre
Mujer
Teoría Económica
8
10
18
Gestión Empresarial
30
72
102
Total
38
82
120
Para determinar si el sexo (género) de las personas adultas es determinante para
que estas consuman licor, se realiza una encuesta a 500 adultos, obteniéndose los
siguientes resultados:
Consume licor
Sí
No
Total
Hombre
195
65
260
Mujer
40
200
240
Total
235
265
500
Use α = 0.05 y demuestre si el género de las personas adultas es
determinante para que consuman licor.
395
4.
Probar con el 5% de significación si el resultado de la evaluación semestral
(aprobado o desaprobado) en la asignatura de estadística básica depende del
profesor, con los resultados del semestre 2012-A en la Facultad de Ciencias
Económicas de la UNAC siguientes:
Profesor
P1
P2
P3
Total
5.
Aprobados Desaprobados
33
17
49
11
15
37
97
65
Total
50
60
52
162
Se lanzan 2 dado 500 veces, el resultado de observar la suma del número de
puntos en los 2 dados es la siguiente:
Suma (Xi)
2
3
4
5
6
7
8
9
10
11
12
Frecuencia (Oi)
6
20
45
42
72
98
75
44
48
35
15
Con el 5% de significación, ¿se ajusta el juego al azar?
6.
Los pesos de los 120 alumnos de la asignatura de Estadística Básica de la FCEUNAC, el año 2012, fueron las siguientes:
PESO (Kg)
Menos 45
45 - 50
50 - 55
55 -60
60 - 65
65 - 70
70 - 75
75 - 80
80 a más
ni = Oi
2
18
20
25
31
9
7
4
4
Con el 5% de significación, probar si los pesos se distribuyen normalmente.
7.
Una encuesta de opinión a 300 clientes de un supermercado, sobre la calidad del
servicio, arroja los siguientes resultados:
396
Calidad servicio
Excelente
Bueno
Regular
Malo
Pésimo
Frecuencias (Oi)
72
67
52
56
53
Con el 5% de significación probar si existe diferencia significativa entre la
opinión de los clientes sobre la calidad del servicio en el supermercado.
8.
Una muestra de los ingresos familiares (S/.) de 20 empleados arroja los
siguientes resultados: 1300, 700, 700, 2500, 1500, 1200, 1500, 1500, 1500,
1000, 1400, 1800, 1500, 1000, 1500, 700, 700, 1000, 1840 y 2000. Probar si la
mediana de los ingresos es diferente de S/. 1400 con la prueba de Wilcoxon y de
los signos. Use α = 0.05.
9.
Los pesos de 15 personas arroja los siguientes resultados: 59, 50, 44, 42, 54, 71,
73, 58, 51, 75, 59, 74, 90, 65 y 43. Probar si la mediana de los pesos es diferente
de 65 kilos con la prueba de Wilcoxon y de los signos. Use α = 0.05.
10. Los precios (S/.) del kilo de carne pagado por 12 amas de casa arroja los
siguientes resultados: 12.50, 12.00, 11.80, 13.20, 12.80, 11.50, 13.50, 12.40,
11.00, 14.00, 11.30 y 13.30. Probar si la mediana de los precios es diferente de
S/. 12.10 con la prueba de Wilcoxon y de los signos. Use α = 0.05.
11. Con la información de la talla de los hombres y mujeres en la tabla, determinar
si la mediana de la talla de los hombres es mayor que la mediana de la talla de
las mujeres. Usar el 5% de significación.
Hombres (1)
171
167
160
165
168
176
174
169
168
176
Mujeres (2)
152
150
152
165
158
150
155
158
165
149
397
REFERENCIAS BIBLIOGRÁFICAS
1.
Anderson, D. y Otros (2004). “Estadística para Administración y Economía”.
Editorial Thomson. Octava edición. México.
2.
Berenson & Levin (1992). "Estadística para Administración y Economía".
Prentice Hall Hispanoamericana S.A., México.
3.
Bazán, J. y Corbera, J. (1997).
“Problemas de probabilidad”. Universidad
Nacional del Callao: Trabajo de investigación para la Facultad de Ciencias
Económicas. Callao.
4.
Canovas, George (1995). “Probabilidad y Estadística: Aplicaciones y métodos”.
Mc Graw Hill, México.
5.
Chué, J. y Otros (2007). “Estadística descriptiva y probabilidades”. Lima, Perú.
Fondo Editorial Universidad de Lima.
6.
López de la Manzanara (1977). "Problemas de Estadística". Editorial Pirámide
S.A., Madrid.
7.
Moya y Saravia (1988). "Probabilidad e Inferencia Estadística". Editorial San
Marcos, Lima.
8.
Hoog & Craig (1981). "Introduction to Mathematical Statistics". Mc Graw –Hill,
México.
9.
Kohler, Heinz (1996). “Estadística para Negocios y Economía”. Compañía
Editorial Continental S.A., México.
10. Levin R. & Rubin D. (1996). "Estadística para Administradores". Prentice–Hall
Hispanoamericana S.A. Sexta edición, México.
11. Levin R. & Rubin D. (2004). “Estadística para Administración y Economía”.
Editorial Pearson Prentice-Hall. Séptima edición, México.
12. Mason, R. y Lind, D. (1998). “Estadística para Administración y Economía”.
Editorial Alfaomega. Octava edición. México.
13. Martínez, Ciro (2005). “Estadística y Muestreo”. Ecoe Ediciones. Décimo
segunda edición. Bogota, Colombia.
14. Meendenhall, William (1990). "Estadística para Administradores". Grupo
Editorial Iberoamérica S.A., México.
15. Ministerio de Educación (2000). “Nutrición y Retardo en el Crecimiento”.
Resultados del II Censo Nacional de Talla en Escolares 1999. Lima.
398
16. Ministerio de Salud (2011). Informe del estado nutricional en el Perú.
Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010, CENAN –
INEI. Lima, Perú, 2011.
17. Mood & Graybill (1978). "Introducción a la Teoría Estadística". Editorial
Aguilar. Madrid, España.
18. Pérez, César (2002). “Estadística aplicada a través de Excel”. Editorial PearsonPrentice Hall. Madrid, España.
19. Spiegel, Murray (1991). "Estadística". Colección Schaum. Mc Graw-Hill,
México.
20. Toma, J. y Rubio, J. (2008). “Estadística aplicada”. Segunda parte. Universidad
del Pacífico: Apuntes de estudio 69. Lima.
21. Webster, Allen. (2000). “Estadística aplicada a los negocios y la economía”.
Editorial McGraw-Hill. Tercera edición. Bogota, Colombia.
REFERENCIAS WEB
22. Acuña, Edgar (2012). “Pruebas no paramétricas”. Universidad de Puerto Rico.
http://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&c
d=6&sqi=2&ved=0CEoQFjAF&url=http%3A%2F%2Facademic.uprm.edu%2Fe
acuna%2Fminiman11sl.pdf&ei=e7dpUov5Foj28wTn8oCYAQ&usg=AFQjCNE
-MH9RWOglMaHg479MiFrk0l_FJA
23. Bazán, Juan (2011). “Texto de estadística computacional con R, Excel, Minitab
y SPSS” (PDF). Universidad Nacional del Callao: Trabajo de investigación para
la Facultad de Ciencias Económicas. Callao.
http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_
Investigacion/Enero_2011/BAZAN_BACA_FCE/Estad%EDstica%20computaci
onal.pdf
24. http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.
25. http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos
reservados. Vigésima segunda edición (2001).
399
APÉNDICE
400
TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR
z
F(z) = Φ (z) = P [Z ? z] =


1 t 2 / 2
e dt
2
z
-3.59
-3.58
-3.57
-3.56
-3.55
-3.54
-3.53
-3.52
-3.51
-3.50
F(z)
0.00017
0.00017
0.00018
0.00019
0.00019
0.00020
0.00021
0.00022
0.00022
0.00023
z
-2.99
-2.98
-2.97
-2.96
-2.95
-2.94
-2.93
-2.92
-2.91
-2.90
F(z)
0.00139
0.00144
0.00149
0.00154
0.00159
0.00164
0.00169
0.00175
0.00181
0.00187
z
-2.39
-2.38
-2.37
-2.36
-2.35
-2.34
-2.33
-2.32
-2.31
-2.30
F(z)
0.00842
0.00866
0.00889
0.00914
0.00939
0.00964
0.00990
0.01017
0.01044
0.01072
z
-1.79
-1.78
-1.77
-1.76
-1.75
-1.74
-1.73
-1.72
-1.71
-1.70
F(z)
0.03673
0.03754
0.03836
0.03920
0.04006
0.04093
0.04182
0.04272
0.04363
0.04457
z
-1.19
-1.18
-1.17
-1.16
-1.15
-1.14
-1.13
-1.12
-1.11
-1.10
F(z)
0.11702
0.11900
0.12100
0.12302
0.12507
0.12714
0.12924
0.13136
0.13350
0.13567
z
-0.59
-0.58
-0.57
-0.56
-0.55
-0.54
-0.53
-0.52
-0.51
-0.50
F(z)
0.27760
0.28096
0.28434
0.28774
0.29116
0.29460
0.29806
0.30153
0.30503
0.30854
-3.49
-3.48
-3.47
-3.46
-3.45
-3.44
-3.43
-3.42
-3.41
-3.40
0.00024
0.00025
0.00026
0.00027
0.00028
0.00029
0.00030
0.00031
0.00032
0.00034
-2.89
-2.88
-2.87
-2.86
-2.85
-2.84
-2.83
-2.82
-2.81
-2.80
0.00193
0.00199
0.00205
0.00212
0.00219
0.00226
0.00233
0.00240
0.00248
0.00256
-2.29
-2.28
-2.27
-2.26
-2.25
-2.24
-2.23
-2.22
-2.21
-2.20
0.01101
0.01130
0.01160
0.01191
0.01222
0.01255
0.01287
0.01321
0.01355
0.01390
-1.69
-1.68
-1.67
-1.66
-1.65
-1.64
-1.63
-1.62
-1.61
-1.60
0.04551
0.04648
0.04746
0.04846
0.04947
0.05050
0.05155
0.05262
0.05370
0.05480
-1.09
-1.08
-1.07
-1.06
-1.05
-1.04
-1.03
-1.02
-1.01
-1.00
0.13786
0.14007
0.14231
0.14457
0.14686
0.14917
0.15151
0.15386
0.15625
0.15866
-0.49
-0.48
-0.47
-0.46
-0.45
-0.44
-0.43
-0.42
-0.41
-0.40
0.31207
0.31561
0.31918
0.32276
0.32636
0.32997
0.33360
0.33724
0.34090
0.34458
-3.39
-3.38
-3.37
-3.36
-3.35
-3.34
-3.33
-3.32
-3.31
-3.30
0.00035
0.00036
0.00038
0.00039
0.00040
0.00042
0.00043
0.00045
0.00047
0.00048
-2.79
-2.78
-2.77
-2.76
-2.75
-2.74
-2.73
-2.72
-2.71
-2.70
0.00264
0.00272
0.00280
0.00289
0.00298
0.00307
0.00317
0.00326
0.00336
0.00347
-2.19
-2.18
-2.17
-2.16
-2.15
-2.14
-2.13
-2.12
-2.11
-2.10
0.01426
0.01463
0.01500
0.01539
0.01578
0.01618
0.01659
0.01700
0.01743
0.01786
-1.59
-1.58
-1.57
-1.56
-1.55
-1.54
-1.53
-1.52
-1.51
-1.50
0.05592
0.05705
0.05821
0.05938
0.06057
0.06178
0.06301
0.06426
0.06552
0.06681
-0.99
-0.98
-0.97
-0.96
-0.95
-0.94
-0.93
-0.92
-0.91
-0.90
0.16109
0.16354
0.16602
0.16853
0.17106
0.17361
0.17619
0.17879
0.18141
0.18406
-0.39
-0.38
-0.37
-0.36
-0.35
-0.34
-0.33
-0.32
-0.31
-0.30
0.34827
0.35197
0.35569
0.35942
0.36317
0.36693
0.37070
0.37448
0.37828
0.38209
-3.29
-3.28
-3.27
-3.26
-3.25
-3.24
-3.23
-3.22
-3.21
-3.20
0.00050
0.00052
0.00054
0.00056
0.00058
0.00060
0.00062
0.00064
0.00066
0.00069
-2.69
-2.68
-2.67
-2.66
-2.65
-2.64
-2.63
-2.62
-2.61
-2.60
0.00357
0.00368
0.00379
0.00391
0.00402
0.00415
0.00427
0.00440
0.00453
0.00466
-2.09
-2.08
-2.07
-2.06
-2.05
-2.04
-2.03
-2.02
-2.01
-2.00
0.01831
0.01876
0.01923
0.01970
0.02018
0.02068
0.02118
0.02169
0.02222
0.02275
-1.49
-1.48
-1.47
-1.46
-1.45
-1.44
-1.43
-1.42
-1.41
-1.40
0.06811
0.06944
0.07078
0.07215
0.07353
0.07493
0.07636
0.07780
0.07927
0.08076
-0.89
-0.88
-0.87
-0.86
-0.85
-0.84
-0.83
-0.82
-0.81
-0.80
0.18673
0.18943
0.19215
0.19489
0.19766
0.20045
0.20327
0.20611
0.20897
0.21186
-0.29
-0.28
-0.27
-0.26
-0.25
-0.24
-0.23
-0.22
-0.21
-0.20
0.38591
0.38974
0.39358
0.39743
0.40129
0.40517
0.40905
0.41294
0.41683
0.42074
-3.19
-3.18
-3.17
-3.16
-3.15
-3.14
-3.13
-3.12
-3.11
-3.10
0.00071
0.00074
0.00076
0.00079
0.00082
0.00084
0.00087
0.00090
0.00094
0.00097
-2.59
-2.58
-2.57
-2.56
-2.55
-2.54
-2.53
-2.52
-2.51
-2.50
0.00480
0.00494
0.00508
0.00523
0.00539
0.00554
0.00570
0.00587
0.00604
0.00621
-1.99
-1.98
-1.97
-1.96
-1.95
-1.94
-1.93
-1.92
-1.91
-1.90
0.02330
0.02385
0.02442
0.02500
0.02559
0.02619
0.02680
0.02743
0.02807
0.02872
-1.39
-1.38
-1.37
-1.36
-1.35
-1.34
-1.33
-1.32
-1.31
-1.30
0.08226
0.08379
0.08534
0.08692
0.08851
0.09012
0.09176
0.09342
0.09510
0.09680
-0.79
-0.78
-0.77
-0.76
-0.75
-0.74
-0.73
-0.72
-0.71
-0.70
0.21476
0.21770
0.22065
0.22363
0.22663
0.22965
0.23270
0.23576
0.23885
0.24196
-0.19
-0.18
-0.17
-0.16
-0.15
-0.14
-0.13
-0.12
-0.11
-0.10
0.42465
0.42858
0.43251
0.43644
0.44038
0.44433
0.44828
0.45224
0.45620
0.46017
-3.09
-3.08
-3.07
-3.06
-3.05
-3.04
-3.03
-3.02
-3.01
-3.00
0.00100
0.00104
0.00107
0.00111
0.00114
0.00118
0.00122
0.00126
0.00131
0.00135
-2.49
-2.48
-2.47
-2.46
-2.45
-2.44
-2.43
-2.42
-2.41
-2.40
0.00639
0.00657
0.00676
0.00695
0.00714
0.00734
0.00755
0.00776
0.00798
0.00820
-1.89
-1.88
-1.87
-1.86
-1.85
-1.84
-1.83
-1.82
-1.81
-1.80
0.02938
0.03005
0.03074
0.03144
0.03216
0.03288
0.03362
0.03438
0.03515
0.03593
-1.29
-1.28
-1.27
-1.26
-1.25
-1.24
-1.23
-1.22
-1.21
-1.20
0.09853
0.10027
0.10204
0.10383
0.10565
0.10749
0.10935
0.11123
0.11314
0.11507
-0.69
-0.68
-0.67
-0.66
-0.65
-0.64
-0.63
-0.62
-0.61
-0.60
0.24510
0.24825
0.25143
0.25463
0.25785
0.26109
0.26435
0.26763
0.27093
0.27425
-0.09
-0.08
-0.07
-0.06
-0.05
-0.04
-0.03
-0.02
-0.01
0.00
0.46414
0.46812
0.47210
0.47608
0.48006
0.48405
0.48803
0.49202
0.49601
0.50000
401
TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR
z
F(z) = Φ (z) = P [Z ? z] =


1 t 2 / 2
e
dt
2
continuación
z
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
F(z)
0.50399
0.50798
0.51197
0.51595
0.51994
0.52392
0.52790
0.53188
0.53586
0.53983
z
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70
F(z)
0.72907
0.73237
0.73565
0.73891
0.74215
0.74537
0.74857
0.75175
0.75490
0.75804
z
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30
F(z)
0.88686
0.88877
0.89065
0.89251
0.89435
0.89617
0.89796
0.89973
0.90147
0.90320
z
1.81
1.82
1.83
1.84
1.85
1.86
1.87
1.88
1.89
1.90
F(z)
0.96485
0.96562
0.96638
0.96712
0.96784
0.96856
0.96926
0.96995
0.97062
0.97128
z
2.41
2.42
2.43
2.44
2.45
2.46
2.47
2.48
2.49
2.50
F(z)
0.99202
0.99224
0.99245
0.99266
0.99286
0.99305
0.99324
0.99343
0.99361
0.99379
z
3.01
3.02
3.03
3.04
3.05
3.06
3.07
3.08
3.09
3.10
F(z)
0.99869
0.99874
0.99878
0.99882
0.99886
0.99889
0.99893
0.99896
0.99900
0.99903
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.54380
0.54776
0.55172
0.55567
0.55962
0.56356
0.56749
0.57142
0.57535
0.57926
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.76115
0.76424
0.76730
0.77035
0.77337
0.77637
0.77935
0.78230
0.78524
0.78814
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
0.90490
0.90658
0.90824
0.90988
0.91149
0.91308
0.91466
0.91621
0.91774
0.91924
1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00
0.97193
0.97257
0.97320
0.97381
0.97441
0.97500
0.97558
0.97615
0.97670
0.97725
2.51
2.52
2.53
2.54
2.55
2.56
2.57
2.58
2.59
2.60
0.99396
0.99413
0.99430
0.99446
0.99461
0.99477
0.99492
0.99506
0.99520
0.99534
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
0.99906
0.99910
0.99913
0.99916
0.99918
0.99921
0.99924
0.99926
0.99929
0.99931
0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29
0.30
0.58317
0.58706
0.59095
0.59483
0.59871
0.60257
0.60642
0.61026
0.61409
0.61791
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.79103
0.79389
0.79673
0.79955
0.80234
0.80511
0.80785
0.81057
0.81327
0.81594
1.41
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.49
1.50
0.92073
0.92220
0.92364
0.92507
0.92647
0.92785
0.92922
0.93056
0.93189
0.93319
2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
2.10
0.97778
0.97831
0.97882
0.97932
0.97982
0.98030
0.98077
0.98124
0.98169
0.98214
2.61
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70
0.99547
0.99560
0.99573
0.99585
0.99598
0.99609
0.99621
0.99632
0.99643
0.99653
3.21
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.30
0.99934
0.99936
0.99938
0.99940
0.99942
0.99944
0.99946
0.99948
0.99950
0.99952
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.62172
0.62552
0.62930
0.63307
0.63683
0.64058
0.64431
0.64803
0.65173
0.65542
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00
0.81859
0.82121
0.82381
0.82639
0.82894
0.83147
0.83398
0.83646
0.83891
0.84134
1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60
0.93448
0.93574
0.93699
0.93822
0.93943
0.94062
0.94179
0.94295
0.94408
0.94520
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
0.98257
0.98300
0.98341
0.98382
0.98422
0.98461
0.98500
0.98537
0.98574
0.98610
2.71
2.72
2.73
2.74
2.75
2.76
2.77
2.78
2.79
2.80
0.99664
0.99674
0.99683
0.99693
0.99702
0.99711
0.99720
0.99728
0.99736
0.99744
3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40
0.99953
0.99955
0.99957
0.99958
0.99960
0.99961
0.99962
0.99964
0.99965
0.99966
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50
0.65910
0.66276
0.66640
0.67003
0.67364
0.67724
0.68082
0.68439
0.68793
0.69146
1.01
1.02
1.03
1.04
1.05
1.06
1.07
1.08
1.09
1.10
0.84375
0.84614
0.84849
0.85083
0.85314
0.85543
0.85769
0.85993
0.86214
0.86433
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
0.94630
0.94738
0.94845
0.94950
0.95053
0.95154
0.95254
0.95352
0.95449
0.95543
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30
0.98645
0.98679
0.98713
0.98745
0.98778
0.98809
0.98840
0.98870
0.98899
0.98928
2.81
2.82
2.83
2.84
2.85
2.86
2.87
2.88
2.89
2.90
0.99752
0.99760
0.99767
0.99774
0.99781
0.99788
0.99795
0.99801
0.99807
0.99813
3.41
3.42
3.43
3.44
3.45
3.46
3.47
3.48
3.49
3.50
0.99968
0.99969
0.99970
0.99971
0.99972
0.99973
0.99974
0.99975
0.99976
0.99977
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.69497
0.69847
0.70194
0.70540
0.70884
0.71226
0.71566
0.71904
0.72240
0.72575
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
0.86650
0.86864
0.87076
0.87286
0.87493
0.87698
0.87900
0.88100
0.88298
0.88493
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
0.95637
0.95728
0.95818
0.95907
0.95994
0.96080
0.96164
0.96246
0.96327
0.96407
2.31
2.32
2.33
2.34
2.35
2.36
2.37
2.38
2.39
2.40
0.98956
0.98983
0.99010
0.99036
0.99061
0.99086
0.99111
0.99134
0.99158
0.99180
2.91
2.92
2.93
2.94
2.95
2.96
2.97
2.98
2.99
3.00
0.99819
0.99825
0.99831
0.99836
0.99841
0.99846
0.99851
0.99856
0.99861
0.99865
3.51
3.52
3.53
3.54
3.55
3.56
3.57
3.58
3.59
3.60
0.99978
0.99978
0.99979
0.99980
0.99981
0.99981
0.99982
0.99983
0.99983
0.99984
402
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
P
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0.0005
0.001
0.005
0.01
0
PROBABILIDAD P
0.025
0.05
3.93E-07 1.57E-06 3.93E-05 1.57E-04 9.82E-04 3.93E-03
0.001
0.015
0.064
0.158
0.299
0.485
0.710
0.972
1.26
1.59
1.93
2.31
2.70
3.11
3.54
3.98
4.44
4.91
5.40
5.90
6.40
6.92
7.45
7.99
8.54
9.09
9.66
10.2
10.8
11.4
12.0
12.6
13.2
13.8
14.4
15.0
15.6
16.3
16.9
17.5
18.2
18.8
19.5
20.1
20.8
21.5
22.1
22.8
23.5
0.002
0.024
0.091
0.210
0.381
0.598
0.857
1.15
1.48
1.83
2.21
2.62
3.04
3.48
3.94
4.42
4.90
5.41
5.92
6.45
6.98
7.53
8.08
8.65
9.22
9.80
10.4
11.0
11.6
12.2
12.8
13.4
14.1
14.7
15.3
16.0
16.6
17.3
17.9
18.6
19.2
19.9
20.6
21.3
21.9
22.6
23.3
24.0
24.7
0.010
0.072
0.207
0.412
0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
14.5
15.1
15.8
16.5
17.2
17.9
18.6
19.3
20.0
20.7
21.4
22.1
22.9
23.6
24.3
25.0
25.8
26.5
27.2
28.0
0.020
0.115
0.297
0.554
0.872
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
15.7
16.4
17.1
17.8
18.5
19.2
20.0
20.7
21.4
22.2
22.9
23.7
24.4
25.1
25.9
26.7
27.4
28.2
28.9
29.7
0.051
0.216
0.484
0.831
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
17.5
18.3
19.0
19.8
20.6
21.3
22.1
22.9
23.7
24.4
25.2
26.0
26.8
27.6
28.4
29.2
30.0
30.8
31.6
32.4
403
0.103
0.352
0.711
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
19.3
20.1
20.9
21.7
22.5
23.3
24.1
24.9
25.7
26.5
27.3
28.1
29.0
29.8
30.6
31.4
32.3
33.1
33.9
34.8
Xα
0.10
0.016
0.211
0.584
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.1
10.9
11.7
12.4
13.2
14.0
14.8
15.7
16.5
17.3
18.1
18.9
19.8
20.6
21.4
22.3
23.1
24.0
24.8
25.6
26.5
27.3
28.2
29.1
29.9
30.8
31.6
32.5
33.4
34.2
35.1
35.9
36.8
37.7
0.20
0.064
0.446
1.01
1.65
2.34
3.07
3.82
4.59
5.38
6.18
6.99
7.81
8.63
9.47
10.3
11.2
12.0
12.9
13.7
14.6
15.4
16.3
17.2
18.1
18.9
19.8
20.7
21.6
22.5
23.4
24.3
25.1
26.0
26.9
27.8
28.7
29.6
30.5
31.4
32.3
33.3
34.2
35.1
36.0
36.9
37.8
38.7
39.6
40.5
41.4
0.30
0.148
0.713
1.42
2.19
3.00
3.83
4.67
5.53
6.39
7.27
8.15
9.03
9.93
10.8
11.7
12.6
13.5
14.4
15.4
16.3
17.2
18.1
19.0
19.9
20.9
21.8
22.7
23.6
24.6
25.5
26.4
27.4
28.3
29.2
30.2
31.1
32.1
33.0
33.9
34.9
35.8
36.8
37.7
38.6
39.6
40.5
41.5
42.4
43.4
44.3
0.40
0.275
1.02
1.87
2.75
3.66
4.57
5.49
6.42
7.36
8.30
9.24
10.2
11.1
12.1
13.0
14.0
14.9
15.9
16.9
17.8
18.8
19.7
20.7
21.7
22.6
23.6
24.5
25.5
26.5
27.4
28.4
29.4
30.3
31.3
32.3
33.3
34.2
35.2
36.2
37.1
38.1
39.1
40.0
41.0
42.0
43.0
43.9
44.9
45.9
46.9
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
P
Los valores en la tabla son de Chi-cuadrado, siendo la pro0
babilidad p el área en el extremos inferior.
G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Xα
0.50
0.60
0.70
0.80
Probabilidad P
0.90
0.95
0.975
0.99
0.995
0.999
0.9995
0.455
1.39
2.37
3.36
4.35
5.35
6.35
7.34
8.34
9.34
10.3
11.3
12.3
13.3
14.3
15.3
16.3
17.3
18.3
19.3
20.3
21.3
22.3
23.3
24.3
25.3
26.3
27.3
28.3
29.3
30.3
31.3
32.3
33.3
34.3
35.3
36.3
37.3
38.3
39.3
40.3
41.3
42.3
43.3
44.3
45.3
46.3
47.3
48.3
49.3
0.708
1.83
2.95
4.04
5.13
6.21
7.28
8.35
9.41
10.5
11.5
12.6
13.6
14.7
15.7
16.8
17.8
18.9
19.9
21.0
22.0
23.0
24.1
25.1
26.1
27.2
28.2
29.2
30.3
31.3
32.3
33.4
34.4
35.4
36.5
37.5
38.5
39.6
40.6
41.6
42.7
43.7
44.7
45.7
46.8
47.8
48.8
49.8
50.9
51.9
1.07
2.41
3.66
4.88
6.06
7.23
8.38
9.52
10.7
11.8
12.9
14.0
15.1
16.2
17.3
18.4
19.5
20.6
21.7
22.8
23.9
24.9
26.0
27.1
28.2
29.2
30.3
31.4
32.5
33.5
34.6
35.7
36.7
37.8
38.9
39.9
41.0
42.0
43.1
44.2
45.2
46.3
47.3
48.4
49.5
50.5
51.6
52.6
53.7
54.7
1.64
3.22
4.64
5.99
7.29
8.56
9.80
11.0
12.2
13.4
14.6
15.8
17.0
18.2
19.3
20.5
21.6
22.8
23.9
25.0
26.2
27.3
28.4
29.6
30.7
31.8
32.9
34.0
35.1
36.3
37.4
38.5
39.6
40.7
41.8
42.9
44.0
45.1
46.2
47.3
48.4
49.5
50.5
51.6
52.7
53.8
54.9
56.0
57.1
58.2
2.71
4.61
6.25
7.78
9.24
10.6
12.0
13.4
14.7
16.0
17.3
18.5
19.8
21.1
22.3
23.5
24.8
26.0
27.2
28.4
29.6
30.8
32.0
33.2
34.4
35.6
36.7
37.9
39.1
40.3
41.4
42.6
43.7
44.9
46.1
47.2
48.4
49.5
50.7
51.8
52.9
54.1
55.2
56.4
57.5
58.6
59.8
60.9
62.0
63.2
6.63
9.21
11.3
13.3
15.1
16.8
18.5
20.1
21.7
23.2
24.7
26.2
27.7
29.1
30.6
32.0
33.4
34.8
36.2
37.6
38.9
40.3
41.6
43.0
44.3
45.6
47.0
48.3
49.6
50.9
52.2
53.5
54.8
56.1
57.3
58.6
59.9
61.2
62.4
63.7
65.0
66.2
67.5
68.7
70.0
71.2
72.4
73.7
74.9
76.2
7.88
10.6
12.8
14.9
16.7
18.5
20.3
22.0
23.6
25.2
26.8
28.3
29.8
31.3
32.8
34.3
35.7
37.2
38.6
40.0
41.4
42.8
44.2
45.6
46.9
48.3
49.6
51.0
52.3
53.7
55.0
56.3
57.6
59.0
60.3
61.6
62.9
64.2
65.5
66.8
68.1
69.3
70.6
71.9
73.2
74.4
75.7
77.0
78.2
79.5
10.8
13.8
16.3
18.5
20.5
22.5
24.3
26.1
27.9
29.6
31.3
32.9
34.5
36.1
37.7
39.3
40.8
42.3
43.8
45.3
46.8
48.3
49.7
51.2
52.6
54.1
55.5
56.9
58.3
59.7
61.1
62.5
63.9
65.2
66.6
68.0
69.3
70.7
72.1
73.4
74.7
76.1
77.4
78.7
80.1
81.4
82.7
84.0
85.4
86.7
12.1
15.2
17.7
20.0
22.1
24.1
26.0
27.9
29.7
31.4
33.1
34.8
36.5
38.1
39.7
41.3
42.9
44.4
46.0
47.5
49.0
50.5
52.0
53.5
54.9
56.4
57.9
59.3
60.7
62.2
63.6
65.0
66.4
67.8
69.2
70.6
72.0
73.4
74.7
76.1
77.5
78.8
80.2
81.5
82.9
84.2
85.6
86.9
88.2
89.6
404
3.84
5.99
7.81
9.49
11.1
12.6
14.1
15.5
16.9
18.3
19.7
21.0
22.4
23.7
25.0
26.3
27.6
28.9
30.1
31.4
32.7
33.9
35.2
36.4
37.7
38.9
40.1
41.3
42.6
43.8
45.0
46.2
47.4
48.6
49.8
51.0
52.2
53.4
54.6
55.8
56.9
58.1
59.3
60.5
61.7
62.8
64.0
65.2
66.3
67.5
5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.7
26.1
27.5
28.8
30.2
31.5
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41.9
43.2
44.5
45.7
47.0
48.2
49.5
50.7
52.0
53.2
54.4
55.7
56.9
58.1
59.3
60.6
61.8
63.0
64.2
65.4
66.6
67.8
69.0
70.2
71.4
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
P
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
G.L.
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
0.0005
24.1
24.8
25.5
26.2
26.9
27.6
28.2
28.9
29.6
30.3
31.0
31.7
32.5
33.2
33.9
34.6
35.3
36.0
36.7
37.5
38.2
38.9
39.6
40.4
41.1
41.8
42.6
43.3
44.1
44.8
45.5
46.3
47.0
47.8
48.5
49.3
50.0
50.8
51.5
52.3
53.0
53.8
54.5
55.3
56.1
56.8
57.6
58.4
59.1
59.9
0.001
25.4
26.1
26.8
27.5
28.2
28.9
29.6
30.3
31.0
31.7
32.5
33.2
33.9
34.6
35.4
36.1
36.8
37.6
38.3
39.0
39.8
40.5
41.3
42.0
42.8
43.5
44.3
45.0
45.8
46.5
47.3
48.0
48.8
49.6
50.3
51.1
51.9
52.6
53.4
54.2
54.9
55.7
56.5
57.2
58.0
58.8
59.6
60.4
61.1
61.9
0.005
28.7
29.5
30.2
31.0
31.7
32.5
33.2
34.0
34.8
35.5
36.3
37.1
37.8
38.6
39.4
40.2
40.9
41.7
42.5
43.3
44.1
44.8
45.6
46.4
47.2
48.0
48.8
49.6
50.4
51.2
52.0
52.8
53.6
54.4
55.2
56.0
56.8
57.6
58.4
59.2
60.0
60.8
61.6
62.4
63.2
64.1
64.9
65.7
66.5
67.3
0.01
30.5
31.2
32.0
32.8
33.6
34.3
35.1
35.9
36.7
37.5
38.3
39.1
39.9
40.6
41.4
42.2
43.0
43.8
44.6
45.4
46.2
47.1
47.9
48.7
49.5
50.3
51.1
51.9
52.7
53.5
54.4
55.2
56.0
56.8
57.6
58.5
59.3
60.1
60.9
61.8
62.6
63.4
64.2
65.1
65.9
66.7
67.6
68.4
69.2
70.1
0
PROBABILIDAD P
0.025
0.05
33.2
35.6
34.0
36.4
34.8
37.3
35.6
38.1
36.4
39.0
37.2
39.8
38.0
40.6
38.8
41.5
39.7
42.3
40.5
43.2
41.3
44.0
42.1
44.9
43.0
45.7
43.8
46.6
44.6
47.4
45.4
48.3
46.3
49.2
47.1
50.0
47.9
50.9
48.8
51.7
49.6
52.6
50.4
53.5
51.3
54.3
52.1
55.2
52.9
56.1
53.8
56.9
54.6
57.8
55.5
58.7
56.3
59.5
57.2
60.4
58.0
61.3
58.8
62.1
59.7
63.0
60.5
63.9
61.4
64.7
62.2
65.6
63.1
66.5
63.9
67.4
64.8
68.2
65.6
69.1
66.5
70.0
67.4
70.9
68.2
71.8
69.1
72.6
69.9
73.5
70.8
74.4
71.6
75.3
72.5
76.2
73.4
77.0
74.2
77.9
405
Xα
0.10
38.6
39.4
40.3
41.2
42.1
42.9
43.8
44.7
45.6
46.5
47.3
48.2
49.1
50.0
50.9
51.8
52.7
53.5
54.4
55.3
56.2
57.1
58.0
58.9
59.8
60.7
61.6
62.5
63.4
64.3
65.2
66.1
67.0
67.9
68.8
69.7
70.6
71.5
72.4
73.3
74.2
75.1
76.0
76.9
77.8
78.7
79.6
80.5
81.4
82.4
0.20
42.4
43.3
44.2
45.1
46.0
47.0
47.9
48.8
49.7
50.6
51.6
52.5
53.4
54.3
55.3
56.2
57.1
58.0
59.0
59.9
60.8
61.8
62.7
63.6
64.5
65.5
66.4
67.3
68.3
69.2
70.1
71.1
72.0
72.9
73.9
74.8
75.7
76.7
77.6
78.6
79.5
80.4
81.4
82.3
83.2
84.2
85.1
86.1
87.0
87.9
0.30
45.3
46.2
47.2
48.1
49.1
50.0
51.0
51.9
52.9
53.8
54.8
55.7
56.7
57.6
58.6
59.5
60.5
61.4
62.4
63.3
64.3
65.3
66.2
67.2
68.1
69.1
70.0
71.0
72.0
72.9
73.9
74.8
75.8
76.8
77.7
78.7
79.6
80.6
81.6
82.5
83.5
84.4
85.4
86.4
87.3
88.3
89.2
90.2
91.2
92.1
0.40
47.8
48.8
49.8
50.8
51.7
52.7
53.7
54.7
55.6
56.6
57.6
58.6
59.6
60.5
61.5
62.5
63.5
64.4
65.4
66.4
67.4
68.4
69.3
70.3
71.3
72.3
73.2
74.2
75.2
76.2
77.2
78.1
79.1
80.1
81.1
82.1
83.0
84.0
85.0
86.0
87.0
88.0
88.9
89.9
90.9
91.9
92.9
93.8
94.8
95.8
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
P
Los valores en la tabla son de Chi-cuadrado, siendo la pro0
babilidad p el área en el extremos inferior.
G.L.
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Xα
0.50
0.60
0.70
0.80
Probabilidad P
0.90
0.95
0.975
0.99
0.995
0.999
0.9995
50.3
51.3
52.3
53.3
54.3
55.3
56.3
57.3
58.3
59.3
60.3
61.3
62.3
63.3
64.3
65.3
66.3
67.3
68.3
69.3
70.3
71.3
72.3
73.3
74.3
75.3
76.3
77.3
78.3
79.3
80.3
81.3
82.3
83.3
84.3
85.3
86.3
87.3
88.3
89.3
90.3
91.3
92.3
93.3
94.3
95.3
96.3
97.3
98.3
99.3
52.9
53.9
55.0
56.0
57.0
58.0
59.1
60.1
61.1
62.1
63.2
64.2
65.2
66.2
67.2
68.3
69.3
70.3
71.3
72.4
73.4
74.4
75.4
76.4
77.5
78.5
79.5
80.5
81.5
82.6
83.6
84.6
85.6
86.6
87.7
88.7
89.7
90.7
91.7
92.8
93.8
94.8
95.8
96.8
97.9
98.9
99.9
100.9
101.9
102.9
55.8
56.8
57.9
58.9
60.0
61.0
62.1
63.1
64.2
65.2
66.3
67.3
68.4
69.4
70.5
71.5
72.6
73.6
74.6
75.7
76.7
77.8
78.8
79.9
80.9
82.0
83.0
84.0
85.1
86.1
87.2
88.2
89.2
90.3
91.3
92.4
93.4
94.4
95.5
96.5
97.6
98.6
99.6
100.7
101.7
102.8
103.8
104.8
105.9
106.9
59.2
60.3
61.4
62.5
63.6
64.7
65.7
66.8
67.9
69.0
70.0
71.1
72.2
73.3
74.4
75.4
76.5
77.6
78.6
79.7
80.8
81.9
82.9
84.0
85.1
86.1
87.2
88.3
89.3
90.4
91.5
92.5
93.6
94.7
95.7
96.8
97.9
98.9
100.0
101.1
102.1
103.2
104.2
105.3
106.4
107.4
108.5
109.5
110.6
111.7
64.3
65.4
66.5
67.7
68.8
69.9
71.0
72.2
73.3
74.4
75.5
76.6
77.7
78.9
80.0
81.1
82.2
83.3
84.4
85.5
86.6
87.7
88.8
90.0
91.1
92.2
93.3
94.4
95.5
96.6
97.7
98.8
99.9
101.0
102.1
103.2
104.3
105.4
106.5
107.6
108.7
109.8
110.9
111.9
113.0
114.1
115.2
116.3
117.4
118.5
77.4
78.6
79.8
81.1
82.3
83.5
84.7
86.0
87.2
88.4
89.6
90.8
92.0
93.2
94.4
95.6
96.8
98.0
99.2
100.4
101.6
102.8
104.0
105.2
106.4
107.6
108.8
110.0
111.1
112.3
113.5
114.7
115.9
117.1
118.2
119.4
120.6
121.8
122.9
124.1
125.3
126.5
127.6
128.8
130.0
131.1
132.3
133.5
134.6
135.8
80.7
82.0
83.3
84.5
85.7
87.0
88.2
89.5
90.7
92.0
93.2
94.4
95.6
96.9
98.1
99.3
100.6
101.8
103.0
104.2
105.4
106.6
107.9
109.1
110.3
111.5
112.7
113.9
115.1
116.3
117.5
118.7
119.9
121.1
122.3
123.5
124.7
125.9
127.1
128.3
129.5
130.7
131.9
133.1
134.2
135.4
136.6
137.8
139.0
140.2
88.0
89.3
90.6
91.9
93.2
94.5
95.8
97.0
98.3
99.6
100.9
102.2
103.4
104.7
106.0
107.3
108.5
109.8
111.1
112.3
113.6
114.8
116.1
117.3
118.6
119.9
121.1
122.3
123.6
124.8
126.1
127.3
128.6
129.8
131.0
132.3
133.5
134.7
136.0
137.2
138.4
139.7
140.9
142.1
143.3
144.6
145.8
147.0
148.2
149.4
90.9
92.2
93.5
94.8
96.2
97.5
98.8
100.1
101.4
102.7
104.0
105.3
106.6
107.9
109.2
110.5
111.7
113.0
114.3
115.6
116.9
118.1
119.4
120.7
121.9
123.2
124.5
125.7
127.0
128.3
129.5
130.8
132.0
133.3
134.5
135.8
137.0
138.3
139.5
140.8
142.0
143.3
144.5
145.8
147.0
148.2
149.5
150.7
151.9
153.2
406
68.7
69.8
71.0
72.2
73.3
74.5
75.6
76.8
77.9
79.1
80.2
81.4
82.5
83.7
84.8
86.0
87.1
88.3
89.4
90.5
91.7
92.8
93.9
95.1
96.2
97.4
98.5
99.6
100.7
101.9
103.0
104.1
105.3
106.4
107.5
108.6
109.8
110.9
112.0
113.1
114.3
115.4
116.5
117.6
118.8
119.9
121.0
122.1
123.2
124.3
72.6
73.8
75.0
76.2
77.4
78.6
79.8
80.9
82.1
83.3
84.5
85.7
86.8
88.0
89.2
90.3
91.5
92.7
93.9
95.0
96.2
97.4
98.5
99.7
100.8
102.0
103.2
104.3
105.5
106.6
107.8
108.9
110.1
111.2
112.4
113.5
114.7
115.8
117.0
118.1
119.3
120.4
121.6
122.7
123.9
125.0
126.1
127.3
128.4
129.6
TABLA 3.
DISTRIBUCIÓN ACUMULATIVA T DE STUDENT
p
Los valores en la tabla son valores t, siendo la probabilidad p el área acumulada en el extremos inferior.
0
G.L.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
45
50
55
60
70
80
90
100
200
300
400
500
1000
5000
0.75
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.682
0.682
0.682
0.682
0.682
0.681
0.680
0.679
0.679
0.679
0.678
0.678
0.677
0.677
0.676
0.675
0.675
0.675
0.675
0.675
0.80
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.853
0.853
0.853
0.852
0.852
0.851
0.850
0.849
0.848
0.848
0.847
0.846
0.846
0.845
0.843
0.843
0.843
0.842
0.842
0.842
0.85
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.054
1.054
1.053
1.052
1.052
1.050
1.049
1.047
1.046
1.045
1.044
1.043
1.042
1.042
1.039
1.038
1.038
1.038
1.037
1.037
PROBABILIDAD P
0.90
0.95
0.975
3.078
6.314
12.706
1.886
2.920
4.303
1.638
2.353
3.182
1.533
2.132
2.776
1.476
2.015
2.571
1.440
1.943
2.447
1.415
1.895
2.365
1.397
1.860
2.306
1.383
1.833
2.262
1.372
1.812
2.228
1.363
1.796
2.201
1.356
1.782
2.179
1.350
1.771
2.160
1.345
1.761
2.145
1.341
1.753
2.131
1.337
1.746
2.120
1.333
1.740
2.110
1.330
1.734
2.101
1.328
1.729
2.093
1.325
1.725
2.086
1.323
1.721
2.080
1.321
1.717
2.074
1.319
1.714
2.069
1.318
1.711
2.064
1.316
1.708
2.060
1.315
1.706
2.056
1.314
1.703
2.052
1.313
1.701
2.048
1.311
1.699
2.045
1.310
1.697
2.042
1.309
1.696
2.040
1.309
1.694
2.037
1.308
1.692
2.035
1.307
1.691
2.032
1.306
1.690
2.030
1.303
1.684
2.021
1.301
1.679
2.014
1.299
1.676
2.009
1.297
1.673
2.004
1.296
1.671
2.000
1.294
1.667
1.994
1.292
1.664
1.990
1.291
1.662
1.987
1.290
1.660
1.984
1.286
1.653
1.972
1.284
1.650
1.968
1.284
1.649
1.966
1.283
1.648
1.965
1.282
1.646
1.962
407
1.282
1.645
1.960
0
0.990
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.453
2.449
2.445
2.441
2.438
2.423
2.412
2.403
2.396
2.390
2.381
2.374
2.368
2.364
2.345
2.339
2.336
2.334
2.330
2.327
t
0.995
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.744
2.738
2.733
2.728
2.724
2.704
2.690
2.678
2.668
2.660
2.648
2.639
2.632
2.626
2.601
2.592
2.588
2.586
2.581
2.577
0.9995
636.619
31.599
12.924
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.768
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.633
3.622
3.611
3.601
3.591
3.551
3.520
3.496
3.476
3.460
3.435
3.416
3.402
3.390
3.340
3.323
3.315
3.310
3.300
3.292
TABLA 4. DISTRIBUCIÓN ACUMULATIVA F:
P [F ≤ f]
Los valores en la tabla son valores F, siendo la probabilidad p el área acumulada en el extremos inferior.
G.L.
De nom.
1
2
3
4
5
6
7
8
9
10
P
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
Grados
1
2
3
4
5
6
7
8
9
161
200
216
225
230
234
237
239
241
648
799
864
900
922
937
948
957
963
4052
5000
5403
5625
5764
5859
5928
5981
6022
16211 20000 21615 22500 23056 23437 23715 23925 24091
18.51
19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
38.51
39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39
98.50
99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39
10.13
9.55
9.28
9.12
9.01
8.94
8.89
8.85
8.81
17.44
16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47
34.12
30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
55.55
49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88
7.71
6.94
6.59
6.39
6.26
6.16
6.09
6.04
6.00
12.22
10.65
9.98
9.60
9.36
9.20
9.07
8.98
8.90
21.20
18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
31.33
26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14
6.61
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.77
10.01
8.43
7.76
7.39
7.15
6.98
6.85
6.76
6.68
16.26
13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
22.78
18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77
5.99
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
8.81
7.26
6.60
6.23
5.99
5.82
5.70
5.60
5.52
13.75
10.92
9.78
9.15
8.75
8.47
8.26
8.10
7.98
18.63
14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39
5.59
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
8.07
6.54
5.89
5.52
5.29
5.12
4.99
4.90
4.82
12.25
9.55
8.45
7.85
7.46
7.19
6.99
6.84
6.72
16.24
12.40 10.88 10.05
9.52
9.16
8.89
8.68
8.51
5.32
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
7.57
6.06
5.42
5.05
4.82
4.65
4.53
4.43
4.36
11.26
8.65
7.59
7.01
6.63
6.37
6.18
6.03
5.91
14.69
11.04
9.60
8.81
8.30
7.95
7.69
7.50
7.34
5.12
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
7.21
5.71
5.08
4.72
4.48
4.32
4.20
4.10
4.03
10.56
8.02
6.99
6.42
6.06
5.80
5.61
5.47
5.35
13.61
10.11
8.72
7.96
7.47
7.13
6.88
6.69
6.54
4.96
4.10
3.71
3.48
3.33
3.22
3.14
3.07
3.02
6.94
5.46
4.83
4.47
4.24
4.07
3.95
3.85
3.78
10.04
7.56
6.55
5.99
5.64
5.39
5.20
5.06
4.94
12.83
9.43
8.08
7.34
6.87
6.54
6.30
6.12
5.97
TABLA 4. DISTRIBUCIÓN ACUMULATIVA F:
de libe rtad de l nume rador
10
11
12
13
14
242
243
244
245
245
969
973
977
980
983
6056
6083
6106
6126
6143
24224 24334 24426 24505 24572
19.40 19.40 19.41 19.42 19.42
39.40 39.41 39.41 39.42 39.43
99.40 99.41 99.42 99.42 99.43
199.40 199.41 199.42 199.42 199.43
8.79
8.76
8.74
8.73
8.71
14.42 14.37 14.34 14.30 14.28
27.23 27.13 27.05 26.98 26.92
43.69 43.52 43.39 43.27 43.17
5.96
5.94
5.91
5.89
5.87
8.84
8.79
8.75
8.71
8.68
14.55 14.45 14.37 14.31 14.25
20.97 20.82 20.70 20.60 20.51
4.74
4.70
4.68
4.66
4.64
6.62
6.57
6.52
6.49
6.46
10.05
9.96
9.89
9.82
9.77
13.62 13.49 13.38 13.29 13.21
4.06
4.03
4.00
3.98
3.96
5.46
5.41
5.37
5.33
5.30
7.87
7.79
7.72
7.66
7.60
10.25 10.13 10.03
9.95
9.88
3.64
3.60
3.57
3.55
3.53
4.76
4.71
4.67
4.63
4.60
6.62
6.54
6.47
6.41
6.36
8.38
8.27
8.18
8.10
8.03
3.35
3.31
3.28
3.26
3.24
4.30
4.24
4.20
4.16
4.13
5.81
5.73
5.67
5.61
5.56
7.21
7.10
7.01
6.94
6.87
3.14
3.10
3.07
3.05
3.03
3.96
3.91
3.87
3.83
3.80
5.26
5.18
5.11
5.05
5.01
6.42
6.31
6.23
6.15
6.09
2.98
2.94
2.91
2.89
2.86
3.72
3.66
3.62
3.58
3.55
4.85
4.77
4.71
4.65
4.60
5.85
5.75
5.66
5.59
5.53
15
246
985
6157
24630
19.43
39.43
99.43
199.43
8.70
14.25
26.87
43.08
5.86
8.66
14.20
20.44
4.62
6.43
9.72
13.15
3.94
5.27
7.56
9.81
3.51
4.57
6.31
7.97
3.22
4.10
5.52
6.81
3.01
3.77
4.96
6.03
2.85
3.52
4.56
5.47
16
246
987
6170
24681
19.43
39.44
99.44
199.44
8.69
14.23
26.83
43.01
5.84
8.63
14.15
20.37
4.60
6.40
9.68
13.09
3.92
5.24
7.52
9.76
3.49
4.54
6.28
7.91
3.20
4.08
5.48
6.76
2.99
3.74
4.92
5.98
2.83
3.50
4.52
5.42
17
247
989
6181
24727
19.44
39.44
99.44
199.44
8.68
14.21
26.79
42.94
5.83
8.61
14.11
20.31
4.59
6.38
9.64
13.03
3.91
5.22
7.48
9.71
3.48
4.52
6.24
7.87
3.19
4.05
5.44
6.72
2.97
3.72
4.89
5.94
2.81
3.47
4.49
5.38
18
247
990
6192
24767
19.44
39.44
99.44
199.44
8.67
14.20
26.75
42.88
5.82
8.59
14.08
20.26
4.58
6.36
9.61
12.98
3.90
5.20
7.45
9.66
3.47
4.50
6.21
7.83
3.17
4.03
5.41
6.68
2.96
3.70
4.86
5.90
2.80
3.45
4.46
5.34
19
248
992
6201
24803
19.44
39.45
99.45
199.45
8.67
14.18
26.72
42.83
5.81
8.58
14.05
20.21
4.57
6.34
9.58
12.94
3.88
5.18
7.42
9.62
3.46
4.48
6.18
7.79
3.16
4.02
5.38
6.64
2.95
3.68
4.83
5.86
2.79
3.44
4.43
5.31
20
248
993
6209
24836
19.45
39.45
99.45
199.45
8.66
14.17
26.69
42.78
5.80
8.56
14.02
20.17
4.56
6.33
9.55
12.90
3.87
5.17
7.40
9.59
3.44
4.47
6.16
7.75
3.15
4.00
5.36
6.61
2.94
3.67
4.81
5.83
2.77
3.42
4.41
5.27
P [F ≤ f]
Los valores en la tabla son valores F, siendo la probabilidad p el área acumulada en el extremos inferior.
G.L.
De nom.
11
12
13
14
15
16
17
18
19
20
P
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
0.950
0.975
0.990
0.995
1
4.84
6.72
9.65
12.23
4.75
6.55
9.33
11.75
4.67
6.41
9.07
11.37
4.60
6.30
8.86
11.06
4.54
6.20
8.68
10.80
4.49
6.12
8.53
10.58
4.45
6.04
8.40
10.38
4.41
5.98
8.29
10.22
4.38
5.92
8.18
10.07
4.35
5.87
8.10
9.94
2
3.98
5.26
7.21
8.91
3.89
5.10
6.93
8.51
3.81
4.97
6.70
8.19
3.74
4.86
6.51
7.92
3.68
4.77
6.36
7.70
3.63
4.69
6.23
7.51
3.59
4.62
6.11
7.35
3.55
4.56
6.01
7.21
3.52
4.51
5.93
7.09
3.49
4.46
5.85
6.99
3
3.59
4.63
6.22
7.60
3.49
4.47
5.95
7.23
3.41
4.35
5.74
6.93
3.34
4.24
5.56
6.68
3.29
4.15
5.42
6.48
3.24
4.08
5.29
6.30
3.20
4.01
5.18
6.16
3.16
3.95
5.09
6.03
3.13
3.90
5.01
5.92
3.10
3.86
4.94
5.82
4
3.36
4.28
5.67
6.88
3.26
4.12
5.41
6.52
3.18
4.00
5.21
6.23
3.11
3.89
5.04
6.00
3.06
3.80
4.89
5.80
3.01
3.73
4.77
5.64
2.96
3.66
4.67
5.50
2.93
3.61
4.58
5.37
2.90
3.56
4.50
5.27
2.87
3.51
4.43
5.17
5
3.20
4.04
5.32
6.42
3.11
3.89
5.06
6.07
3.03
3.77
4.86
5.79
2.96
3.66
4.69
5.56
2.90
3.58
4.56
5.37
2.85
3.50
4.44
5.21
2.81
3.44
4.34
5.07
2.77
3.38
4.25
4.96
2.74
3.33
4.17
4.85
2.71
3.29
4.10
4.76
6
3.09
3.88
5.07
6.10
3.00
3.73
4.82
5.76
2.92
3.60
4.62
5.48
2.85
3.50
4.46
5.26
2.79
3.41
4.32
5.07
2.74
3.34
4.20
4.91
2.70
3.28
4.10
4.78
2.66
3.22
4.01
4.66
2.63
3.17
3.94
4.56
2.60
3.13
3.87
4.47
7
3.01
3.76
4.89
5.86
2.91
3.61
4.64
5.52
2.83
3.48
4.44
5.25
2.76
3.38
4.28
5.03
2.71
3.29
4.14
4.85
2.66
3.22
4.03
4.69
2.61
3.16
3.93
4.56
2.58
3.10
3.84
4.44
2.54
3.05
3.77
4.34
2.51
3.01
3.70
4.26
8
2.95
3.66
4.74
5.68
2.85
3.51
4.50
5.35
2.77
3.39
4.30
5.08
2.70
3.29
4.14
4.86
2.64
3.20
4.00
4.67
2.59
3.12
3.89
4.52
2.55
3.06
3.79
4.39
2.51
3.01
3.71
4.28
2.48
2.96
3.63
4.18
2.45
2.91
3.56
4.09
408
Grados
9
2.90
3.59
4.63
5.54
2.80
3.44
4.39
5.20
2.71
3.31
4.19
4.94
2.65
3.21
4.03
4.72
2.59
3.12
3.89
4.54
2.54
3.05
3.78
4.38
2.49
2.98
3.68
4.25
2.46
2.93
3.60
4.14
2.42
2.88
3.52
4.04
2.39
2.84
3.46
3.96
de libe rtad de l nume rador
10
11
12
13
2.85
2.82
2.79
2.76
3.53
3.47
3.43
3.39
4.54
4.46
4.40
4.34
5.42
5.32
5.24
5.16
2.75
2.72
2.69
2.66
3.37
3.32
3.28
3.24
4.30
4.22
4.16
4.10
5.09
4.99
4.91
4.84
2.67
2.63
2.60
2.58
3.25
3.20
3.15
3.12
4.10
4.02
3.96
3.91
4.82
4.72
4.64
4.57
2.60
2.57
2.53
2.51
3.15
3.09
3.05
3.01
3.94
3.86
3.80
3.75
4.60
4.51
4.43
4.36
2.54
2.51
2.48
2.45
3.06
3.01
2.96
2.92
3.80
3.73
3.67
3.61
4.42
4.33
4.25
4.18
2.49
2.46
2.42
2.40
2.99
2.93
2.89
2.85
3.69
3.62
3.55
3.50
4.27
4.18
4.10
4.03
2.45
2.41
2.38
2.35
2.92
2.87
2.82
2.79
3.59
3.52
3.46
3.40
4.14
4.05
3.97
3.90
2.41
2.37
2.34
2.31
2.87
2.81
2.77
2.73
3.51
3.43
3.37
3.32
4.03
3.94
3.86
3.79
2.38
2.34
2.31
2.28
2.82
2.76
2.72
2.68
3.43
3.36
3.30
3.24
3.93
3.84
3.76
3.70
2.35
2.31
2.28
2.25
2.77
2.72
2.68
2.64
3.37
3.29
3.23
3.18
3.85
3.76
3.68
3.61
14
2.74
3.36
4.29
5.10
2.64
3.21
4.05
4.77
2.55
3.08
3.86
4.51
2.48
2.98
3.70
4.30
2.42
2.89
3.56
4.12
2.37
2.82
3.45
3.97
2.33
2.75
3.35
3.84
2.29
2.70
3.27
3.73
2.26
2.65
3.19
3.64
2.22
2.60
3.13
3.55
15
2.72
3.33
4.25
5.05
2.62
3.18
4.01
4.72
2.53
3.05
3.82
4.46
2.46
2.95
3.66
4.25
2.40
2.86
3.52
4.07
2.35
2.79
3.41
3.92
2.31
2.72
3.31
3.79
2.27
2.67
3.23
3.68
2.23
2.62
3.15
3.59
2.20
2.57
3.09
3.50
16
2.70
3.30
4.21
5.00
2.60
3.15
3.97
4.67
2.51
3.03
3.78
4.41
2.44
2.92
3.62
4.20
2.38
2.84
3.49
4.02
2.33
2.76
3.37
3.87
2.29
2.70
3.27
3.75
2.25
2.64
3.19
3.64
2.21
2.59
3.12
3.54
2.18
2.55
3.05
3.46
17
2.69
3.28
4.18
4.96
2.58
3.13
3.94
4.63
2.50
3.00
3.75
4.37
2.43
2.90
3.59
4.16
2.37
2.81
3.45
3.98
2.32
2.74
3.34
3.83
2.27
2.67
3.24
3.71
2.23
2.62
3.16
3.60
2.20
2.57
3.08
3.50
2.17
2.52
3.02
3.42
18
2.67
3.26
4.15
4.92
2.57
3.11
3.91
4.59
2.48
2.98
3.72
4.33
2.41
2.88
3.56
4.12
2.35
2.79
3.42
3.95
2.30
2.72
3.31
3.80
2.26
2.65
3.21
3.67
2.22
2.60
3.13
3.56
2.18
2.55
3.05
3.46
2.15
2.50
2.99
3.38
19
2.66
3.24
4.12
4.89
2.56
3.09
3.88
4.56
2.47
2.96
3.69
4.30
2.40
2.86
3.53
4.09
2.34
2.77
3.40
3.91
2.29
2.70
3.28
3.76
2.24
2.63
3.19
3.64
2.20
2.58
3.10
3.53
2.17
2.53
3.03
3.43
2.14
2.48
2.96
3.35
20
2.65
3.23
4.10
4.86
2.54
3.07
3.86
4.53
2.46
2.95
3.66
4.27
2.39
2.84
3.51
4.06
2.33
2.76
3.37
3.88
2.28
2.68
3.26
3.73
2.23
2.62
3.16
3.61
2.19
2.56
3.08
3.50
2.16
2.51
3.00
3.40
2.12
2.46
2.94
3.32
Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01.
n
0.05
6
0.01
n
0.05
0.01
n
0.05
0.01
0 - 21
18
40 - 131
27 - 144
30
137 - 328 109 - 356
7
2 - 26
19
46 - 144
32 - 158
31
147 - 349 118 - 378
8
3 - 33
0 - 36
20
52 - 158
37 - 173
32
159 - 369 128 - 400
9
5 - 40
1 - 44
21
58 - 173
42 - 189
33
170 - 391 138 - 423
10
8 - 47
3 - 52
22
65 - 188
48 - 205
34
182 - 413 148 - 447
11
10 -56
5 - 61
23
73 - 203
54 - 222
35
195 - 435 159 - 471
12
13 - 65
7 - 71
24
81 - 219
61 - 239
36
208 - 458 171 - 495
13
17 - 74
9 - 82
25
89 - 236
68 - 257
37
221 - 482 182 - 521
14
21 - 84
12 - 93
26
98 - 253
75 - 276
38
235 - 506 194 - 547
15
25 - 95
15 - 105
27
107 - 271
83 - 295
39
249 - 531 207 - 573
16
29 - 107
19 - 117
28
116 - 290
91 - 315
40
264 - 556 220 - 600
17
34 - 119
23 - 130
29
126 - 309 100 - 335
Fuente: Journal of the American Statistical Association, setiembre de 1965.
Tabla 6. Valores críticos para la prueba del signo S: n ≤ 25 y  = 0.01 o 0.05
n
0.01
0.05
n
0.01
0.05
1
-
-
14
1
2
2
-
-
15
2
3
3
-
-
16
2
3
4
-
-
17
2
4
5
-
-
18
3
4
6
-
0
19
3
4
7
-
0
20
3
5
8
0
0
21
4
5
9
0
1
22
4
5
10
0
1
23
4
6
11
0
1
24
5
6
12
1
2
25
5
7
13
1
2
La hipótesis nula se rechaza si S es menor o igual al valor de la tabla.
409