χ χ χ χ

Transcripción

χ χ χ χ
Medidas de Asociación – Variables Cualitativas
Estadística Chi-Cuadrado:
rs
n ⋅ n ij2
ij
ni• ⋅ n • j
χ2 = ∑
−n
1. Tablas de Contingencia de dos clases para cada variable. (r = 2, s = 2)
Coeficiente H :
H =
n 11 ⋅ n 22 − n 12 ⋅ n 21
n ⋅n
n ⋅ n 21
, − 12
≤ H ≤ 11 22
n ••
n ••
n ••
Observación:
Si H > 0.8 ⇒ Asociación positiva entre los atributos.
Si H < 0.2 ⇒ Asociación negativa entre los atributos.
Si 0.2 ≤ H ≤ 0.8 ⇒ Independencia entre los atributos.
2. Tablas de Contingencia donde ambas características tienen la misma cantidad de clases.
(r
= s = k)
Coeficiente de Contingencia
CC =
χ2
n + χ2
Observación: El CC varía entre cero y un máximo que depende de la cantidad de clases; esto
es: máx (CC ) =
Si
k −1
.
k
CC
> 0.6 , entonces podemos asumir que existe asociación entre las variables.
máx (CC )
3. Tablas de Contingencia donde las características tienen distinta cantidad de clases. (r ≠ s )
Coeficiente de Tschuprow
T2 =
χ2
n
(r − 1) ⋅ (s − 1)
Profesor: Patricio Videla Jiménez.
Medidas de Asociación – Variables Cualitativas
4. Tablas de Contingencia de todo Tipo.
Coeficiente de Cramer
V =
χ2
n ⋅ min{r − 1 : s − 1}
Observación: Los indicadores T 2 y V varían entre cero y uno, y al igual que el CC , indicarán
que menor es el grado de asociación entre las variables, mientras más cercano se encuentren a cero.
El criterio, para decidir la existencia de asociación entre las variables, es el mismo utilizado para
CC máx (CC ) .
Ejemplo: Los siguientes datos caracterizan las variables estadísticas nivel educacional y ajuste al
matrimonio
Educación
Preparatoria
Secundaria
Profesional
3
4
χ =∑∑
2
i =1 j =1
T2 =
V =
n ⋅ n ij2
ni• ⋅ n • j
χ2
n
Ajuste al matrimonio
Regular
Bueno
25
112
20
90
30
103
Pobre
72
65
50
− n = 54.1245
(r − 1) ⋅ (s − 1)
χ2
Muy Bueno
98
120
245
=
54.1245
1030 (3 − 1)(4 − 1)
n ⋅ min{r − 1 : s − 1}
=
= 0.0214
54.1245
= 0.1621
1030 ⋅ 2
Observación: Los indicadores T 2 y V indican que las variables no presentan asociación entre sí.
No obstante, se trata de indicadores muy “conservadores”, que no tienen un valor probabilístico,
sólo descriptivo.
Profesor: Patricio Videla Jiménez.