χ χ χ χ
Transcripción
χ χ χ χ
Medidas de Asociación – Variables Cualitativas Estadística Chi-Cuadrado: rs n ⋅ n ij2 ij ni• ⋅ n • j χ2 = ∑ −n 1. Tablas de Contingencia de dos clases para cada variable. (r = 2, s = 2) Coeficiente H : H = n 11 ⋅ n 22 − n 12 ⋅ n 21 n ⋅n n ⋅ n 21 , − 12 ≤ H ≤ 11 22 n •• n •• n •• Observación: Si H > 0.8 ⇒ Asociación positiva entre los atributos. Si H < 0.2 ⇒ Asociación negativa entre los atributos. Si 0.2 ≤ H ≤ 0.8 ⇒ Independencia entre los atributos. 2. Tablas de Contingencia donde ambas características tienen la misma cantidad de clases. (r = s = k) Coeficiente de Contingencia CC = χ2 n + χ2 Observación: El CC varía entre cero y un máximo que depende de la cantidad de clases; esto es: máx (CC ) = Si k −1 . k CC > 0.6 , entonces podemos asumir que existe asociación entre las variables. máx (CC ) 3. Tablas de Contingencia donde las características tienen distinta cantidad de clases. (r ≠ s ) Coeficiente de Tschuprow T2 = χ2 n (r − 1) ⋅ (s − 1) Profesor: Patricio Videla Jiménez. Medidas de Asociación – Variables Cualitativas 4. Tablas de Contingencia de todo Tipo. Coeficiente de Cramer V = χ2 n ⋅ min{r − 1 : s − 1} Observación: Los indicadores T 2 y V varían entre cero y uno, y al igual que el CC , indicarán que menor es el grado de asociación entre las variables, mientras más cercano se encuentren a cero. El criterio, para decidir la existencia de asociación entre las variables, es el mismo utilizado para CC máx (CC ) . Ejemplo: Los siguientes datos caracterizan las variables estadísticas nivel educacional y ajuste al matrimonio Educación Preparatoria Secundaria Profesional 3 4 χ =∑∑ 2 i =1 j =1 T2 = V = n ⋅ n ij2 ni• ⋅ n • j χ2 n Ajuste al matrimonio Regular Bueno 25 112 20 90 30 103 Pobre 72 65 50 − n = 54.1245 (r − 1) ⋅ (s − 1) χ2 Muy Bueno 98 120 245 = 54.1245 1030 (3 − 1)(4 − 1) n ⋅ min{r − 1 : s − 1} = = 0.0214 54.1245 = 0.1621 1030 ⋅ 2 Observación: Los indicadores T 2 y V indican que las variables no presentan asociación entre sí. No obstante, se trata de indicadores muy “conservadores”, que no tienen un valor probabilístico, sólo descriptivo. Profesor: Patricio Videla Jiménez.