estudio de sensibilidad para datos faltantes en el ajuste de modelos
Transcripción
estudio de sensibilidad para datos faltantes en el ajuste de modelos
ESTUDIO DE SENSIBILIDAD PARA DATOS FALTANTES EN EL AJUSTE DE MODELOS DE EFECTOS MIXTOS. CASO DE ESTUDIO: COHORTE DE PACIENTES CON VIH. Rossana Timaure García 1,2 Giampaolo Orlandoni Merli 2,3 [email protected] [email protected] 1 Departamento de Ingeniería Informática, Laboratorio de Instrumentación Biológica, Universidad Nacional Experimental del Táchira. San Cristóbal, Venezuela. 2 Instituto de Estadística y Computación Aplicada, IEAC. Universidad de los Andes. Mérida, Venezuela. Josefa Ramoni Pezzari 2,3 [email protected] 3 Programa de Investigación Financiera. Universidad de Santander. Bucaramanga, Colombia Resumen. Un enfoque de la investigación clínica es el estudio del cambio, característica fundamental en el seguimiento de enfermedades crónicas, donde a los pacientes se le realizan mediciones de forma periódica pero generalmente se presentan fallas sean en forma intermitente o por deserción, por causas conocidas o no por el investigador; este aspecto se convierte en una limitante para el diseño de modelos ya que puede ocasionar sesgo en las estimaciones, entre los métodos estadísticos más utilizados, para tratar de solucionar este problema están los modelos de efectos mixtos. En esta investigación se evaluó el efecto de los datos faltantes, como problema metodológico en el ajuste de modelos de efectos mixto, con estimación por máxima verosimilitud (LM) y máxima verosimilitud restringida (REML), bajo los supuestos que los datos faltan al azar y presentan varias estructura de covarianza. Para este estudio se imputo un cohorte de 103 pacientes con VIH, todos bajo medicación con antirretrovirales, del programa VIH/SIDA del Instituto Autónomo Hospital Universitario de los Andes, a los cuales se registró una vez por año (entre 2007 y 2013) el número de réplicas de VIH en sangre (CVP) y el conteo de células T CD4+ (CCD4), biomarcadores que se utilizan para el estudio de la progresión de la infección; además de las variables demográficas género (G) y edad (E). De esta cohorte se evaluaron varios perfiles de estudio en todos los casos la variable a explicar fue el Log10CVP y las explicativas el CCD4, G, E y el tiempo. A partir de los datos completos se generaron de forma aleatoria datos faltantes entre el 5 y el 50%, con patrones monótonos, no monótonos y mixtos; los resultados arrojaron que para todos los modelos los que mejor ajustan son los de pendiente e intercepto aleatorio, con estimación por máxima verosimilitud y las variables que resultaron significativas para explicar la variabilidad del LOG10CVP fueron: la edad y la interacción de CCD4 y el tiempo; los criterios de información de Akaike, información Bayesiana y el de información de Akaike corregido, fueron los criterios para evaluar la bondad de ajuste e indicaron en todos los casos que los modelo más parsimonioso eran con una matriz de covarianza no estructurada, sin embargo con respecto a las estimaciones las curvas de predicción comienzan a desviarse significativamente a partir de un 25 % de datos faltantes, con respecto al modelo de datos completos de la cohorte, así como disminuye progresivamente la varianza total explicada por las variables que resultaron significativas, es decir con valores de datos faltantes superiores al 20% las estimaciones son sensibles al sesgo. En conclusión, para el ajuste de modelos de efectos mixto que tiene como supuestos que los datos faltan al azar y son ignorables, se debe evaluar esta premisa cuando los datos faltantes superan el 20 %, en el caso de estudios con características similares a las variables involucradas en el seguimiento de la progresión de la infección por VIH. Palabras claves: Análisis de sensibilidad, datos faltantes, modelos de efectos mixtos, VIH