estudio de sensibilidad para datos faltantes en el ajuste de modelos

Transcripción

estudio de sensibilidad para datos faltantes en el ajuste de modelos
ESTUDIO DE SENSIBILIDAD PARA DATOS FALTANTES EN EL AJUSTE DE
MODELOS DE EFECTOS MIXTOS. CASO DE ESTUDIO: COHORTE DE PACIENTES
CON VIH.
Rossana Timaure García 1,2
Giampaolo Orlandoni Merli 2,3
[email protected]
[email protected]
1
Departamento de Ingeniería Informática, Laboratorio de Instrumentación Biológica,
Universidad Nacional Experimental del Táchira. San Cristóbal, Venezuela.
2
Instituto de Estadística y Computación Aplicada, IEAC. Universidad de los Andes. Mérida,
Venezuela.
Josefa Ramoni Pezzari 2,3
[email protected]
3
Programa de Investigación Financiera. Universidad de Santander. Bucaramanga, Colombia
Resumen. Un enfoque de la investigación clínica es el estudio del cambio, característica
fundamental en el seguimiento de enfermedades crónicas, donde a los pacientes se le
realizan mediciones de forma periódica pero generalmente se presentan fallas sean en
forma intermitente o por deserción, por causas conocidas o no por el investigador; este
aspecto se convierte en una limitante para el diseño de modelos ya que puede
ocasionar sesgo en las estimaciones, entre los métodos estadísticos más utilizados,
para tratar de solucionar este problema están los modelos de efectos mixtos. En esta
investigación se evaluó el efecto de los datos faltantes, como problema metodológico
en el ajuste de modelos de efectos mixto, con estimación por máxima verosimilitud
(LM) y máxima verosimilitud restringida (REML), bajo los supuestos que los datos faltan
al azar y presentan varias estructura de covarianza. Para este estudio se imputo un
cohorte de 103 pacientes con VIH, todos bajo medicación con antirretrovirales, del
programa VIH/SIDA del Instituto Autónomo Hospital Universitario de los Andes, a los
cuales se registró una vez por año (entre 2007 y 2013) el número de réplicas de VIH
en sangre (CVP) y el conteo de células T CD4+ (CCD4), biomarcadores que se utilizan
para el estudio de la progresión de la infección; además de las variables demográficas
género (G) y edad (E). De esta cohorte se evaluaron varios perfiles de estudio en todos
los casos la variable a explicar fue el Log10CVP y las explicativas el CCD4, G, E y el
tiempo. A partir de los datos completos se generaron de forma aleatoria datos faltantes
entre el 5 y el 50%, con patrones monótonos, no monótonos y mixtos; los resultados
arrojaron que para todos los modelos los que mejor ajustan son los de pendiente e
intercepto aleatorio, con estimación por máxima verosimilitud y las variables que
resultaron significativas para explicar la variabilidad del LOG10CVP fueron: la edad y la
interacción de CCD4 y el tiempo; los criterios de información de Akaike, información
Bayesiana y el de información de Akaike corregido, fueron los criterios para evaluar la
bondad de ajuste e indicaron en todos los casos que los modelo más parsimonioso
eran con una matriz de covarianza no estructurada, sin embargo con respecto a las
estimaciones las curvas de predicción comienzan a desviarse significativamente a partir
de un 25 % de datos faltantes, con respecto al modelo de datos completos de la
cohorte, así como disminuye progresivamente la varianza total explicada por las
variables que resultaron significativas, es decir con valores de datos faltantes
superiores al 20% las estimaciones son sensibles al sesgo. En conclusión, para el
ajuste de modelos de efectos mixto que tiene como supuestos que los datos faltan al
azar y son ignorables, se debe evaluar esta premisa cuando los datos faltantes superan
el 20 %, en el caso de estudios con características similares a las variables
involucradas en el seguimiento de la progresión de la infección por VIH.
Palabras claves: Análisis de sensibilidad, datos faltantes, modelos de efectos mixtos, VIH