Corpus de Cuestionarios Online en Genómica Nutricional

Transcripción

Corpus de Cuestionarios Online en Genómica Nutricional
Corpus de Cuestionarios Online en Genómica Nutricional:
generación de instancias y almacenamiento de las respuestas
Oscar Coltell1
Antonio Fabregat1
Elisabet Barrera
María Arregui1
Eduardo Añíbarro
Guillermo Ramos
Antonio Monteagudo
Departamento de Lenguajes y Sistemas Informáticos. Universitat Jaume I
Castellón 1201, España
1
RETIC «COMBIOMED». ISCIII
Madrid, 28007, España
y
Dolores Corella
Departamento de Medicina Preventiva. Universitat de València
Valencia, 46010, España
CIBER «Fisiopatología de la Obesidad y Nutrición». ISCIII.
Madrid, 28007, España
RESUMEN
En los estudios de Genómica Nutricional los
cuestionarios para la medición de la dieta y la actividad
física son herramientas de uso común y exhaustivo.
Aunque es crítica la adquisición de información fiable y
precisa en dichos cuestionarios, siguen diseñándose y
administrándose manualmente en soporte papel, con
tratamientos mecanizados para impresos especiales. Así,
el proceso de adquisición de datos de dieta y actividad
física tiene demasiados pasos manuales con un riesgo de
error medio o alto, perdiéndose también la calidad y
fiabilidad de los datos. Con el uso de las nuevas
tecnologías para la Web asíncrona se pueden desarrollar
cuestionarios online considerando la facilidad y
ergonomía para el diseño de la estructura de los
cuestionarios y la calidad del diseño de la interfaz de
usuario para manejarlos. En este trabajo se describe un
aspecto puntual en la automatización del mecanismo de
almacenamiento de respuestas a los cuestionarios según
el tipo de preguntas. Cada tipo de cuestionario requiere
un método diferente para el envío y la actualización de
las respuestas en base al tipo de dependencia entre éstas.
Por ello, no existe una solución global en los tipos de
cuestionarios discutidos, sino estrategias válidas para
cada uno de ellos.
Palabras Claves: Cuestionarios Online en Genómica
Nutricional, frameworks para interfaces de usuario y
comunicaciones asíncronas con el servidor, RAP en
ontologías, nuSOAP en servicios Web, XAJAX y ExtJS,
y escenarios de intercambio de datos.
1. INTRODUCCIÓN
En los estudios de Genómica Nutricional, uno de los
aspectos críticos es la adquisición de información fiable y
precisa sobre el estilo de vida de los participantes con
respecto a los medios de obtención y consumo de energía,
es decir, principalmente la dieta y el ejercicio físico. Por
ello, los cuestionarios para la medición de la dieta [1] y la
actividad física [2] son herramientas de uso común y
exhaustivo en dichos estudios. Sin embargo, y salvo
algunas excepciones [3-4], dichos cuestionarios siguen
diseñándose y administrándose manualmente en soporte
papel. Además, la traslación de las respuestas de los
mencionados cuestionarios sigue estando basada en la
grabación manual o en la exploración óptica sólo para
impresos especiales. Así, se puede colegir que el proceso
de adquisición de datos de dieta y actividad física de los
participantes está constituido por demasiados pasos
manuales con un riesgo de error medio o alto,
perdiéndose también la calidad y fiabilidad de los datos
[5-6].
Estas razones son las que esgrimen los investigadores
responsables de los estudios epidemiológicos y
nutrigenómicos al plantear la imperiosa necesidad de
disponer de versiones online de cuestionarios para medir
la dieta, la actividad física y otros factores ambientales
sobre los pacientes. Además de facilitar la
correspondiente adquisición de los datos de consumo de
alimentos y actividad física de cada participante, en los
cuestionarios online se pueden controlar los errores de
grabación de datos y digitalizar las respuestas, facilitando
su almacenamiento y el cálculo de resultados. Por lo
tanto, a la hora de desarrollar cuestionarios online, es
necesario tener en cuenta dos aspectos principales: la
facilidad y ergonomía para el diseño de la estructura de
los cuestionarios; y la calidad del diseño de la interfaz de
usuario para manejarlos. La facilidad y ergonomía para el
diseño de la estructura de los cuestionarios viene dada por
la disponibilidad de una herramienta informática que
permita centrarse en la estructura y aspecto (inclusión de
preguntas de distintos formatos, organización de las
preguntas, presentación de las preguntas y los espacios de
respuesta) y facilite la generación de instancias de
cuestionarios. La calidad del diseño de la interfaz de
usuario influye en el grado de aceptación y utilidad del
usuario final y determina cómo se va a enviar la
información entre el cliente y el servidor para ser
finalmente almacenada. Todo ello no es posible sin el
concurso de nuevas y potentes tecnologías para el
desarrollo de aplicaciones Web.
La tendencia en el desarrollo de aplicaciones Web ha ido
cambiando desde el diseño e implementación de
aplicaciones Web síncronas hasta el uso de las nuevas
tecnologías para la Web asíncrona, conocidas como
técnicas AJAX (Asynchronous Javascript And XML).
Con AJAX se consigue que el usuario final tenga la
sensación de que se está accediendo a los datos de forma
local, es decir, evitando cambiar de pantalla, o refrescar
la que se muestra, cada vez que sea necesario que un
conjunto de datos sea procesado en el servidor.
Completando esto con las tecnologías Web que permiten
el procesado interno de los datos (para tratamientos
internos, como la obtención de resultados calculados a
partir de las respuestas de los cuestionarios) y el
almacenamiento estructurado, eficiente y seguro de
dichos datos, actualmente se pueden realizar aplicaciones
Web para la generación y administración de cuestionarios
on-line con las que se alcanzan unos grados de precisión,
eficiencia y calidad de los datos que eran impensables no
hace demasiado tiempo.
En este campo, el grupo de investigación
BioInfoGenómica (BIG) ha estado consolidando una
excelente y amplia experiencia en el desarrollo de
aplicaciones Web y construcción de ontologías asociadas
[7]. Como BIG trabaja con el enfoque general de la
Ingeniería del Software para producir resultados de
calidad y simplificar los procesos de desarrollo, procura
aplicar sistemáticamente el principio de reutilización de
software, entre otros principios. En particular, BIG
mantiene una cartera de frameworks como RAP (RDF
API for PHP) en la especificación de ontologías; nuSOAP
en la construcción de servicios Web; y XAJAX,
Prototype, Prototye Window, Scriptaculous y ExtJS, para
el diseño y desarrollo de interfaces de usuario. En este
trabajo se describe un aspecto puntual como resultado del
trabajo del grupo para la automatización del mecanismo
de almacenamiento de respuestas a los cuestionarios
según el tipo de preguntas.
2. OBJETIVOS
El objetivo principal de este trabajo es definir en el
diseño de cuestionarios los diferentes escenarios de
intercambio de datos que se pueden dar en cada uno de
los tipos de cuestionarios utilizados en estudios de
Genómica Nutricional y asociarles un método de envío de
datos que permita mantener la coherencia entre la
información mostrada en el cliente y la almacenada en el
servidor.
3. METODOLOGÍA
En el proceso y generación de cuestionarios para los
estudios de Epidemiología Nutricional, es necesario
abordar previamente el estudio de los diferentes tipos de
cuestionarios que se van a manejar y la estructura de la
información de las preguntas que contienen, para facilitar,
entre otras cosas, el intercambio de datos en dichos
cuestionarios.
Por otra parte, la forma en la que los datos se envían al
servidor es una decisión importante a considerar al
comenzar el diseño de cada uno de los cuestionarios
online. En la actualidad, gracias a la técnica AJAX y al
framework XAJAX que la implementa, la decisión más
plausible es la de enviar cada dato al servidor de forma
asíncrona cuando el usuario lo introduce en la aplicación.
Pero hay que tener en cuenta que el tiempo requerido
para el envío de los datos es la suma del establecimiento
de una conexión TCP con el servidor y el correspondiente
envío de datos, más el tiempo de proceso de los datos por
parte de éste y, finalmente, hay que sumarle el tiempo en
el que la respuesta a la petición tarda en volver al cliente.
Se identifican así tres casos diferenciados por la
información mostrada en la interfaz de usuario y la
información almacenada en el servidor:
Primer caso: al recibir una respuesta del usuario,
ésta se plasma en la interfaz y posteriormente se
envía una petición al servidor. Transcurrido el
tiempo de comunicación, se asume que dicha
información se ha podido almacenar correctamente
y se corresponde con lo que el usuario ve en su
pantalla. Sin embargo, puede ocurrir que se haya
producido un error a la hora de almacenar la
información en el servidor. Por tanto, el controlador
tendrá que eliminar dicha información de la interfaz
de usuario y lo que haya introducido en base a dicha
información.
Segundo caso: se muestra el dato en la interfaz de
usuario cuando ya se ha recibido la respuesta de
aceptación por parte del servidor. El inconveniente
es que el tiempo de respuesta de la aplicación está
directamente relacionado con la velocidad de
conexión con el servidor. La ventaja es que todo lo
que el usuario ve en pantalla ya está guardado en el
servidor y, si en algún momento ocurre un
imprevisto, toda esa información estará de nuevo
disponible al volver a abrir el cuestionario.
Tercer caso: combinación de los dos anteriores. Se
muestra la información por pantalla al mismo
tiempo que se envía al servidor para ser procesada,
mientras que el usuario está viendo una marca
asociada a cada respuesta indicando el estado en la
que se encuentra el proceso de ésta. El usuario es
consciente de que la información sigue siendo
procesada y puede o no ser validada posteriormente.
El modelo de desarrollo que se aplica en las aplicaciones
Web y entornos cliente-servidor realizados por el grupo
de investigación sigue el patrón Modelo Vista
Controlador (MVC), donde la interfaz de la aplicación, la
gestión de los datos y la lógica de control se diseñan y
construyen como tres componentes claramente
diferenciados. Este patrón presenta las siguientes
ventajas:
1. Determina una separación clara entre los componentes
de un programa para poder implementarlos por separado.
2. Plantea una interfaz programada (API: Application
Programm Interface) muy bien definida, permitiendo la
sustitución del Modelo, la Vista o del Controlador.
3. La conexión entre el Modelo y sus Vistas es dinámica,
es decir, se produce en tiempo de ejecución y no en
tiempo de compilación.
4. RESULTADOS Y DISCUSIÓN
Los autores han utilizado los frameworks mencionados
anteriormente en el desarrollo de varios proyectos de
investigación en el ámbito de la Genómica Nutricional
que se encuentran en fase de producción, como
FITUVEROLES
(http://www.fituveroles.uji.es)
u
OBENUTIC (http://www.obenutic.uji.es), y en otros
proyectos en fase de desarrollo como NUTRIFIS y
OBENOMICS (los respectivos portales Web no están
abiertos al acceso general). En los dos primeros, una parte
importante del tiempo de desarrollo se destinó al diseño e
implementación de cuestionarios online para la
adquisición de datos de dieta. En los dos últimos, se han
incorporado también los cuestionarios de actividad física.
En OBENUTIC se han implementado dos tipos de
cuestionarios como instrumentos de medida de la dieta de
los participantes: los cuestionarios de frecuencia de
consumo de alimentos (CFCA) y los recordatorios de 24
horas (R24H). Los CFCA tienen la misma estructura para
todos los participantes, siguiendo un patrón fijo
establecido en cada estudio, mientras que el contenido
final de los R24H varía en base a cada participante.
Además, los R24H requieren de mayor dinamismo dado
que, al almacenar la información que los participantes
van recordando durante la sesión en la que el cuestionario
es ejecutado, pocas veces se dan las respuestas en el
orden lógico en el que éstas deberían ser almacenadas. Al
contrario, las respuestas deben guardarse ordenadas por
momentos del día y, a ser posible, dentro de cada
momento del día, se debe seguir el orden real. Así, resulta
muy útil el uso del framework Scriptaculous que permite
crear listas reordenables mediante drag&drop, facilitando
que el usuario pueda ordenar sus respuestas en cada
momento.
En el caso de los R24H, las respuestas son libres dentro
del contexto de ingesta de alimentos, y es importante el
orden en que las respuestas se almacenan en cada bloque,
al igual que lo es asegurar la validez de una respuesta
antes de permitir que el usuario siga respondiendo.
Cuando un usuario ejecuta la acción de introducir un
nuevo dato, ésta es recogida por la interfaz de usuario del
cuestionario, la cual lanza un evento que es capturado por
el motor AJAX. En el caso normal, tras interpretar el
evento, el motor AJAX realiza una conexión asíncrona
con el controlador que está ubicado en el servidor.
Dado que la acción de añadir un nuevo dato significa un
cambio en los datos del modelo, el controlador realiza
una llamada al método del modelo que se encarga de
realizar dicha acción con el gestor de la base datos. No
obstante, antes de añadir un nuevo dato, tanto el modelo
como el gestor de la base datos realizan una
comprobación, y si todo es correcto, se añade el dato y se
devuelven señales a las capas superiores para indicar que
la acción se ha llevado a cabo correctamente. El
controlador envía la señal al motor AJAX a través de la
red y es entonces cuando la interfaz de usuario se
actualiza para que el usuario vea que el dato ya se ha
añadido.
En caso de error, la comprobación que el modelo realiza
sobre la base de datos genera una excepción y se
devuelve un mensaje de error a través de todas las capas
superiores hasta que le llega al usuario que, hasta ese
momento, no ha podido ver en su pantalla el dato
reflejado. La solución aplicada es mostrar una barra de
estado que actúa de forma modal e indica al usuario que
debe esperar mientras se realiza la acción sobre el
servidor (relación directa entre el tiempo de respuesta de
la aplicación, la velocidad de conexión del usuario y la
carga actual del servidor).
En el caso del CFCA, se dispone de una batería de
preguntas ordenadas por bloques a las que cada
participante responde una a una sin importar el orden que
se siga. La solución adoptada aparentemente ofrece un
bajo tiempo de respuesta, pero con la seguridad para el
usuario de que los datos ya están almacenados en el
servidor cuando la marca cambia a «correcto». Las
acciones ejecutadas en segundo plano para procesar los
datos de las respuestas a estos cuestionarios también se
pueden agrupar en los casos correctos y erróneos. Sin
embargo, cada petición de adición de una respuesta no es
una llamada bloqueante, a diferencia de los R24H, dado
que el usuario puede seguir contestando a las siguientes
preguntas puesto que las respuestas son independientes
unas de otras.
Comparando el enfoque seguido en los R24H respecto al
seguido en los CFCA, se puede observar que el primero
provoca una ralentización en la aparición de los datos en
pantalla. Pero, al mismo tiempo, esta estrategia asegura
que todo aquello que el usuario ve en su formulario ya
está guardado en la base de datos, tal y como establece
uno de los requisitos de los R24H.
En NUTRIFIS y OBENOMICS se han incluido además
los cuestionarios de medición de la actividad física
(CAF). De forma similar a los CFCA, en los CAF se
dispone de una batería de preguntas ordenadas por
bloques a las que cada participante responde una a una
sin importar el orden que se siga. Una diferencia
sustancial es que en el CAF hay una conversión
intermedia de las respuestas a frecuencias homogéneas,
pero que no afecta a la independencia de los bloques de
preguntas. Por tanto, el mecanismo de intercambio de
datos es básicamente el mismo que en los CFCA.
5. CONCLUSIONES
Cada tipo de cuestionario requiere un método diferente
para el envío y la actualización de las respuestas en base
al tipo de dependencia entre éstas. Un envío asíncrono de
la información con llamada bloqueante es mejor para los
cuestionarios en los que las respuestas son dependientes
unas de otras, como en el R24H; mientras que el envío
asíncrono de la información con llamadas no bloqueantes,
pero con uso de marcadores de estado, es mejor para
aquellos cuestionarios en los que las respuestas no son
dependientes unas de otras, como en los CFCA y CAF,
donde el sistema de marcas permite mantener informado
al usuario de forma pasiva y hacer que éste sea consciente
de qué información está realmente guardada y qué
información está todavía pendiente de validación.
Los frameworks que ofrecen soporte para la creación de
las interfaces de usuario y las comunicaciones asíncronas
con el servidor, son imprescindibles para el desarrollo de
proyectos de aplicaciones Web con altos grados de
interacción con el usuario, ya que facilitan el trabajo de
los programadores al permitirles realizar aplicaciones con
un mayor grado de utilidad y con aspecto más moderno e
intuitivo.
Finalmente, no existe una solución global en los tipos de
cuestionarios discutidos, sino estrategias válidas para
cada uno de ellos. Estas estrategias están implementadas
y en explotación en los proyectos OBENUTIC y
FITUVEROLES, en proceso de producción, y con un
buen rendimiento y un alto grado de satisfacción de sus
usuarios. Y se están implementando en los proyectos en
curso NUTRIFIS y OBENOMICS.
AGRADECIMIENTOS
Este trabajo ha sido financiado parcialmente por los
proyectos
NUTRIFIS
(PI08/90002,
ISCIII-FIS),
OBENOMICS (AP-050/09, Conselleria de Sanitat,
Generalitat
Valenciana),
RETIC
COMBIOMED
(RD07/0067/0006, ISCIII-FIS), OBENUTIC (BI061326,
ISCIII-FIS) y CIBER “Fisiopatología de la Obesidad y
Nutrición” (ISCIII-FIS). CIBERobn es una iniciativa del
ISCIII.
REFERENCIAS
[1] Pennington JA, Stumbo PJ, Murphy SP, McNutt
SW, Eldridge AL, McCabe-Sellers BJ, Chenard CA.
Food composition data: the foundation of dietetic
practice and research. J Am Diet Assoc.
2007;107(12):2105-13.
[2] Sit CH, Lau CH, Vertinsky P. Physical activity and
self-perceptions among Hong Kong Chinese with an
acquired physical disability. Adapt Phys Activ Q.
2009;26(4):321-35.
[3] Forbes LE, Storey KE, Fraser SN, Spence JC,
Plotnikoff RC, Raine KD, Hanning RM, McCargar
LJ. Dietary patterns associated with glycemic index
and glycemic load among Alberta adolescents. Appl
Physiol Nutr Metab. 2009;34(4):648-58.
[4] Huntington A, Gilmour J, Schluter P, Tuckett A,
Bogossian F, Turner C. The Internet as a research
site: establishment of a web-based longitudinal
study of the nursing and midwifery workforce in
three countries. J Adv Nurs. 2009;65(6):1309-17.
[5] Li YP, He YN, Zhai FY, Yang XG, Hu XQ, Zhao
WH, Ma GS.Comparison of assessment of food
intakes by using 3 dietary survey methods.
Zhonghua Yu Fang Yi Xue Za Zhi. 2006;40(4):27380.
[6] Wakai K. A review of food frequency
questionnaires developed and validated in Japan. J
Epidemiol. 2009;19(1):1-11.
[7] Arregui M, Coltell O, Vázquez R, Fabregat A,
Portolés O, Corella D. FITUVEROLES: un portal
Web piloto para la determinación de fitoesteroles
ingeridos en la dieta mediante cuestionarios
digitalizados. Public Health Nutrition 2006; 9(7A):
255.