Corpus de Cuestionarios Online en Genómica Nutricional
Transcripción
Corpus de Cuestionarios Online en Genómica Nutricional
Corpus de Cuestionarios Online en Genómica Nutricional: generación de instancias y almacenamiento de las respuestas Oscar Coltell1 Antonio Fabregat1 Elisabet Barrera María Arregui1 Eduardo Añíbarro Guillermo Ramos Antonio Monteagudo Departamento de Lenguajes y Sistemas Informáticos. Universitat Jaume I Castellón 1201, España 1 RETIC «COMBIOMED». ISCIII Madrid, 28007, España y Dolores Corella Departamento de Medicina Preventiva. Universitat de València Valencia, 46010, España CIBER «Fisiopatología de la Obesidad y Nutrición». ISCIII. Madrid, 28007, España RESUMEN En los estudios de Genómica Nutricional los cuestionarios para la medición de la dieta y la actividad física son herramientas de uso común y exhaustivo. Aunque es crítica la adquisición de información fiable y precisa en dichos cuestionarios, siguen diseñándose y administrándose manualmente en soporte papel, con tratamientos mecanizados para impresos especiales. Así, el proceso de adquisición de datos de dieta y actividad física tiene demasiados pasos manuales con un riesgo de error medio o alto, perdiéndose también la calidad y fiabilidad de los datos. Con el uso de las nuevas tecnologías para la Web asíncrona se pueden desarrollar cuestionarios online considerando la facilidad y ergonomía para el diseño de la estructura de los cuestionarios y la calidad del diseño de la interfaz de usuario para manejarlos. En este trabajo se describe un aspecto puntual en la automatización del mecanismo de almacenamiento de respuestas a los cuestionarios según el tipo de preguntas. Cada tipo de cuestionario requiere un método diferente para el envío y la actualización de las respuestas en base al tipo de dependencia entre éstas. Por ello, no existe una solución global en los tipos de cuestionarios discutidos, sino estrategias válidas para cada uno de ellos. Palabras Claves: Cuestionarios Online en Genómica Nutricional, frameworks para interfaces de usuario y comunicaciones asíncronas con el servidor, RAP en ontologías, nuSOAP en servicios Web, XAJAX y ExtJS, y escenarios de intercambio de datos. 1. INTRODUCCIÓN En los estudios de Genómica Nutricional, uno de los aspectos críticos es la adquisición de información fiable y precisa sobre el estilo de vida de los participantes con respecto a los medios de obtención y consumo de energía, es decir, principalmente la dieta y el ejercicio físico. Por ello, los cuestionarios para la medición de la dieta [1] y la actividad física [2] son herramientas de uso común y exhaustivo en dichos estudios. Sin embargo, y salvo algunas excepciones [3-4], dichos cuestionarios siguen diseñándose y administrándose manualmente en soporte papel. Además, la traslación de las respuestas de los mencionados cuestionarios sigue estando basada en la grabación manual o en la exploración óptica sólo para impresos especiales. Así, se puede colegir que el proceso de adquisición de datos de dieta y actividad física de los participantes está constituido por demasiados pasos manuales con un riesgo de error medio o alto, perdiéndose también la calidad y fiabilidad de los datos [5-6]. Estas razones son las que esgrimen los investigadores responsables de los estudios epidemiológicos y nutrigenómicos al plantear la imperiosa necesidad de disponer de versiones online de cuestionarios para medir la dieta, la actividad física y otros factores ambientales sobre los pacientes. Además de facilitar la correspondiente adquisición de los datos de consumo de alimentos y actividad física de cada participante, en los cuestionarios online se pueden controlar los errores de grabación de datos y digitalizar las respuestas, facilitando su almacenamiento y el cálculo de resultados. Por lo tanto, a la hora de desarrollar cuestionarios online, es necesario tener en cuenta dos aspectos principales: la facilidad y ergonomía para el diseño de la estructura de los cuestionarios; y la calidad del diseño de la interfaz de usuario para manejarlos. La facilidad y ergonomía para el diseño de la estructura de los cuestionarios viene dada por la disponibilidad de una herramienta informática que permita centrarse en la estructura y aspecto (inclusión de preguntas de distintos formatos, organización de las preguntas, presentación de las preguntas y los espacios de respuesta) y facilite la generación de instancias de cuestionarios. La calidad del diseño de la interfaz de usuario influye en el grado de aceptación y utilidad del usuario final y determina cómo se va a enviar la información entre el cliente y el servidor para ser finalmente almacenada. Todo ello no es posible sin el concurso de nuevas y potentes tecnologías para el desarrollo de aplicaciones Web. La tendencia en el desarrollo de aplicaciones Web ha ido cambiando desde el diseño e implementación de aplicaciones Web síncronas hasta el uso de las nuevas tecnologías para la Web asíncrona, conocidas como técnicas AJAX (Asynchronous Javascript And XML). Con AJAX se consigue que el usuario final tenga la sensación de que se está accediendo a los datos de forma local, es decir, evitando cambiar de pantalla, o refrescar la que se muestra, cada vez que sea necesario que un conjunto de datos sea procesado en el servidor. Completando esto con las tecnologías Web que permiten el procesado interno de los datos (para tratamientos internos, como la obtención de resultados calculados a partir de las respuestas de los cuestionarios) y el almacenamiento estructurado, eficiente y seguro de dichos datos, actualmente se pueden realizar aplicaciones Web para la generación y administración de cuestionarios on-line con las que se alcanzan unos grados de precisión, eficiencia y calidad de los datos que eran impensables no hace demasiado tiempo. En este campo, el grupo de investigación BioInfoGenómica (BIG) ha estado consolidando una excelente y amplia experiencia en el desarrollo de aplicaciones Web y construcción de ontologías asociadas [7]. Como BIG trabaja con el enfoque general de la Ingeniería del Software para producir resultados de calidad y simplificar los procesos de desarrollo, procura aplicar sistemáticamente el principio de reutilización de software, entre otros principios. En particular, BIG mantiene una cartera de frameworks como RAP (RDF API for PHP) en la especificación de ontologías; nuSOAP en la construcción de servicios Web; y XAJAX, Prototype, Prototye Window, Scriptaculous y ExtJS, para el diseño y desarrollo de interfaces de usuario. En este trabajo se describe un aspecto puntual como resultado del trabajo del grupo para la automatización del mecanismo de almacenamiento de respuestas a los cuestionarios según el tipo de preguntas. 2. OBJETIVOS El objetivo principal de este trabajo es definir en el diseño de cuestionarios los diferentes escenarios de intercambio de datos que se pueden dar en cada uno de los tipos de cuestionarios utilizados en estudios de Genómica Nutricional y asociarles un método de envío de datos que permita mantener la coherencia entre la información mostrada en el cliente y la almacenada en el servidor. 3. METODOLOGÍA En el proceso y generación de cuestionarios para los estudios de Epidemiología Nutricional, es necesario abordar previamente el estudio de los diferentes tipos de cuestionarios que se van a manejar y la estructura de la información de las preguntas que contienen, para facilitar, entre otras cosas, el intercambio de datos en dichos cuestionarios. Por otra parte, la forma en la que los datos se envían al servidor es una decisión importante a considerar al comenzar el diseño de cada uno de los cuestionarios online. En la actualidad, gracias a la técnica AJAX y al framework XAJAX que la implementa, la decisión más plausible es la de enviar cada dato al servidor de forma asíncrona cuando el usuario lo introduce en la aplicación. Pero hay que tener en cuenta que el tiempo requerido para el envío de los datos es la suma del establecimiento de una conexión TCP con el servidor y el correspondiente envío de datos, más el tiempo de proceso de los datos por parte de éste y, finalmente, hay que sumarle el tiempo en el que la respuesta a la petición tarda en volver al cliente. Se identifican así tres casos diferenciados por la información mostrada en la interfaz de usuario y la información almacenada en el servidor: Primer caso: al recibir una respuesta del usuario, ésta se plasma en la interfaz y posteriormente se envía una petición al servidor. Transcurrido el tiempo de comunicación, se asume que dicha información se ha podido almacenar correctamente y se corresponde con lo que el usuario ve en su pantalla. Sin embargo, puede ocurrir que se haya producido un error a la hora de almacenar la información en el servidor. Por tanto, el controlador tendrá que eliminar dicha información de la interfaz de usuario y lo que haya introducido en base a dicha información. Segundo caso: se muestra el dato en la interfaz de usuario cuando ya se ha recibido la respuesta de aceptación por parte del servidor. El inconveniente es que el tiempo de respuesta de la aplicación está directamente relacionado con la velocidad de conexión con el servidor. La ventaja es que todo lo que el usuario ve en pantalla ya está guardado en el servidor y, si en algún momento ocurre un imprevisto, toda esa información estará de nuevo disponible al volver a abrir el cuestionario. Tercer caso: combinación de los dos anteriores. Se muestra la información por pantalla al mismo tiempo que se envía al servidor para ser procesada, mientras que el usuario está viendo una marca asociada a cada respuesta indicando el estado en la que se encuentra el proceso de ésta. El usuario es consciente de que la información sigue siendo procesada y puede o no ser validada posteriormente. El modelo de desarrollo que se aplica en las aplicaciones Web y entornos cliente-servidor realizados por el grupo de investigación sigue el patrón Modelo Vista Controlador (MVC), donde la interfaz de la aplicación, la gestión de los datos y la lógica de control se diseñan y construyen como tres componentes claramente diferenciados. Este patrón presenta las siguientes ventajas: 1. Determina una separación clara entre los componentes de un programa para poder implementarlos por separado. 2. Plantea una interfaz programada (API: Application Programm Interface) muy bien definida, permitiendo la sustitución del Modelo, la Vista o del Controlador. 3. La conexión entre el Modelo y sus Vistas es dinámica, es decir, se produce en tiempo de ejecución y no en tiempo de compilación. 4. RESULTADOS Y DISCUSIÓN Los autores han utilizado los frameworks mencionados anteriormente en el desarrollo de varios proyectos de investigación en el ámbito de la Genómica Nutricional que se encuentran en fase de producción, como FITUVEROLES (http://www.fituveroles.uji.es) u OBENUTIC (http://www.obenutic.uji.es), y en otros proyectos en fase de desarrollo como NUTRIFIS y OBENOMICS (los respectivos portales Web no están abiertos al acceso general). En los dos primeros, una parte importante del tiempo de desarrollo se destinó al diseño e implementación de cuestionarios online para la adquisición de datos de dieta. En los dos últimos, se han incorporado también los cuestionarios de actividad física. En OBENUTIC se han implementado dos tipos de cuestionarios como instrumentos de medida de la dieta de los participantes: los cuestionarios de frecuencia de consumo de alimentos (CFCA) y los recordatorios de 24 horas (R24H). Los CFCA tienen la misma estructura para todos los participantes, siguiendo un patrón fijo establecido en cada estudio, mientras que el contenido final de los R24H varía en base a cada participante. Además, los R24H requieren de mayor dinamismo dado que, al almacenar la información que los participantes van recordando durante la sesión en la que el cuestionario es ejecutado, pocas veces se dan las respuestas en el orden lógico en el que éstas deberían ser almacenadas. Al contrario, las respuestas deben guardarse ordenadas por momentos del día y, a ser posible, dentro de cada momento del día, se debe seguir el orden real. Así, resulta muy útil el uso del framework Scriptaculous que permite crear listas reordenables mediante drag&drop, facilitando que el usuario pueda ordenar sus respuestas en cada momento. En el caso de los R24H, las respuestas son libres dentro del contexto de ingesta de alimentos, y es importante el orden en que las respuestas se almacenan en cada bloque, al igual que lo es asegurar la validez de una respuesta antes de permitir que el usuario siga respondiendo. Cuando un usuario ejecuta la acción de introducir un nuevo dato, ésta es recogida por la interfaz de usuario del cuestionario, la cual lanza un evento que es capturado por el motor AJAX. En el caso normal, tras interpretar el evento, el motor AJAX realiza una conexión asíncrona con el controlador que está ubicado en el servidor. Dado que la acción de añadir un nuevo dato significa un cambio en los datos del modelo, el controlador realiza una llamada al método del modelo que se encarga de realizar dicha acción con el gestor de la base datos. No obstante, antes de añadir un nuevo dato, tanto el modelo como el gestor de la base datos realizan una comprobación, y si todo es correcto, se añade el dato y se devuelven señales a las capas superiores para indicar que la acción se ha llevado a cabo correctamente. El controlador envía la señal al motor AJAX a través de la red y es entonces cuando la interfaz de usuario se actualiza para que el usuario vea que el dato ya se ha añadido. En caso de error, la comprobación que el modelo realiza sobre la base de datos genera una excepción y se devuelve un mensaje de error a través de todas las capas superiores hasta que le llega al usuario que, hasta ese momento, no ha podido ver en su pantalla el dato reflejado. La solución aplicada es mostrar una barra de estado que actúa de forma modal e indica al usuario que debe esperar mientras se realiza la acción sobre el servidor (relación directa entre el tiempo de respuesta de la aplicación, la velocidad de conexión del usuario y la carga actual del servidor). En el caso del CFCA, se dispone de una batería de preguntas ordenadas por bloques a las que cada participante responde una a una sin importar el orden que se siga. La solución adoptada aparentemente ofrece un bajo tiempo de respuesta, pero con la seguridad para el usuario de que los datos ya están almacenados en el servidor cuando la marca cambia a «correcto». Las acciones ejecutadas en segundo plano para procesar los datos de las respuestas a estos cuestionarios también se pueden agrupar en los casos correctos y erróneos. Sin embargo, cada petición de adición de una respuesta no es una llamada bloqueante, a diferencia de los R24H, dado que el usuario puede seguir contestando a las siguientes preguntas puesto que las respuestas son independientes unas de otras. Comparando el enfoque seguido en los R24H respecto al seguido en los CFCA, se puede observar que el primero provoca una ralentización en la aparición de los datos en pantalla. Pero, al mismo tiempo, esta estrategia asegura que todo aquello que el usuario ve en su formulario ya está guardado en la base de datos, tal y como establece uno de los requisitos de los R24H. En NUTRIFIS y OBENOMICS se han incluido además los cuestionarios de medición de la actividad física (CAF). De forma similar a los CFCA, en los CAF se dispone de una batería de preguntas ordenadas por bloques a las que cada participante responde una a una sin importar el orden que se siga. Una diferencia sustancial es que en el CAF hay una conversión intermedia de las respuestas a frecuencias homogéneas, pero que no afecta a la independencia de los bloques de preguntas. Por tanto, el mecanismo de intercambio de datos es básicamente el mismo que en los CFCA. 5. CONCLUSIONES Cada tipo de cuestionario requiere un método diferente para el envío y la actualización de las respuestas en base al tipo de dependencia entre éstas. Un envío asíncrono de la información con llamada bloqueante es mejor para los cuestionarios en los que las respuestas son dependientes unas de otras, como en el R24H; mientras que el envío asíncrono de la información con llamadas no bloqueantes, pero con uso de marcadores de estado, es mejor para aquellos cuestionarios en los que las respuestas no son dependientes unas de otras, como en los CFCA y CAF, donde el sistema de marcas permite mantener informado al usuario de forma pasiva y hacer que éste sea consciente de qué información está realmente guardada y qué información está todavía pendiente de validación. Los frameworks que ofrecen soporte para la creación de las interfaces de usuario y las comunicaciones asíncronas con el servidor, son imprescindibles para el desarrollo de proyectos de aplicaciones Web con altos grados de interacción con el usuario, ya que facilitan el trabajo de los programadores al permitirles realizar aplicaciones con un mayor grado de utilidad y con aspecto más moderno e intuitivo. Finalmente, no existe una solución global en los tipos de cuestionarios discutidos, sino estrategias válidas para cada uno de ellos. Estas estrategias están implementadas y en explotación en los proyectos OBENUTIC y FITUVEROLES, en proceso de producción, y con un buen rendimiento y un alto grado de satisfacción de sus usuarios. Y se están implementando en los proyectos en curso NUTRIFIS y OBENOMICS. AGRADECIMIENTOS Este trabajo ha sido financiado parcialmente por los proyectos NUTRIFIS (PI08/90002, ISCIII-FIS), OBENOMICS (AP-050/09, Conselleria de Sanitat, Generalitat Valenciana), RETIC COMBIOMED (RD07/0067/0006, ISCIII-FIS), OBENUTIC (BI061326, ISCIII-FIS) y CIBER “Fisiopatología de la Obesidad y Nutrición” (ISCIII-FIS). CIBERobn es una iniciativa del ISCIII. REFERENCIAS [1] Pennington JA, Stumbo PJ, Murphy SP, McNutt SW, Eldridge AL, McCabe-Sellers BJ, Chenard CA. Food composition data: the foundation of dietetic practice and research. J Am Diet Assoc. 2007;107(12):2105-13. [2] Sit CH, Lau CH, Vertinsky P. Physical activity and self-perceptions among Hong Kong Chinese with an acquired physical disability. Adapt Phys Activ Q. 2009;26(4):321-35. [3] Forbes LE, Storey KE, Fraser SN, Spence JC, Plotnikoff RC, Raine KD, Hanning RM, McCargar LJ. Dietary patterns associated with glycemic index and glycemic load among Alberta adolescents. Appl Physiol Nutr Metab. 2009;34(4):648-58. [4] Huntington A, Gilmour J, Schluter P, Tuckett A, Bogossian F, Turner C. The Internet as a research site: establishment of a web-based longitudinal study of the nursing and midwifery workforce in three countries. J Adv Nurs. 2009;65(6):1309-17. [5] Li YP, He YN, Zhai FY, Yang XG, Hu XQ, Zhao WH, Ma GS.Comparison of assessment of food intakes by using 3 dietary survey methods. Zhonghua Yu Fang Yi Xue Za Zhi. 2006;40(4):27380. [6] Wakai K. A review of food frequency questionnaires developed and validated in Japan. J Epidemiol. 2009;19(1):1-11. [7] Arregui M, Coltell O, Vázquez R, Fabregat A, Portolés O, Corella D. FITUVEROLES: un portal Web piloto para la determinación de fitoesteroles ingeridos en la dieta mediante cuestionarios digitalizados. Public Health Nutrition 2006; 9(7A): 255.