A Mobile Augmented Reality Framework Based on Reusable

Transcripción

A Mobile Augmented Reality Framework Based on Reusable
IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
713
A Mobile Augmented Reality Framework Based
on Reusable Components
R. I. Barraza, O. O. Vergara, Senior Member, IEEE, and V. G. Cruz
Abstract— In recent years, Augmented Reality (AR) has
experienced a great growth in the interest of researchers and
general public. Commercial applications such as AR browsers,
games, and marketing campaigns are gradually becoming more
available; however, the need for a flexible authoring solution still
remains. The aim of this paper is to present a novel framework to
create marker based augmented reality applications for mobile
devices. The framework is composed of five main subsystems: a)
presentation: with a game engine as the core component, b)
tracking: which performs all the computer vision algorithms, c)
interaction: composed of a custom visual editor which processes
all the inputs to the framework, d) world model: used to store
and provide access to the digital representation of the world, and
e) context: used to provide status information of the entire
system. All the subsystems were used to provide for users a
comprehensive way to develop and share prefabricated objects
that allow reusability across applications. A particular case, of an
interactive “pARabola plotting” application, is presented to
demonstrate the efficiency of the framework. The application
was tested in four mobile devices running Android OS. The
experimental results demonstrate the ability of the framework to
create usable mobile AR applications, observing better visual and
interaction results on the higher quality mobile devices.
Keywords— Augmented reality, Framework, Reusable
components, Mobile devices, Android operating system.
L
I. INTRODUCCIÓN
A REALIDAD AUMENTADA (RA) es un campo de
estudio dentro de la Realidad Virtual (RV) que puede ser
vista como una de las posibilidades de representación que
existen entre el mundo real y un mundo completamente
virtual. El paradigma de interacción humano-computadora es
una parte fundamental de la RA. Es por eso que la RA permite
complementar la realidad con objetos virtuales, de tal manera
que para el usuario, dichos objetos parecen coexistir en el
mismo tiempo y espacio que los objetos en el mundo real [13].
Para poder realizar un sistema de RA se necesitan al menos
cuatro elementos: 1) un dispositivo que capture las imágenes
del mundo real, el cual típicamente es una cámara, 2) un
dispositivo en el que se puedan proyectar de manera conjunta
las imágenes del mundo real y los modelos virtuales, el cual
puede ser una pantalla de una computadora o de un dispositivo
móvil, 3) un elemento que permita interpretar la información
que se obtiene del mundo real, reconocer los objetos de
interés, estimar la pose para superponer los objetos virtuales y
realizar el algoritmo de seguimiento, el cual es una unidad
R. Barraza, Universidad Autónoma de Ciudad Juárez, Ciudad Juárez,
Chihuahua, México, [email protected]
O. Vergara, Universidad Autónoma de Ciudad Juárez, Ciudad Juárez,
Chihuahua, México, overgara@uacj
V. Cruz, Universidad Autónoma de Ciudad Juárez, Ciudad Juárez,
Chihuahua, México, [email protected]
central de procesamiento, y 4) un objeto que permita activar la
RA, aquí se distingue entre los sistemas que utilizan
marcadores (objetos enmarcados con un borde) y los que no
(el lugar donde se suporpone la información puede ser
cualquier objeto dentro de la escena).
La tecnología detrás de la RA, que permite enriquecer la
percepción de nuestra realidad, ha existido desde hace más de
dos décadas. Sin embargo, las primeras implementaciones
estaban limitadas por pesados y costosos sistemas de
procesamiento llamados Head Mounted Displays (HMD por
sus siglas en inglés), lo que implicaba que, en muchas
ocasiones, la movilidad del usuario fuera reducida debido a la
configuración general del sistema [4]. Con el desarrollo
tecnológico de dispositivos móviles, como teléfonos
inteligentes y tabletas digitales equipados con cámaras de
video, se abrió la puerta a una nueva era de aplicaciones de
RA. Las pantallas de dichos dispositivos, pueden ser utilizadas
como ventanas hacia el mundo real aumentándolo con objetos
e información virtual relevante, lográndose así un enfoque
más natural, sencillo y económico.
La llegada de los dispositivos móviles, trajo consigo la
capacidad de la comunicación inalámbrica, no sólo en la
forma de tecnologías de radio de largo alcance, sino también
en estándares de comunicación de corto alcance como
Bluetooth y Wireless Local Area Network (WLAN por sus
siglas en inglés). Dichos esquemas permiten a los dispositivos
interconectarse y compartir información sobre seguimiento,
interacción y contexto, para crear escenas distribuidas y
ambientes colaborativos [5-6]. Cuando se habla de
aplicaciones de RA móvil (RAM), esencialmente se está
tratando con sistemas en tiempo real, con tiempos de respuesta
en el orden de los milisegundos [7]. Por lo que, el añadir una
capa de red a la RAM, implica lidiar con los posibles
problemas de interoperabilidad, latencia y ancho de banda,
mismos que tienen que ser considerados sin perder de vista la
limitante del tiempo de procesamiento, que de inicio, ya se ve
afectado por la complejidad de los algoritmos de visión por
computadora.
La RAM permite crear atractivos espacios multimedia
compartidos, lo que proporciona, formas de mejorar las
experiencias de los usuarios en una amplia gama de campos de
investigación [8]. Esto hace de la RAM una de las áreas más
interesantes de la RA. Sin embargo, para lograr integrar de
manera más efectiva la RAM en la vida cotidiana, es necesario
contar con un framework potente, configurable, extensible y
económico. Anteriormente, ya se han presentado en la
literatura algunos trabajos para atender a dicha necesidad, sin
embargo, algunos inconvenientes como las técnicas de
integración, el soporte multiusuario, y los métodos de
evaluación han entorpecido su diseminación dentro de las
comunidades de desarrollo.
714
IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
El objetivo principal del presente artículo es mostrar el
diseño de un framework extensible, flexible y sencillo, basado
en componentes reutilizables, para el desarrollo de
aplicaciones de RAM. Adicionalmente, se presenta una
aplicación desarrollada a partir del framework que
posteriormente pudiera ser reutilizada como un objeto
prefabricado por usuarios con menor conocimiento técnico a
través de un editor What You See Is What You Get
(WYSIWYG por sus siglas en inglés).
El resto del artículo se encuentra organizado de la siguiente
manera. En la Sección II, se presenta un resumen de los
frameworks de RA existentes en la literatura. La Sección III,
define los materiales y métodos utilizados para el desarrollo
del framework. En la Sección IV, se presenta la aplicación
interactiva pARabola, así como los resultados obtenidos en
pruebas con diferentes dispositivos. Finalmente, las
conclusiones obtenidas se muestran en la Sección V.
II. TRABAJOS RELACIONADOS
El interés por la creación de frameworks de apoyo para el
desarrollo de aplicaciones de RA ha existido casi desde la
aparición del campo de investigación mismo. La evolución
comenzó desde las primeras librerías de código abierto como
ARToolKit [9], ARTag [10] y ArUco [11], proyectos de
código cerrado como Studierstube Tracker [12] y Studierstube
ES [13] hasta llegar a paquetes de software comercial como
Vuforia, Layar, Metaio y Junaio, por mencionar algunos.
Gracias a dichos proyectos, una variedad de campos han sido
permeados por la tecnología de RA, principalmente en la
forma de sistemas personales de información, aplicaciones
médicas, entretenimiento y educación; aún así, la mayor parte
de las aplicaciones sigue sin contar con una aceptación
general. Para comprender el porqué de la necesidad de un
framework sencillo, extensible y flexible para el desarrollo de
aplicaciones de RAM, a continuación se presentan algunas
características de las investigaciones relacionadas.
Hasta el día de hoy, resulta difícil señalar un proyecto que
haya logrado lo que el framework de RA Studierstube [13]. El
cual fue diseñado en 1996 y utilizado por más de una década
en la creación de numerosas herramientas para la enseñanza
de distintos tópicos y para promover la investigación de la
RA. Sin embargo, a pesar de ser un framework robusto, de
código abierto y que permite a múltiples usuarios trabajar de
manera simultánea, también presenta algunos inconvenientes:
la curva de aprendizaje es elevada, por lo que resulta difícil
utilizarlo para la creación rápida de prototipos, su
mantenimiento requiere extensa experiencia en el área, no
cuenta con una interfaz gráfica de usuario para la gestión de
escenas, y actualmente no cuenta con soporte, lo cual hace que
la tarea de integración de nuevas tecnologías sea complicada.
En el proyecto presentado en 2005 por [14] se generó un
conjunto de herramientas que permitían que tecnólogos,
diseñadores y estudiantes pudieran crear prototipos de RA de
manera rápida. Los autores detectaron que incluso cuando la
tecnología necesaria para la creación de aplicaciones de RA se
encontraba disponible para Director (su plataforma de
desarrollo), el proceso de desarrollo seguía siendo
complicado. El tiempo necesario desde la concepción de la
idea, la codificación y la obtención del producto final, era
demasiado largo y muchas veces no se obtenía el resultado
esperado. Por lo que, se dispusieron a crear Designers
Augmented Reality Toolkit (DART), un sistema basado en
Director que incorpora los conceptos de Xtras (plug-ins
nativos escritos en C++ para proporcionar servicios como la
captura de vídeo, seguimiento y registro de marcador de
referencia) y comportamientos (fragmentos de código
LINGO) utilizados como elementos básicos para el desarrollo
de la aplicación de RA. DART tiene algunos inconvenientes,
tales como el costo de las licencias, un gestor de escenas
basado en líneas de tiempo y la falta de soporte móvil nativo.
En el 2006 Miroslav y Petrovski desarrollaron la plataforma
Collaborative Mobile Augmented Reality (CMAR) [15], que
consiste en cuatro módulos: 1) seguimiento y renderizado, 2)
administración de escena distribuida, 3) manejador de eventos
y 4) comunicación Bluetooth. La plataforma expone un
conjunto de funciones para el desarrollo de RAM de manera
sencilla. Como parte de la investigación, presentaron un
prototipo que permite a múltiples usuarios compartir una
escena común con nueve objetos manipulables por los
participantes. A pesar de enfocarse al ahora casi extinto
sistema operativo Symbian, CMAR fue un paso importante en
la dirección correcta para llevar a la RA al ambiente
colaborativo móvil.
El framework ComposAR aparece en el año 2008 [16]
como un intento para poner al alcance la creación de
contenido de RA a un grupo más extenso de desarrolladores.
Fue construido sobre ARToolKit for Open Scene Graph
(osgART), utiliza el lenguaje de programación Python y
permite la creación de herramientas externas para ser
utilizadas dentro del ambiente de edición. Una característica
particular de ComposAR es que fue diseñado con el propósito
exclusivo de apoyar la creación de contenido de RA a través
de la programación visual, interpretación de fragmentos de
código Python y un modo de prueba en tiempo de ejecución,
que permite ocultarle al usuario desarrollador, los complejos
conceptos relacionados con la RA.
Uno de los frameworks de más reciente creación (2012) es
ARTiFiCe [8], que hace uso de un motor de juegos y puede
utilizarse para el desarrollo de aplicaciones colaborativas de
realidad virtual y aumentada. Se propuso una estructura de
software que puede adaptarse fácilmente a la introducción de
nuevas tecnologías y dispositivos. De esta forma ARTiFiCe
puede ser configurado para ambientes totalmente envolventes
al emplear una combinación de HMD y mandos de control con
seis grados de libertad (Microsoft Kinect), ambientes semienvolventes, estaciones de escritorio y entornos móviles.
Como se puede observar, existen distintos proyectos que
han surgido con el fin de desarrollar frameworks para la
creación de aplicaciones de RAM, todos ellos con sus ventajas
y desventajas asociadas. Sin embargo, aún existen muchos
retos por superar y demasiados nichos de oportunidad.
III. FRAMEWORK BASADO EN COMPONENTES
REUSABLES
De acuerdo con el estudio realizado por [17], a pesar de la
variedad y la notoria diferencia que existe entre las
aplicaciones, la mayoría de los sistemas de RA comparten una
estructura arquitectónica básica en común. Por lo que, existen
subsistemas y componentes fundamentales que pueden
encontrarse en la mayoría de las aplicaciones de RA. Esto
BARRAZA CASTILLO et al.: A MOBILE AUGMENTED
obedece a que todos los sistemas de RA son interactivos y su
funcionalidad central es la misma: rastrear la posición del
marcador, mezclar objetos virtuales con escenas reales y
procesar y reaccionar contextualmente a los cambios e
interacción del usuario.
Después de la revisión de la literatura y de la evaluación de
diferentes opciones, se propone como base del framework para
realizar aplicaciones de RAM con marcadores, el diagrama de
bloques que se muestra en la Fig. 1a. Además, con el fin de
crear un framework extensible, fácil de usar y basado en
técnicas de visión por computadora, se eligieron los
componentes y plataformas de desarrollo que se muestran en
la Fig. 1b como las herramientas particulares para cada uno de
los subsistemas de la Fig. 1a.
a)
b)
Figura 1. Framework propuesto. a) Subsistemas a desarrollar, y b)
componentes y plataformas para el desarrollo de RAM con marcadores.
A. Subsistema de Presentación
Es el encargado de desplegar la escena compuesta al
usuario, incluye los elementos del mundo real, así como los
elementos virtuales que permitirán aumentarlo. En el núcleo
del framework, se encuentra Unity3D [18], un poderoso motor
de juegos 3D que proporciona la capacidad de renderizado,
modelos de transformación, iluminación y sombreado, efectos
especiales, un motor de simulación física y un detector de
colisiones. Unity3D, también ofrece la posibilidad de extender
su funcionalidad a través de programación directa del editor o
a través de extensiones de desarrolladores independientes.
Además, permite exportar el desarrollo final a una amplia
gama de plataformas que incluyen Windows, Mac OS, iOS,
Android, Xbox 360, PS3 y Wii.
A pesar de que Unity3D es un motor de juegos que no
ofrece soporte incorporado para el desarrollo de aplicaciones
de RA, su capacidad para el manejo de escenas,
extensibilidad, flexibilidad y su amplia comunidad de
desarrollo, lo han convertido en la plataforma preferida para
muchos desarrolladores, así como un excelente recurso para
utilizarse en el subsistema de presentación. Además, la
facilidad de integrar extensiones de desarrollo independiente
permite tomar ventaja de toda su funcionalidad inherente.
Todo elemento dentro de una escena de Unity3D, deriva de
la clase base GameObject, la cual actúa como un contenedor
jerárquico para otros objetos denominados Components,
715
mismos que son los responsables de la funcionalidad real del
sistema. Debido a que todo elemento deriva de GameObject,
ciertas propiedades y métodos comunes son heredados, tal es
el caso del rendererizador, el animador, el detector de
colisiones, el transformador, etc. También, es posible adjuntar
nuevas clases que permiten controlar la apariencia visual y el
comportamiento de los elementos dentro de la escena. Se
puede utilizar el editor de código y el lenguaje de
programación C# para desarrollar clases personalizadas que
expongan métodos y propiedades que permitan a un objeto
responder a la interacción del usuario a través del subsistema
de interacción. La desventaja de utilizar Unity3D es que no
contiene un ambiente integrado para crear modelos 3D
complejos, por lo que es necesario hacer uso de herramientas
externas para su posterior importación.
B. Subsistema de Seguimiento
Es un componente clave en cualquier aplicación de RA, es
responsable de la detección de marcadores, procesamiento,
filtrado y estimación de pose. Dicha información se transmite
al componente de renderizado, dentro del subsistema de
presentación, encargado de añadir los elementos virtuales
correspondientes y combinar la escena final que será vista por
el usuario. Con el fin de mantener la ilusión de que el mundo
real y el virtual coexisten como uno solo, las afectaciones y
fluctuaciones inducidas por la librería de seguimiento deben
mantenerse al mínimo sin sacrificar el tiempo de respuesta.
Aunque algunas librerías de RA basadas en visión por
computadora existentes realizan la detección robusta y
seguimiento en tiempo real de los marcadores, también
presentan limitantes tales como costo, soporte de plataforma e
implementación compleja. Dichos inconvenientes se
solucionaron mediante el uso del SDK Vuforia [19], una
librería estable, bien documentada y creada por Qualcomm
(líder de la industria de las telecomunicaciones inalámbricas).
Vuforia puede incorporarse a Unity3D en forma de
extensión, por lo que el código C/C++ de la biblioteca
responsable de la detección de marcadores y el seguimiento
puede ser llamado desde la clase de C# TrackableBehaviour,
derivada de la clase base MonoBehaviour. Esto facilita la
comunicación y transmisión de la información de estimación
de la pose a los componentes de gestión de escena y
renderizado con el objetivo de actualizar los valores del nodo
de transformación.
C. Subsistema de Interacción
Se encarga de recolectar y procesar cualquier acción de
entrada ejercida por el usuario. A lo largo de los años se han
desarrollado diferentes interfaces de interacción para RA, cada
una con sus propias ventajas y limitantes. Tomando en cuenta
la clasificación presentada en [20], donde se define la forma
en que el usuario puede interactuar con las aplicaciones de
RAM, se implementó un enfoque basado en una interfaz
gráfica de usuario táctil. La principal ventaja, es que no se
requiere ningún hardware extra, aparte del propio dispositivo
móvil, y que la mayoría de los usuarios de teléfonos
inteligentes se sienten cómodos con este tipo de interfaz.
El proceso de estimación de la pose, está a cargo de la clase
TrackableBehaviour de Vuforia, el resultado es
posteriormente transmitido al resto de los componentes para
716
IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
modificar los valores de transformación del objeto y
renderizado. Con el fin de poder responder a las entradas del
usuario, se creó una clase personalizada de interacción la cual
es asociada al objeto principal (cámara de RA), para asegurar
que la interfaz gráfica de usuario este siempre visible y lista
para transmitir información al subsistema de presentación
cuando se detecte la interacción del usuario con el dispositivo.
Al registrarse un contacto con la pantalla, se desencadenan
una serie de eventos para evaluar si algún elemento de la
interfaz gráfica ha sido tocado. Después, se verifica la
presencia de un marcador válido en la escena, se valida
cualquier cambio en las propiedades expuestas y finalmente, si
fuera necesario, se invoca el método correspondiente para
actualizar el objeto con la nueva información.
D. Subsistema de Modelo del Mundo
La idea principal es almacenar y proporcionar acceso a una
representación digital del mundo real, esto incluye los
patrones de los marcadores de referencia, los datos sobre
puntos de interés, los modelos tridimensionales utilizados,
entre otros. Dentro del framework el subsistema de modelo del
mundo no es un componente independiente, sino una
amalgama entre las clases de la librería de seguimiento, que
reconocen cuáles son los patrones a buscar y cómo
interpretarlos, y el editor de escena, mismo que actúa como
contenedor jerárquico para todos los componentes de la escena
virtual listos para ser utilizados por cualquier otro subsistema
dentro del bucle principal de la aplicación.
E. Subsistema de Contexto
Es responsable de almacenar y proporcionar información
contextual relevante a todo el framework; puede tratarse de
datos estáticos o datos generados en tiempo real conforme se
ejecuta la aplicación. A pesar de que es posible incluir
información acerca del seguimiento de los marcadores,
generalmente dicha tarea se delega al subsistema de
seguimiento. Al igual que en el subsistema de interacción,
para implementar este componente se utilizan clases
personalizadas y asociadas a objetos vacíos dentro de Unity3D
y el patrón de pizarra (donde todos los objetos pueden escribir
y leer la información que necesiten). Del mismo modo, se
puede emplear un patrón donde los objetos pueden
comunicarse directamente entre ellos para el intercambio de
datos.
La Fig. 2 muestra una vista simplificada de las clases
utilizadas en cada subsistema del framework para el desarrollo
de la aplicación experimental que será descrita en la Sección
IV.
concepto de la ecuación de segundo grado y la forma en que
se comporta su gráfica cuando sus coeficientes cambian.
La elección de la aplicación, surge después de la aplicación
de encuestas con diferentes profesores de diferentes
asignaturas en la Universidad Autónoma de Ciudad Juárez, en
Ciudad Juárez, Chihuahua, México. Como resultado de las
encuestas, se observó, que en las materias de matemáticas, el
tema de ecuaciones cuadráticas es particularmente difícil de
enseñar. Esto se debe a que el profesor debe redibujar las
gráficas en el pizarrón al cambiar algún parámetro de la
ecuación.
Figura 2. Diagrama simplificado de subsistemas y clases del framework.
A pesar de que pARabola no es una aplicación
particularmente compleja, sirve para el propósito de exponer
los beneficios del framework propuesto. El primer reto, fue
encontrar la manera de graficar ecuaciones en 2D y 3D dentro
de Unity3D, ya que este no proporciona controles predefinidos
para hacerlo. Después de investigar sobre las mallas
procedurales para trazado de trayectorias, controles de interfaz
gráfica de usuario personalizados y emisores de partículas, se
optó por este último, debido a que proporciona un mayor
control y una implementación más limpia.
Aunque el propósito real de los sistemas de emisión de
partículas dentro del motor de juego es otro, su flexibilidad
permite controlar el comportamiento aleatorio como se
muestra en la Fig. 3.
IV. DESARROLLO DE LA APLICACIÓN PARABOLA
Como parte de la propuesta del framework, se desarrolló
una aplicación de RAM sencilla pero práctica e ilustrativa. Se
tomó como base el patrón Modelo Vista-Controlador y se creó
la aplicación interactiva llamada pARabola (con la "A" y "R"
en mayúsculas para referirse a "Augmented Reality") que
permite graficar la parábola definida por una ecuación
cuadrática.
La aplicación está enfocada a que los estudiantes de
ingeniería puedan utilizarla para comprender mejor el
Figura 3. Emisor de partículas aleatorias.
BARRAZA CASTILLO et al.: A MOBILE AUGMENTED
Las partículas emitidas por el generador, pueden ser
organizadas de tal forma que sigan un camino descrito por una
función matemática tal como si fuera un componente de
graficación, así como se puede observar en la Fig. 4.
Figura 4. Emisor de partículas posicionadas estáticamente de acuerdo a una
función cuadrática.
Después de la primera iteración, el sistema emisor es capaz
de posicionar las partículas individuales en coordenadas
predefinidas. Para que el sistema pueda responder a la
interacción del usuario (por ejemplo, a los cambios de
coeficientes) fue necesario crear los controles de la interfaz
gráfica de usuario del subsistema de interacción, así como las
clases en el subsistema de contexto. Como resultado, se
anexaron a la aplicación 2 parámetros que regulan la
resolución y escala de la gráfica (deslizadores superior e
inferior izquierdo en la Fig. 5) y 3 coeficientes que
representan las constantes a, b y c en la ecuación de la
parábola (los tres deslizadores ubicados en la parte superior
derecha de la Fig. 5). Con el sistema de partículas ya
funcional, se creó un objeto prefabricado para encapsular su
funcionalidad.
717
En la segunda iteración, con el emisor de partículas
modificado y el objeto prefabricado creado, se introduce el
componente de RA en la mezcla, para ello se utilizó la
extensión Vuforia para Unity3D. Un nuevo proyecto fue
creado y con él una escena vacía, después, se añadió un objeto
de tipo ARCamera al contenedor jerárquico y se anexaron las
clases responsables de la inicialización, captura y transmisión
de cuadros de imagen al componente de seguimiento y
finalización. Antes de delegar la imagen al subsistema de
seguimiento, Vuforia convierte cada cuadro capturado por la
cámara a un formato adecuado para el renderizado con
OpenGL ES y las operaciones de seguimiento.
El subsistema de seguimiento contiene los algoritmos de
visión por computadora que permiten detectar y rastrear
objetos del mundo real en los cuadros capturados por la
cámara. Como resultado, el componente de seguimiento
almacena la información resultante en un objeto de estado
(parte del subsistema de contexto) mismo que es utilizado por
el componente de presentación para garantizar un renderizado
y posicionamiento correcto del objeto 3D. Cabe mencionar
que el ciclo de seguimiento-actualización se ejecutará para
cada cuadro de video procesado.
El componente de tipo FrameMarker mostrado en la Fig. 6,
fue utilizado para asociar el objeto prefabricado creado con el
emisor de partículas. De tal forma que, cuando el marcador es
detectado en la escena, el emisor de partículas modificado
(con los correspondientes valores de las constantes a, b y c)
sea posicionado sobre él. En esencia este proceso construye el
subsistema del modelo del mundo de la aplicación.
Figura 6. Marcador utilizado en la aplicación pARabola.
Figura 5. Aplicación pARabola ejecutándose dentro del ambiente de Unity3D.
El último componente necesario para concluir la aplicación
es el subsistema de interacción. El cual había sido, en parte,
previamente implementado, mediante el uso de clases
desarrolladas en C# las cuales acompañan al objeto
prefabricado. De la misma forma, se crearon las clases
necesarias para dibujar y administrar los controles de la
interfaz gráfica de usuario. Así, el ciclo de seguimiento,
interacción y actualización finalmente se completó.
Por cada cuadro en el que el componente ARCamera esté
activo en la aplicación, se llamará al código correspondiente
en la interfaz de usuario para evaluar si alguno de los
deslizadores ha sido seleccionado y/o se ha cambiado su valor,
de ser así, se enviará un mensaje al interior del objeto
prefabricado para reposicionar las partículas del emisor acorde
al cambio sugerido por el usuario.
El subsistema de seguimiento analizará entonces, el
contenido del estado del objeto y actualizará la información
para que el componente de presentación actualice la escena y
718
refleje tanto los cambios en la pose del modelo 3D, así como
cualquier modificación que éste último haya sufrido.
Después del proceso anterior, la aplicación esta lista para
ser empaquetada en el formato valido (apk para Android) para
su instalación en cualquier dispositivo con el sistema
operativo Android 2.2 o superior y que tenga al menos un
procesador ARMv6 + VFP.
A. Discusión de Resultados
La versión final de la aplicación pARabola fue probada en
los 4 dispositivos enlistados en la Tabla I. A pesar de que no
hubo necesidad de realizar modificaciones especiales para
lograr la ejecución en ninguno de los dispositivos, la
diferencia visual fue evidente en los modelos con
especificaciones técnicas superiores. Un vídeo que demuestra
el uso de la aplicación ejecutándose en un teléfono HTC One
S
se
encuentra
disponible
en
la
red
(http://youtu.be/eS7DvvymNFE).
La aplicación se ejecutó correctamente y en ningún
momento se percibió demora en el tiempo de respuesta en
ninguno de los dispositivos. Por lo que, se realizaron pruebas
para evaluar el rendimiento en cada extremo del espectro de
hardware. El Galaxy Mini S5570 con un solo núcleo de
procesamiento y una velocidad de reloj de 600 MHz tardó
16.2 segundos para cargar la aplicación, mientras que el
Galaxy SII así como la Tab2 lograron hacerlo en 5.6
segundos, esto debido a que comparten especificaciones
técnicas similares, mientras que el HTC One S con dos
núcleos a 1.5 GHz fue capaz de hacerlo en sólo 4.8 segundos.
Una vez que la aplicación había sido cargada y el ciclo de
seguimiento, interacción y actualización comenzó, se realizó
un monitoreo constante del parámetro de rendimiento Frames
Per Second (FPS por sus siglas en inglés). Sin ningún
marcador a la vista, el S5570 mantuvo una velocidad de entre
28-31 FPS, nuevamente el SII y la Tab2 mostraron un
comportamiento similar al mantenerse entre 29-32 FPS.
Finalmente, el HCT One S logró una velocidad casi constante
de 31-32 FPS.
Aunque no se encontró ninguna diferencia significativa
entre los dispositivos desde el momento en que la aplicación
identifica el marcador en la escena y el emisor de partículas
aparece por primera vez, se observó un pequeño decremento
en los FPS del S5570 cuando el usuario interactúa con los
controles de la interfaz gráfica. De manera similar se produjo
un decremento de los FPS y se percibió la dificultad del S5570
para identificar y seguir al marcador cuando el dispositivo fue
sometido a movimientos deliberadamente bruscos. Los
modelos de gama más alta realizaron un mejor trabajo de
seguimiento del marcador en movimiento y se mantuvieron en
el rango de 29-30 FPS.
Después de probar la versión final de la aplicación en las
cuatro configuraciones de hardware disponibles, fue evidente
que cuanto más limitado es el hardware, menor es el
rendimiento de las aplicaciones. Por lo que se concluye que,
las especificaciones técnicas como, el número de núcleos de
procesamiento, la velocidad de reloj de los mismos, la
memoria disponible, la cámara e inclusive el tamaño y
resolución de la pantalla, juegan un papel significativo en la
experiencia final del usuario.
IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015
Adicionalmente, tomando como base uno de los
dispositivos con mejor desempeño en las pruebas de carga y
ejecución (HTC One S), se realizó una serie de ensayos para
identificar el comportamiento del sistema de detección y
seguimiento bajo distintas condiciones de iluminación
ambiental, distancia entre el marcador y dispositivo, y el
ángulo de incidencia.
El tamaño de los marcadores utilizados para las pruebas fue
de 5.5cm x 5.5cm, manteniendo un margen blanco alrededor
del borde negro de al menos el doble de grosor de este último.
La Tabla II muestra la media aritmética de los resultados
obtenidos después de ejecutar 10 veces las pruebas.
Como se puede observar en la cuarta columna de la Tabla
II, la detección del marcador se ve afectada de manera
negativa en ambientes con temperatura de luz cálida, mientras
que se obtiene un mejor resultado bajo condiciones de luz
blanca o de día.
El ángulo mínimo requerido para la detección, está
directamente relacionado con la visibilidad del borde de color
negro del marcador; en cuanto se obtiene una vista completa
de este, es posible realizar la detección.
Debido a que el reconocimiento del marcador se da con
base al patrón binario codificado alrededor del borde interno,
tanto la distancia de detección mínima como la máxima,
tuvieron mejores resultados bajo condiciones de luz que
permiten un mayor contraste. Sin embargo, el tamaño del
marcador y la calidad del lente del dispositivo son factores
complementarios con los que también es posible mejorar el
rendimiento.
Aunado al desarrollo y la demostración de la aplicación, se
realizó un estudio con un grupo de estudiantes de ingeniería de
la Universidad Autónoma de Ciudad Juárez con el fin de
obtener una primera aproximación y evaluación del uso de la
tecnología de RAM en las aulas. Para obtener los datos se
desarrolló una encuesta para conocer la percepción de los
estudiantes con respecto a la aplicación pARabola. Con base a
los resultados obtenidos a través de la aplicación del
cuestionario y los comentarios conseguidos mediante la
técnica de pensar en voz alta, se observa una respuesta
positiva por parte de los estudiantes hacia el uso de la
tecnología como herramienta complementaria de enseñanzaaprendizaje en el aula.
V. CONCLUSIONES
En el presente artículo se mostró un framework para el
desarrollo de aplicaciones de realidad aumentada móvil. El
framework se basa en un modelo genérico de referencia de
arquitectura de RA, un patrón probado de desarrollo de
software y un motor de juego como eje central, con los que se
pueden crear aplicaciones atractivas mucho más rápido de una
manera sencilla.
Uno de los problemas más comunes de los sistemas para el
desarrollo de contenido de RA, es el equilibrio entre la
facilidad de desarrollo y la funcionalidad de la aplicación
final. En otras palabras, algunas características importantes
son sacrificadas en favor de una interfaz de desarrollo más
amigable y viceversa los frameworks más robustos requieren
de un mayor conocimiento técnico y de una habilidad de
programación mayor por parte del diseñador.
BARRAZA CASTILLO et al.: A MOBILE AUGMENTED
719
TABLA I. CARACTERÍSTICAS TÉCNICAS DE LOS DISPOSITIVOS DE PRUEBA.
Compañía
Modelo
Versión de
Android
CPU
RAM
(MiB)
Cámara
(MP)
Pantalla
(Px)
Samsung
Galaxy Mini
S5570
v2.2
(Froyo)
600 MHz ARMv6
384
3.15
240 x 320
Samsung
Galaxy S II
v2.2.3
(Gingerbread)
Doble núcleo
1.2 GHz Cortex-A9
1024
8
480 x 800
HTC
One S
v4.0
(Ice Cream
Sandwich)
Doble núcleo
1.5GHz Krait
1024
8
540 x 960
Samsung
Tab 2 10.1
P5110
v4.0.3
(Ice Cream
Sandwich)
Doble núcleo
1 GHz Cortex-A9
1024
3.15
800 x 1280
TABLA II. RESULTADOS DE LAS PRUEBAS DE DETECCIÓN Y SEGUIMIENTO.
Fuente de Luz
Distancia Min
Detección (cm)
Distancia Max
Detección (cm)
Ángulo Min
Detección (grados)
4 focos Sylvania
CLF 13W 2,700K
13.6
166
47
4 focos Sylvania
CLF 13W 6,500K
12.3
182
43
Luz natural
12.1
187
41
Aprovechando la naturaleza altamente programable del
editor de Unity3D, el modelo de encapsulamiento, el editor de
programación visual y el intérprete de código, se proporciona
la flexibilidad y escalabilidad necesaria para la creación de
aplicaciones tanto por diseñadores experimentados como por
novatos y entusiastas. El objetivo principal es presentar el
framework como un proyecto de código abierto, a disposición
de la comunidad en general con la esperanza de que sea
adoptado de una forma más amplia y continúe su desarrollo a
través de contribuciones de terceros.
Aún queda trabajo por realizar, como incluir un subsistema
de red que permita a múltiples dispositivos descubrirse y
conectarse entre sí de manera intuitiva para compartir
información e interactuar con los elementos de la escena, para
así crear un ambiente colaborativo más natural y atractivo para
los usuarios. Lograr esto, implica resolver una serie de
problemas como el desarrollo de un mecanismo de bloqueo de
objetos para asegurar que sólo un usuario pueda controlar un
objeto a la vez, implementar un algoritmo de deducción
estimada e interpolación de pose y finalmente crear objetos
prefabricados de conducta para controlar el comportamiento
de otros objetos y facilitar el desarrollo visual de contenido de
RA móvil.
AGRADECIMIENTOS
Los autores desean agradecer al Consejo Nacional de
Ciencia y Tecnología CONACyT por el apoyo ofrecido a
Ramón Barraza para sus estudios de Doctorado. Un
reconocimiento especial para Jasper Flick por su guía sobre
los emisores de partículas Shuriken.
REFERENCIAS
[1]
R. Azuma, “A survey of augmented reality,” Presence: Teleoperators
and Virtual Environments, vol. 6, no. 4, pp. 355-385, August 1997.
[2] O. Demuynck and J. M. Menendez, “Magic cards: A new augmentedreality approach,” IEEE Computer Graphics and Applications, vol. 33,
no. 1, pp. 12-19, January-February 2013.
[3] M. Mine, J. van Baar, A. Grundhofer, D. Rose and B. Yang,
“Projection-based augmented reality in disney theme parks,” Computer,
vol. 45, no. 7, pp. 32-40, July 2012.
[4] M. Gervautz and D. Schmalstieg, “Anywhere interfaces using handheld
augmented reality,” Computer, vol. 45, no. 7, pp. 26-31, July 2012.
[5] A. Morrison, A. Mullonib, S. Lemmeläc, A. Oulasvirtad, G. Jacuccid,
P. Peltonene, D. Schmalstieg and H. Regenbrechtf, “Collaborative use
of mobile augmented reality with paper maps,” Computers & Graphics,
vol. 35, no. 4, pp. 789-799, August 2011.
[6] X. Wang, P. Love, M. Kim and W. Wang, “Mutual awareness in
collaborative design: An augmented reality integrated telepresence
system,” Computers in Industry, vol. 65, no. 2, pp. 314-324, February
2014.
[7] T. Siu and V. Herskovic, “Mobile augmented reality and contextawareness for firefighters,” IEEE Latin America Transactions, vol. 12,
no. 1, pp. 42-47, January 2014.
[8] A. Mossel, C. Schönauer, G. Gerstweiler and H. Kaufmann, “Artificeaugmented reality framework for distributed collaboration,” The
International Journal of Virtual Reality, vol. 11, no. 3, pp. 1-7, 2012.
[9] H. Kato and M. Billinghurst, “Marker tracking and HMD calibration for
a video-based augmented reality conferencing system,” 2nd IEEE and
ACM International Workshop on Augmented Reality (IWAR), San
Francisco, California, USA, pp. 85-94, October 1999.
[10] M. Fiala, “ARTag, a fiducial marker system using digital techniques,”
IEEE Computer Society Conference on Computer Vision and Pattern
Recognition (CVPR), San Diego, California, USA, vol. 2, pp. 590-596,
June 2005.
[11] R. Muñoz-Salinas, “ArUco: A minimal library for augmented reality
applications based on OpenCV,” Technical Report, University of
Córdoba, Spain, 2012.
720
[12] D. Schmalstieg and D. Wagner, “Mobile phones as a platform for
augmented reality,” IEEE Virtual Reality (VR) Conference, Reno,
Nevada, USA, pp. 1-2, March 2008.
[13] D. Schmalstieg, A. Fuhrmann, G. Hesina, Z. Szalavári, L. M.
Encarnaçao, M. Gervautz and W. Purgathofer, “The studierstube
augmented reality project,” Presence: Teleoperators and Virtual
Environments, vol. 11, no. 1, pp. 33-54, February 2002.
[14] B. MacIntyre, M. Gandy, S. Dow and J. D. Bolter, “DART: A toolkit for
rapid design exploration of augmented reality experiences,” 17th annual
ACM Symposium on User Interface Software and Technology (UIST),
Santa Fe, New Mexico, USA, pp. 197-206, October 2005.
[15] A. Miroslav and A. Petrovski, “Interactive collaborative augmented
reality using a distributed scene graph on mobile phones,” Ms.C. Thesis,
Linkoping University, Sweden, June 2006.
[16] S. Hartmut, J. Looser and M. Billinghurst, “ComposAR: An intuitive
tool for authoring AR applications,” 7th IEEE/ACM International
Symposium on Mixed and Augmented Reality (ISMAR), Cambridge,
United Kingdom, pp. 177-178, September 2008.
[17] A. MacWilliams, T. Reicher, G. Klinker and B. Bruegge, “Design
patterns for augmented reality systems,” International Workshop
Exploring the Design and Engineering of Mixed Reality Systems
(MIXER), Funchal, Madeira Island, pp. 1-8, January 2004.
[18] Unity, “Unity - Game Engine,” Unity, [Online]. Available:
http://www.unity3d.com. [Accessed 5 08 2013].
[19] Qualcomm, “Augmented Reality (Vuforia) - Mobile Technologies Qualcomm Developer Network,” QDevNet, [Online]. Available:
https://developer.qualcomm.com/mobile-development/mobiletechnologies/augmented-reality. [Accessed 15 08 2013].
[20] E. Ortman and K. Swedlund, “Guidelines for user interactions in mobile
augmented reality,” Ms.C. Thesis, Umeå University, Sweden, November
2012.
Ramón Barraza was born in Ciudad Juárez, Chihuahua,
México on August 31, 1981. He received the B. S. degree in
computer science from Instituto Tecnológico de Ciudad
Juárez in 2003, and the M. Sc. degree in computer science
from Instituto Tecnológico de Hermosillo, in 2009.
Currently, Ramón Barraza is a Ph.D. student on engineering
sciences at Universidad Autónoma de Ciudad Juárez.
Additionally, he serves as a professor at Instituto Tecnológico de Ciudad
Juárez. His current research interest includes software engineering, augmented
reality and mobile computing.
Osslan Vergara was born in Cuernavaca, Morelos, México
on july 3, 1977. He earned the B.S. degree in computer
engineering from the Instituto Tecnológico de Zacatepec,
México, in 2000; the M. Sc. in computer science at the
Center of Research and Technological Development
(CENIDET) in 2003; and the Ph.D. degree in computer
science from CENIDET in 2006. He currently serves as a
professor at the Autonomous University of Ciudad Juárez, Chihuahua,
México. He is a senior member of the IEEE Computer Society since 2012.
His fields of interest includes pattern recognition, digital image processing,
augmented reality and mechatronics.
Vianey Cruz was born in Cárdenas, Tabasco, México, on
September 14, 1978. She earned the B.S. degree in
computer engineering from the Instituto Tecnológico de
Cerro Azul, México, in 2000; the M.Sc. degree in computer
science at the Center of Research and Technological
Development (CENIDET) in 2004; and the Ph.D. degree in
computer science from CENIDET in 2010. She currently
serves as a professor at the Autonomous University of
Ciudad Juarez, Chihuahua, México. She is a member of the IEEE Computer
Society. Her fields of interest include neuro symbolic hybrid systems, digital
image processing, knowledge representation, artificial neural networks and
augmented reality.
IEEE LATIN AMERICA TRANSACTIONS, VOL. 13, NO. 3, MARCH 2015