Introducción
La realidad extendida es un conjunto de tecnologías muy usado por la capacidad de crear entornos (reales y virtuales) para práctica y por proporcionar información localizada, espacialmente durante un entrenamiento [1], [2]. Por esto, varios estudios coinciden en su utilidad para proporcionar información procedimental y de soporte durante el entrenamiento [3], [4], [5], especialmente en entornos inmersivos de aprendizaje [6]. Según Lebel [7] y Gavish [8], la información proporcionada mejora el desempeño del aprendiz, ya que le brinda apoyo inicial durante la fase de aprendizaje y automatización. Además, Spruit [9] la menciona como un componente fundamental durante el entrenamiento, ya que garantiza condiciones adecuadas para el aprendizaje. Sin embargo, la inadecuada presentación de información puede sobrecargar la memoria de trabajo del aprendiz, al reducir los recursos cognitivos disponibles para el aprendizaje [10], [11]. Por esto, [12] y [13] afirman que el principio de atención dividida es importante para evitar los continuos cambios de atención. Este principio establece que los alumnos deben evitar dividir la atención visual entre múltiples fuentes de información para garantizar la integración mental. Aplicar esto representa algunos desafíos, como la selección del formato de presentación [12], [14] y la localización de espacios de información [15], [16]. De otro lado, otros principios como la señalización [17] se aplican para conducir la atención durante el aprendizaje, pero la información encontrada está segmentada, por lo que, a pesar del amplio uso de estas tecnologías, pocos estudios las han evaluado desde la perspectiva del aprendizaje multimedia y la carga cognitiva [18]. Por esto, García-San Juan [19] afirma que aún se desconocen los efectos en el aprendiz de la separación y presentación múltiple de fuentes de información. Finalmente, Rashid [20] afirma la necesidad de ampliar el estudio del efecto de atención dividida y distribución de la información, para reducir los cambios de atención visual del aprendiz. En conjunto, lo descrito anteriormente limita la aprehensión de información por parte de los aprendices en un entorno de realidad aumentada, ya que el aprendiz usa inadecuadamente sus recursos cognitivos debido a la mala configuración de la interfaz gráfica. Con el propósito de diseñar mejores interfaces de usuario para entornos inmersivos de aprendizaje que usen realidad extendida para lograr la integración espacial de contenido, en este estudio se busca identificar los elementos de configuración de los espacios de información presentados en la interfaz gráfica de usuario que pueden ser utilizados para reducir la carga cognitiva de los aprendices. A fin de responder a esta pregunta, se realizó una revisión sistemática de literatura, con el objeto de analizar estudios que aplicaron realidad aumentada en el aprendizaje. En el apartado 1 de este trabajo se presentan los materiales y métodos usados en la revisión; en el apartado 2, se describen en detalle los resultados; finalmente, en el apartado 3 se discuten dichos resultados y se establecen las conclusiones.
Materiales y métodos
Para conducir esta revisión, se siguió la metodología propuesta por Kossyva [21]. El objetivo de este estudio es identificar la forma en que se aplica el principio de contigüidad espacial en materiales de instrucción para tecnologías interactivas, además de los atributos de la interfaz de usuario que se aplican para poder implementar la contigüidad espacial y las características de los usuarios que afectan el desempeño durante la ejecución del aprendizaje.
Se utilizaron las PICOC (population, intervention, comparison, outcomes y context, en inglés) para delimitar la revisión.
Población/tipología: artículos, capítulos de libros, memorias de eventos y tesis doctorales.
Intervención: estudios experimentales con usuarios que evalúen: desempeño, carga cognitiva, esfuerzo mental.
Comparación: ninguna comparación de intervención.
Outcomes: conjunto de trabajos que definan características de interfaz de usuario en: desempeño (tiempos, número de errores), carga cognitiva, esfuerzo mental.
Contexto/nivel de cobertura: artículos en inglés y español publicados a partir de 1990.
Efecto cognitivo | Actividad del usuario | Tecnología | Diferencias entre usuarios | Principio de reducir CC |
---|---|---|---|---|
Cognitive load | Learning | Virtual reality | User characteristics | Proximity |
Extrinsic cognitive load | Training | Augmented reality | User differences | Contiguity |
Split attention | Procedural information | Mixed reality | User abilities | Layout |
Workload | Localization | |||
Visual focus | ||||
Ecuación de búsqueda |
Nota: (TI=(“Cognitive Load” OR “Extrinsec Cognitive load” OR “Split Attention” OR “Workload” OR “Visual Focus” AND learning OR Training OR "procedural information" AND "augmented reality" OR "mixed reality" OR "Virtual Reality" AND "user diferences" OR "user abilities" OR “User characteristics“ AND Proximity OR Contiguity OR Layout OR Localization))
Fuente: elaboración propia.
Se obtuvo un listado de 18 términos de búsqueda agrupados en cuatro categorías, tal como se observa en la tabla 1. Finalmente, se construyó una ecuación de búsqueda usando conectores booleanos AND, OR y NOT. La ecuación de búsqueda fue usada en tres bases de datos multidisciplinarias: LENS, ACM, Scopus, con una ventana de tiempo entre 1990 y 2022. LENS es el proyecto insignia de la empresa social Cambia, el cual busca obtener, fusionar y vincular diversos conjuntos de conocimientos abiertos, incluidos trabajos académicos y patentes. ACM (Digital Library) es la librería digital de la Association for Computing Machinery (ACM) y contiene journals, conferencias, revistas técnicas y libros, entre otros. Scopus es una base de datos de referencias bibliográficas y citas de la empresa Elsevier, de literatura peer-review y contenido web de calidad, con herramientas para el seguimiento, análisis y visualización de la investigación. La búsqueda en estas bases de datos arrojó un total de 4679 resultados, a partir de los siguientes criterios de inclusión aplicados a los títulos y resúmenes: a) estudios escritos en español o inglés; b) estudios que evaluaron carga cognitiva, carga mental, esfuerzo mental, desempeño o aprendizaje; c) estudios que evaluaron prototipos o material de instrucción orientado al aprendizaje y entrenamiento; d) estudios que usaron dispositivos de visualización, dispositivos de escritorio, head-mounted displays, para entornos de realidad aumentada, mixta y virtual; e) estudios con población entre 15 y 50 años.
Resultados
Los resultados muestran que algunos estudios evaluaron el principio de contigüidad espacial en formatos de instrucción, otros evaluaron propiedades de los entornos virtuales para entregar información instruccional, y otros más identificaron características de los usuarios y su influencia en el desempeño y uso de material instruccional.
Impacto de las diferencias entre usuarios
Estudios cuyo objetivo fue evaluar características del usuario en el uso de material de instrucción e interacción con tecnologías inmersivas. A continuación, se relacionan los principales hallazgos relacionados con las diferencias entre usuarios:
Habilidad espacial (HE): con base en la teoría de la carga cognitiva, varios estudios en diversos campos han intentado confirmar o desmentir el supuesto de que los usuarios con alta HE pueden manejar mejor su exposición a un estímulo visualmente complejo y mantener un nivel de esfuerzo mental bajo, en comparación con los usuarios que poseen HE baja [22], [23], [24], [25], [26], [27]. [28], [29]. En la tabla 2 se relacionan los principales efectos en el esfuerzo mental y el desempeño.
Conocimiento previo (CP): el CP influye de varias formas, sobre todo en la eficacia del formato de integrado [30], lo cual es especialmente más útil para los estudiantes con CP bajo [16], [31], ya que evita los cambios de atención que se generan en la búsqueda de información. Finalmente, se evidencia que el bajo CP puede definir aspectos como la necesidad de integración espacial de información, un mayor tiempo para el desarrollo de la tarea, e indicadores visuales que reduzcan la búsqueda de información [32], [33], entre otros.
Memoria de trabajo visual (MTV): los estudios revisados evidenciaron que las personas con alta MTV prefirieron visualizaciones más concretas [34], y viceversa, las personas con baja MTV las prefirieron más sencillas [35]. Esta diferencia también afecta el layout de la información, evidenciando que las personas con baja MTV tuvieron mejores resultados con información dispuesta de manera horizontal [33]. A pesar de estos indicios, aún no se evidencian estudios que analicen a profundidad el efecto de la MTV en el aprendizaje.
Taxonomía de técnicas para fomentar la integración del contenido: se clasificaron las técnicas identificadas en una taxonomía bajo el criterio de extensión del contenido (ver figura 1).
Técnicas para el manejo de contenidos cortos y largos: a su vez, las técnicas para el contenido corto se clasifican dependiendo del uso de la proximidad entre contenido en: con proximidad, teniendo en cuenta la distancia de separación física entre las fuentes de contenido; y no proximidad, que fundamenta la integración mediante otros atributos, como la conexión continua y la conexión simbólica.
Aplicación de la contigüidad espacial: se identificaron las principales técnicas para reducir la carga cognitiva mediante la reducción del procesamiento (figura 2), las cuales explotaron la cercanía entre fuentes de información como mecanismo para la integración, así: la integración física por proximidad [36] usa la cercanía física entre las fuentes de información para fomentar la asociación [37], [38], mientras que la integración activa incentiva la interacción del usuario para realizar la tarea de integrar espacialmente la información [39],[40].
Diferencia entre usuarios | Esfuerzo mental | Desempeño | ||
---|---|---|---|---|
Efecto | Característica | Efecto | Característica | |
Habilidad espacial - alto | Reducción [3] [4] | Proximidad espacial | Aumento en retención y aprendizaje[8] | Uso de representación pictórica |
Reducción [7] | Uso de indicaciones visuales | Aumento en precisión de la tarea [5] | Uso de representaciones estáticas | |
Habilidad espacial - bajo | Reducción [3] [4] | Uso de contigüidad espacial | Aumento en aprendizaje usando [6] | Uso de material segmentado, animaciones e indicaciones visuales |
Reducción [8] | Uso de codificación color | |||
Reducción [9] [5] | Uso de indicaciones animadas |
Fuente: elaboración propia.
Diferencia entre usuarios | Esfuerzo mental | Desempeño | ||
---|---|---|---|---|
Efecto | Característica | Efecto | Característica | |
Conocimiento previo - alto | Aumento de tiempo de tarea [15] | Uso de extracción de información | ||
Conocimiento previo - bajo | Reducción [13] | Uso de contigüidad espacial | Reducción. Mayor tiempo de tarea y errores [12], [10] | Mayor proximidad |
Aumento [12] | Uso de alta densidad de información | Aumento [11] | Uso de proximidad física y etiquetas | |
Reducción [11] | Uso de proximidad física | Aumento de resultados de aprendizaje [14] | Proximidad física | |
Aumento. Reducción errores [14], [10] | Uso de proximidad física Uso de etiquetado |
Fuente: elaboración propia.
Sin embargo, considerando que en el diseño de la interfaz no siempre es posible aplicar estas técnicas, también se identificaron otras que aprovechan la conexión continua y la conexión simbólica, como mecanismo para fomentar la asociación de contenido:
Conexión continua: aprovecha el uso de un elemento visual, como una línea, para conectar las fuentes de información, independientemente de su cercanía física (figura 3).
Etiquetado: se usan elementos visuales como líneas continuas, punteadas, etc., para conectar las fuentes de información [24], [41], [42].
Conexión simbólica: aprovecha el uso de elementos visuales con significancia simbólica en ambas fuentes de información, para fomentar la asociación de las fuentes (figura 3).
Referenciación: aplicando el uso de referencias sencillas en formato textual que permitieran la asociación entre el contenido.
Codificación: aprovechando el uso del color [43] y la forma en las fuentes de información que se desean relacionar.
Todas estas técnicas logran una disminución de la carga cognitiva [24], pero presentan una debilidad evidenciada en la cantidad de contenido que pueden soportar sin sobrecargar de información al usuario [44], por lo cual algunos investigadores han propuesto alternativas que logran el mismo propósito [45], [46]. Dentro de las técnicas identificadas están (figura 4):
Segmentación simple: usada para dividir el contenido en partes más pequeñas [24], [44].
Divulgación progresiva: usada para dividir el contenido en unidades más pequeñas y administrarlo progresivamente bajo demanda del usuario [40], [47].
Reinvención: aplicando la minimización de una ventana con el contenido completo y usando un icono en el espacio de trabajo [48], [49].
Extracción: aplica la diferenciación, según el usuario, del contenido relevante o irrelevante para la ejecución de la tarea [50], [51], [52].
Características de integración física
Se estableció la presencia de atributos de la interfaz de usuario, en esta técnica, relacionados con la organización de los espacios de información (figura 5) y con la configuración del entorno virtual.
Los espacios de información se organizan según los siguientes atributos:
Context switching (CS): conocido también como cambio de contexto, se establece como el cambio de enfoque que se presenta cuando un usuario modifica su atención sobre un elemento virtual y lo centra en uno real, y viceversa [52] (figura 6). El CS no afecta significativamente el des-empeño del usuario en tareas de visualización que se presentan en distancias inferiores a 2 m y que no requieren interacción con el contenido [52], [53]. Sin embargo, en algunos estudios se reporta sobrecarga en la memoria de trabajo [54], lo que podría afectar el desempeño [55], ya que los usuarios compensaron el CS realizando más rápido las tareas, pero percibieron mayor esfuerzo mental, presión y frustración. En actividades que requirieron interacción en espacios cercanos al cuerpo, se observó un impacto significativo en la degradación del desempeño [54] y un aumento de la carga mental [56].
Proximidad física: la proximidad física entre fuentes de información se establece como la cercanía en términos de distancia [57] (figura 7). Medida en grados angulares [57], se identificó un impacto negativo en el tiempo de tarea y su precisión para separaciones superiores a 35° [58], con un comportamiento lineal del efecto [58]. Se estableció un ángulo de 27º como el óptimo de separación horizontal entre fuentes de información [59]. En los estudios revisados se evaluó la separación horizontal [44], pero no se identificó alguna evaluación para separación vertical. En dispositivos HMD, el tiempo y carga mental es menor [58], [60]. En tareas de alta frecuencia siempre fue preferida la distancia más corta [61].
Localización en el espacio: la localización se definió con la ubicación y orientación con res-pecto a un sistema de referencia. Se identificó el uso de localizaciones relativas (arriba, abajo, izquierda y derecha) y absolutas entre fuentes de información [59], [62] - [65]: in-situ [66], aleatoria, inview [67] [68]. Se identificó que la posición absoluta in-situ mejoró la precisión en la interacción, el tiempo de respuesta de la tarea y la carga mental, si bien esto está asociado a campos de visión (FOV, field of view) grandes [65]. Al contrario, para FOV pequeños, la localización inview mostró mejores resultados [64]. Con respecto a la orientación, las fuentes de información orientadas al usuario mostraron mejores resultados [63].
Contigüidad espacial: la contigüidad espacial se define como la cercanía entre fuentes de información que fomentan la contigüidad del contenido [69] (figura 8). Se diferenció entre la contigüidad de campo, entendida como la separación de fuentes de información sobre el mismo plano visual (separado=discontiguo, cercano=contiguo), y la contigüidad de profundidad, entendida como la separación entre fuentes que involucran planos visuales localizados a diferentes profundidades [70] (igual profundidad=contiguo, profundidades diferentes=discontiguo) [52]. Las separaciones de profundidad tienen un impacto negativo, es decir que cuando hay diferencia de profundidades se presenta menor desempeño [52] y precisión en la tarea [54], además de que se incrementa significativamente la carga cognitiva percibida. Los autores sugieren no introducir discontigüidades de profundidad, debido a los efectos identificados [71].
Cantidad de pantallas: se define como el número de espacios de información delimitados que se localizan dentro del espacio 3D. Se identificó una relación directa de incremento entre el número de pantallas y la carga cognitiva del usuario [55] [71].
Tamaño y layout: el tamaño se refiere a las dimensiones físicas que delimitan un espacio de información (figura 9). En relación a ello, los estudios reportaron que los displays grandes son más adecuados para visualización general [72] [73]. Sin embargo, para realidad aumentada, el efecto está relacionado con el FOV, por lo que generalmente se obtuvieron mejores resultados, en términos de tiempo [81] y carga mental subjetiva [72], con tamaños pequeños que no excedieran el FOV. Para la selección de elementos dentro de un espacio de información, se identificó que el tamaño grande mejora el tiempo de la tarea [74]. Con respecto al layout, para tareas de alta frecuencia o baja frecuencia de cambio se identificaron dos factores: la distancia (separación entre espacios de información) y la ruta [75] (dirección de movimiento en el cambio).
Las ubicaciones de información a la izquierda mostraron mejores resultados en términos de tiempo de tarea para tareas de baja frecuencia [35], [61], a excepción de los sistemas exocéntricos con pantalla curva [59], donde el menor tiempo se observó en las pantallas localizadas a la derecha [55]. Asimismo, fueron mejor percibidos los desplazamientos verticales de arriba-abajo para tareas de alta frecuencia. Las configuraciones múltiples de mosaico obtuvieron menores tiempos de cambio, pero la configuración aleatoria obtuvo menores transiciones de mirada con menor distancia y tiempo de identificación.
Curvatura: es la deformación de un plano visual para adaptar una sección cilíndrica, cuyo eje se localiza en el centro visual del usuario. Este atributo fomenta la rotación de la cabeza y reduce el tiempo de búsqueda, aunque no evidenció relación con la carga cognitiva.
Bisel de pantallas: es un excedente de espacio no usado que incrementa la separación y enmarca el display [76], pero no se identificaron efectos del uso de biseles en la carga cognitiva [73], [77].
Discusión y conclusión
En esta revisión se identificaron características de diseño de entornos virtuales 3D en tecnologías de realidad extendida, aunque la mayoría de las investigaciones tienen información fragmentada y no para todas las tecnologías expuestas. De manera general, son pocas las investigaciones para algunas características y se considera importante ampliar los hallazgos preliminares de algunas de ellas con nuevos experimentos que puedan dar orientación al efecto cognitivo de estas tecnologías.
Con respecto a las diferencias entre usuarios, se identificó la influencia de factores individuales como la habilidad espacial, el conocimiento previo y la memoria de trabajo visual. En este sentido, son varias las apreciaciones: primero, efectivamente varios estudios han podido reafirmar que la habilidad espacial alta brinda a la persona la capacidad de gestionar eficientemente su memoria de trabajo visual, a fin de evitar la sobrecarga cognitiva cuando aprende con materiales de alto contenido visual [23], [24]. Al parecer, ciertos formatos (integrados) [23], segmentados y con características de animación [25] y de codificación [27] son especialmente útiles para personas con baja capacidad espacial, principalmente porque ayudan a reducir el procesamiento extraño, manteniendo recursos cognitivos disponibles para el procesamiento pertinente [29], lo cual permitió a los estudiantes aumentar la comprensión y nivelar su conocimiento. Sin embargo, para personas con capacidad espacial alta, estas características no brindan un apoyo adicional y relevante [23]. Por lo tanto, se identifica que las personas con menor capacidad espacial requieren y obtienen mejores resultados aplicando estrategias para la reducción del procesamiento extraño [27].
Por otra parte, varios estudios coinciden en establecer que la capacidad espacial se considera un predictor o moderador del resultado en términos de aprendizaje con materiales de alto contenido visual [22]. Asimismo, el conocimiento previo del tema afecta el esfuerzo mental, especialmente de estudiantes con poco conocimiento, razón por la cual dedican más tiempo a observar los objetos relacionados por cercanía, en búsqueda de relaciones aún no establecidas por su falta de conocimiento [22]. Por el contrario, los estudiantes con alto conocimiento previo dirigen su atención al contenido relevante [78], con un mínimo de búsquedas visuales. Lo anterior es reafirmado por la capacidad que muestran los expertos de discriminar entre la información relevante o no relevante y de adaptar el ritmo de la tarea a la dificultad [31]. Por esto, el bajo conocimiento previo genera propensión al error en estudiantes con condiciones de atención dividida [30]. Además, con respecto a la memoria de trabajo visual, unos pocos estudios evidenciaron como efecto principal para los usuarios de baja memoria de trabajo el aumento del desempeño de la tarea en presencia de algunas características como el layout.
En este estudio, a partir de la información recabada, se propone una taxonomía de técnicas para la integración de contenido fundamentada en su extensión, un factor considerado fundamental, dado que incrementa la necesidad de usar recursos cognitivos en la memoria de trabajo durante el desarrollo de la actividad. En el proceso, no se identificaron taxonomías similares. De igual forma, conscientes de las limitaciones de las técnicas basadas en la proximidad espacial, se propone la categoría de “no proximidad espacial”, para agrupar técnicas que tienen un efecto similar o superior en el esfuerzo mental y el desempeño. Asimismo, se plantea la categoría de “contenido largo”, que agrupa técnicas para segmentar el contenido y lograr espacios de información que no estén sobrecargados, aprovechando mejor los recursos cognitivos del estudiante.
El principal parámetro analizado para identificar un conjunto de características de organización de los espacios de información fue la distancia, tanto entre el usuario y el espacio de información como entre espacios de información. Las características identificadas como relevantes fueron:
Context switching, que permitió establecer un consenso en el efecto de cambio de contexto, así como la degradación del desempeño y el aumento del esfuerzo mental. Esta característica es de especial cuidado en tecnologías como la realidad aumentada y la realidad mixta, donde el cambio de contexto tiene alta presencial dada su naturaleza. A pesar de esto, fueron pocos los estudios recuperados y se considera la necesidad de ampliar la investigación, evaluando especialmente el esfuerzo mental en distancias cercanas al cuerpo.
La proximidad física, que permitió identificar similitudes con la contigüidad espacial, dada su dependencia de la distancia entre espacios de información, por lo cual se considera que pueden constituir una única característica a abordar. De igual forma, el efecto cognitivo es similar, dado que se incrementa el uso de la memoria de trabajo debido a la separación de las fuentes de información [76], algo que afecta el desempeño del usuario.
La localización en el espacio, que involucra una relación con el FOV como atributo del espacio 3D y con el hardware, y cuya influencia en el esfuerzo mental es notoria.
Desde la revisión, se identificaron cuatro atributos de configuración del entorno virtual: el sistema de referencia, la cobertura angular, la proximidad al usuario y el campo visual. De estos atributos, según la literatura encontrada, se consideran mayores los efectos del sistema de referencia y del FOV, especialmente porque, en el caso de sistema de referencia, crea una base de ubicación y orientación de los usuarios, fomentando o degradando la adecuada relación de estos con su entorno virtual, como lo menciona Müller [79] y Markov-Vetter [80]. De igual forma, el campo visual tiene un efecto que vincula especialmente los dispositivos de visualización (head-sets) y el efecto de la carga mental, como lo menciona Czerwinski [81].
Como conclusión de este estudio, se observó que la información en la mayoría de las investigaciones está fragmentada y se requiere más experimentación para entender el efecto cognitivo de estas tecnologías. Habiendo establecido la influencia de factores individuales como la habilidad espacial, el conocimiento previo y la memoria de trabajo visual en el aprendizaje con materiales visuales, con diferencias notables en el desempeño según la capacidad espacial y el conocimiento previo de los individuos, se propuso una taxonomía de técnicas para la integración de contenido, enfocada en la extensión del mismo y la optimización de los recursos cognitivos. Se analizaron características de organización de los espacios de información, incluyendo la distancia, el context switching, la proximidad física y la localización en el espacio, destacando la necesidad de más investigación en áreas como el esfuerzo mental en distancias cercanas al cuerpo.
Finalmente, se identificaron cuatro atributos de configuración del entorno virtual, con énfasis en el sistema de referencia y el campo visual. La revisión subraya la complejidad de la interacción entre estos factores y la experiencia del usuario, y resalta la necesidad de una investigación más profunda y cohesiva para comprender plenamente cómo estos elementos interactúan en el contexto de la realidad extendida. Todos estos son hallazgos que pueden tener un impacto significativo en el diseño de nuevos entornos inmersivos de aprendizaje de diversas disciplinas.