En educación cada vez es mas común recurrir a las nuevas tecnologías para el aprendizaje de diversas habilidades académicas (como pueden ser destrezas matemáticas, velocidad lectora, aprendizaje de idiomas, etc.). De hecho, existen multitud de recursos electrónicos, disponibles a través de la Web, para la ayuda en el aprendizaje de estas materias. Igualmente, cada vez es más frecuente el uso de entornos exploratorios basados en tecnología 3D. Estos pueden tener una serie de ventajas sobre procedimientos tradicionales de enseñanza, como es el caso de la posibilidad de realizar un aprendizaje “multimodal”, o la de facilitar los procesos de transferencia de las habilidades aprendidas de un contexto a otro. Así, el aprendizaje puede darse de una manera más experiencial y menos limitado que en las aproximaciones tradicionales (Freitas & Neumann, 2009). Por ejemplo, un estudio de Kim, Park, y Baek (2009) mostró que el uso de videojuegos, cuando se realiza junto con determinadas estrategias meta-cognitivas, produce una mejora tanto del aprendizaje académico como del propio desempeño en el juego.
Por otro lado, también existen cada vez más recursos informáticos encaminados a la evaluación de los diferentes problemas psicológicos habituales en los centros educativos, como pueden ser el consumo de sustancias, acoso escolar, trastorno por déficit de atención, fobia escolar, ansiedad ante los exámenes, etc (Gutiérrez-Maldonado, Alsina-Jurnet, Carvallo-Becíu, Letosa-Porta, & Magallón-Neri, 2007; Carmona, Cangas, & Langer, 2012; Kyriakakis, Van Rooyen, & Sisemore, 2000; McCabe, Boyd, Young, Crawford, & Pope, 2005; Zoll, Enz, Schaub, Aylett, & Paiva, 2006).
Desde luego, el empleo de los recursos electrónicos en la población juvenil posee varias ventajas en relación a los medios tradicionales de evaluación psicológica. Por un lado, los adolescentes están muy familiarizados con las nuevas tecnologías, que tienen para ellos un gran atractivo e interés. Por otro lado, son procedimientos que se pueden aplicar fácilmente a poblaciones muy amplias, es posible dar retroalimentación inmediata a los participantes, se pueden incluir más recursos técnicos (como luces y sonidos) que ayudan a centrarse más en la tarea, etc. (Bates & Cox, 2008; Buchanan, Johnson, & Goldberg, 2005; Johnson, 2005; Reips, 2000).
Recientemente, en la universidad de Almería se ha desarrollado una herramienta informática que utiliza entornos de simulación 3D para evaluar el comportamiento del alumno ante situaciones de acoso escolar y consumo de sustancias. Diseñada para ser utilizada como herramienta de evaluación tipo screening en ordenadores convencionales, el programa de simulación denominado My-school (MS) consta de un total de 17 escenas, las cuales muestran diversas situaciones conflictivas de consumo de sustancias y acoso escolar, ante las cuales el alumno ha de indicar cuál sería su manera de responder al verse inmerso en ese tipo de situaciones de riesgo. Una descripción pormenorizada del programa informático puede ser consultada en Carmona, Cangas, García, Langer, y Zárate (2012) y Carmona, Espínola, Cangas, e Iribarne (2010a, 2010b, 2011).
El programa MS ha mostrado una fiabilidad buena (Carmona et al., 2012), ya que ahora completa sus pruebas psicométricas con medidas de validez. Específicamente, en el presente estudio se han utilizado dos procedimientos habituales en la construcción de instrumentos de evaluación nuevos, como son el estudio de la validez de contenido y la validez de criterio predictiva (López Feal, 1986). Así, a partir del criterio de expertos, se persigue evaluar la pertinencia del contenido de las diferentes situaciones de consumo de sustancias y acoso escolar que pretende evaluar el programa informático; asimismo, a partir de la utilización de un criterio externo (como es la entrevista) se pretende evaluar la validez predictiva de la herramienta informática. De esta manera, el presente trabajo se divide en dos estudios, cada uno de ellos encaminado a mostrar los resultados de las dos pruebas de validez utilizadas.
Método
Estudio I
Participantes
Al ser la finalidad del presente estudio analizar las propiedades psicométricas relativas a la validez de contenido de los ítems que componen el programa de simulación 3D My-School (MS), se recurrió a una muestra de expertos con experiencia específica en el ámbito de los comportamientos de consumo de drogas y acoso escolar. En total participaron cuatro jueces (N = 4), dos expertos en el campo del consumo de drogas (n = 2) y dos expertos en el campo de los comportamientos de acoso escolar (n = 2), todos ellos pertenecientes a centros de investigación o instituciones sanitarias de reconocido prestigio. Si atendemos a los participantes que colaboraron en este estudio (N = 4), un 50 % fueron hombres (n = 2), y un 50 % mujeres (n = 2). Las características sociodemográficas pueden consultarse en la Tabla 1. Con respecto a los ámbitos específicos de experiencia, dos de los expertos presentaban una amplia experiencia en el campo del consumo de drogas (n = 2) y los otros dos expertos en el campo de los comportamientos de acoso escolar (n = 2).
Instrumentos
Para la recogida de información de los juicios dados por los expertos, los autores del presente estudio diseñaron una escala ad hoc, con un puntaje de cero a cien para medir la pertinencia de los ítems en términos de relevancia, coherencia, claridad y tendenciosidad de las situaciones del programa MS para detectar comportamientos de consumo de drogas y acoso escolar. En base a lo sugerido por Osterlind (1989), se decidió no incluir un sistema de respuestas dicotómicas acuerdo/desacuerdo por no ser suficientemente adecuado para la evaluación del contenido de los ítems con respecto al acuerdo existente entre los evaluadores expertos.
De manera pormenorizada, la plantilla del protocolo de juicios de expertos utilizada incluyó una descripción tanto del propósito del juicio de expertos como del de la prueba objeto de evaluación, en donde se especifica claramente la finalidad para la que sería utilizada la información procedente de sus respuestas. A su vez, también se incluyó en dicha plantilla el objetivo general y los específicos del estudio que se estaba llevando a cabo, además de una conceptualización del universo del contenido referido a la definición de comportamientos de consumo de sustancias y acoso escolar. A continuación, se incluyó una tabla con información acerca de la operacionalización de las variables relevantes a tener en cuenta para el proceso de evaluación de los distintos dominios presentes en el programa MS. Con toda esta información se persiguió unificar los criterios utilizados por los expertos con la finalidad de instruir claramente al juez en la dimensión y el indicador que mide cada ítem o grupo de ellos, algo que es clave para establecer la correcta fiabilidad de los datos obtenidos mediante el juicio de los diferentes expertos implicados en este tipo de procedimientos (Escobar-Pérez & Cuervo-Martínez, 2008). Por último, se especificó una descripción tanto de los indicadores utilizados para la evaluación del programa MS, como del sistema de puntuaciones. En concreto, si atendemos a las puntuaciones, estas estaban comprendidas según una escala de cero a 100, en donde cero se correspondía con no cumplir con el criterio o indicador, y 100 con cumplir con el criterio.
Procedimiento
Siguiendo la recomendación de Millman y Greene (1989), la elección de los expertos fue realizada con base en el propósito o finalidad para el cuál fue construido el programa informático MS, en donde se tuvo en cuenta, por tanto, que el grupo de expertos elegido representase suficientemente una diversidad de puntos de vista con respecto al contenido de las situaciones que componen dicho programa. Finalmente, los expertos seleccionados procedieron del ámbito de la psicología, psiquiatría y de la educación, asegurándose así la independencia entre los mismos. Por su parte, para la elección del número de expertos a incluir se siguió la recomendación, sugerida por Lynn (1986) (citado en McGartland, Berg-Weger, Tebb, Lee, & Rauch, 2003), de incluir un mínimo de tres jueces expertos. El tiempo total empleado por cada uno de los participantes en contestar a la plantilla estuvo comprendido entre los 30 y 40 minutos de duración total. Cada uno de los participantes respondió a dicha plantilla de manera individualizada.
Resultados
Con la finalidad de evaluar la validez de contenido de las situaciones del programa MS se recurrió al uso del coeficiente de concordancia w de Kendall (Kendall & Babington, 1939) de cara a evaluar el grado de acuerdo existente entre los evaluadores con respecto a la valoración del contenido de las diferentes situaciones del programa. Así, tal y como se muestra en la Tabla 2, se obtuvo para el total de las situaciones un índice w de Kendall de 0.71 (x2 = 315.264; p = 0).
Para cada uno de los ítems se obtuvo una ordenación de cuatro variables (relevancia, coherencia, claridad y tendenciosidad) según una escala ordinal con valores de cero a 100. En primer lugar, se muestran los estadísticos descriptivos obtenidos tras la aplicación del procedimiento no paramétrico referido a los rangos y las medias obtenidas por cuanto a la valoración por parte de los expertos del contenido de las situaciones relacionadas con acoso escolar (Tabla 3) y consumo de drogas (Tabla 4).
Por cuanto a la dirección de las valoraciones, si nos centramos en cada uno de los valores observados para cada ítem específico, podemos comprobar que la media de las puntuaciones otorgadas por los jueces, referidos a las variables relevancia, coherencia y claridad del contenido de los ítems es alta en todas las variables (véanse tablas 3 y 4). Por su parte, la variable tendenciosidad del contenido de los ítems mostraría, por el contrario, valores bajos de media en todos los ítems analizados.
A su vez, se realizó un análisis individual por separado de cada uno de los ítems, con la finalidad de analizar el grado de concordancia específico existente entre las valoraciones de los expertos con respecto a cada una de las variables analizadas. Para ello, se utilizó de nuevo el estadístico w de Kendall (véase Tabla 5).
Pues bien, si atendemos a los resultados obtenidos para cada uno de los ítems, la prueba mostró la existencia de relaciones estadísticamente significativas (p < 0.05) entre las valoraciones de los expertos para todos los ítems analizados, con la excepción de un solo caso (ítem 13 referido al consumo de drogas con el grupo de amigos), para el cual la prueba no mostró valores significativos. En conclusión, estos resultados indicarían la existencia de concordancia entre los jueces expertos con respecto a la valoración de cada una de las situaciones cuando estas son analizadas de manera específica o individualizada. Así, los índices w de Kendall se encontrarían en un intervalo comprendido entre 0.651 y 0.932.
Estudio II
Participantes
Con la finalidad de calcular la validez predictiva de los datos obtenidos mediante el programa My-School (MS), se utilizó una muestra de estudiantes de Educación Secundaria Obligatoria (ESO) y Bachillerato, procedente de dos centros escolares elegidos aleatoriamente, situados en la provincia de Almería (España). Como medida de evaluación de la validez predictiva del programa MS se recurrió a la entrevista en profundidad como criterio externo para confirmar las respuestas dadas seis meses antes en el programa MS por una submuestra procedente de 570 participantes, que respondieron al programa con anterioridad. La selección de la muestra se realizó por estratos con asignación óptima y sin reemplazo. Los grupos contemplados se correspondieron con cada una de las variables independientes del estudio, a saber: ser acosado/acosador, consumidor de tabaco, alcohol, marihuana, cocaína, MDMA o éxtasis y no ser consumidores de ninguna sustancia. Bajo estos criterios se conformó una submuestra compuesta por un total de 58 participantes, los cuales correspondieron al 10 % del total de los 570 participantes que contestaron previamente al programa MS. Un resumen de las características sociodemográficas puede consultarse en la Tabla 6.
Instrumentos
A continuación, se presentan los instrumentos utilizados en este estudio.
Entrevista semiestructurada. Se realizó una entrevista semiestructurada, ex profeso, para la presente investigación, con la finalidad de obtener ⸺o no⸺ la corroboración de los resultados obtenidos mediante el programa de simulación 3D MS. La entrevista estuvo compuesta por cuatro partes diferenciadas en función del contenido al que hacía mención. Una primera parte la formaban preguntas con contenidos neutros genéricos no relacionados con el consumo de drogas ni el acoso escolar. Una segunda parte estuvo compuesta por cuestiones relacionadas con acoso escolar, como es el ser víctima, acosador o testigo de este tipo de situaciones. En tercer lugar se presenta un conjunto de cuestiones relacionadas con la historia de consumo de sustancias del alumno y del grupo de amigos. La cuarta parte de la entrevista hace referencia a cuestiones relacionadas con el ambiente familiar y cuestiones de personalidad.
Programa My-School (MS). El programa de simulación MS utiliza entornos virtuales tridimensionales para recrear determinados contextos de consumo de drogas y acoso escolar con la finalidad de detectar a modo de herramienta tipo screening estos tipos de comportamientos de riesgo. Para ello, el programa MS consta de un total de 17 escenas de simulación, las cuales recrean, mediante la utilización de gráficos tridimensionales (al estilo de los actuales videojuegos), diferentes situaciones de consumo de sustancias y acoso escolar con personajes que interactúan entre sí en situaciones conflictivas y ante las cuales el participante ha de elegir cómo comportarse, dadas las diferentes opciones de respuesta que se le ofrecen. Para una descripción detallada del programa, el lector puede remitirse a Carmona et al. (2010a, 2010b, 2011).
Procedimiento
Una vez seleccionada la submuestra compuesta por 58 alumnos, con la finalidad de no comprometer su participación, así como con la intención de no alterar o influir en la sinceridad de las respuestas de los participantes que fueron entrevistados, se les informó, tanto a los propios participantes de las entrevistas como al resto de compañeros no entrevistados, que se trataba de “un estudio dirigido a recabar información sobre ellos con la finalidad de conocer mejor a los jóvenes de estas edades”, informándoles acerca de la voluntariedad y confidencialidad de sus respuestas. Cada una de las entrevistas realizadas fue llevada a cabo de manera individual por un total de dos entrevistadores con experiencia previa tanto en la evaluación como en el tratamiento de estos tipos de comportamientos. Las entrevistas se realizaron en el interior de despachos privados habilitados para tal fin por los responsables académicos del centro. Los investigadores eran ciegos a las respuestas emitidas previamente por los participantes. Las entrevistas tuvieron una duración aproximada de 20 minutos por alumno, dependiendo dicha duración de la propia dinámica de cada una de las entrevistas realizadas. Previo a la realización de las entrevistas, se les informó acerca del anonimato, la voluntariedad y la confidencialidad de sus respuestas.
Resultados
En primer lugar, se analizó la posible existencia de respuestas congruentes entre los participantes con respecto a la información obtenida a través de las entrevistas y las respuestas dadas seis meses antes en el programa MS, para lo cual se conformaron tablas de contingencia dicotómicas con el total de congruencias observadas. A continuación, y siguiendo con los análisis estadísticos realizados, se utilizó la prueba de McNemar para muestras dependientes (McNemar, 1947), como medida para identificar la posible existencia de diferencias estadísticamente significativas entre las respuestas emitidas en MS y la entrevista. Al ser la finalidad de dicho análisis la posible corroboración de los datos obtenidos mediante ambas mediciones.
En concreto, con respecto a los resultados obtenidos, la comparación realizada mediante la prueba estadística McNemar para muestras dependientes reveló que no existen diferencias estadísticamente significativas entre las respuestas obtenidas mediante el uso del programa de simulación MS y las obtenidas mediante las entrevistas individualizadas (x2 = 3.2; p > 0.05). Así, la inexistencia de diferencias significativas entre los datos procedentes de ambos tipos de medidas distintas nos indicaría que existiría una correspondencia significativa (validez de criterio predictiva) entre las respuestas que los participantes dieron a través del programa MS y las respuestas dadas por esos mismos participantes en la vida real medido mediante el uso de la entrevista. Un resumen de dichos resultados puede consultarse en la Tabla 7.
Tal y como puede observarse en la Tabla 7, con respecto a los participantes relacionados con alguna de las condiciones de acoso escolar, se observa que existe correspondencia entre MS y las entrevistas en el total de alumnos que participaron (n = 17), en donde no existe, por tanto, ningún participante para el que no se corroborase en las entrevistas, seis meses después, sus respuestas del programa MS (n = 0). Por su parte, con respecto al consumo de sustancias, para cada una de las evaluadas (tabaco, alcohol, marihuana, cocaína y MDMA) existiría un alumno para el que no se habría encontrado que exista correspondencia entre sus respuestas en MS con respecto a esas sustancias en concreto y las respuestas dadas en la entrevista (n = 5). No obstante, para el resto de participantes (n = 36) sí existiría correspondencia entre sus respuestas de consumo de sustancias obtenidas mediante el programa MS y las registradas en la entrevista seis meses después.
Si atendemos a los porcentajes de alumnos que en sus respuestas se habrían mostrado coincidentes en ambas pruebas, el 100 % de los de ellos, bien como implicados en situaciones de acoso escolar o bien como no acosados, habrían mostrado respuestas similares tanto en el programa MS como en las entrevistas. El porcentaje de alumnos que se habrían mostrado incongruentes con sus respuestas en ambas medidas fue 0. Con respecto al consumo de sustancias, un 87.8 % de los alumnos habría mostrado respuestas coincidentes en ambas medidas de evaluación. Sin embargo, el 12.2 % de alumnos restante no habría mostrado dicha coincidencia entre la entrevista y sus respuestas de consumo de drogas en el programa MS.
En definitiva, y si tenemos en cuenta los datos de manera global, los análisis muestran la inexistencia de diferencias estadísticamente significativas entre las respuestas mostradas por el programa se simulación 3D MS y las entrevistas, corroborándose así la correspondencia entre las respuestas de consumo de sustancias y acoso escolar obtenidas mediante el programa MS y las respuestas dadas por esos mismos participantes en las entrevistas seis meses después.
Discusión
El presente artículo ha buscado analizar las propiedades psicométricas referidas a la validez del programa de simulación 3D My-School (MS) para detectar alumnos consumidores de sustancias o implicados en acoso escolar. Para ello, en primer lugar, se llevó a cabo el análisis de la validez del contenido de las situaciones que componen el programa MS, utilizando como criterio externo jueces expertos en el campo de los comportamientos de consumo de drogas y acoso escolar. En segundo lugar, se analizó la validez de criterio predictiva de dicha herramienta, para lo cual, como medida o criterio externo, se procedió a la realización de entrevistas individualizadas, las cuales fueron realizadas seis meses después de la aplicación del programa MS en esa misma muestra de participantes.
Pues bien, si atendemos al primer estudio dirigido al análisis de la validez del contenido de las situaciones del programa, la obtención de un índice w de Kendall de 0.71 para el total de ítems o situaciones del programa MS (p = 0) nos indicaría la existencia de una concordancia media-alta o acuerdo sustancial entre los cuatro jueces expertos con respecto a las variables estudiadas (Landis & Koch, 1977). Es relevante destacar la pertinencia de analizar la dirección o el significado de las valoraciones realizadas por los expertos respecto a las variables relevancia, coherencia, claridad y tendenciosidad para cada uno de los ítems o situaciones individualmente. A este respecto, y tal y como señalan Siegel y Castellan (1995), es importante analizar si la concordancia entre los jueces, medida mediante el estadístico w de Kendall, responde a que estén de acuerdo acerca de la idoneidad del ítem que estén clasificando o, por el contrario, exista concordancia con respecto a la baja idoneidad del ítem en particular en base a las variables utilizadas para su clasificación. En este sentido, tal y como puede observarse en las Tablas 3 y 4, los resultados mostraron valores de media altos para las tres variables relevancia, coherencia y claridad, y bajos para la variable tendenciosidad. Es decir, existiría entre los jueces un acuerdo sustancial a la hora de valorar el contenido de las diferentes situaciones del programa MS como relevantes, coherentes y claros con respecto a los dominios a los que se refieren, esto es, consumo de drogas o acoso escolar. A su vez, los valores bajos en las medias de las valoraciones referentes a la variable tendenciosidad nos indicaría la existencia de acuerdo o concordancia entre los jueces por cuanto a la baja tendenciosidad que mostraría el contenido de las situaciones del programa MS.
Mención aparte merece el análisis de la concordancia realizado a cada uno de los ítems de manera individual. En este sentido, el análisis individualizado reveló valores w de Kendall significativos para todas las situaciones del programa MS, con la excepción de la situación 13 (véase Tabla 5). De manera específica, el hecho de que los índices w de Kendall se encuentren en un intervalo comprendido entre 0.651 y 0.932 implicaría un acuerdo sustancial o casi perfecto (Landis & Koch, 1977) entre los jueces, respecto a la validez del contenido de cada una de las situaciones para la detección de comportamientos de acoso escolar y consumo de drogas.
Por su parte, con respecto a los resultados del estudio II, relativos a la validez de criterio predictiva del programa MS para detectar alumnos consumidores de sustancias o implicados en acoso escolar, los datos obtenidos mediante el estadístico McNemar muestran que no existen diferencias significativas entre las respuestas obtenidas mediante el uso del programa de simulación MS y las obtenidas mediante las entrevistas individualizadas. Existe, por tanto, una correspondencia entre lo que los alumnos dicen cuando son entrevistados con respecto a su consumo de drogas y su implicación en situaciones de acoso escolar, y lo que respondieron seis meses antes en el programa informático MS cuando se vieron inmersos en ese mismo tipo de situaciones simuladas virtualmente.
Con respecto a la elección de la muestra específica seleccionada para las entrevistas, cabe puntualizar que dado que el número de acosadores y acosados, así como de consumidores de determinadas sustancias, como cocaína o MDMA, fue minoritario, lo que coincide con las prevalencias observadas para estas edades (Observatorio Español Sobre Drogas, 2008; Serrano & Iborra, 2005), la muestra final utilizada fue seleccionada para incluir a aquel número reducido de alumnos que mostraban estos tipos de comportamientos, por lo que esta no es proporcional al total de la población original de participantes que respondieron seis meses antes al programa MS, sino representativa de aquellos implicados en situaciones de acoso escolar y consumo de drogas, así como de no consumidores y no acosados/acosadores, en donde la muestra final utilizada corresponde al 10 % del total de la muestra inicial de 570 alumnos. De esta manera, fue posible analizar y validar dichas situaciones del programa informático MS en base a la muestra utilizada.
A modo de conclusión, con respecto al estudio I, podemos afirmar que la importancia de los resultados obtenidos con base al acuerdo sustancial observado entre los jueces ⸺con respecto a la validez del contenido de las situaciones que componen el programa MS⸺ se presentaría como un aval empírico que fundamentaría el uso de dicho programa para la detección de estos tipos de comportamientos en jóvenes. En segundo lugar, con respecto al estudio II, el uso de entrevistas individualizadas habría permitido corroborar la validez predictiva de la herramienta MS para la detección de comportamientos de acoso escolar y consumo de drogas en jóvenes estudiantes. En definitiva, los resultados obtenidos se presentarían como un aval empírico de la validez de contenido y de criterio, predictiva del programa de simulación 3D MS para detectar alumnos en riesgo de consumo de sustancias y acoso escolar.