En la era de la inteligencia artificial (IA), la sociedad se encuentra inmersa en un rápido cambio tecnológico, cuya máxima expresión es la inteligencia artificial generativa (IAG). En este contexto, el desarrollo y la accesibilidad de herramientas avanzadas han permitido que prácticamente cualquier persona pueda crear avatares animados por inteligencia artificial con precisión y realismo sorprendentes (Salehi et al., 2022). Estas representaciones digitales han encontrado un terreno fértil en el periodismo, donde su implementación está redefiniendo la forma en que se produce y consume la información (Stănescu, 2018). La relevancia de estudiar este fenómeno radica no solo en la innovación tecnológica que representa, sino también en las profundas implicaciones éticas, sociales y políticas que conlleva.
Los avatares impulsados por IA han demostrado ser herramientas poderosas para captar la atención del público, al ofrecer nuevas formas de narrar historias y presentar noticias. Con capacidades que van desde mantener conversaciones hasta interpretar emociones, estos avatares están transformando el paisaje mediático y hacen los espacios digitales más atractivos y accesibles para audiencias globales (Bertoa et al., 2020). Sin embargo, el uso extensivo de avatares realistas también plantea desafíos únicos. La capacidad de estos avatares para simular la humanidad y transmitir cualquier tipo de información, verdadera o falsa, pone en riesgo la integridad y confiabilidad del contenido en línea. En un contexto donde las noticias falsas (fake news) representan una amenaza constante (Knox, 2019), la facilidad con la que se pueden generar avatares realistas para difundir información falsa agrava las preocupaciones existentes sobre la veracidad y la confianza en los medios digitales (Loeb, 2021).
La aparición de ultrafalsificaciones (deepfakes) notoriamente convincentes ilustra vívidamente la doble cara de esta tecnología. Un claro ejemplo de esto es la cuenta de Tik-Tok conocida como @DeepTomCruise, la cual ha ganado popularidad por sus vídeos asombrosamente realistas donde una persona imita al famoso actor Tom Cruise, con la ayuda de tecnología de ultrafalsificación para hacer que el parecido sea prácticamente indistinguible del real. Los videos de esta cuenta han dejado perplejos a muchos, ya que muestran al "falso" Tom Cruise realizando actividades cotidianas, trucos de magia y otras hazañas, todo ello con una autenticidad visual y vocal que desafía la percepción (Fehring y Bonaci, 2013 ). Otro caso interesante en este sentido es la ultrafalsificación de Donald Trump. Particularmente fueron muy famosas las imágenes donde el expresidente de los Estados Unidos aparecía capturado en las calles de Nueva York (Ahmed y Sonuc, 2023). Finalmente, destaca el caso del presidente de Ucrania Volodymyr Zelens-ky, en el que se difundió un vídeo ultrafalsificado donde aparentemente pedía a sus soldados rendirse ante las fuerzas invasoras. Este incidente resalta el potencial uso de ultrafalsificaciones en el contexto de conflictos geopolíticos, donde la desinformación puede tener consecuencias directas en el campo de batalla y en la moral de un país (Twomey et al., 2023). Mientras que estos ejemplos han capturado la fascinación del público por su asombrosa verosimilitud, también han generado debates sobre las implicaciones éticas de su uso, especialmente cuando se emplean para difundir desinformación o manipular la opinión pública (Allen et al., 2024).
A pesar de la creciente prevalencia de avatares en el periodismo y su evidente impacto en la percepción pública, existe una notable escasez de investigaciones académicas que exploren cómo afectan la credibilidad de la información presentada (Bearman y Luckin, 2020; Siemens et al., 2022). Esta laguna en la literatura es alarmante, considerando la rapidez con la que se adoptan estas tecnologías y la importancia crítica de mantener la confianza en los medios de comunicación en una era de información saturada (Qu y Baek, 2023).
Ante este escenario, el presente estudio se propone abordar esta brecha en el conocimiento. El objetivo central es evaluar la influencia del tipo de emisor del mensaje -sea una persona real, un avatar parecido a humano o un avatar claramente ficticio- en la percepción de credibilidad de la información presentada. En una época donde cada vez más personas consumen noticias y contenidos a través de medios digitales, se vuelve vital entender cómo el tipo de emisor afecta la percepción de credibilidad.
Para abordar este objetivo, se diseñó un experimento 3 x 1, involucrando a estudiantes de la tercera universidad pública más importante de Colombia. Se creó una pieza comunicativa de un minuto que presentaba un revolucionario hallazgo científico ficticio, un escáner portátil llamado SkinSpect, que puede usarse para detectar anomalías y enfermedades de la piel, entre ellas el cáncer. En el primer grupo, la información fue transmitida por una persona real. En el segundo, un avatar con apariencia muy humana fue el emisor, mientras que en el tercer grupo un avatar claramente ficticio presentó la misma información. Un total de 150 estudiantes participaron, subdivididos en tres grupos de 50 personas cada uno, y se utilizaron análisis de varianza (analysis of variance - Anova) para examinar las diferencias entre los grupos.
Este artículo se estructura en seis secciones. Tras esta introducción, el segundo apartado se sumerge en los referentes teóricos y proporciona un panorama general de la evolución y el impacto de los avatares en la comunicación digital. El tercer apartado detalla la metodología empleada, mientras que el cuarto presenta los resultados descriptivos y los empíricos. En el quinto segmento se ofrece una discusión detallada de los hallazgos, seguida de las conclusiones, en el sexto apartado, junto con las limitaciones del estudio y propone futuras líneas de investigación.
Marco teórico
Avatares y agentes conversacionales de IA
En los últimos años los avatares y agentes conversacionales impulsados por inteligencia artificial (IA) han emergido como herramientas esenciales en la interacción entre seres humanos y máquinas, actuando como mediadores digitales en una amplia gama de entornos, desde aplicaciones móviles hasta sistemas empresariales (Liew et al., 2017). Estos avatares de IA, más que simples representaciones, encapsulan características humanas avanzadas y abarcan no solo aspectos visuales, sino también modismos, gestos y otras sutilezas del comportamiento humano (Miao et al., 2022).
Por otro lado, los agentes conversacionales van más allá de ser simples programas: son entidades de IA diseñadas para comprender, procesar y responder en lenguaje natural y ofrecen diálogos coherentes y enriquecidos que se sienten genuínos y auténticos para el interlocutor humano (Hoyet et al., 2019). Las innovaciones en campos como el procesamiento de lenguaje natural, el reconocimiento de voz y la síntesis de imágenes han posibilitado la creación de avatares y agentes que bordean la línea entre la realidad y la virtualidad. Plataformas reconocidas como Alexa, Siri y Watson son testimonio de las prodigiosas habilidades conversacionales que la IA puede alcanzar, que ha revolucionado la forma en que las personas interactúan con la tecnología (Keeling et al., 2010). De manera complementaria, firmas innovadoras como Soul Machines, D-ID y Synthesia están a la vanguardia en la creación de avatares digitales, aprovechando técnicas de aprendizaje profundo (deep learning) y gráficos computarizados para dar vida a representaciones humanoides sorprendentemente realistas (Seymour et al., 2020). Estos avances sugieren una nueva era de interacción humano-computadora, donde los avatares y agentes conversacionales empiezan a jugar un papel central en campos como la educación en línea, la salud mental, periodismo y la cultura, pues facilitan nuevos entornos para el aprendizaje, enriquecen la experiencia terapéutica virtual y facilitan las vivencias en museos virtuales mediante narraciones afectivas (Ausburn et al., 2009; Rehm et al., 2016; Sylaiou et al., 2020), con lo cual también mejoran la divulgación, calidad y presentación de las noticias en medios periodísticos de gran impacto, al proporcionar a los expertos nuevas herramientas para la investigación y la verificación de datos que se reflejan en la aceptación de los receptores (Ufarte-Ruiz et al., 2023).
La investigación ha demostrado que los humanos responden socialmente a estos avatares y agentes de IA y les atribuyen patrones de conducta e intenciones humanas, lo que plantea interrogantes sobre cómo la antropomorfización de estas tecnologías influye en su efectividad para propósitos comunicativos diversos (Li et al., 2023). Este fenómeno se ve reforzado por estudios que exploran el antropomorfismo en contextos de interacción humano-computadora y resaltan la importancia de manipulaciones en la apariencia física y la necesidad de entender mejor cómo diferentes avatares producen efectos actitudinales, sociales, perceptuales y de comportamiento distintos (Nowak y Fox, 2018; Frazer, 2022). Otros autores, como Pérez-Seijo et al. (2020), reconocen el potencial de la IA en la democratización de la información, al dar a todos la oportunidad de producir y compartir noticias, y argumentan que esta puede ayudar a combatir la desinformación, al proporcionar a los usuarios datos precisos y verificables, como un componente de reconocimiento sobre el avance en la aceptación social en el escenario pospandémico.
Credibilidad percibida del mensaje
La credibilidad del mensaje aparece cuando el receptor percibe el mensaje como verdadero, confiable y válido, siendo además un aspecto fundamental en la comunicación, ya que determina en gran medida si los receptores creen en un mensaje y lo aceptan (Shamim et al., 2022). La credibilidad de un mensaje depende de varios factores. Uno de ellos es la fuerza de los argumentos presentados en él, de modo que aquellos que presentan argumentos convincentes, válidos y lógicos tienden a percibirse como más creíbles (Li y Suh, 2015). La fuerza de los argumentos se puede evaluar en función de su coherencia interna y completitud, así como de la lógica empleada para conectar las premisas con las conclusiones (Kim y Benbasat, 2009). Un receptor que percibe que la información tiene argumentos válidos desarrollará una actitud positiva hacia el mensaje y lo considerará más creíble (Li y Suh, 2015).
Otro factor clave es la claridad de la información comunicada en el mensaje. Mensajes que transmiten la información de forma coherente, precisa y fácil de entender se perciben como más creíbles (Martín-Santana et al., 2017). La claridad se relaciona con la calidad de la representación de la información y su facilidad para ser comprendida por la audiencia (Kahn et al., 2002). También es importante la fuente del mensaje, incluyendo la experiencia y fiabilidad del emisor (Li y Suh, 2015). Un experto en un tema generalmente se percibe como una fuente más fiable y creíble que alguien sin conocimiento en esa área (Derdenger et al., 2018). En el contexto de las redes sociales, la familiaridad con el autor del mensaje influye en la credibilidad, ya que los mensajes de extraños se perciben como menos creíbles (McGloin et al., 2014). En internet, particularmente, el medio por el que se transmite el mensaje también afecta su credibilidad. Por ejemplo, la interactividad, transparencia y dependencia del medio son factores que incrementan la credibilidad de los mensajes en redes sociales (Li y Suh, 2015).
Teniendo en cuenta la importancia que tiene la fuente del mensaje y la familiaridad del autor en la credibilidad del mensaje, es consecuente pensar que en internet los mensajes transmitidos por humanos y por avatares creados con inteligencia artificial pueden tener efectos distintos en la credibilidad. Incluso el uso de avatares más y menos realistas podría desencadenar efectos distintos en la credibilidad del mensaje.
Uso de avatares IA y su influencia en la credibilidad del mensaje
La comprensión de cómo los avatares creados con inteligencia artificial (IA) influyen en la percepción de la credibilidad del mensaje es un área aún en desarrollo. A pesar de que los estudios realizados hasta la fecha presentan resultados heterogéneos, hay algunas tendencias notables. Por ejemplo, investigaciones de Baylor (2009) e Ilves (2013) sugieren que avatares con un alto grado de realismo pueden aumentar la percepción de credibilidad. Esta percepción se acentúa al observar avatares que presentan características y expresiones faciales próximas a las humanas. Una posible explicación radica en que estos avatares activan normas sociales en la interacción, y llevan a una percepción de mayor competencia social y, por tanto, a mayor credibilidad (Miao et al., 2022). Esta tendencia se refuerza con la noción del efecto antropomórfico: cuanto más humano se perciba un avatar, mayores serán las expectativas sociales y, por consiguiente, la credibilidad otorgada (Wang et al., 2019).
En contraposición, es importante destacar que otras investigaciones han encontrado que los avatares menos parecidos a los humanos se perciben como más creíbles y simpáticos que los más realistas (Hooi y Cho, 2014). Para explicar este fenómeno, se ha propuesto la hipótesis del valle inquietante. Según esta hipótesis, las respuestas de las personas a los agentes no humanos son más positivas cuanto más se parece el agente a un humano, pero hasta cierto punto. Cuando el avatar es exageradamente parecido a un ser humano, puede empezar a generar reacciones negativas en el espectador (Mori et al., 2012). Esto sucede porque, en la medida en que el agente se asemeja demasiado a una persona real, cualquier pequeña imperfección o diferencia se vuelve muy notoria y produce una sensación de inquietud o rechazo en el receptor.
Al comparar seres humanos con avatares impulsados por IA en términos de transmisión de información, se ha observado una tendencia generalizada: las personas suelen ser vistas como más creíbles. Por ejemplo, en el ámbito educativo, los estudiantes tienden a confiar más en un profesor real que en un avatar (Vallis et al., 2023). En el sector turístico, los anuncios con agentes de viajes reales generan una percepción más favorable que aquellos con avatares realistas (Seymour et al., 2020). Esta tendencia podría radicar en la predisposición humana a confiar en interacciones y experiencias conocidas, ya que el contacto humano directo establece un nivel de confianza basado en la empatía y reciprocidad, aspectos aún no replicados plenamente por avatares de IA (Endo y Fujinami, 2023).
Dada la divergencia de hallazgos, esta investigación busca discernir las potenciales diferencias en la credibilidad al utilizar distintos portavoces para transmitir noticias, centrándose en un portavoz humano, un avatar realista y un avatar evidentemente ficticio. A partir de esto, planteamos las siguientes preguntas de investigación: ¿cuál es el nivel de realismo percibido por los receptores respecto a los avatares ficticios, avatares realistas y portavoces humanos? (Pl); ¿cuál es la percepción de credibilidad que tienen los receptores al recibir una noticia de un portavoz humano en comparación con avatares creados por inteligencia artificial? (P2); ¿existen diferencias significativas en la percepción de credibilidad entre un avatar realista y uno evidentemente ficticio al transmitir una noticia? (P3); ¿cuál es la influencia del género del receptor en la percepción de credibilidad en cada uno de los escenarios? (P4); ¿cuál es la influencia de la edad del receptor en la percepción de credibilidad para cada uno de los escenarios? (P5).
Metodología
Para establecer la influencia del uso de avatares en la credibilidad de la información se aplicó un estudio experimental. Esta es una metodología de investigación diseñada para analizar relaciones bajo condiciones controladas, donde se manipulan una o más variables independientes para observar su efecto sobre una o más variables dependientes (Grahl et al., 2023). El experimento se consideró la mejor técnica para evaluar la credibilidad de noticias difundidas por humanos y avatares creados con inteligencia ar-tificial debido a su capacidad para controlar variables extrínsecas y enfocarse específicamente en el impacto del tipo de emisor en la percepción de credibilidad (Willoughby y Liu, 2018). Esta precisión y control permiten una interpretación más clara de los efectos directos del emisor en la credibilidad percibida, un aspecto crucial para entender la influencia de la inteligencia artificial en la comunicación digital.
El experimento consistió en un diseño entre sujetos 3 x 1, en el que se evaluaron tres condiciones de emisores del mensaje: una persona real, un avatar que parecía humano o avatar realista y un avatar evidentemente ficticio. La variable dependiente del estudio fue la percepción de credibilidad de la información presentada en el video titulado "Un escáner portátil para detectar enfermedades en la piel", en el cual el presentador (humano, avatar realista o avatar ficticio) exponía un nuevo invento tecnológico ficticio, llamado SkinSpect, que funciona como escáner portátil para detectar diversas enfermedades de la piel. A continuación, se presenta el mensaje del video:
Desde los laboratorios de la Universidad politécnica de Hong Kong surge una revolución en la detección temprana de enfermedades de la piel. Conocido como SkinSpect, este innovador escáner utiliza la última tecnología en espectroscopía para analizar a profundidad la piel humana. Capaz de identificar cambios y anomalías a nivel microscópico, SkinSpect promete ser una herramienta invaluable en la detección precoz de condiciones dermatológicas, como el cáncer de piel. Los especialistas en dermatología alrededor del mundo ven en SkinSpect un potencial enorme para revolucionar la forma en que se diagnostican y tratan enfermedades de la piel. Tres años de investigación y desarrollo fueron necesarios para garantizar la precisión y confiabilidad del escaneo. SkinSpect es una muestra de cómo la ciencia y la tecnología pueden unirse para mejorar y preservar la salud de la humanidad.
Antes de la implementación del estudio principal, se realizó un pretest con 15 estudiantes para probar la claridad del instrumento de medición. Basándose en sus comentarios, se hicieron ajustes mínimos para mejorar la comprensión de algunas preguntas y garantizar así que las mediciones fueran precisas y fiables.
Para la aplicación principal del cuestionario, mediante un muestreo no probabilístico -por bola de nieve- se seleccionaron 150 estudiantes de administración de empresas de una universidad en el sur occidente colombiano. Estos estudiantes fueron invitados a un salón de clases donde se les mostró un video de 60 segundos. En este video, un portavoz presentaba la noticia disruptiva. Dependiendo del grupo, el presentador variaba: para el primer grupo era una persona real, para el segundo un avatar realista y para el tercero un avatar claramente ficticio. En todos los casos, el contenido de la noticia permaneció constante, lo que aseguró que cualquier diferencia en la percepción de credibilidad fuera atribuible al tipo de emisor y no a variaciones en el contenido de la información presentada. Para asegurar una evaluación coherente de la credibilidad de la información entre los participantes, se les proporcionó una orientación clara sobre cómo percibir y evaluar la credibilidad en el contexto del experimento. Esto se hizo con el fin de homogeneizar la comprensión del concepto evaluado. Es importante mencionar también que los participantes se asignaron aleatoriamente a uno de los tres grupos experimentales. Esta técnica redujo el riesgo de sesgos en la selección y aseguró una distribución equitativa de cualquier variable no controlada que pudiera influir en los resultados. La Figura 1 muestra capturas de pantalla de los escenarios.
Tras la presentación del video, a cada participante se le proporcionó un instrumento de medición autoadministrado. Este instrumento se basó en la escala aplicada por Li y Suh (2015) que contiene cuatro ítems para medir la credibilidad percibida de la información, en una escala de Likert de cinco puntos. A su vez, esta escala fue adaptada del documento de Kahn et al. (2002), que cuenta con más de 500 citas en Scopus para 2023. Vale la pena destacar que esta escala ha sido citada y adaptada recurrentemente en estudios que analizan la credibilidad de la información en entornos digitales (La Barbera et al., 2023; Tatpornpan et al., 2023; Shamim et al., 2024). A continuación, en la Tabla 1 se presentan los ítems adaptados de la escala de medición.
Credibilidad de la información | |
---|---|
Ítem 1 | En general, pienso que la información en la noticia es creíble. |
Ítem 2 | En general, considero que la información en la noticia es objetiva. |
Ítem 3 | En general, pienso que la información en la noticia es verídica. |
Ítem 4 | En general, pienso que la información en la noticia es digna de confianza. |
Fuente: elaboración propia.
La iabilidad de la escala se evaluó mediante el alfa de Cronbach, que arrojó un valor de 0,841, superior al umbral de 0,70 recomendado por Hair et al. (2009). Posteriormente, para consolidar la variable, se aplicó un aná lisis de componentes principales.
Resultados
Descripción de la muestra
La muestra estuvo compuesta por 150 estudiantes, de los cuales el 48% eran mujeres y el 52% hombres. Cada uno de los tres escenarios (persona real, avatar realista y avatar ficticio) tuvo asignados 50 estudiantes. Además del género, se recogieron datos demográficos como la edad, con un mínimo de 16 años y un máximo de 38, una media de 22 y una desviación estándar de 4,1. A continuación, en la Tabla 2 se muestran los estadísticos descriptivos de los sujetos.
Control de manipulación
Se realizaron pruebas t de una muestra para asegurar que las manipulaciones fueron comprendidas adecuadamente por los encuestados (Tabla 3). A los participantes que vieron a la persona real se les preguntó si percibían al emisor del mensaje como una persona real, puntuando 1 como "no real" a 5 como "muy real". Para el escenario 1, que presentaba a una persona real, la percepción promedio de realismo fue de 3,44, lo que indica una tendencia hacia el realismo, significativamente por encima del punto medio neutral de la escala (valor t = 3,01, p < 0,005), esto refleja una clara percepción por los participantes de la autenticidad de la persona real. En contraste, el escenario 2, que presentaba un avatar realista, mostró una percepción media de 2,3, un valor significativamente inferior al punto neutral (valor t = -4,98, p < 0,001). Esto sugiere que los participantes percibieron al avatar realista como menos realista de lo que se podría esperar en un punto medio de la escala. Finalmente, el escenario 3, que presentaba un avatar ficticio, tuvo una percepción media de 1,72, indicador de una percepción significativamente baja de realismo (valor t = -12,91, p < 0,001), lo cual resalta la clara distinción que los participantes hicieron entre el avatar ficticio y cualquier connotación de realismo. Estos resultados evidencian una gradación en la percepción de realismo que disminuye significativamente desde la persona real hasta el avatar realista y alcanza el punto más bajo con el avatar ficticio.
Análisis empírico
Para revisar las diferencias significativas en la percepción de credibilidad, de acuerdo con los tres escenarios propuestos (persona real, avatar realista y avatar ficticio), se aplicó un análisis de varianza (Anova) de tres factores. Luego se aplicó la prueba post-hoc de Tukey para encontrar las diferencias particulares en cada escenario. Posteriormente, para incluir las covariables, se aplicó un análisis de la covarianza (Ancova), lo que permitió analizar el efecto del género y la edad en la percepción de credibilidad en cada uno de los escenarios propuestos. Es importante señalar que antes de proceder a la aplicación de las pruebas se comprobó el supuesto de normalidad mediante la prueba de Shapiro Wilk. Esta arrojó un valor de 0,735, lo cual sugiere que no existe evidencia suficiente para rechazar la hipótesis nula de normalidad en la distribución de los datos. A continuación, en la Tabla 4 se muestra el resultado del Anova.
Estadístico F | Valor p | |
---|---|---|
Credibilidad percibida de la información | 4,412 | < 0,013 |
Fuente: elaboración propia.
Como puede apreciarse en la Tabla 4, existe una diferencia estadísticamente significativa en las calificaciones de credibilidad entre los diferen tes escenarios, que se refleja en un estadístico de F de 4,412 con un valor p < 0,013. Esto indica que el tipo de avatar (persona real, avatar realista o avatar ficticio) empleado en los videos tiene un efecto significativo en la percepción de credibilidad del mensaje por parte de los espectadores. El valor de F sugiere que la variación entre las medias de los grupos es mayor de lo que se esperaría por azar, teniendo en cuenta la variación dentro de los grupos.
Prueba post-hoc
Para determinar las diferencias específicas entre los escenarios en términos de la credibilidad de la información, se llevó a cabo un análisis post-hoc utilizando la prueba de Tukey. A continuación, la Tabla 5 presenta las medias y diferencias de medias entre los diferentes escenarios respecto a la fuerza de los argumentos.
Escenario | Media | Comparación | Diferencias de medias | Intervalos de confianza | Valor P |
---|---|---|---|---|---|
Persona real | 3,30 | Avatar realista | -0,450 | -0,833-0,066 | 0,0170 |
Avatar ficticio | -0,373 | -0,757-0,010 | 0,0585 | ||
Avatar realista | 2,85 | Avatar ficticio | 0,076 | -0,307-0,460 | 0,8740 |
Avatar ficticio | 2,93 | - | - | - | - |
Fuente: elaboración propia.
Como se aprecia en la Tabla 5, entre el escenario 1 (persona real) y el escenario 2 (avatar realista), la diferencia en las medias de credibilidad es de -0,45, con un intervalo de confianza que va de -0,8338 a -0,0662 y un valor p ajustado de 0,017, lo cual es significativo al nivel de 0,05 e indica que hay una diferencia considerable y que la credibilidad percibida para el avatar realista es menor que para la persona real. Entre el escenario 1 (persona real) y el escenario 3 (avatar ficticio), la diferencia en las medias es de -0,3733 con un intervalo de confianza que va de -0,7571 a 0,0105 y un valor p ajustado de 0,0585, diferencia que no es estadísticamente significativa al nivel de 0,05, aunque está muy cerca del umbral. Finalmente, entre el escenario 2 (avatar realista) y el escenario 3 (avatar ficticio), la diferencia en las medias es de 0,0767 con un intervalo de confianza que va de -0,3071 a 0,4605 y un valor p ajustado de 0,874, lo que implica que esta diferencia tampoco es estadísticamente significativa.
Análisis de covarianza (Ancova)
Como se dijo, se utilizó un análisis de covarianzas (Ancova) para incluir dentro del análisis los efectos de la edad y el género. Antes de proceder a aplicar el Ancova se probó el supuesto de multicolinealidad, para asegurar que las variables independientes (escenario y género) y la covariable (edad) no estuvieran perfectamente correlacionadas. Para esto, se aplicó un modelo de regresión lineal por mínimos cuadrados ordinarios (MCO) y después se obtuvo el factor de inflación de la varianza (FIV). La Tabla 6 presenta los resultados de esta estimación.
Como puede apreciarse en la Tabla 6, los valores del FIV se encuentran dentro de los rangos esperados de acuerdo con Hair et al. (2009). Tras comprobar el cumplimiento de este supuesto se procedió a aplicar el Ancova, cuyos resultados se evidencian en la Tabla 7.
Efecto | F | P |
Modelo corregido | 3,338 | 0,004 |
Escenario | 6,815 | 0,005" |
Género | 0,144 | 0,633 |
Edad | 0,063 | 0,752 |
Género* Escenario | 6,737 | 0,006"* |
R2 Ajustado = 0,165 |
* p < 0,1; ** p < 0,05; *** p < 0,01.
Fuente: elaboración propia.
Como puede apreciarse en la Tabla 7, el modelo corregido fue estadísticamente significativo, con F = 3,380, p = 0,004, lo que explica el 16,5% de la variación en la credibilidad. Al examinar los efectos principales, se encontró nuevamente que el escenario, ya fuera persona real, avatar realista o avatar ficticio, tiene un impacto significativo en la credibilidad (F = 6,815, p = 0,005). En contraste, ni el género (F = 0,144, p = 0,633) ni la edad (F = 0,063, p = 0,752) de los participantes demostraron tener un efecto significativo en la credibilidad por sí solos. No obstante, la interacción entre el género del sujeto y el escenario sí resulto ser significativa (F = 6,737, p = 0,006). Este hallazgo apunta a que la influencia del género en la percepción de la credibilidad no es uniforme en los diferentes escenarios, sino que varía de manera significativa dependiendo del contexto específico presentado. Para profundizar en este punto, se obtuvo el gráfico de interacción que se presenta en la Figura 2.
El gráfico de interacción proporciona una representación visual de cómo la credibilidad se ve afectada por la interacción entre el género y el escenario. Las mujeres (género 1) muestran una mayor credibilidad en los escenarios 1 (línea azul) y 2 (línea roja), lo que implica que cuando el presentador es una persona real o un avatar realista ellas tienen una mayor credibilidad. En contraste, en el escenario 3, representado por la línea verde, se aprecia una mayor credibilidad en los hombres, lo que implica que estos tienden a confiar más en avatares ficticios que las mujeres.
Discusión de resultados
El estudio experimental realizado ofrece un análisis detallado y metódico sobre la influencia de diferentes tipos de emisores (humanos, avatares realistas y avatares ficticios) en la percepción de credibilidad de la información. A través de un diseño metodológico riguroso y un análisis estadístico robusto, esta investigación aporta evidencia empírica sobre cómo la presentación del emisor afecta la credibilidad atribuida por los receptores.
En términos del realismo percibido (P1), los resultados descriptivos, específicamente los análisis de las pruebas t, confirman una jerarquía esperable, con puntuaciones decrecientes desde humanos a avatares realistas y, finalmente, avatares ficticios, lo que es coherente con la literatura existente (Grewe et al., 2021). No obstante, es llamativo que, incluso para el caso de la persona real, la percepción promedio de realismo se ubicó solamente en un 3,44 dentro de la escala. Esto podría deberse a que los participantes, al ser universitarios jóvenes, están ampliamente expuestos a avatares de alta calidad en medios digitales, lo que genera confusión y escepticismo sobre lo que es "real" (Latoschik et al., 2017).
Respecto a la credibilidad percibida de la información (P2), que se aborda en las pruebas Anova y post-hoc, se resalta que el tipo de emisor sí incide significativamente. En línea con estudios previos (Seymour et al., 2020; Vallis et al., 2023), se confirma una ventaja de humanos sobre avatares realistas, lo que sugiere que, a pesar de los avances en la tecnología de la IA, hay elementos intrínsecamente humanos, como la empatía y la reciprocidad, que son esenciales para establecer la confianza y que aún no se replican completamente en los avatares (Endo y Fujinami, 2023). De manera intrigante, la ausencia de diferencias significativas entre humanos y avatares claramente ficticios podría interpretarse como una indicación de que los emisores que no imitan precisamente la apariencia humana no activan las expectativas sociales convencionales y eluden el llamado valle inquietante (Mori et al., 2012). Este resultado abre el debate sobre la posible dualidad del efecto: por un lado, los avatares ficticios, al ser reconocidos claramente como no humanos, podrían ser menos susceptibles de desconfianza. Por otro, puede haber un riesgo de que se utilicen para propagar desinformación sin ser considerados menos creíbles que los humanos (Carnevale et al., 2023).
En contraste con lo esperado (P3), no se hallaron diferencias significativas en la credibilidad entre avatares realistas y ficticios, lo que sugiere que los elementos de diseño que contribuyen a la percepción de realismo o ficción no afectan la credibilidad asignada. Esto lleva a reflexionar sobre cómo la presentación estética de un emisor puede o no ser un factor tan crítico como la calidad y el contexto de la información proporcionada (Wang et al., 2021). Otra posible explicación puede estar relacionada con los sesgos de confirmación, de modo que los participantes podrían haber tendido a buscar y focalizarse selectivamente en evidencia que confirma sus expectativas iniciales sobre cada avatar, por ejemplo, esperar que el avatar realista fuera más creíble y que el ficticio fuera menos creíble, de este modo esta circunstancia podría haber enmascarado diferencias reales en sus comportamientos. Finalmente, teniendo en cuenta que el experimento fue aplicado a jóvenes universitarios, es probable que este tipo de personas estén ampliamente familiarizados con avatares ficticios, como personajes de dibujos animados o de videojuegos con apariencia no realista y, por tanto, esto pudo ocasionar que no percibieran a estos avatares como extraños o amenazantes y se eliminaran diferencias de credibilidad (Teng, 2019). En este sentido es importante que futuras investigaciones consideren evaluar y controlar el nivel de exposición previa.
En cuanto a diferencias demográficas, los resultados del Ancova resaltan una interacción entre género y tipo de emisor (P4). Las mujeres otorgaron mayor credibilidad a humanos y avatares realistas, mientras los hombres confiaron más en avatares ficticios. Esto podría atribuirse a que las mujeres asignan más importancia a señales sociales y emocionales al evaluar fuentes de información (Lenuta, 2016). La edad de los participantes no evidenció un efecto independiente (P5), probablemente debido al rango etario reducido de la muestra. Futuros estudios con muestras más diversas en edad podrían esclarecer este punto.
En síntesis, si bien esta investigación no dilucida todos los matices, sí aporta evidencia novedosa de que la credibilidad de los avatares de IA tiene límites frente a la de los humanos reales. Conforme estas tecnologías se vuelven omnipresentes, se requieren más estudios interdisciplinarios para garantizar un uso ético y responsable que promueva el bienestar humano.
Conclusiones y recomendaciones
Los resultados de este estudio experimental ofrecen conclusiones valiosas sobre el impacto del tipo de emisor en la credibilidad percibida de las noticias tecnológicas. A continuación, se presentan las más importantes que se relacionan con las preguntas de investigación inicialmente formuladas. Respecto a la primera pregunta de investigación (P1), sobre las diferencias en el realismo percibido de cada emisor, los resultados indican una gradación decreciente desde los humanos reales, pasando por avatares realistas hasta llegar a los avatares ficticios. Incluso en el caso de la persona genuina, llama la atención que la puntuación promedio de realismo percibido no alcanzó valores máximos en la escala. Esto podría atribuirse a la familiaridad de los participantes con avatares digitales realistas, lo que dificulta distinguir entre realidad y ficción (Latoschik et al., 2017).
Pasando a la pregunta 2, sobre diferencias en credibilidad entre humanos y avatares, se confirma una ventaja significativa de las personas reales frente a los avatares realistas, en línea con estudios previos (Seymour et al., 2020; Vallis et al., 2023). Esto sugiere que, a pesar de los rápidos avances en las capacidades gráficas y conversacionales de la IA, aún persiste una ventaja humana inherente para establecer credibilidad, confianza y conexión emocional. Los humanos poseen sutilezas como lenguaje corporal, entonación vocal y expresiones faciales que refuerzan la empatía, elementos que los avatares más realistas aún no logran replicar a cabalidad (Endo y Fujinami, 2023). Por otro lado, el estudio también revela que no hubo diferencias estadísticamente significativas entre la condición de persona real y avatar ficticio. Esto implica que la apariencia claramente artificial de un avatar no necesariamente disminuye la credibilidad frente a un humano real. Una posible explicación es que los avatares ficticios, al distanciarse de la apariencia humana, evitan despertar expectativas sociales tan elevadas y el efecto del valle inquietante, lo que las hace tan creíbles como una persona (Mori et al., 2012). No obstante, esto también abre la puerta al riesgo de difundir información engañosa sin levantar sospechas.
En relación con la pregunta 3, que examina distinciones entre avatares realistas y ficticios, no se hallaron divergencias significativas en términos de credibilidad. Esto indica que los aspectos estéticos y de diseño que señalan ficción o realismo tienen una influencia mínima, siendo más relevantes otros aspectos de la comunicación como la calidad de los argumentos y el contexto (Wang et al., 2021). Pasando a las preguntas demográficas, se destaca una interacción entre género y tipo de emisor (P4), lo que denota la mayor relevancia de las claves sociales y emocionales para las mujeres al evaluar fuentes informativas (Lenuta, 2016). En contraste, la edad no mostró un efecto independiente (P5), probablemente debido al estrecho rango etario de los participantes.
En cuanto a las recomendaciones, se destaca la necesidad de mayor investigación interdisciplinaria para discernir los matices psicológicos y éticos en el uso de avatares para propósitos informativos. Los resultados de este estudio resaltan que, a medida que los avatares ganan popularidad, deben implementarse salvaguardas para evitar la diseminación de noticias falsas y preservar la integridad de los medios. Así mismo, es esencial fomentar entre las personas, especialmente en las jóvenes, el desarrollo de un pensamiento crítico que evalúe la calidad de los argumentos y el contexto, más allá de la apariencia del emisor. Las plataformas que adopten avatares deben ser transparentes sobre su naturaleza no humana y rendir cuentas sobre la veracidad de la información que difunden.
Por último, es importante considerar las implicaciones éticas a medida que avanzamos en una era donde la IA y los avatares tienen roles más prominentes en la sociedad, y es fundamental considerar hasta qué punto deberíamos permitir que los avatares reemplacen las interacciones humanas y cómo garantizamos que la información presentada por avatares sea transparente y no sesgada.
En cuanto a las limitaciones y futuras líneas de investigación, si bien este estudio experimental arroja resultados novedosos, también es importante reconocer algunas limitaciones que brindan oportunidades para expansiones futuras. En primer lugar, la muestra se limitó a estudiantes universitarios de una región específica. Dado que los jóvenes están más familiarizados con la tecnología, sus reacciones a los avatares podrían diferir de otros grupos etarios. Futuros estudios deberían incorporar muestras más amplias y representativas de la población, considerando variables de control como edad, género, nivel educativo, ubicación geográfica y experiencia previa con este tipo de avatares.
Otra limitación fue la duración relativamente corta de los videos experimentales, lo cual no permite capturar potenciales cambios en las percepciones con una exposición más prolongada a los avatares. Investigaciones longitudinales, con seguimiento a lo largo de semanas o meses, aportarían comprensión sobre la evolución en las actitudes. Asimismo, al centrarse en noticias tecnológicas, no queda claro si los resultados se extrapolan a otros ámbitos temáticos, como política, deportes o entretenimiento. Evaluar diferentes dominios en futuras réplicas robustecería la validez externa. Adicionalmente, el contexto experimental limita la naturalidad de la exposición mediática; observar comportamientos reales en redes sociales aumentaría la validez ecológica.
En términos metodológicos, una ruta prometedora sería complementar los cuestionarios cuantitativos con técnicas cualitativas como grupos focales o entrevistas en profundidad. Esto permitiría comprender con mayor riqueza los razonamientos subjetivos detrás de las percepciones. Además, incorporar medidas fisiológicas y de neuroimagen aportaría evidencia objetiva sobre las reacciones emocionales generadas.
Otra área fértil para la investigación futura es examinar un rango más amplio de variables dependientes relacionadas con la experiencia del usuario, más allá de la mera credibilidad percibida. Por ejemplo, sería valioso evaluar la satisfacción, la intención de uso y el involucramiento (engagement) con los avatares. Esto orientaría el diseño para optimizar su aceptación y efectividad. Finalmente, a medida que los avatares de IA se vuelven más sofisticados, un imperativo ético será estudiar sus implicaciones sociales a largo plazo. Temas críticos incluyen la privacidad de los datos, sesgos algorítmicos potenciales y los efectos en las relaciones humanas. La investigación interdisciplinaria con expertos en ética, sociología y política será esencial para guiar el desarrollo responsable de esta tecnología emergente.