Introducción
El ChatGPT fue desarrollado por Open AI con el objetivo de imitar conversaciones humanas mediante réplicas a palabras clave que son reconocidas mediante algoritmos programados1. Fue conocido y rápidamente viralizado desde el 30 de noviembre del año 2022 y se dispuso de manera gratuita. Está construido a partir de un modelo de lenguaje GPT-3.5 y, aunque no es el primer sistema de inteligencia artificial generativa, destaca sobre los modelos anteriores por su amplio procesamiento de lenguaje natural. Por ejemplo, genera escritura recreativa desde poesía hasta conversaciones con sentido propio. Asimismo, logra generar contenido de diferente tipo, como texto y archivos multimedia a partir de los datos con los cuales fue previamente entrenado2. Gracias a su capacidad de dar respuesta a todo tipo de cuestión, reúne una amplia variedad de usuarios que comprende distintas generaciones, campos y continentes3.
La medicina es un área de base científica que se apoya en la tecnología para facilitar los procesos que esta requiere. Este tipo de inteligencia artificial es una tecnología de asistencia como la realidad virtual, las cuales fueron creadas para remodelar flujos de trabajo4. Por lo cual se convierte en un foco de interés para el área de la salud. Indudablemente, todo sistema tiene sus fallas y limitaciones. Sin embargo, el ChatGPT posee la facultad de mejorar su rendimiento mediante técnicas de aprendizaje automático para atender a las necesidades de una manera más exacta y por consecuencia obtener resultados reales1. Aparentemente, este sistema automatizado es apto tanto para orientar un diagnóstico avanzado (asistido por computador), como para respaldar decisiones, terapias y rehabilitación médica4. De manera que este material podría favorecer el proceso de aprendizaje.
Por otro lado, está involucrado en la academia, principalmente en el área de la salud. Se ha visto que permite resolver exámenes de medicina tanto de pre-grado como posgrado5. La preocupación radica en la integridad académica ante su función de generar textos2. De modo que no se ha establecido si sobrepasa los límites éticos y se desconoce hasta qué punto reemplazaría esta labor científica que el humano ha desarrollado y perfeccionado. En síntesis, ChatGPT es una herramienta novedosa que tiene su lugar en el área de la salud. Razón que nos motivó a tener como objetivo en este manuscrito identificar y analizar la tendencia de las publicaciones sobre ChatGPT en el ámbito de la medicina a nivel mundial desde su lanzamiento.
Método
Se realizó un análisis bibliométrico descriptivo, de corte retrospectivo, tomando literatura médica disponible en las bases de datos de Medline y Embase relacionado con ChatGPT en el área de la salud, desde el 2022 hasta el 2023, como se mencionó previamente.
Búsqueda y análisis bibliométrico
Las dos bases de datos fueron consultadas en abril de 2023 utilizando la estrategia de búsqueda: (ChatGPT) [Title/Abstract]. Incluimos artículos originales, cartas al editor, opiniones, comentarios y reportes de casos, entre otros, con el propósito de abarcar todo el material literario disponible. Se tuvieron en cuenta solo artículos en inglés. Obtuvimos información sobre: tipo de documento, número de publicaciones por revistas y países. Para obtener el factor de impacto (FI) utilizamos el Journal Citation Reports 2021 (Clarivate, London) para estimar la calidad de las revistas y estimamos el índice H mediante SCImago. Analizamos estos datos de manera estadística y descriptiva para la obtención de resultados. Posteriormente elaboramos tablas y gráficas con el programa Microsoft Office Excel (2021, versión 18.0).
Análisis por mapeo
Realizamos un mapeo bibliográfico mediante la herramienta VOSViewer (Centre for Science and Technology Studies, Universiteit Leiden, Países Bajos), el cual nos permite exponer las áreas de investigación de mayor a menor frecuencia y/o importancia y el comportamiento de la tendencia en las palabras claves sobre nuestro tema de interés. En consecuencia, se evaluaron las correlaciones de palabras clave y de palabras clave en relación con título y resumen por técnicas de agrupamiento. Estimamos el Total Link Strength (TLS), que es la fuerza total de enlace, la cual establece cuánto se relaciona un ítem respecto a todos los demás. También se identificaron las interacciones de palabras clave de título y resumen con el objetivo de mapear el predominio de conocimiento científico. Finalmente, desarrollamos el análisis de coocurrencia para describir los campos y direcciones de la investigación.
En la figura 1 exponemos nuestra estrategia de búsqueda y elección de artículos incluyendo 309 relacionados con ChatGPT en el área de la salud desde el 2022. Como es un tema tan novedoso, identificamos que los artículos originales y las cartas al editor son los tipo de documentos más encontrados, como se ilustra en la figura 2.
En la tabla 1 observamos el top 10 de las revistas relacionadas con nuestro tema de interés, donde encontramos que la mayoría de ellas son estadounidenses, con el mayor número de publicaciones en total frente a otros países, sin embargo el factor de impacto más alto es de Nature (revista inglesa) y por consiguiente, tiene un mayor índice H.
Rango | Revista | País | Publicaciones | IF (2021) | JCR (2021) | indice H |
---|---|---|---|---|---|---|
1 | medRxiv | - | 33 | - | - | - |
2 | Cureus | Estados Unidos | 21 | - | Q3* | - |
3 | Nature | Inglaterra | 18 | 69.504 | Q1 | 1276 |
4 | Annals of biomedical engineering | Estados Unidos | 11 | 4.219 | Q2 | 141 |
5 | Aesthetic surgery journal | Estados Unidos | 7 | 4.485 | Q1 | 66 |
6 | Accountability in research | Estados Unidos | 6 | 3.057 | Q2 | 31 |
7 | Radiology | Estados Unidos | 6 | 29.146 | Q1 | 307 |
8 | Journal of educational evaluation for health professions | Corea del sur | 5 | - | Q3 | 11 |
9 | Medical teacher | Reino Unido | 5 | 4.277 | Q1 | 119 |
10 | Annals of surgical oncology | Estados Unidos | 4 | 4.339 | Q1 | 184 |
•2020 |
La figura 3 representa el panorama actual de mayor número de publicaciones relacionadas con nuestro tema alrededor del mundo. A modo general, el continente con mayor número de publicaciones es América (especialmente América del norte) seguido de Europa y Asia respectivamente. EE.UU. encabeza el top 10 de los países con mayor número de publicaciones (126), seguido de Inglaterra (63) y Países Bajos (12). Los países asiáticos que registraron publicaciones en nuestra búsqueda tenían cinco o menos publicaciones. Particularmente, en el 2022 tan solo fueron publicados ocho artículos (2,5%) y la mayoría durante el primer periodo del 2023.
Las palabras clave que fueron más frecuentemente encontradas por coocurrencia se exponen en la tabla 2. El top 3 en orden de mayor repetición se dispone así: «inteligencia artificial», «ChatGPT» y «humanos». Con una fuerza total de enlace de 129, 81 y 61 respectivamente.
Rango | Palabras clave | Frecuencia | TLS | Rango | Palabras clave | Frecuencia | TLS |
---|---|---|---|---|---|---|---|
1 | Inteligencia artificial (ai) | 68 | 129 | 10 | Medical Education | 8 | 24 |
2 | Chatgpt | 64 | 81 | 11 | Writing | 8 | 21 |
3 | Humans | 42 | 61 | 12 | Literary paternity | 8 | 27 |
4 | Machine Learning | 18 | 35 | 13 | Chatbots | 7 | 12 |
5 | Ethics | 12 | 33 | 14 | Large language models | 6 | 13 |
6 | Publication | 12 | 29 | 15 | Software | 5 | 12 |
7 | Chatbot | 11 | 27 | 16 | Education | 5 | » |
8 | Natural Language Processing | 10 | 24 | 17 | Communication | 5 | 7 |
9 | Language | 10 | 14 |
A continuación en la figura 4, respecto al mapeo mediante VOSviewer, se describen los tres grupos principales (mayoría de ítems). Grupo 1 (rojo) «futuro e innovación», que incluye: inteligencia artificial, ChatGPT, educación, procesamiento natural del lenguaje, educación médica y grandes modelos de lenguaje. Grupo 2 (verde) «investigación/publicaciones», que se compone de: aprendizaje automático, escritura, publicación, chatbots, ética. Grupo 3 (azul) «acceso a información», abarca: humanos, lenguaje, software y comunicación.
En el siguiente mapa (Fig. 5) graficamos la coautoría. Es decir, el enlace entre autores que comparten publicaciones tomando en cuenta tres artículos, con una fuerza total de enlace entre estos de 12. Como se puede ver en la figura 6, se ilustra por grupos la coocurrencia que existe entre los términos incluidos en título y resumen, siendo las más importantes «modelo de lenguaje», «paciente», «importancia», «autor», «impacto» y «caso».
En nuestro análisis por mapeo también identificamos que dentro de los términos más empleados actualmente se encuentran la inteligencia artificial, ChatGPT, educación médica, y humanos, por lo que se está enfocando en la posible relación de la inteligencia artificial y su impacto en la educación en un futuro, el cual aún estamos en búsqueda de esta dirección.
Discusión
El ChatGPT es una herramienta de inteligencia artificial que si bien no es la primera, ha sido revolucionaria por sus amplias características, pues abarca respuestas desde entretenimiento hasta el área de investigación más avanzada. Se han descrito diferentes utilidades en medicina tanto en la academia, resolución de exámenes, interpretación de exámenes médicos y redacción de textos científicos, este último ha sido altamente controvertido. A pesar de ser tan reciente se dispone de bastante literatura en nuestra área de interés teniendo en cuenta que la mayoría de artículos obtenidos son del presente año. EE.UU. es el país que lidera este tipo de publicaciones, lo cual es consistente con que sea el país más avanzado en tecnología actualmente.
Encontramos que la tendencia actual de publicaciones sobre ChatGPT en medicina incluye: comparaciones entre el sistema y estudiantes en interpretación de resultados de laboratorio; análisis de su rendimiento en responder exámenes avanzados de admisión o exámenes de pregrado de medicina y su comparación con el rendimiento de los estudiantes, y algunos tienen como objetivo evaluar su capacidad de redacción científica. En pocas palabras, los objetivos son evaluar su utilidad en la educación, investigación y práctica médica6-8.
Abdel et al. evaluaron a Chat GPT en un caso clínico de toxicología, considerándose sencillo para ser resuelto por un clínico. Su respuesta en dos ocasiones preguntada arrojó dos propuestas de tratamiento que coincidían con los estándares de manejo indicados9. Por lo contrario, Balel en su artículo realizó 30 preguntas a Chat GPT, de las cuales la mitad de las preguntas fueron realizadas por pacientes y las restantes realizadas por especialistas (se empleó tecnicismo acerca de cirugía maxilofacial). ChatGPT proporcionó información razonable, precisa y útil para los pacientes, pero no tuvo buen desempeño cuando se trataban de las preguntas técnicas avanzadas10.
Por otra parte, algunas especialidades médicas y otros campos de la salud han contribuido con su publicación con el ánimo de evaluar el desempeño de este chatbot en sus campos, como lo son: cirugía plástica11, psiquiatría12, neurología13, medicina interna14, ginecología y obstetricia15, oncología16 y ortopedia17, entre otras. Encontramos tres revistas urológicas con alta calidad científica las cuales aportaron su artículo en este campo. Andrew et al. evaluaron la posibilidad de facilitar tareas de baja complejidad a los urólogos con el objetivo de impactar en su dinámica de trabajo y permitirles enfocarse en lo esencial18.
Adicionalmente, las revistas Annals of Biomedical Engineering, Radiology, Journal of Educational Evaluation for Health Profession y Annals of Surgical Oncology encabezan la investigación hacia una futura transformación de la práctica de la medicina. Sallam et al. en su artículo indican que la inteligencia artificial podría ayudar a la mejora de los diagnósticos y la predicción de riesgos8.
Aunque ChatGPT cumpla funciones de redacción y sean similares a la redacción científica realizada por el hombre, algunos autores creen que es muy pronto confiar en esta función, pues no supera a los científicos reales19,20. Es necesario precisar objetivamente la tasa de certeza que este sistema alcanza, así como su potencial margen de error, el cual en ocasiones es altamente detectable. Debido a que es una herramienta relativamente nueva, el periodo de búsqueda no abarca más allá de cinco meses, por lo cual nos limita a tener un amplio panorama del tema y por consiguiente no contamos con estudios de una alta jerarquía científica. Sin embargo creemos que es un buen comienzo para impulsar el conocimiento y motivar nuevas publicaciones. Adicionalmente, la tecnología siempre será la base de nuevos conocimientos que nos permitirá avanzar en la práctica y educación médica, sin embargo no debe dejarse a un lado el compromiso ético.
Conclusiones
ChatGPT es un nuevo sistema con potencial efecto benéfico en muchas áreas de la medicina. Este es el primer análisis bibliométrico colombiano acerca de este tema, desconocemos los alcances o compromisos éticos que pudieran generar las acciones de la inteligencia artificial, por lo que se encuentra esta herramienta en estudio. Por lo anterior, se esperan estudios de mayor peso científico para dar continuidad a la evaluación de este nuevo sistema y su aplicación en medicina.