INTRODUCCIÓN
Las pirámides educativas son una representación gráfica de conceptos teóricos complejos, útiles para profesionales, investigadores y estudiantes en el campo de la educación médica. La mayoría fueron desarrolladas en la segunda mitad del siglo XX y continúan vigentes por su capacidad de asistir procesos estructurales como el diseño curricular, las metodologías de enseñanza y la evaluación programática. Estas pirámides se sustentan en teorías educativas, filosóficas, psicológicas y humanísticas, entre otras. Como se verá, aunque la mayoría de las pirámides clásicas provienen de la educación general, la educación médica ha contribuido con evidencia empírica que soporta su utilidad.
Las pirámides de George Miller, Benjamin Bloom y Donald Kirkpatrick gozan de gran aceptación en este campo 1. Sin embargo, son reconocidas otras como la de Abraham Maslow y la de Edgar Dale, que han respaldado numerosos estudios 2-4. Estas cinco pirámides son transversales a diferentes niveles educativos (pregrado, posgrado, educación continuada), disciplinas (clínicas o quirúrgicas) y escenarios de práctica (universitarios o sitios de trabajo).
La utilidad de estas pirámides radica en que pueden guiar a los educadores en ambientes universitarios, hospitales y comunidades, a mejorar su experiencia educativa desde el diseño curricular e instruccional hasta la evaluación estudiantil y programática 5-11. No obstante, la adopción y aplicación práctica de los conceptos que subyacen a estas representaciones gráficas por parte de los educadores es pobre, un fenómeno que revela la necesidad del desarrollo profesoral para la adopción de la evidencia educativa que sustenta cada una de estas pirámides 12. Creemos que estas pirámides son familiares para quienes están involucrados en los procesos de diseño curricular, evaluación e instrucción, aunque no hay evidencia que soporte este supuesto, al menos en el medio local. Por otra parte, no existe literatura que compare los indicadores bibliométricos en cuanto al uso y los efectos de estas pirámides en los programas de educación médica o en los beneficios de estas, o los riesgos en los egresados de nuestros programas.
Por lo tanto, como un primer paso para desarrollar investigación respecto a los puntos antes mencionados y otros que puedan surgir, presentamos esta revisión de la literatura con el objetivo de examinar los aspectos conceptuales que sustentan las pirámides educativas, sus limitaciones, las modificaciones que se han propuesto en algunas de ellas y hacer una descripción de su utilidad.
MATERIALES Y MÉTODOS
Se realiza una reflexión sobre las pirámides educativas que intenta contestar las siguientes preguntas: ¿cuáles aspectos conceptuales consideran en las diferentes representaciones gráficas que se utilizan en la estructura y los procesos de la educación médica actual? ¿Qué limitaciones tienen y cómo se ha lidiado con estas limitaciones? ¿Para qué se utilizan las diferentes representaciones gráficas?
Las pirámides fueron seleccionadas con base en el diseño gráfico que hubiera sido parte de su conceptualización original. Para cada pirámide se revisaron narrativamente sus aspectos históricos, componentes principales, utilidad y limitaciones, así como las modificaciones que han sufrido desde su versión inicial.
SÍNTESIS DE LA INFORMACIÓN
Se identificaron cinco pirámides que cumplieron con el criterio de inclusión, las cuales se describen en detalle más adelante. Los documentos que describen la adquisición de habilidades de Dreyfus y Dreyfus 13) o el de autoeficacia de Albert Bandura 14, que suelen describirse piramidalmente, no cumplieron con el criterio de inclusión.
La pirámide de Miller
En 1990, George Miller, profesor de la Escuela de Medicina de Illinois University, publicó un revolucionario documento en la revista Academia Medicine titulado "The assessment of clinical skills / competence / performance" 5. Miller postuló que "ningún método de evaluación, individualmente, puede proveer todos los datos requeridos para el juicio de algo tan complejo como la prestación de servicios profesionales por parte de un médico". Con base en este argumento, su propuesta se convirtió en un marco conceptual para la evaluación integral de diferentes aspectos que permiten que un estudiante, residente o médico ejerza sus funciones profesionales.
El modelo está conformado por cuatro niveles, dispuestos piramidalmente, en los que se posibilita la evaluación de: "sabe" (knows), "sabe cómo" (knows how), "demuestra cómo" (shows how) y "hace" (does). Estos niveles reflejan el conocimiento, la competencia, el desempeño y la acción, respectivamente 5. A su vez, la pirámide ofrece una descripción sobre los posibles métodos de evaluación de acuerdo con cada uno de los niveles. En general, los objetivos educacionales -por ejemplo, los de la taxonomía de Bloom-, pueden guiar la construcción de exámenes de selección múltiple (ESM), así como otros métodos como ensayos y pruebas orientadas al manejo de problemas de los pacientes para evaluar el conocimiento. Asimismo, Miller describió psicométricamente la validez de contenido y predictiva, y la confiabilidad de dos métodos adicionales, basados en simulación, que pueden asistir la evaluación del saber cómo, demostrar cómo y hacer: examen clínico observacional estructurado (OSCE) y pacientes estandarizados (PE) 5.
Su aporte más relevante fue la comprensión de la evaluación como un proceso jerárquico conducente al aprendizaje, cuyos métodos más complejos se sitúan en el vértice, conceptos que fueron básicos para el diseño de sistemas de evaluación y currículos. A partir de 1990, el cuerpo de evidencia sobre la validez y confiabilidad de métodos de evaluación, su practicidad y limitaciones, ha crecido sustancialmente, en especial para el nivel "hace".
Particularmente, los métodos para la evaluación del aprendizaje en el sitio de trabajo (workplace based assessment), y la evaluación programática, han contribuido a este desarrollo 15,16. Al mismo tiempo, la pirámide de Miller ha permitido la evolución de la educación médica basada en competencias (competency-based medical education)17.
No obstante, algunas omisiones de la pirámide de Miller han sido objeto de controversia. Por ejemplo, Cruess, Cruess y Steinert cuestionaron el alcance para la evaluación de la identidad profesional 6. En particular, para evaluar si los médicos en formación comprenden la naturaleza de la profesión y las obligaciones que deben cumplir para satisfacer las necesidades y expectativas de la sociedad y, consecuentemente, exhibir una conducta profesional apropiada. Los autores dieron respuesta a este vacío, incluyendo un quinto nivel a la pirámide de Miller. Este nivel ha recibido el nombre de "es", para referirse a la identidad, en el cual es posible evaluar si un profesional demuestra constantemente las actitudes, los valores y comportamientos que se esperan de alguien que ha llegado a "pensar, actuar y sentirse como un médico". Las diferencias principales con la pirámide de Miller original se encuentran en la Figura 1. Aunque el "hacer" puede prestarse a confusiones con el "es", Cruess, Cruess y Steinert postularon que no son términos estrictamente intercambiables 6. La evaluación del profesionalismo y de la formación de la identidad profesional tiene objetivos distintos y requiere métodos de evaluación diferenciales. La evaluación de los atributos de un "buen médico", por lo tanto, debe ser reformulada más allá de las pruebas de conocimiento y habilidades prácticas. Las teorías de la formación de la identidad profesional pueden contribuir a definir tales atributos y, de igual manera, algunos métodos como las entrevistas para la valoración del estatus del desarrollo de la identidad profesional, o cuestionarios -por ejemplo, el Cuestionario de Autoevaluación de la Identidad Profesional (Professional Self Identity Questionnaire - PSIQ)- facilitarían esta medición (6). A pesar de lo anterior, la aceptación del nivel "es" -un nivel que está relacionado con las competencias del "ser" en el marco de la educación basada en competencias (EBC)- es limitada por parte de la comunidad académica, así como de algunos de estos métodos de evaluación.
El crecimiento y la adopción de Actividades Profesionales a Confiar (APC) (Entrustable Professional Activities - EPAs) por parte de organizaciones científicas y escuelas de medicina a nivel global, convirtió la toma de decisiones para confiar responsabilidades, en un enfoque que acentuó la necesidad de evaluar a los médicos en formación en el lugar de trabajo 7. Una APC se define como una unidad de práctica profesional (una tarea o grupo de tareas) que se puede confiar o encomendar completamente a un aprendiz, una vez que él o ella ha demostrado la competencia necesaria para ejecutar esa actividad sin supervisión 8. Con este argumento, Ten Cate et al. postularon que la pirámide de Miller debe incluir un nivel superior al "hace" denominado "confiable" (trusted) (Figura 1). Este nivel refleja la decisión de otorgar a un estudiante, residente o profesional un certificado conducente a una licencia, registro, certificación o recertificación que brinda permiso para actuar sin supervisión, el cual hace consciente a los otorgantes de los riesgos inherentes 7. Por lo tanto, certificar que alguien es confiable para realizar autónomamente una o varias tareas (por ejemplo, una histerectomía), refleja la responsabilidad social de aquellos involucrados en la educación. Usualmente, estas decisiones son parte de comités de evaluación de programas encargados de analizar múltiples fuentes de desempeño con el fin de emitir un veredicto sobre la confiabilidad de un individuo para la sociedad. La reacción positiva de la comunidad académica y de educadores a este marco conceptual para la evaluación resulta prometedora para la extensión de la pirámide de Miller propuesta por Ten Cate et al. 7.
Finalmente, la estructura lineal y jerárquica de la pirámide de Miller plantea cuestionamientos sobre la secuencialidad y fragmentación en la evaluación del desempeño profesional. Frente a la necesidad de incorporar las dimensiones emergentes a la identidad profesional (nivel "es") y confiabilidad (nivel "confiable"), Al-Eraky y Marei propusieron la reconstrucción del marco de Miller para integrar estos dos niveles en "órbitas de evaluación" 18. Esta modificación alerta a los educadores sobre la necesidad de evadir las jerarquías arraigadas en las estructuras piramidales para evaluar simultáneamente aspectos cognitivos y no cognitivos. Su elaboración semeja el desarrollo profesional en el marco de la construcción de comunidades de práctica y socialización propuesta desde la década de los noventa por Lave y Wenger 19. Así, ante esta extensión innovadora y teórica de la pirámide de Miller, se abre una ventana de oportunidad para avanzar en el tema.
La pirámide de Dale
Según Masters, la educación médica no es ajena a la afirmación general que indica que los estudiantes recuerdan el 5 % de lo que escuchan en una conferencia o clase magistral, el 10 % de lo que leen, y porcentajes superiores cuando atienden a actividades colaborativas y prácticas 20. Masters ofrece una revisión de dos explicaciones frecuentemente encontradas en la literatura sobre el origen de estos porcentajes 20. La primera proviene del National Training Laboratories Institute for Applied Behavioral Science (conocido como NTL Institute), fundado por Kurt Lewin en Estados Unidos en 1947. Al NTL Institute se le atribuye la pirámide del aprendizaje (Figura 2). Sin embargo, los porcentajes incluidos en la pirámide no están respaldados por ninguna investigación adelantada por el NTL 20. La segunda explicación corresponde a la obra de Edgar Dale (1900-1985), un educador, investigador y productor cinematográfico norteamericano de Ohio State University. Dale contribuyó significativamente al desarrollo de programas audiovisuales a nivel global. Sus ideas principales están plasmadas en dos obras: Methods for Analyzing the Contení of Motion Pictures (1933) y Audiovisual Methods in Teaching (1946). Esta última describe el uso de diferentes medios para la enseñanza, y el célebre "cono de la experiencia" 21. Vale la pena aclarar que Edgar Dale nunca publicó una pirámide del aprendizaje ni presentó porcentajes referentes a la retención de información con diferentes estrategias instruccionales (Figura 2). El cono de la experiencia, en palabras de Dale, es simplemente "un diagrama de varios tipos de materiales didácticos según el grado relativo de concreción que cada uno puede proporcionar"22. Al parecer, el NTL Institute atribuyó la pirámide del aprendizaje a Edgar Dale en la década de los cincuenta. De esta forma, se perpetuó incorrectamente como suya, razón por la cual algunos académicos la bautizaron como el "cono corrupto de Dale" 21. Otra hipótesis es que los porcentajes hayan sido añadidos por un empleado de la Mobil Oil Company que publicó una versión del cono con cifras sin sustento científico 20. Su interpretación es lo opuesto a las demás pirámides del escrito actual. Los niveles "superiores" del posible aprendizaje se encuentran en la base y los niveles "inferiores" en el vértice.
Los porcentajes de la pirámide o cono corrupto de Dale, por lo tanto, parecen corresponder a un mito sin evidencia científica. No obstante, es ampliamente mencionado en educación médica desde 1946 4. Llamativamente, el número de citaciones y referencias de la pirámide ha crecido de manera exponencial en este campo a partir de la segunda década del siglo XXI. Para Ken Masters, autor de dos grandes revisiones sobre la pirámide de Dale, publicadas en 2013 y 2020, "la pirámide es basura, las estadísticas son basura, y no provienen de Edgar Dale. Hasta que el NTL Institute pueda proporcionar detalles sobre la investigación original, su versión también debe tratarse como basura"20. Sin embargo, pese a la severidad de estas afirmaciones, las cuales probablemente parafrasean la publicación de Edgar Dale, Waste in Education (1969) 22, algunos principios de la obra son plenamente vigentes para la prevención de la enseñanza y el aprendizaje ineficientes. Por ejemplo, Edgar Dale afirmó en 1969 que "la mayoría de los estudiantes aprenden menos y olvidan más de lo que deberían, una pérdida innecesaria de tiempo y dinero".
Los avances en la educación médica han abordado de forma amplia estos ítems, con una evidencia positiva sobre la utilidad de los cambios en los procesos educativos basados en fundamentación teórica. La contribución de la pirámide de Dale a la educación médica no es clara, y su utilización como un modelo conceptual no está soportada por la evidencia empírica. Masters, por tanto, desaconseja su referenciación y utilización futura 4,20.
La pirámide de Kirkpatrick
En educación médica, el proceso de evaluación de un programa académico se entiende, según Frye, como: "la recolección y análisis sistemático de información relacionada con el diseño, la implementación y los resultados de un programa, con el propósito de monitorear y mejorar su calidad y eficacia"23. Por lo tanto, atañe al mérito, valor, importancia y calidad de un programa 24, y no a objetivos políticos (pseudoevaluación) 25. Al menos veintidós modelos genéricos son útiles para la evaluación de un programa académico25. En educación médica, algunos modelos como el CIPP (context, input, process, product), el modelo lógico y el de Kirkpatrick son ampliamente aceptados. A su vez, están respaldados por marcos como el reduccionismo, la teoría de sistemas y la complejidad 23.
Donald Kirkpatrick (1924-2014) fue un educador de la Universidad de Wisconsin. Su trabajo tuvo origen en la década de los cincuenta y está agrupado en Evaluating Training Programs, un libro publicado inicialmente en 1994 26. Kirkpatrick desarrolló un modelo de cuatro niveles (The Four Levels of Evaluation) con el fin de asistir a los evaluadores de programas y aclarar los términos elusivos del proceso 9. Los niveles están dispuestos de forma jerárquica y piramidal (Figura 3):
Reacción: se refiere a la satisfacción del participante con el programa. Es útil para recibir comentarios valiosos, informar sobre la voluntad y el compromiso de los profesores con su trabajo -razón por la cual necesitan recibir retroalimentación por parte de los estudiantes-, y para informar a los alumnos sobre el interés que el programa tiene en sus necesidades y expectativas, entre otros.
Aprendizaje: se refiere al cambio de actitud, o conocimiento o habilidades de los participantes tras asistir al programa.
Comportamiento: se refiere al cambio duradero en el comportamiento derivado de la aplicación del aprendizaje al contexto.
Resultado: se refiere al impacto del programa. Los resultados finales pueden incluir una mayor producción, impacto social, menores costos y rentabilidad, entre otros.
Los criterios de reacción y aprendizaje se consideran internos, porque se centran en lo que ocurre dentro del programa. Los criterios de comportamiento y de resultados se centran en los cambios que ocurren fuera (y generalmente después) del programa y, por lo tanto, se consideran criterios externos. La principal ventaja del modelo es que es completo y preciso. También es adaptable y flexible a diferentes sectores (por ejemplo, educación e industria). Adicionalmente, los datos que proporciona se pueden incorporar a los objetivos organizacionales y las necesidades de los estudiantes y profesores 23,25,27. Sin embargo, aunque los niveles superiores (comportamiento y resultado) proporcionan la información más valiosa, son complejos y dispendiosos de evaluar, en términos de recursos y tiempo 9; por esta razón, es común que la evaluación se detenga en el segundo nivel (aprendizaje). Una limitación del modelo de Kirkpatrick es que no toma en cuenta variables intermedias que afectan el aprendizaje (por ejemplo, la motivación del estudiante, el conocimiento y la habilidad previa). Otra crítica radica en que el modelo parte del supuesto de causalidad entre el programa educativo y sus resultados, un reflejo de las teorías lineales reduccionistas, por lo que la información resultante de su aplicación puede ser insuficiente 23. Por este último aspecto es recomendable que se utilice en conjunto con otros modelos para evaluar la calidad de los programas de educación médica. No obstante, el modelo de Kirkpatrick continúa vigente -como informa un extenso número de estudios 28-33- hechos para la evaluación de programas en pregrado, en posgrado y en educación continua, desarrollo profesoral, simulación, formación de capacidades docentes en residentes y, más recientemente, para documentar la efectividad de diferentes metodologías instruccionales durante la pandemia COVID-19, entre otros. Lograr una implementación a los niveles superiores del modelo es un desafío y constituye el paso adicional pendiente para demostrar su efectividad evaluativa.
La pirámide de Bloom
La taxonomía cognitiva representa la puesta en marcha de los objetivos educativos, organizados de acuerdo con su complejidad cognitiva, con el fin de evaluar a los estudiantes 34. La publicación Taxonomy of Educational Objectives: The Classification of Educational Goals, en 1956 35, es una monumental contribución a la educación en el siglo XX. Esta obra fue realizada por Benjamin Bloom (1913-1999), un psicólogo y educador norteamericano de la Universidad de Chicago. La taxonomía contiene seis categorías de habilidades cognitivas organizadas jerárquicamente, las cuales se representan en una pirámide (Figura 4). Las categorías se ordenan de lo simple a lo complejo, y de lo concreto a lo abstracto. La diferenciación en categorías de habilidades de orden superior e inferior no es propia de la taxonomía. Sin embargo, el dominio de una categoría es un requisito para el siguiente. Las categorías son:
Conocimiento: capacidad de recordar hechos (conocimiento factual), conceptos (conocimiento conceptual) o principios (conocimiento procedimental). Se refiere a la retención de información.
Comprensión: capacidad de traducir, interpretar o extrapolar hechos, conceptos y principios.
Aplicación: capacidad de trasladar a la práctica hechos, conceptos y principios.
Análisis: capacidad de razonar sobre elementos, relaciones o principios.
Síntesis: capacidad de producir comunicación, planes u operaciones y relaciones abstractas.
Evaluación: capacidad de emitir juicios propios o a la luz de criterios externos.
La taxonomía de Bloom creó un lenguaje común, y es ampliamente conocida y citada en múltiples idiomas. Igualmente, es popular entre los profesores y, probablemente, ha contribuido a que la instrucción tenga como objetivo el fortalecimiento de procesos cognitivos cercanos al vértice de la pirámide a través de metodologías que promueven el aprendizaje significativo. No obstante, los profesores rara vez son conscientes de las críticas al modelo. Probablemente, la más importante fue realizada por Anderson y Krathwohl, dos psicólogos educativos norteamericanos 36. Para ellos, la taxonomía original es unidimensional, pues está centrada específicamente en cinco de los seis procesos cognitivos (comprensión, aplicación, análisis, síntesis y evaluación). No obstante, lo que se entiende por "conocimiento" en la taxonomía original no es un proceso. Esto supone que la base de la taxonomía no corresponde al "conocimiento", sino a un proceso cognitivo representado por la capacidad de "recordar". Este argumento llamó la atención sobre la necesidad de reorganizar la taxonomía en dos dimensiones: i) dimensión de conocimiento y ii) dimensión del proceso cognitivo 37.
De esta manera Anderson y Krathwohl 36 incluyeron un cuarto tipo de conocimiento a los ya existentes (factual, conceptual y procedimental), denominado conocimiento metacognitivo. Este último representa una forma de conocimiento estratégico o reflexivo sobre cómo abordar la solución de problemas y "aprender a aprender" 38. Además, con respecto a la dimensión del proceso cognitivo, decidieron mantener el número original de seis categorías, pero realizaron algunos cambios importantes. Inicialmente, las renombraron como verbos activos y no como sustantivos. La primera de las seis categorías principales se refiere al proceso "recordar". La segunda ("comprensión") fue reemplazada por el proceso "entender". Las dos siguientes categorías mantuvieron el mismo significado, pero fueron renombradas con los procesos "aplicar" y "analizar". Finalmente, consideraron que la verdadera naturaleza de la síntesis es la creación de nuevos productos, en consecuencia, eliminaron la categoría "síntesis" e introdujeron el proceso "crear". De esta forma, los dos últimos niveles corresponden a los procesos "evaluar" y "crear" 37. Finalmente, con base en los cambios realizados, construyeron una tabla bidimensional denominada tabla de taxonomía (Figura 4). La dimensión del conocimiento se encuentra en el eje vertical, y la dimensión del proceso cognitivo en el horizontal. Las celdas resultantes permiten definir con mayor claridad los objetivos de aprendizaje y evaluación 37.
Estas taxonomías han sido utilizadas en el campo de la educación médica para definir resultados previstos de aprendizaje, modelos curriculares y sistemas de evaluación. Al mismo tiempo, han surgido múltiples adaptaciones y modificaciones dirigidas a dimensiones afectivas, éticas e instruccionales 10,11 que aún no son completamente aceptadas.
La pirámide de Maslow
Como otros humanistas, Abraham Maslow (1908-1970), un psicólogo norteamericano, creía en el potencial de las personas y en el esfuerzo por alcanzar un nivel superior de capacidades. En la cima de las capacidades se encuentra la autorrealización. Sus ideas fueron plasmadas en 1943 en el libro A Theory of Human Motivation39. Allí describió una teoría jerárquica de las necesidades, a menudo representada como una pirámide de cinco niveles (Figura 5). Para Maslow, una vez que una persona ha ascendido no priorizará las necesidades del nivel inferior a menos que estén insatisfechas, en cuyo caso volverá a atenderlas, pero no retrocederá permanentemente 40. Maslow exploró las experiencias cumbre o trascendentes relacionadas con la posibilidad humana. A lo largo de su carrera, continuó refinando la teoría, argumentando en última instancia que la trascendencia es el estado más evolucionado del ser más allá de las propias metas. No obstante, la trascendencia no forma parte de la pirámide. El constructo teórico de Maslow considera que la motivación humana está basada en la búsqueda de diferentes niveles de necesidades, y los individuos están motivados para cumplir sus necesidades en un orden jerárquico. Estos niveles son:
Necesidades fisiológicas: son necesidades biológicas. Consisten en necesidades de oxígeno, alimentos, agua y una temperatura corporal relativamente constante.
Necesidades de seguridad: aparecen cuando todas las necesidades fisiológicas están satisfechas y ya no controlan los pensamientos y comportamientos.
Necesidades de amor, afecto y pertenencia: las personas buscan superar la soledad y la alienación. Esto implica dar y recibir amor y afecto, y sentido de pertenencia.
Necesidades de estima: las personas tienen la necesidad de un alto nivel de respeto por sí mismas (autoestima), y de respeto por parte de los demás (estima) para sentirse seguras y valiosas.
Necesidades de autorrealización: la necesidad de una persona de ser y hacer aquello para lo que nació.
Maslow creía que la educación puede cambiar el movimiento de una persona en la pirámide, acelerando o retrasando su potencial 40. En educación médica, la pirámide es cercana a otros marcos de autorrealización como la teoría de la autodeterminación, y tiene implicaciones en el bienestar y en las capacidades de los profesores para satisfacer y estimular otros aspectos de la educación diferentes a la cualificación, por ejemplo, la socialización y la autonomía. Es altamente probable que aquellos residentes y estudiantes que desarrollen su identidad profesional en ambientes de práctica seguros, con inclusión, pertenencia y respeto, encuentren sentido y propósito en su profesión. Estos aspectos han sido identificados en diversos estudios que soportan la utilidad de la pirámide de Maslow para la comprensión de la motivación y el bienestar en educación médica 2,3,41.
CONCLUSIONES
Las pirámides revisadas han contribuido como referentes teóricos para el soporte de procesos educativos en las profesiones de la salud. Su utilidad práctica es extensiva a diferentes especialidades y niveles de educación por cuanto pueden asistir a los profesores para optimizar los procesos de diseño curricular, instruccional y evaluación. Es importante evaluar, en el medio local, los efectos en los programas de ciencias de la salud que se han basado en estos referentes teóricos.