1. INTRODUCCIÓN
El artículo 26 de la Declaración Universal de los Derechos Humanos afirma que toda persona, sin distinción de raza, sexo, religión o cualquier otra categoría tiene derecho a la educación. Una educación orientada al desarrollo pleno de la personalidad y bajo la premisa del “respeto a los derechos humanos y a las libertades fundamentales”. Esto lo ratifica la Convención sobre los Derechos del Niño Adoptada y abierta a la firma y ratificación por la Asamblea General en su resolución 44/25, de 20 de noviembre de 1989. En Colombia, su adopción se ratifica a través de la Ley 12/1991, de 22 de enero: “Los niños, niñas y adolescentes tienen derecho a la educación”, el cual debe ser garantizado dentro de la dignidad humana. En coherencia con lo anterior, el artículo 67 de la Constitución Política de 1991, reafirma este derecho y le asigna a la educación una característica esencial: la calidad, la cual, según lo dispuesto en la carta magna, no solo tiene que ver con la garantía del acceso y la permanencia, sino con el cumplimiento de los fines propios de la educación integral.
La calidad es un término complejo, según Vásquez (2013), la calidad de la educación implica el cumplimiento de las metas y predicciones que las teorías científicas y pedagógicas proponen para el desarrollo humano, la convivencia feliz y el fortalecimiento del trinomio: hombre-sociedad-universo. De manera concreta, la calidad de la educación se evidencia en la eficacia y eficiencia de su sistema, es decir, en el cumplimiento de lo que por naturaleza está llamada a ser maximizando la capacidad de las instituciones y de sus actores (García, Juárez y Salgado, 2018; Guevara, 2017). Una educación de calidad que aporte al pleno desarrollo integral de los individuos y que siente las bases para la construcción de proyectos de vida digna en ambientes de bienestar es un buen indicador de la atención y el respeto frente a este derecho fundamental.
Garantizar la observancia por el derecho a la educación implica vincular procesos de evaluación. En este orden de ideas, la calidad se ve articulada con la evaluación como proceso que posibilita el examen cuidadoso, crítico y oportuno que permite identificar falencias y fortalezas tanto en los resultados como en los insumos y procesos educativos, a fin de tomar decisiones orientadas a mejorar continuamente la calidad de los procesos formativos que se ofrecen en cada uno de los niveles curriculares: desde las instancias ministeriales hasta en el aula y desde la actuación de cuidadores, docentes y directivos.
La evaluación puede analizarse desde dos grandes perspectivas: la formativa y la sumativa (Scriven, 1981). La primera tiene como propósito central el análisis y la valoración continua de los procesos que se desarrollan en un sistema, programa o curso. Apuesta por una mirada cualitativa y profunda de los procesos con el propósito de comprenderlos para mejorarlos (Gerritsenvan, Joostenten & Kester, 2017; Romero, Castejón, López & Fraile, 2017; Rosales, 2014). Casado y Casado (2017) resaltan, además, las posibilidades que ofrece este tipo de evaluación de reconducir los procesos formativos y adecuarlos a las diferencias y particularidades de los individuos. Se trata de una evaluación que forma en que los procesos de retroalimentación se constituyen en escenarios de aprendizaje en todos los actores del proceso formativo. Una evaluación de este tipo atiende las diferencias, la pluralidad, al derecho a no ser discriminado, tal como lo plantea la Convención sobre los Derechos del Niño en sus artículos 2 y 23. Este último artículo propone la atención de los niños y niñas con capacidades excepcionales, con necesidades educativas especiales. En ese contexto, la evaluación formativa acoge los principios de flexibilidad pedagógica, de tal forma que se adecúen los eventos evaluativos a estas particularidades. Como lo señalan Backhoff y Contreras (2014), este tipo de evaluación tiene un bajo impacto porque beneficia directamente solo a un grupo particular de estudiantes y docentes.
La evaluación sumativa, por el contrario, centra su interés en la verificación y en el análisis de los resultados, por cuanto está asociada a la rendición de cuentas. Esta se presenta a través de escalas estandarizadas que permiten la comparación bajo unos mismos criterios o puntos de referencia. La evaluación sumativa, de talante cuantitativo, permite establecer niveles de desarrollo nacional, institucional o en un grupo particular de estudiantes, para el caso del contexto educativo. Este tipo de evaluación homogeneiza a los participantes y los resultados que se obtienen, y es la que se prefiere a la hora de medir la calidad, incluso la calidad educativa. De sus resultados, en general se generan incentivos, reconocimientos y financiación para instituciones, docentes o estudiantes. Es decir, que, según sean estos resultados, se incluye o se excluye a los sujetos.
En este contexto, se inscriben las pruebas objetivas o estandarizadas como instrumentos que permiten realizar procesos de medición alrededor de variables, categorías o tópicos. En el plano de la evaluación educativa, la calidad educativa (institucional, de los desarrollos, competencias y aprendizajes) se mide bajo los mismos parámetros y estándares, homogeneizando la evaluación para la justicia y la objetividad. Si bien es cierto la utilización de las pruebas estandarizadas tiene sus ventajas, entre ellas, la posibilidad de tener un panorama objetivo e imparcial (Álvarez, 2001), así como una visión general de una situación que puede llegar a ser compleja y tomar mucho tiempo si se realizara de manera comprensiva (Soubirón y Camarano, 2006). Además, Sánchez y Del Sagrario (2013) y Guevara (2017) hacen alusión al poder y control que ejercen los resultados de estos exámenes frente a las decisiones curriculares.
La aplicación de instrumentos de medición de la calidad educativa, como referente para la toma de decisiones en diferentes instancias, tiene riesgos. Uno de ellos tiene que ver con la corrupción de la práctica educativa en pos de los resultados. Autores como Geiser (2016), Glewwe, Ilias & Kremer (2010) o Martínez-Rizo (2016), entre otros, señalan que la orientación a los resultados lleva a los docentes a subordinar el currículo y su práctica pedagógica al servicio de la preparación de los estudiantes para los exámenes y no necesariamente para aprender para la vida, lo que hace de la enseñanza un acto técnico que en general tiene un efecto transitorio en la formación integral del estudiante. Esto podría entonces constituirse en un atentado al derecho a una educación de calidad, aunque lo que se quiera llegar a concretar sea la calidad misma de la educación. En palabras de Campbell (1979, p. 35), “cuanto más se utilice un indicador para tomar decisiones sociales, este estará más sujeto a las presiones de corrupción y será más propenso a distorsionar y corromper los procesos sociales que pretende monitorear”.
El otro riesgo tiene que ver con los procesos de inequidad, pues, al ser propuesta para generalizar sobre un factor o tópico y estar bajo la regulación de estándares igualitarios, impide comprender componentes estructurales, que para nuestro caso son de índole educativa o pedagógica.
En palabras de Olvera y Arrellano (2015), definir normativamente el término equidad es controversial y genera mucha polémica y debates casi inacabables. Para estos autores, ante las grandes brechas de desigualdades sociales y económicas existente en los países latinoamericanos, se hace necesario que las democracias garanticen la política de la equidad y la justicia social, y para ello es necesario que se haga operativo y práctico el término en sus políticas públicas (Olvera y Arrellano, 2015; Toledano, 2009).
Esta posición cobra mucha más importancia cuando se destaca en las políticas públicas de América Latina una perspectiva de equidad con enfoque netamente distributivo (Toledano, 2009). El término equidad no puede (ni debe) minimizarse solo al aspecto distributivo de la riqueza, sino que se deben resaltar, desde la ética del reconocimiento de la diversidad, la valoración del pluralismo y el respeto por las diferencias. En el mismo camino, se encuentra Bolívar (2005), quien define la equidad como la posibilidad de garantizar igualdad de oportunidades amparado en los principios de justicia y en el respeto de las libertades fundamentales y de la diversidad. Bolívar trae a colación las obras de Rawls (2002) y de Sen (1995), quienes sostienen que al hablar de equidad es necesario superar la visión que justifica una igualdad estricta en que a todos se juzgan por igual al margen de su situación particular, lo cual pone en situación desfavorable a un grupo de individuos.
La equidad en este sentido es (y debe) ser un referente obligado para medir el éxito educativo (entendida principalmente como formación integral de los actores educativos), ya que por definición es un proceso formativo con poder de incidencia en la construcción de justicia social (Toledano, 2009).
Desde esa perspectiva, la equidad en educación como derecho de los niños y las niñas posibilitará que se atiendan las diferencias y diversidades en coherencia con los derechos fundamentales, los principios democráticos, con énfasis en valores como la justicia y la inclusión educativa, y viabilizará el debilitamiento de la asociación existente entre la distribución de las oportunidades, los beneficios y bienes sociales, y las particularidades de posibilidades dadas por los rasgos de adscripción, como sexo, etnia, entre otros, ofreciendo a todos una educaciónde calidad, resumida en la apropiación de los niveles superiores de conocimiento (en general reservada a los sectores privilegiados de la sociedad) (Barrios, 2006; Márquez, Gutiérrez-Barroso y Gómez-Galdona, 2017; Sánchez y Manzanares, 2014; Toledano, 2009). Así es como la calidad educativa necesariamente está asociada a la equidad educativa.
En este orden de ideas, Casassus, Arancibia y Froemel (1996, p. 239) señalan que “las apreciaciones de la calidad pueden ayudar a superar el problema de la falta de equidad en el servicio educativo, al identificar las escuelas más carentes y que consecuentemente requieren acciones concretas que les permitan mejorar la calidad de la Educación entregada a los sectores más desfavorecidos en lo cultural, social y económico”. No obstante, resulta importante tener claro, tal como lo señaló Juan Carlos Tedesco, pedagogo y educador argentino: “Medir no mejora los resultados y la competencia entre escuelas, lejos de mejorar la calidad del conjunto del sistema, fortalece la desigualdad, la segmentación y la inequidad, particularmente en la educación obligatoria” (Tedesco, 2016, p. 6).
Es importante anotar que la Declaración Universal de los Derechos Humanos, en su artículo 28, no explicita de manera directa la demanda por una educación equitativa; menciona el derecho del niño a la educación y que esta se pueda ejercer progresivamente y en condiciones de igualdad de oportunidades, con el fin de que todos los niños y las niñas dispongan de ella y tengan facilidad de acceso. La Declaración de los Derechos del Niño tampoco menciona la palabra equidad de manera manifiesta, no obstante, en su artículo 2, demanda el derecho a no ser discriminado. Frente a esto, se necesita insistir que equidad e igualdad no es lo mismo. Desde este panorama, si según los resultados de las pruebas estandarizadas utilizadas en los informes nacionales e internacionales para dar cuenta de la calidad educativa solo se admiten los mejores, el derecho a continuar el camino de la educación formal se puede ver truncado. La pregunta será, entonces, ¿responderá esto a las necesidades de equidad de nuestro país? Cavieres (2014) afirma que los resultados, asociados a los puntajes obtenidos por docentes y estudiantes en las pruebas estandarizadas, refuerza la ventaja que le posibilita o no a un sujeto “elegir y ser seleccionado” en el campo escolar, universitarios o laboral, entre otros contextos, permitiendo a unos sí y a otros no avanzar en su proceso de movilidad tanto social como económica. Medir la calidad, bajo el referente de los resultados de estas pruebas, deja de lado el análisis crítico de la complejidad de la educación como acto social (Mosquera, 2018; Samaniego, 2016) y la complejidad de las dinámicas de enseñanza y de aprendizaje que permanentemente se desarrollan y emergen en el aula. Samaniego (2016, p. 397) considera que esto constituye “una evidencia de lo apremiante de su revisión a la luz del análisis crítico de Estandarización y Medición de la Calidad Educativa”.
Los sistemas de medición de la calidad de la educación según Arancibia (1997) permiten determinar el nivel en que se encuentra dicha calidad en los respectivos países, lo que brinda insumos para tomar decisiones en el diseño y en la ejecución de políticas públicas para el mejoramiento permanente de los indicadores de la calidad de esta. A nivel, el Instituto Colombiano para la Evaluación de la Educación (Icfes), que tiene como función brindar apoyo al Ministerio de Educación Nacional (MinEducación) en la ejecución de la política relacionada con la evaluación de la calidad educativa, toma como referencia, entre otros, los resultados de las pruebas estandarizadas Saber (Icfes, 2018b) aplicadas a niños, niñas y jóvenes en los grados 3º, 5º, 9º y 11. La prueba Saber en los grados 3º, 5º y 9º evalúa las áreas de lenguaje y matemáticas (Icfes, 2018a). Para el grado 11 evalúa lectura crítica, matemáticas, sociales y competencias ciudadanas, ciencias naturales e inglés (Icfes 2018b). Esta prueba debe ser presentada por todos los estudiantes que en su momento se encuentren cursando dichos grados.
A nivel internacional, los organismos que han propuesto sistemas con mayor impacto a efectos de medición de la calidad de la educación son la International Association for the Evaluation of Educational Achievement (IEA) y la Organización para la Cooperación y el Desarrollo Económico (OCDE). La primera ha aplicado instrumentos para medir los desempeños de los estudiantes como el Trends in International Mathematics and Science Study (TIMSS) o el aplicado para evaluar la comprensión de textos literarios e informativos (Progress in International Reading Literacy Study (PIRLS) en que participan niños entre 9 y 10 años, el utilizado en el International Computer and Information Literacy Study (ICILS) y el Teacher Education and Development Study in Mathematics (TEDS-M) dirigidos a los futuros profesores de Matemáticas en Educación Primaria y Secundaria Obligatoria al finalizar su formación inicial para medir el conocimiento en matemáticas y en didáctica de las matemáticas. Por su parte, la OCDE se apoya en la prueba conocida como Programme for International Student Assessment (PISA) que tiene como propósito fundamental la evaluación de la formación de los estudiantes cuando se encuentren ante la iniciación de la educación postsecundaria o que están a punto de iniciar su vida laboral, la cual evalúa las áreas de matemáticas, lectura y competencias científicas a los estudiantes que terminan la educación media (OCDE, 2016). La página oficial de PISA declara que el impacto de la prueba redunda en la formulación de las políticas educativas relacionadas con la evaluación nacional y con los ajustes y las propuestas curriculares para incluir competencias similares a las que evalúa el instrumento, así como los sistemas de mejora nacional. No obstante, a estos aportes, en 2014, más de 80 expertos internacionales entre ellos Elizabeth Bloom, Peter McLaren, Henry Giroux o Lori Atkinson, en carta dirigida a Schleicher, en su momento director de PISA, señalaron, entre otras cosas, que el formato empleado en esta prueba objetiva lleva a cargos de sesgos y comparaciones injustas.
En general, podemos afirmar que, cuando se insiste en determinar la calidad educativa centrado en resultados cuantitativos, se corre el riesgo de no visibilizar, por ejemplo, los avances de los aprendizajes y la relación con las dinámicas de enseñanza de los docentes o las prácticas de exclusión al constituirse en requisitos de selección (Ministerio de Educación, República de Chile, 2003), por lo que se aporta a la inequidad y se viola, en este orden de ideas, el derecho fundamental de la educación de calidad para todos.
2. EL DERECHO A LA EQUIDAD DE GÉNERO EN EL CONTEXTOS DE LAS EVALUACIONES ESTANDARIZADAS PARA MEDICIÓN DE ÉXITO ESCOLAR
Es mundialmente reconocido que la educación es un derecho humano básico y fundamental para el desarrollo personal, social y cultural de los individuos. Por esto, en la Declaración Mundial sobre educación para todos “Satisfacción de las necesidades básicas de aprendizaje” Jomtien, Tailandia, 5 al 9 de marzo, 1990, se afirma que la educación debe ser accesible para todos (Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura [Unesco], 2004). Tristemente, la inequidad de género se constituye en un notable obstáculo para alcanzar este objetivo y llevar a la educación a constituirse en la herramienta para el desarrollo pleno e integral que se espera. En 2017, la Organización de las Naciones Unidas (ONU) reconoció que, para acabar con la pobreza extrema y el hambre, se debían encaminar los esfuerzos hacia la equidad sexual, por lo que planteó la eliminación de las desigualdades entre géneros en todos los niveles educativos como una de sus principales metas y prioridades del milenio (Programa de las Naciones Unidas para el Desarrollo [PNUD], 2017; Unesco, 2004). Asimismo, en 2017, gracias a un esfuerzo entre la Comisión Económica para América Latina (Cepal), la Organización de las Naciones Unidas para la Mujer (ONU Mujeres), el PNUD y el Fondo de Población de las Naciones Unidas (UNFPA), se propuso como uno de los objetivos que debía asumir Colombia la promoción de la equidad de género y la autonomía de la mujer mediante el aumento de la participación política de la mujer y la reducción de las brechas existentes en cuanto a las tasas de desempleo y de ingresos laborales en relación con los varones, como reducir los índices de violencia de género, que se constituyen en un síntoma del problema de desigualdad de género en Colombia (PNUD, 2017).
Si bien muchos países han logrado que exista igualdad de participación entre los estudiantes en los diferentes niveles educativos (paridad de género), la mayoría está en deuda con el acceso a la igualdad de oportunidades educativas de calidad que les permita romper las desigualdades sociales, laborales y económicas que permean a mujeres y hombres en nuestra sociedad (equidad de género) (Unesco, 2010). Es cierto que al inicio se pensaba que la razón de la inequidad de género estaba marcada por las diferencias sexuales determinadas por la naturaleza (nature), sin embargo, las investigaciones de las últimas décadas demuestran que esta afirmación carece de soporte teórico, por ejemplo, desde el punto de vista neurológico, por lo que se deduce que son las normas sociales de género las responsables de la existencia de estas brechas (De la Rica y González, 2013).
El análisis y la interpretación que se realiza a los resultados de las pruebas estandarizadas (nacionales o internacionales) permiten, entre otros fines, evidenciar esta inequidad educativa entre géneros. Por ejemplo, las investigaciones reportadas por De la Rica y González (2013), Guerrero (2016) y Abadía y Bernal (2017) dan cuenta de a) una brecha de género significativa en el desempeño en matemáticas en el contexto del PISA, con una marcada tendencia en la mayoría de los países (44 de 63) de un rendimiento bajo de ellas en matemática en comparación con los hombres; b) que en algunos países, como Albania y Qatar, las mujeres superan a los varones en matemáticas, pero constituyen casos aislados; c) los polos opuestos lo representan Suecia, donde las niñas superan a los hombres (1,08); y d) que en Colombia existe una importante brecha de género (-33,32) que se invierte en lectoescritura en que se obtienen valores promedio para las mujeres de 40,54 puntos más que los hombres. El estudio de De la Rica y González (2013) reveló que, cuando más alta es la ventaja en lectura de una mujer con respecto a los hombres, también menor es su desventaja en matemáticas con respecto a ellos.
En este mismo orden de ideas, investigaciones de Fryer & Levitt (2010) demostraron una gran brecha de género en matemáticas en los primeros años de educación de hombres y mujeres en los Estados Unidos. Para ello, los investigadores evaluaron a 20 000 estudiantes de 10 000 escuelas utilizando una gran base de datos administrado por el Departamento de Educación norteamericano llamado Early Childhood Longitudinal Study, Kindergarten Class of 1998-99 (ECLS-K), consistente en evaluar las experiencias escolares tempranas de los niños desde el jardín de infantes (kindergarten) hasta la escuela intermedia (octavo grado) (Fryer & Levitt, 2010; National Center for Education Statistic [NCES], s. f.). Estos datos proporcionan información descriptiva no solo de la transición de los hombres y mujeres durante la escuela, sino también de su estado al ingresar y su progresión hasta octavo grado (Fryer & Levitt, 2010; NCES, s. f.). Además, los datos ECLS-K permiten estudiar la relación entre el rendimiento escolar con los factores familiares, escolares, comunitarios e individuales de los hombres y mujeres (Fryer & Levitt, 2010; NCES, s. f.). Fryer & Levitt (2010) hallaron que al ingresar a la escuela prácticamente no existen diferencias significativas entre hombres y mujeres, pero en los primeros seis años de vida escolar, e independiente de su estrato social, las mujeres pierden un 25 % de la desviación estándar en comparación con los hombres. Estos mismos investigadores utilizaron los resultados del TIMSS para estimar la brecha de género en matemáticas. Los investigadores usaron un subconjunto de 17 países que estaban incluidos tanto en PISA como en TIMSS, además de la World Economic Forum, Global Gender Gap Index. El estudio reveló sorprendentemente que, cuando se utiliza el conjunto más amplio de naciones, desaparece cualquier relación entre la brecha de género en las matemáticas y la igualdad de género. Incluso, se observa que las mujeres superan a los niños en matemáticas en países con bajo estatus de las mujeres (como Bahréin e Irán). Las explicaciones que dan los investigadores ante estos inusuales resultados se mueven entre la falsedad de los datos y el alto grado de educación segregada por sexo (escuelas del mismo sexo) en estos países musulmanes.
En esta misma línea, Mizala (2016) utilizó los resultados del Sistema de Medición de la Calidad de la Educación (Simce) de estudiantes de 4º y 8º básico y 2º medio en matemáticas, y los resultados de la Prueba de Selección Universitaria (PSU), que es un test escrito estandarizado para el proceso de admisión a la educación universitaria, para evaluar la brecha de género en matemáticas en Chile (Agencia de Calidad en Educación [ACE], s. f.). En todas las pruebas, se demostró la brecha de género en matemáticas dado que los hombres comparados con las mujeres obtuvieron mejores puntajes (Mizala, 2016; Radovic, 2018).
En este sentido, Mizala (2016) y Fryer & Levitt (2010) demostraron una correlación de estos resultados con el estatus social, la participación, las oportunidades de promoción y la estabilidad laboral de las mujeres. Además, las investigaciones encontraron variaciones en cuanto la equidad de género en variables como oportunidades educativas, sociales, económicas y laborales de las mujeres en los países de estudio. Lo anterior se ve en la escasa representación del género femenino en carreras técnicas o science, technology, engineering and mathematics (STEM) o, incluso, en participación política o trabajos de investigación científica y tecnológica, lo que podría afectar de forma negativa los futuros salarios de las mujeres en su profesión y acentuar la inequidad (Else-Quest, Hyde & Linn, 2010; De la Rica y González, 2013; Campos y Santillán, 2016; Fernández, 2017). Así es como en Chile se observa que las mujeres, en comparación con los varones, obtienen ingresos promedio del 32,2 % por debajo y se desempeñan principalmente en el sector terciario (Instituto Nacional de Estadísticas [INE], 2015; Fernández, 2017).
Un aspecto que demostró relevancia en el mantenimiento de la brecha de equidad de género es la expectativa y creencia de padres, cuidadores y docentes acerca del desempeño de las niñas y niños en ciertas áreas del saber (p. ej., matemáticas o ciencias) en pruebas estandarizadas Simce, PSU y PISA (Martínez, 2015; Mizala, Martínez & Martínez, 2015; Árias, 2016). Diversos estudios confirman un gran sesgo de parte de los adultos sobre los educandos femeninos y masculinos, sobre todo, cuando existen estereotipos de género, que evidencian rotulación del estudiantado y la generación de expectativas de desempeño de género de acuerdo con el área del saber (Gunderson et al., 2013; Mizala et al., 2015; Mizala, 2016).
En este mismo orden de ideas, Mizala (2016) y Mizala et al. (2015) en su investigación en Chile demostraron que los resultados de equidad de género están correlacionados con el nivel de interacción de los docentes con los estudiantes. En este estudio, se utilizó un diseño de investigación basado en una metodología de encuesta experimental previamente utilizada para estudiar los efectos de las variables en los estudiantes sobre las expectativas de los docentes. En el experimento, se entregó un párrafo a cada docente participante para que lo leyera. En este párrafo, se describía a un estudiante de escuela primaria con bajo rendimiento en matemáticas y dificultades de comportamiento. Se construyeron cuatro párrafos de igual estructura básica, pero variando el sexo (niña y niño) y el estatus socioeconómico del estudiante (bajo y alto). Luego de leer el párrafo, cada participante llenó un cuestionario sobre el estudiante como si se tratase de su propio estudiante. Este cuestionario incluía escalas para medir sus expectativas de rendimiento con respecto al estudiante y el tipo de apoyo que consideraban que el estudiante ficticio debería recibir. Además, se utilizó un modelo analysis of variance (ANOVA) de tres vías para evaluar la ansiedad ante las matemáticas de los maestros de escuela primaria (Mizala et al., 2015; Martínez, 2015). Así, se observó mayor tiempo de atención, de retroalimentación y de reto de los docentes con los niños que con las niñas en clases de matemáticas, lo cual puede incidir en los resultados de desempeño de las estudiantes mujeres, en la medida en que los procesos de enseñanza docente (y la motivación de los padres) inciden en el nivel de autoconfianza del estudiante (o del hijo, según el caso), lo que afecta su capacidad de aprendizaje no solo en matemáticas sino en cualquiera otra área del saber (Correa, 2016; Mizala et al., 2015; Árias et al., 2016). Además, esta brecha de equidad de género aumenta con competencias docentes, como manejo de grupo, desempeño académico y las prácticas pedagógicas (Bassi, Lesser & Mateo, 2016; Espinoza y Taut, 2016).
Otra investigación similar en Chile fue realizada por Del Río, Strasser y Susperreguy (2016). En este estudio, se exploranron los estereotipos de género tanto implícitos como explícitos de 180 estudiantes, sus madres y padres de familia, y de 19 de sus educadoras de escuelas urbanas de la capital chilena. Para ello, se utilizaron dos instrumentos diseñados por Cvencek, Meltzoff & Greenwald (2011) del Institute for Learning and Brain Sciences (I-LABS), uno que asocia género y habilidades académicas de forma explícita (TEE, por sus siglas en inglés) y otro de manera implícita (IAT, por sus siglas en inglés). Estos cuestionarios se adaptaron a las capacidades de los participantes, de tal forma que contenían imágenes para los niños y las niñas, y conceptos para los adultos. En general, los resultados reflejaron que tanto los infantes como los adultos del estudio tienen un estereotipo que asocia las matemáticas con el género masculino (Del Río et al., 2016).
Por otra parte, la investigación de De la Rica y González (2013) basados en los resultados de PISA de 2009 concluyen que un factor determinante de la inequidad educativa identificada en estudios de este tipo lo constituye el grado de participación laboral de las madres (Unesco, 2016). Este efecto es más fuerte en los países que están debajo del promedio (baja participación femenina en el mercado laboral) y, por tanto, en sociedades donde estas madres “se destacan” entre sus colegas femeninas. Estas brechas se acortan aún más cuando se trata de sociedades tradicionalmente machistas (Marianne, 2010; De la Rica y González, 2013; Tomasetto, Mirisola, Galdi & Cadinu, 2015). Si bien esta correlación se encontró para las madres trabajadoras fuera de casa, no fue así para los padres trabajadores fuera de casa, ya que no se encontró correlación estadísticamente significativa (De la Rica y González, 2013).
3. RAZA Y ETNIA: UN RETO PARA LA EQUIDAD EN MEDICIÓN DE ÉXITO ESCOLAR CON PRUEBAS ESTANDARIZADAS
Como se mencionó, actualmente las discusiones sobre pruebas estandarizadas y sistemas de medición son temas imprescindibles cuando se reflexiona sobre la calidad educativa, en especial cuando se hace referencia a temas como rendimiento académico de los estudiantes, eficacia escolar y mejoramiento de los procesos educativos (Arzola-Franco, 2017; Lundren, 2013; Mons, 2009). En el caso de las investigaciones sobre eficacia escolar, se ha encontrado que los resultados en pruebas estandarizadas a gran escala han permitido identificar factores asociados que influyen en el desempeño de los estudiantes, tales como características personales, ambientes familiares y ambientes escolares (Murillo & Román, 2011). Un factor que históricamente ha sido objeto de discusión es la influencia de los factores socioculturales asociados a etnia y raza en el desempeño de estudiantes en pruebas estandarizadas. Algunos estudios científicos explican que los modelos estandarizados tienden a estar alineados con las necesidades de los estudiantes caucásicos de clase media, pues desde su creación fueron los referentes para la construcción de los test de tipo psicológico y de éxito escolar, lo cual podría generar sesgos en el momento de interpretar los resultados obtenidos por estudiantes con diferente condición socioeconómica y cultural al señalado (Stewart & Haynes 2015). Por ejemplo, el TIMSS reveló que el puntaje promedio en el eje de matemáticas de estudiantes de 4º grado de los Estados Unidos fue 529, donde los puntajes más altos (582) lo obtuvieron los estudiantes asiáticos, seguidos de caucásicos (550), mientras que los hispanos (504) y afrodescendientes (482) consiguieron resultados por debajo del promedio (Aud, Fox & KewalRamani, 2010). De igual manera, en este país, en los puntajes de matemáticas y lectura crítica de Suite of Assessments (SAT), calificada en una escala que va de 200 a 800, los caucásicos obtuvieron el más alto puntaje (528), seguidos de estudiantes asiáticos y de las islas del Pacífico (513); y los puntajes más bajos fueron obtenidos por afrodescendiente y latinos, así: puertorriqueños (456), otros hispanos/latinos (455), mexicano-americanos (454) y afrodescendientes (430) (Aud et al., 2010).
Las desigualdades étnicas asociadas a pruebas estandarizadas, en especial enfocadas en el caso de la población de los afrodescendientes en los Estados Unidos, ha sido motivo de debate desde hace muchos años en el mundo académico y sociopolítico; de hecho, existe evidencia científica robusta que soporta esta premisa (Fryer & Levitt, 2004). Investigadores como Fryer & Levitt señalan que los estudiantes afrodescendientes tienden a obtener aproximadamente una desviación estándar por debajo de los estudiantes caucásicos en pruebas estandarizadas, incluso, después de controlar covariables, como estructura familiar, nivel socioeconómico, características del vecindario, entre otros factores. Sin embargo, al parecer las diferencias identificadas no solo están asociadas a la raza, sino también a otros factores, como sesgo de las evaluaciones, sesgos del docente, pobreza, familia, condiciones del vecindario y, en especial, asociado a la calidad educativa de las escuelas, lo que incluye aspectos como condición socioeconómica, educación del profesorado, relación computadora estudiantes, interacciones docente-niño, entre otros (Fryer & Levitt, 2004). Por ejemplo, Brunn-Bevel & Byrd (2015) reportaron que los distritos escolares en Virginia con una representación desproporcionada de estudiantes afrodescendientes continúan teniendo docentes con los salarios más bajos y licencias de funcionamiento provisionales, mientras que los distritos escolares con mayores ingresos familiares están asociados con indicadores positivos de calidad educativa. Powers & Pivovarova (2017) reportaron que el coeficiente de los estudiantes nacidos en los Estados Unidos y los inmigrantes tiene una diferencia significativa de 27 puntos. De igual forma, revelan que al controlar la variable de estatus socioeconómico se evidencia una variación racial o étnica. Por ejemplo, los afrodescendientes, en comparación con los nativos estadounidenses y asiáticos, poseen bajas calificaciones, pero al mismo tiempo se hace evidente que los mejores resultados son de los alumnos pertenecientes a familias con mayores nivel socioeconómico y mejores condiciones institucionales (Alacaci & Erbaş, 2010).
Consistente con estos resultados, la Unesco (2005) ha evidenciado que las condiciones de vulnerabilidad económica y sociocultural son impedimentos para el desarrollo de los aprendizajes escolares, por ello que los estudiantes que provienen de estatus socioeconómicos bajos presentan un desempeño escolar menor en comparación con los que provienen de los estratos socioeconómicos altos. En esa misma línea, la OCDE (2013) afirma que el éxito escolar de los estudiantes se relaciona con cuatro factores que influyen en él: a) estratificación escolar; b) inversión en recursos financieros humanos, materiales y tiempo escolar; c) sistema de gobernanza de la escuela; y d) ausentismo de estudiantes y clima escolar. Por tanto, las desventajas socioeconómicas y socioculturales podrían ser reducidas si se intervienen dichos factores y se redireccionan a su favor, siempre y cuando también se generen pruebas estandarizadas que sean relevantes culturalmente para las particularidades de los diferentes grupos humanos.
Las disparidades étnicas en el rendimiento cognitivo no solo son un asunto pendiente por resolver para los Estados Unidos (Fryer & Levitt, 2004; Brunn-Bevel & Byrd, 2015). En países como India, Malasia y Sudáfrica, también se evidencian diferencias en esta dimensión del desarrollo humano. Por ejemplo, en las castas superiores indias, se presentan más altos puntajes que las castas consideradas “inferiores” (Rushton & Jensen, 2005). De igual manera, las minorías raciales de China y de las Indias orientales obtienen resultados más altos en Malasia que la población nativa. En América Latina, caracterizada por su alta diversidad cultural y lingüística, ya que cuenta con presencia de varios pueblos indígenas, las investigaciones revelan que los grupos indígenas reportan puntajes más bajos en los resultados de pruebas como Segundo Estudio Regional Comparativo y Explicativo (Serce) y Tercer Estudio Regional Comparativo y Explicativo (Terce) en relación con población no indígena (Treviño et al., 2010; Treviño et al., 2016).
Serce y Terce son estudios regionales desarrollados por el Laboratorio Latinoamericano de Evaluación de la Calidad de la Educación (Llece) de la Oficina Regional de Educación para América Latina y el Caribe (OREALC) que se constituyen en un ámbito de discusión técnico-político para el problema del aprendizaje y sus variables relacionadas (Unesco, 1997). Serce se llevó a cabo en 2006. Este contó con la participación de 16 países de América Latina, como Argentina, Brasil, Chile, Colombia, Costa Rica, Cuba, Ecuador, El Salvador, Guatemala, México y el estado de Nuevo León, Nicaragua, Panamá, Paraguay, Perú, Uruguay y República Dominicana. Las áreas que se evaluaron en el estudio fueron lectura y matemáticas en estudiantes del 3º y 6º año, y ciencias para los estudiantes de 6º año. En este estudio, se realizaron, además, evaluación de escritura de los alumnos de 6º y se aplicaron cuestionarios de contexto a padres, alumnos, docentes y directores (Treviño, 2009). A su vez, el Llece realizó una tercera prueba llamada Terce. Esta se aplicó en 2013 cuandi participaron 15 países de la región: Argentina, Brasil, Chile, Colombia, Costa Rica, Ecuador, Guatemala, Honduras, México, Nicaragua, Panamá, Paraguay, Perú, República Dominicana y Uruguay, más el estado mexicano de Nuevo León. Este tercer estudio evaluó el desempeño de los estudiantes de 3º y 6º, en que se diseñaron pruebas de matemáticas, ciencias, lectura y escritura. Además, se evidenciaron en dicha prueba datos sobre los factores asociados que contextualizan los resultados (Unesco, 2014).
En el análisis de los resultados de las evaluaciones de Terce realizado por la Unesco, se pone en evidencia la existencia de una brecha amplia en relación con los logros de aprendizajes entre los estudiantes de los pueblos originarios y los que no lo son, en especial en países como Perú, Paraguay, Panamá y Nicaragua. El análisis de los logros de aprendizaje en las pruebas Terce muestran diferencias que oscilan entre 18 y 43 puntos según al país de pertenencia de los estudiantes indígenas. Sin embargo, en algunos casos, los resultados demuestran que el rendimiento se asocia significativamente al nivel socioeconómico al que pertenezcan los estudiantes y poco a la relación con las raíces étnicas, ejemplo de ello son los países de Colombia y Honduras; pero, por el contrario, en Paraguay, la asociación entre origen indígena y logro académico es significativo (Treviño et al., 2016). Suárez, Elías y Zarza (2016) reportan que el origen de las desigualdades en pruebas como Terce en Paraguay están asociados a género y nivel socioeconómico de la familia, así como a cualidades individuales como el idioma y aspectos institucionales (p. ej., la cantidad de recursos de la escuela, su condición de privada o pública, así como aspectos tales como la relación negativa entre la repetición escolar y el rendimiento académico, las actividades extracurriculares asociadas a mejor rendimiento, y el ausentismo del docente y del estudiante). En términos socioculturales, la Unesco (2013) también reportó que en Paraguay hay niños y niñas indígenas a quienes se les aplicó la prueba estandarizada Terce, cuyos resultados son similares a los niveles de aprendizaje de los niños que no son indígenas para el caso de 3er grado; sin embargo, los resultados en matemáticas son más bajos para los niños indígenas en el nivel de 6º grado.
En general, las desigualdades existentes parecen estar asociadas a factores que trascienden el ámbito socioeconómico, y al parecer se encuentran relacionadas con la falta de oportunidades a la que los pueblos indígenas se encuentran expuesto en cada país debido a la ausencia de políticas inclusivas y relevantes culturalmente que respondan a sus características y necesidades particulares (Borja-Vega, Lunde & García Moreno, 2007; Hall & Patrinos, 2004). En otras palabras, las posibilidades son escasas para la población indígena de América Latina, en especial para los grupos que habitan en zonas rurales o urbanas que cuenta con difícil acceso a servicios básicos, tales como agua, electricidad, alcantarillado, entre otros (Borja-Vega et al., 2007). Es importante considerar, para interpretar y comprender el Terce, que se concibe a los estudiantes indígenas como aquellos que pertenecen a una familia que se comunica por medio de la lengua indígena y tiene como madre a una mujer que pertenece a una etnia (Treviño et al., 2016); por tanto, es un concepto mucho más inclusivo que no se limita a las condiciones particulares del niño, sino que es una concepción más ecológica que estima el ámbito familiar del sujeto.
En las evaluaciones estandarizadas de aprendizajes nacionales, es interesante analizar el caso de Colombia, el cual es considerado un país pluricultural y multilingüe, debido a “la existencia de 87 etnias indígenas, 3 grupos diferenciados de población afrocolombiana y el pueblo ROM o gitano” (Departamento Administrativo Nacional de Estadística [DANE], 2007, p. 9). Los resultados de las pruebas estandarizadas de Colombia denominadas Saber 11, las cuales evalúan a los estudiantes que están a punto de terminar la educación media en las competencias de lectura crítica, matemáticas, sociales y ciudadanas, ciencias naturales e inglés, incluyen un cuestionario de contexto para hacer seguimiento a los procesos de enseñanza y aprendizaje generales y específicos de cada región y localidad, así como analizar otros factores sociales, tales como características de la familia, condiciones de la vivienda, alimentación, uso del tiempo libre, entre otros (Icfes, 2017). Martínez y Turriago (2015) señalaron que el mejor rendimiento del periodo de 2005 a 2006 se concentró en Bogotá y en los departamentos de Santander, Boyacá y Caldas, los cuales conforman la zona andina de Colombia, caracterizada por presentar los índices más bajos de necesidades básicas insatisfechas, en contraste con zonas periféricas, como las zonas limítrofes de Colombia con países de Suramérica, la Costa Caribe y la Costa Pacífica, cuyas condiciones socioeconómicas son más limitadas y reportan puntajes más bajos que el resto del país. Consistentemente, Ayala-García (2015) identificó que el promedio de estudiantes que presentan bajo nivel de competencia (superior al 50 %) en el segundo semestre de 2013 se encuentran ubicados en los departamentos de “Vaupés (58 %), Chocó (57 %), Amazonas (54 %), Vichada (54 %), Magdalena (53 %), La Guajira (52 %), Cauca (51 %), Córdoba (51 %), Guaviare (51 %) y Bolívar (50 %)” (p. 13), todos ellos localizados en zonas periféricas. Lo anterior indica una relación inversamente proporcional entre el índice de necesidades básicas insatisfechas y los mejores resultados del Icfes de 2005, que pone en evidencia la relación del bajo nivel de competencias de los estudiantes y la pobreza departamental (Martínez & Turriago, 2015; Núñez y Carvajal, 2007). En esta misma línea, la Unesco (2016) afirma que, al controlar la variable socioeconómica en Colombia en el momento de analizar pruebas estandarizadas de aprendizaje, el factor asociado de pertenencia étnica no representa significancia en los resultados escolares (citado por Icfes, 2016). De hecho, este fenómeno se extiende a todos los países de América Latina donde la pertenencia a un pueblo originario o etnia se encuentra asociada a condiciones económicas y accesibilidad de servicios educativos desfavorables; y con ello, más que el aprendizaje, los resultados de las pruebas estandarizadas muestran una radiografía sobre el suministro y distribución de los servicios básicos y calidad de los recursos educativos en las diferentes zonas del país.
Es importante señalar que los resultados asociados a variables como etnia y raza deben leerse muy sutilmente para no promover la discriminación. A pesar de que se proclama socialmente que se rechaza el prejuicio racial, los sesgos pueden afectar los juicios y generar discriminación al malinterpretar los resultados de pruebas asociadas a éxito escolar (Glaser, Spencer & Charbonneau, 2014; Stewart & Haynes, 2015). Por este motivo, es fundamental utilizar marcos teóricos que permitan comprender e interpretar el fenómeno, tal como lo es el Critical Race Theory (CRT), el cual permite examinar y comprender cómo las pruebas estandarizadas promueven un sistema de evaluación son sesgos raciales y étnicos implícitos, así como prácticas meritocráticas particulares a cada grupo sociocultural que en cierto modo condicionan los procesos educativos. Entender las limitaciones de las pruebas estandarizadas como práctica evaluativa inclusiva es fundamental en el momento de tomas de decisiones pedagógicas en el aula e institucionales, e incluso en políticas públicas en los países, ya que su omisión podría conducir a desigualdades educativas (Zwick, 2001). Un caso muy común son los procesos de admisión a educación superior, los cuales dependen de los puntajes de las pruebas estandarizadas, que, en realidad, va más allá de un simple puntaje, puesto que se asocia principalmente a factores como los ingresos del hogar, el origen étnico y la educación de los padres (Adelman, 2007; Guinier, 2015).
Un análisis e interpretación culturalmente pertinente y relevante de los resultados de las evaluaciones estandarizadas facilita que los gobiernos, escuelas y los sujetos participantes identifiquen problemas para orientar el diseño de planes de mejoramiento que permiten redireccionar los procesos educativos de acuerdo con la realidad del entorno (Mons, 2009). Sin embargo, hay algunas corrientes que mencionan que los resultados obtenidos por medio de las evaluaciones a gran escala están contribuyendo al modelo de escuela tradicional, la cual está mediada por la presión de la obtención de resultados predeterminados y homogeneizantes que poco contribuyen a la naturaleza inclusiva de una educación equitativa y de calidad (Lundren, 2013).
4. ALGUNAS CONCLUSIONES Y FUTURAS ACCIONES
La evaluación en general responde a los modelos de desarrollo y de producción de una sociedad. La evaluación en contextos educativos no se aleja de esta situación en que el rendimiento, la eficacia y la eficiencia se constituyen en indicadores centrales de la calidad de los sistemas educativos. Medir a través de resultados puede ser conveniente cuando se desea tener un panorama global de la situación educativa. No obstante, esta mirada general puede esconder algunas realidades particulares y contextuales que la evaluación crítica, cualitativa y formativa puede ofrecer. Más allá de la estandarización, es necesario dar cabida a la diferencia en un país y un mundo que cada vez más reconoce la multi- y pluridiversidad. La evaluación de la calidad desde indicadores cualitativos permitiría identificar los logros en la diferencia. Como lo plantean Gómez y Sánchez (2013, p. 21), se requiere una metodología cualitativa que posibilite reconocer las particulares y características, y que proporcionen “la mirada subjetiva de cada actor educativo, pero en conjunto dichas miradas permiten conocer lo que ellos piensan y sienten con respecto al ejercicio curricular” y formativo. Evaluar la calidad de la educación desde esta perspectiva implica ver no solo los efectos y resultados, sino también los procesos, las actuaciones, las dinámicas, las interacciones y los valores que genera. Una educación de calidad se concretiza en la posibilidad de construir sociedades que progresan hacia el bienestar y la felicidad del ser humano. Así es como esta se constituye en un derecho.
Si la educación es un derecho humano, entonces debe ser universal, por lo que no debería haber condiciones para que este sea concedido. La autonomía escolar y la equidad que proclama la Ley 115/1994, de 8 de febrero se ve amenazada por la disposición de una evaluación estandarizada. La equidad reclama una evaluación diversificada que contextualiza y considera las diferencias y particularidades. No obstante, el sentido formativo de la evaluación y su papel de co-constructor de una sociedad justa, democrática y equitativa se ve influenciada por las creencias, las visiones de sus actores sobre estos mismos principios y los valores. La historia de la humanidad es testigo vivo de la exclusión y discriminación de género que han sufrido las niñas y las mujeres en la sociedad. Durante mucho tiempo, las féminas fueron disciplinadas y moldeadas por las instituciones religiosas, sociales y gubernamentales para ejercer el único papel social y moralmente aceptado para ellas: madres y esposas. En el caso colombiano (y de muchos países latinoamericanos), solo hasta la tercera década del siglo pasado se les reconoció la igualdad con los varones en cuanto a derechos civiles y ciudadanos (Ley 28/1932, de 12 de noviembre), y hace tan solo sesenta años atrás se les otorgó el derecho de votar. Desde entonces se han observado, por ejemplo en el contexto educativo, brechas de género con detrimento del género femenino, lo cual se evidencia en los resultados de pruebas estandarizadas nacionales e internacionales, en especial en el área de matemáticas. Aspecto que ha incidido negativamente en la poca representación de las mujeres en carreras STEM, como ingeniería y matemáticas, y por ende en el mercado laboral de las mujeres en términos de oportunidad, salarios, estabilidad, promoción y estatus. Aunque las primeras hipótesis apuntaban a que los aspectos genéticos podrían estar detrás de estas diferencias, las investigaciones recientes evidencian la estratificación social como la responsable de estas diferencias. Desde entonces, diversos entes nacionales e internacionales a través de políticas públicas y planes educativos han buscado reducir esta brecha de género que todavía existe en los contextos educativos y laborales.
Algunos procesos evaluativos realmente no incluyen la diversidad de la naturaleza humana, a pesar de que idealmente estos procesos deberían orientarse por el principio de equidad y consolidarse como un proceso holístico formativo que contribuye con el mejoramiento de la calidad de vida del ser humano. En relación con la evaluación que usa pruebas estandarizadas, los factores socioeconómicos asociados a ingreso, nivel educativo de pares, características del ambiente familiar, características del barrio, entre otros, así como factores culturales relacionados con etnia y raza, históricamente no han sido in extenso representados en las grandes mediciones, lo que ha generado sesgos en el momento de reportar e interpretar de manera homogeneizante los resultados. Tal como se presenta en este artículo, esta homogeneización y falta de pertinencia sociocultural se ha presentado a lo largo de la historia en diferentes países del mundo, que todavía tienen el reto de convertir los procesos evaluativos estandarizados en dinámicas inclusivas, pertinentes, relevantes y representativas.
En consecuencia, es fundamental que el diseño psicométrico de los instrumentos, como los procesos de administración y el análisis de datos, se generen a partir de la realidad del contexto y las particularidades de sus participantes. La reducción del sesgo en pruebas estandarizadas es un reto fundamental en pro de la dignidad de las personas, que muchas veces es vulnerada por el desconocimiento de sus particularidades en función del sexo, el nivel socioeconómico, la religión, la etnia, la raza, el grupo etario, entre otras. Dicha reducción permite la comprensión y el respeto del individuo como ser único y miembro de una colectividad, y evita las movilizaciones y tomas de decisiones que afectan a determinados grupos de la sociedad. De ahí que las pruebas estandarizadas deben garantizar la confiabilidad, objetividad y validez del instrumento para todos los participantes. De esta manera, los procesos evaluativos darían realmente fe del aprendizaje de cada uno de los participantes, pero a la vez de la visión general y acertada de la calidad del sistema educativo en que dichos participantes aprenden y se desarrollan. Así, se requiere una apuesta a la equidad, confiabilidad y transparencia de los procesos evaluativos para que de esta manera informen de forma precisa sobre la realidad del contexto, y así se puedan generar políticas institucionales, locales, nacionales e internacionales que permitan el mejoramiento de la educación.
Esta apuesta no solo debe permear el proceso de construcción y administración de los instrumentos de medición, sino también a los evaluadores, los evaluados y a todo aquel agente político y social interesado en conocer los resultados arrojados y tomar acciones sobre ello. En el caso de Colombia, es hora ya de tomar acciones. Como lo muestra este artículo, los resultados de las pruebas estandarizadas y de los estudios de factores asociados han demostrado que el factor socioeconómico amplía brechas sociales en el territorio colombiano; por tanto, el Icfes, el MinEducación, las universidades y las entidades interesadas en la medición de la calidad de la educación en el país requieren un trabajo colaborativo para la formulación de nuevos instrumentos que apunten a la pluralidad y diversidad colombiana, y así dar cuenta del principio inclusivo que se proclama y se protege desde el marco legal.