Introducción
Las tecnologías de la información y las comunicaciones (TIC) permean cada vez más las actividades cotidianas de las personas. En Colombia, de acuerdo con el Departamento Administrativo Nacional de Estadística -DANE- (2016), el porcentaje de hogares que poseía un computador de escritorio, portátil o tableta en 2015 era de 45 % en el total nacional, 53 % en las cabeceras urbanas y 12 % en el sector rural. De acuerdo con la Organización para la Cooperación y el Desarrollo Económico -OECD- (2015a), para el caso específico de la población escolar, el porcentaje de estudiantes en Colombia que presentaron las pruebas del programa para la evaluación internacional de alumnos (PISA) que reportaron acceso al menos a un computador en su hogar pasó de 47,8 % en 2009 al 62,9 % en 2012.
Aunque esta cifra contrasta con las estadísticas de los países desarrollados, en los que casi el 100 % de los estudiantes tiene un computador en casa, la cifra también refleja un avance significativo en el acceso a tales tecnologías en el país.
La evolución en el acceso y uso de las TIC en Colombia ha estado vinculada a la política pública. Por ejemplo, durante el periodo 2010-2014 el gobierno nacional implementó el programa Plan Vive Digital, el cual impulsó simultáneamente cuatro componentes: infraestructura, servicios, aplicaciones y usuarios. Este programa buscaba no solo mejorar la competitividad del país, sino también llevar las TIC a zonas con bajos niveles socioeconómicos. De acuerdo con la OECD (2015b), en 2015 se habían instalado 449 “Puntos Vive Digital” en áreas menos favorecidas y 6548 “Kioscos Vive Digital” en centros urbanos con más de 100 habitantes. A nivel departamental, algunos gobiernos regionales también han destinado recursos para programas que entregan, fundamentalmente, computadores y tabletas a población en edad escolar.
En estas condiciones de aumento generalizado en el acceso y uso de las TIC por parte de la población joven en Colombia, el presente estudio intenta responder a las siguientes preguntas: ¿Puede el acceso a las TIC en Colombia mejorar el desempeño académico de los estudiantes con bajo rendimiento académico? ¿En qué áreas de conocimiento, y en qué parte de la distribución de habilidades, el acceso a las TIC tiene su mayor impacto? ¿Existe alguna externalidad positiva sobre el desempeño académico que sea resultado de la densidad en el acceso a las TIC a nivel de institución educativa? ¿Cuál es el grado de dependencia espacial de los resultados asociados al acceso a TIC y el desempeño académico a nivel municipal? ¿Cómo ha evolucionado el efecto de las TIC sobre el desempeño académico en los últimos años?
Para responder a estas preguntas, el presente artículo propone una metodología desarrollada en tres partes. En primer lugar, para estudiar la correlación entre las TIC y el desempeño académico individual, se utiliza un enfoque de regresión cuantílica que, empleando modelos econométricos, permite estimar tales correlaciones en diferentes partes de la distribución de habilidades de los estudiantes. En segundo lugar, dada la importancia de considerar los factores asociados a la localización geográfica, se calculan índices de autocorrelación espacial para conocer el grado de dependencia espacial de los resultados a nivel municipal. Finalmente, dado que no es posible corregir los problemas de endogeneidad a nivel individual, en este caso específico se estima el efecto causal de la proporción de estudiantes con computador sobre el rendimiento académico a nivel de municipio, utilizando un modelo de variables instrumentales.
En este orden de ideas, el presente artículo realiza dos aportes a la literatura. En primer lugar, considera el efecto diferencial que pueden tener las TIC sobre la distribución de habilidades de los estudiantes en las áreas de Lenguaje, Matemáticas e Inglés. Los estudios sobre el tema se han enfocado principalmente en la estimación del efecto promedio de la tenencia de computador o internet sobre el rendimiento académico. Lo anterior implica que existen pocos estudios para el caso colombiano sobre la relación entre el acceso a las TIC y el rendimiento académico para estudiantes que tienen alto y bajo desempeño académico. El presente trabajo, al considerar un enfoque de regresión cuantílica, avanza en esta última dirección. En segundo lugar, utilizando un enfoque de variables instrumentales, presenta evidencia a nivel municipal del efecto causal de la mayor disponibilidad de computadores (proporción de estudiantes con computador) sobre el rendimiento académico promedio.
Los resultados a nivel individual sugieren que la tenencia de computador está asociada a un mejor desempeño en Lenguaje y Matemáticas, y a un menor desempeño en Inglés. Cuando se estudia la tenencia con conexión a internet, los resultados sugieren correlaciones positivas crecientes a lo largo de la distribución de habilidades en casi todas las áreas y periodos. Durante el periodo de estudio, los coeficientes estimados parecen haberse reducido. Con relación a los efectos a nivel de municipio, el análisis espacial sugiere una alta correlación espacial entre acceso a TIC y los puntajes de las pruebas Saber 11. Las estimaciones del efecto causal por variables instrumentales indican un gran efecto sobre el rendimiento académico de la proporción de computadores y una relación negativa con la proporción de computadores conectados a internet.
Este documento se estructura de la siguiente forma. Adicional a esta introducción, se incluye una revisión de literatura sobre el efecto de diferentes medidas de TIC sobre el rendimiento académico. Posteriormente, se explica el marco teórico y se presenta la metodología. Después, se presentan los resultados del modelo a nivel individual y consecutivamente se presentan los índices de autocorrelación espacial y los resultados del modelo a nivel municipal. Finalmente se presentan algunas conclusiones.
I. Revisión de literatura
El estudio de los factores generales asociados al rendimiento académico a nivel internacional inicia con los trabajos pioneros de Carroll (1963) en el campo teórico, y Coleman et al. (1966) y Jencks et al. (1972) en el campo aplicado. Desde la economía, Hanushek (1972, 1979, 1986) plantea un modelo teórico basado en el concepto de función de producción en el que los resultados del logro individual de los estudiantes están directamente relacionados con dos tipos de insumos: los que se pueden modificar mediante política pública y los que no. En el primer caso encontramos las características de las escuelas, como los profesores y el currículo, mientras que en el segundo tenemos las dotaciones innatas de los estudiantes, como su capacidad de aprender y su entorno familiar y social.
En el contexto de la función de producción educativa, las TIC estarían dentro del primer grupo de insumos con efectos mixtos desde el plano teórico. Por un lado, las TIC son útiles en el desarrollo de tareas en casa y pueden ayudar en el aprendizaje mediante la consulta y el uso de programas educativos. Por otro lado, constituyen una fuente de distracción para los estudiantes, en la medida en que facilitan los juegos y permiten navegar por la web desplazando actividades productivas por ocio. De acuerdo con Bulman y Fairlie (2016), los resultados a nivel internacional sugieren efectos mixtos -y en algunos casos nulos- de la tenencia o inversión en TIC.
A manera de síntesis, en las tablas 1A y 2A del anexo se presentan los resultados de los estudios que han estimado el efecto del acceso a TIC sobre los resultados académicos en pruebas estandarizadas y sobre otras medidas de desempeño académico a nivel internacional. De acuerdo con estos resultados, en el primer caso, el acceso a TIC está asociado, en general, a un mejor desempeño académico, independientemente del tipo de datos y del enfoque metodológico utilizado (Tabla 1A, anexo). La evidencia está respaldada por estudios realizados para varios países en los que se estiman regresiones multivariadas, modelos probit y regresiones cuantílicas.
De otro lado, en la Tabla 2A del anexo se muestran los resultados del efecto de las TIC sobre otras medidas de rendimiento académico relacionadas con la inscripción y graduación en colegios, con índices de rendimiento educativo y con habilidades en otras áreas. En este caso, el efecto estimado también es, en general, positivo y se basa en evidencia -principalmente para Estados Unidos- que utiliza modelos probit, panel de datos y experimentos controlados y cuasiexperimentos en sus estimaciones.
Para el caso colombiano y con relación a los determinantes generales del rendimiento académico, Piñero y Rodríguez (1998), Sarmiento et al. (2000, Gaviria y Barrientos (2001) y Viáfara y Urrea (2006) aportan evidencia a nivel nacional, mientras que Correa (2004) lo hace para Cali, y Barrientos (2008) y Tobón et al. (2009) para Medellín. Los estudios específicos del impacto del acceso a TIC sobre el desempeño académico reportan efectos positivos. Chica et al. (2010), Parra (2013) y Hernández (2015) lo hacen a partir de datos de las pruebas Saber 11; Rodríguez et al. (2011) lo hacen a partir del programa Computadores para Educar; mientras que Sierra (2017) evalúa el grado de apropiación de las TIC por parte de los docentes.
En general, la literatura para Colombia no contempla el efecto diferencial que pueden tener las TIC sobre la distribución de habilidades de los estudiantes en diferentes campos del conocimiento. En el mejor de los casos, los estudios analizan el efecto promedio de la tenencia de computador o internet en diferentes categorías de rendimiento académico mediante modelos multinomiales. Por tanto, no es posible concluir si las TIC mejoran el desempeño de los estudiantes con bajo rendimiento académico.
Adicionalmente, existen pocos estudios para Colombia que aporten evidencia empírica sobre el grado de correlación espacial a nivel municipal entre estas variables y, especialmente, sobre el efecto causal del acceso a TIC sobre el rendimiento académico promedio municipal.
II. Marco teórico
El concepto de función de producción educativa fue propuesto por Carroll (1963), para quien el logro educativo (años de educación o desempeño en pruebas) está en función de unos insumos o factores productivos que al interactuar generan o producen un logro educativo. Estos insumos se relacionan con condiciones personales, familiares y de entorno, propias de cada estudiante. Hanushek (1972, 1979, 1986) retoma esta idea y plantea un modelo en el que los resultados del logro individual de los estudiantes están directamente relacionados con dos tipos de insumos. Los primeros insumos están relacionados con las dotaciones innatas del estudiante, su capacidad de aprender y el entorno familiar y de amigos, los cuales no pueden ser modificados por la política pública. En el segundo grupo se encuentran las características de las escuelas, los profesores y el currículo, que sí son susceptibles de reformarse. El modelo general descrito por Hanushek (1979) viene dado por la ecuación (1):
donde el logro educativo, Y it , depende del vector de características personales, P it , del vector de características familiares, B it , del vector de características de la escuela, S it , y del vector de habilidades innatas, A it . Para efectos de este trabajo, dentro de las características personales tenemos la edad y el sexo. Las características familiares vienen dadas por el número de personas en el hogar, el nivel educativo de los padres y el estrato socioeconómico. Las características de la escuela se relacionan con la ubicación urbana o rural, con la naturaleza de la institución, con la jornada escolar y con un indicador de eficiencia. Las medidas de acceso a TIC consideradas son: la tenencia de computador en el hogar, la tenencia de computador con internet y la densidad de computadores de los compañeros del estudiante a nivel de institución educativa, que se propone como medida de externalidad de red.
III. Datos y métodos
A. Datos
Los datos utilizados corresponden a las bases de datos de las pruebas Saber 11 del calendario A1 de los años 2014 y 2016, suministradas por el Icfes y el Censo de población de 1973 proporcionado por el DANE. Se eligieron estos años de las pruebas Saber 11 por ser los más recientes en el momento del desarrollo de la investigación, y porque desde el punto de vista metodológico se pueden comparar los puntajes de las áreas evaluadas. Estas pruebas son presentadas por estudiantes de grado undécimo y por bachilleres. El examen cuenta con cinco pruebas, de las cuales se estudiaron tres: Lectura Crítica (Lenguaje), Matemáticas e Inglés. Estas pruebas evalúan diferentes competencias en cada una de las áreas y se califican con números enteros en una escala de 0 a 100.
Para efectos de la estimación, los puntajes de las pruebas fueron estandarizados para cada área y año analizados. Con relación a las variables TIC, la base de datos proporciona información sobre la tenencia de computador en el hogar y sobre la existencia de servicio o conexión a internet. Con base en esta información, se define la variable explicativa de interés, tenencia de computador, y variables complementarias como tenencia de computador e internet y densidad de computadores por institución. La tenencia de computador e internet en el hogar representa la interacción entre las dos variables dicótomas, y la densidad de computadores por institución educativa representa al número de estudiantes que tienen computador respecto del total de estudiantes por institución educativa.
Por otra parte, la base de datos del Icfes ofrece información sobre características sociodemográficas de los estudiantes. En la estimación se incluye el sexo, la edad, la región, el estrato y la educación de los padres; se consideran solo estas variables con el fin de evitar posibles problemas de colinealidad. Finalmente, el Censo de población de 1973 permite caracterizar la población y ofrece información válida para la definición de instrumentos que permitirán predecir las condiciones recientes de acceso a TIC.
B. Regresión cuantílica
Para estimar la asociación estadística entre el acceso a TIC a nivel individual y el rendimiento académico del estudiante, se utiliza un modelo de regresión cuantílica (RC). Este modelo permite estimar el impacto de una variable explicativa sobre diferentes percentiles de la distribución condicional de habilidades de los estudiantes en diferentes áreas de conocimiento. Lo anterior es una ventaja respecto del método de mínimos cuadrados ordinarios (MCO) que solo permite una estimación en la media (Koenker, 2005). El modelo de RC se presenta en la ecuación (2):
en donde habilidades Qy|x (τ) representa elx. Los detalles de la estimación se encuentran τ-ésimo cuantil de la distribución de (y) condicional en en Koenker y Bassett (1978, 1982). En el presente estudio, la variable dependiente (y) es el puntaje estandarizado de las pruebas en las diferentes áreas evaluadas; y la matriz de variables explicativas (x) está compuesta por factores individuales, familiares, de contexto y de acceso a las TIC (tenencia de computador en casa, tenencia de computador e internet y densidad de computadores por institución educativa). El grado de asociación estadística de cada variable explicativa sobre la distribución condicional de la variable dependiente viene dado por la ecuación (3):
en donde el efecto marginal de cada variable explicativa varía a lo largo de la distribución condicional de habilidades.
C. Autocorrelación espacial
Dadas las limitaciones del enfoque individual, en el sentido de no poder estimar un efecto causal, el presente artículo explora un enfoque agregado para avanzar en este propósito. Para ello, se realiza en primer lugar un análisis espacial del efecto de las TIC a nivel de municipio. En particular, este análisis permite evaluar la existencia de una dependencia espacial entre la proporción de computadores por municipio y el desempeño académico promedio en estas unidades geográficas. Para estimar la autocorrelación entre las unidades espaciales, se utiliza el índice I de Moran global (ecuación (4)).
En donde n es el número de unidades espaciales; y es la variable de interés; y es la media de esta variable y w ij es la matriz de pesos. Los valores de este índice se encuentran entre -1 y 1, donde los valores negativos indican conglomerados distintos (autocorrelación espacial negativa), mientras que los valores positivos indican que son similares (autocorrelación espacial positiva). Por otra parte, los valores cercanos a cero indican la falta de relación entre conglomerados. Para identificar conglomerados espaciales, se utilizan los indicadores locales de asociación espacial (LISA), que estiman cinco tipos de conglomerados espaciales a partir de los resultados del I de Moran. Los LISA explican las relaciones entre dichos conglomerados, dependiendo de si se encuentran por encima o por debajo de la media. Los conglomerados son: alto-alto, bajo-bajo, alto-bajo, bajo-alto y no significativos.
D. Variables instrumentales
Es importante precisar que el acceso a las TIC no es una variable exógena y puede estar influenciada por factores inobservables no considerados en el modelo individual. Por tanto, es necesario adoptar un enfoque que solucione este problema de endogeneidad y de sesgo en la estimación del efecto del acceso a las TIC sobre el desempeño académico. El método de variables instrumentales (VI) permite avanzar en ese sentido. La base de datos a nivel individual no contiene buenos instrumentos, por lo que se opta por un enfoque agregado (municipal) en el que sí es posible evaluar diferentes instrumentos y corregir el sesgo.
El enfoque de VI parte de un conjunto de ecuaciones en las que se presenta el efecto de la proporción de estudiantes con computador sobre el desempeño promedio municipal (ecuación (5)) y el conjunto de instrumentos que se utilizan para predecir la variable endógena, en este caso la proporción de estudiantes con computador (ecuación (6)). El método consta de dos etapas: en la primera, se estima la ecuación (6) a partir de un conjunto de instrumentos Z y se predicen los valores de la proporción de estudiantes con computador; y en la segunda, se estima la ecuación (5) con los valores pronosticados en el paso anterior. El modelo se evalúa a partir de la significancia estadística global e individual, y mediante una prueba de Hansen en la que la hipótesis nula es que los instrumentos son válidos.
En la ecuación (5), la variable dependiente desempeño académico j representa el promedio del puntaje estandarizado del municipio j; x j representa las variables sociodemográficas e institucionales y γ k denota el efecto fijo del departamento k en el que está ubicado el municipio j. En la ecuación (6) la variable dependiente proporción de estudiantes con PC representa el número de estudiantes que cuentan con un computador en casa respecto del total de estudiantes por municipio.
El conjunto de instrumentos utilizados para predecir la proporción de estudiantes con pc (Z j ) se toman del censo de 1973 del DANE. Específicamente, se consideran como instrumentos: la proporción de población menor a cinco años, la proporción de población femenina y la proporción de profesionales, todos en relación con 1973. Se espera que estas variables estén altamente correlacionadas con la proporción de estudiantes con computador en el municipio, pero no deberán estar correlacionadas con el desempeño académico promedio municipal. Conceptualmente, se asume que, por el periodo de tiempo considerado y por la importancia de estas variables en el desarrollo de los municipios y en la demanda de TIC, estas dos condiciones se espera que se cumplan.
De acuerdo con Fiorini (2010), el acceso a TIC está mediado por la decisión de los padres de tener un computador en el hogar. En ese sentido, las variables seleccionadas como instrumento a nivel municipal del censo de 1973 reflejarían la estructura sociodemográfica y educativa de un hogar promedio en el municipio, que a su vez puede transmitirse entre generaciones. Esto se encuentra en línea con lo expuesto por Lera-López et al. (2009) y Agostini y Willington (2012), quienes encuentran que la edad, el nivel educativo, la ocupación laboral y el sexo del jefe del hogar condicionan la probabilidad de acceder y usar las TIC.
IV. Resultados
A. Estadísticas descriptivas
i) Estadísticas a nivel individual
La Tabla 1 presenta las estadísticas descriptivas de los puntajes obtenidos en los años 2014 y 2016 en las áreas estudiadas. Durante el periodo considerado se presentó una mejora en términos de rendimiento académico en las tres áreas. En Lenguaje el promedio pasó de 50,5 a 53,08; en Matemáticas la media pasó de 50,53 a 51,46; mientras que en Inglés el promedio pasó de 50,39 a 52,48. En los dos últimos casos, la dispersión en los resultados también aumentó.
Las Tablas 2, 3 y 4 describen características socioeconómicas e institucionales. En ellas se observa que la mayor proporción de estudiantes son mujeres, viven en las zonas urbanas del país y pertenecen principalmente a los estratos 1, 2 y 3. En cuanto a la educación de los padres, al menos el 70 % cursaron algún grado de primaria o secundaria y, en general, las madres tienden a tener mayores niveles de educación. Finalmente, más del 70 % de las instituciones son de tipo oficial, más de la mitad son de jornada de la mañana y alrededor del 45 % de las instituciones obtienen un puntaje mayor en Lenguaje respecto de la media a nivel municipal.
Área | Media | Desviación | P10 | Mediana | P90 | Observaciones | |
---|---|---|---|---|---|---|---|
Lenguaje 2014 | 50,50 | 9,79 | 38 | 51 | 63 | 482055 | |
2016 | 53,08 | 9,48 | 41 | 53 | 66 | 491993 | |
Matemáticas 2014 | 50,53 | 9,79 | 39 | 50 | 63 | 482055 | |
2016 | 51,46 | 11,42 | 36 | 52 | 66 | 491993 | |
Inglés 2014 | 50,39 | 9,89 | 41 | 48 | 61 | 482055 | |
2016 | 52,48 | 11,58 | 38 | 51 | 69 | 491993 |
Fuente: elaboración propia.
Sexo | 2014 | 2016 |
---|---|---|
(%) | (%) | |
Hombre | 45,5 | 45,8 |
Mujer | 54,5 | 54,2 |
Región Urbano | 80,1 | 77,8 |
Rural | 19,9 | 22,2 |
Sisben 1 | 45,8 | 52 |
2 | 22,2 | 21,4 |
3 | 4,0 | 3,5 |
4 | 0,8 | 0,9 |
5 | 27,2 | 22,1 |
Estrato 1 | 42,0 | 44,8 |
2 | 34,9 | 34,4 |
3 | 17,9 | 16,2 |
4 | 3,7 | 3,3 |
5 | 1,1 | 1,0 |
6 | 0,4 | 0,4 |
Fuente: elaboración propia.
Tipo | 2014 | 2016 |
---|---|---|
Oficial | 74,5 | 74,7 |
No Oficial | 24,3 | 24,0 |
Otro | 1,1 | 1,2 |
Jornada Mañana | 53,9 | 54,7 |
Tarde | 16,3 | 15,3 |
Nocturna | 4,8 | 4,6 |
Completa | 20,6 | 20,6 |
Única | 0,02 | 0,4 |
Sabatina | 4,3 | 4,3 |
Desempeño Alto | 45,9 | 46,6 |
Fuente: elaboración propia.
De otra parte, la Tabla 5 muestra que cerca del 60 % de los estudiantes tienen acceso a un computador en casa y un poco más del 52 % tienen acceso a internet. Durante el periodo analizado, la tenencia de computador ha disminuido mientras que el acceso a internet ha crecido. Aunque este resultado parece en principio contradictorio, puede explicarse por una mayor tendencia al uso de dispositivos electrónicos respecto de los equipos de cómputo, lo cual es consistente con una mayor demanda de internet. La menor tenencia de computadores en casa se ve reflejada también en una menor densidad de computadores por parte de compañeros en la institución educativa.
Variable TIC | 2014 | 2016 |
---|---|---|
Tenencia de computador | 63,1 | 59,7 |
Acceso a internet | 52,0 | 53,5 |
Densidad de computadores | 0,63 | 0,6 |
Fuente: elaboración propia.
La Tabla 6 presenta la composición socioeconómica de la tenencia de computador y acceso a internet. En este caso, los que tienen una mayor proporción de computadores y de acceso a internet son los hombres, los estudiantes que viven en zonas urbanas, los de estratos socioeconómicos más altos y pertenecientes a colegios privados. El acceso a internet crece durante el periodo, aunque con un menor ritmo en los estratos altos.
ii) Estadísticas a nivel municipal
Los patrones observados a nivel nacional se evidencian también a nivel municipal. La Tabla 7 presenta algunas estadísticas de los puntajes a nivel municipal, y en la Figura 1 se presenta la variación, entre 2014 y 2016, del puntaje promedio por área evaluada a nivel municipal. En este caso, se evidencia que, en gran parte de los municipios del país, el puntaje promedio de la prueba aumentó. Al parecer, las mejoras en Lenguaje se presentaron de forma más homogénea a lo largo y ancho del territorio, mientras que las de las otras áreas se distribuyeron de forma un poco más heterogénea entre municipios con altos puntajes y bajos puntajes promedio.
La Tabla 8 presenta las estadísticas de las variables consideradas en el modelo econométrico a nivel municipal. Al considerar el acceso a las tecnologías, se observa que la proporción de estudiantes con computador disminuyó, mientras que la proporción de estudiantes con computador e internet no presentó grandes variaciones durante el periodo analizado. En 2014 la mitad de los municipios tenían al menos un 40 % de sus estudiantes con acceso a computador y al menos un 15 % con acceso a internet.
Características | Tenencia de computador | Acceso a internet | |||
---|---|---|---|---|---|
2014 | 2016 | 2014 | 2016 | ||
Sexo Hombre | 63,8 | 61,2 | 52,9 | 55,3 | |
Mujer | 62,6 | 58,4 | 51,2 | 51,9 | |
Región Rural | 34 | 36,5 | 18,3 | 23,9 | |
Urbano | 70,4 | 66,3 | 60,3 | 61,9 | |
Estrato 1 | 38,1 | 36,9 | 24,4 | 27,4 | |
2 | 73,9 | 71,1 | 61,8 | 65,9 | |
3 | 90,9 | 88 | 84,8 | 87,2 | |
4 | 97,3 | 96,1 | 95,2 | 96,3 | |
5 | 98,5 | 97,2 | 97,1 | 97,1 | |
6 | 98,3 | 96,7 | 96,7 | 96,9 | |
Tipo de Colegio Público | 56,9 | 52,6 | 43,9 | 45,1 | |
Privado | 81,5 | 80,6 | 75,4 | 78,5 |
Fuente: elaboración propia.
Área | Media | Desviación | P10 | P50 | P90 | Observaciones |
---|---|---|---|---|---|---|
Lenguaje 2014 | 47,55 | 9,03 | 46 | 47 | 60 | 1028 |
2016 | 50,71 | 8,87 | 40 | 50 | 62 | 1031 |
Matemáticas 2014 | 48,42 | 8,54 | 38 | 48 | 59 | 1028 |
2016 | 48,82 | 10,86 | 34 | 49 | 63 | 1031 |
Inglés 2014 | 47,6 | 6,73 | 40 | 47 | 54 | 1028 |
2016 | 48,76 | 10,11 | 36 | 48 | 63 | 1031 |
Fuente: elaboración propia.
Con relación a las otras variables, se evidencia una mayor proporción de estudiantes mujeres, un promedio de cuatro (4) personas que habitan el mismo hogar, una gran participación de instituciones públicas, una baja participación de estudiantes en la jornada de la tarde y un poco más de la mitad de los estudiantes en zonas urbanas en la mitad de los municipios del país. Las estadísticas para los instrumentos muestran que en 1973 la mitad de los municipios en el país tenían solo un 27 % de su población con menos de 5 años, un 51 % de población femenina y un 7 % de profesionales.
B. Estimaciones por MCO
La Tabla 9 presenta los resultados del modelo MCO para los puntajes estandarizados de las pruebas. De acuerdo con los resultados, las variables son estadísticamente significativas y tienen los signos esperados. Tener un computador en casa, está relacionado con un mayor puntaje, tanto en Lenguaje como en Matemáticas. La estimación para estas áreas en 2014 es de 0,031 y 0,023 desviaciones estándar, respectivamente. En el Inglés, la tenencia solo de computador en 2014 estuvo asociada a un menor desempeño académico.
Lenguaje | Matemáticas | Inglés | |||||
---|---|---|---|---|---|---|---|
2014 | 2016 | 2014 | 2016 | 2014 | 2016 | ||
Tenencia de computador | 0,031*** | 0,023*** | 0,023*** | 0,037*** | -0,026*** | 0,001 | |
(0,004) | (0,004) | (0,004) | (0,004) | (0,003) | (0,004) | ||
Computador e internet | 0,074*** | 0,032*** | 0,038*** | 0,008* | 0,076*** | 0,081*** | |
(0,004) | (0,004) | (0,004) | (0,004) | (0,003) | (0,004) | ||
Densidad de computadores | 0,246*** | 0,273*** | 0,150*** | 0,287*** | 0,054*** | 0,252*** | |
(0,007) | (0,007) | (0,007) | (0,007) | (0,006) | (0,007) |
Nota: *** p <0,01; ** p <0,05; * p <0,10. Errores estándar robustos en paréntesis. Los resultados por área se refieren a estimaciones independientes. Las estimaciones incluyen las siguientes variables control: edad, sexo, tamaño del hogar, estrato, nivel educativo de los padres, tipo de institución educativa, jornada de estudio, desempeño de la institución, área geográfica y variables dummies de departamento y distrito capital (33).
Fuente: elaboración propia.
Con relación a la interacción entre computador e internet, las estimaciones sugieren una relación positiva y mayor en las tres áreas evaluadas respecto al hecho de tener solo computador. Este resultado es consistente con la evidencia a nivel internacional. Es interesante el caso del área de Inglés, en la que solo poseer computador reduce el desempeño, pero tenerlo con acceso a internet incrementa el puntaje en 0,076 desviaciones estándar. Las diferencias en los coeficientes de interacción estimados por áreas evidencian una mayor ventaja comparativa del uso del internet en el desempeño en Inglés, seguido del desempeño en Lenguaje y, en menor medida, en Matemáticas.
Por otro lado, incrementar la densidad de computadores en una unidad está asociado a un mayor rendimiento académico: en Lenguaje es de 0,24 desviaciones, en Matemáticas, de 0,14 desviaciones y, en Inglés, de 0,047 desviaciones. Este resultado se constituye en una primera aproximación a la medición de una externalidad de red, ya que una mayor densidad implica una mayor interacción entre estudiantes y un mayor flujo de información, que en principio aumenta el rendimiento académico en promedio.
Con relación a la evolución de los coeficientes, para la tenencia, el grado de asociación con el desempeño en Lenguaje disminuyó, con Matemáticas aumentó, mientras que con Inglés no resultó estadísticamente significativo. En el caso de la interacción entre computador e internet, dicha correlación disminuyó en Lenguaje y en Matemáticas, pero se mantuvo en Inglés. En cuanto a la densidad, la correlación aumentó en las tres áreas evaluadas. Una explicación a estos patrones está relacionada con el uso diferencial que hacen los estudiantes de las TIC de acuerdo con el área de estudio. En Inglés, se observa una constante necesidad de los recursos online para fortalecer competencias en esta área. Es interesante ver que el coeficiente estimado de la densidad de computadores en Inglés es el que registra el mayor crecimiento.
C. Estimaciones por regresión cuantílica
La Tabla 10 presenta los coeficientes de la estimación por regresión cuantílica para el percentil 10, la mediana y el percentil 90 de la distribución de puntajes estandarizados en las diferentes áreas. En general, los coeficientes tienen los signos esperados y en la gran mayoría de los casos son estadísticamente significativos. De acuerdo con los resultados, la tenencia de computador en 2014 tuvo un coeficiente creciente a lo largo de la distribución del puntaje, tanto en Lenguaje como en Matemáticas, aunque fue negativo y creciente para los percentiles superiores en Inglés.
Nota: *** p<0,01; ** p<0,05; * p<0,10. Errores estándar robustos en paréntesis. Los resultados por área se refieren a estimaciones independientes. Las estimaciones incluyen las siguientes variables control: edad, sexo, tamaño del hogar, estrato, nivel educativo de los padres, tipo de institución educativa, jornada de estudio, desempeño de la institución, área geográfica y dummies de departamento y distrito capital (33).
Fuente: elaboración propia.
Este resultado implica que la sola tenencia de computador para ese periodo estuvo más asociada a los estudiantes con mejor desempeño en Lenguaje y Matemáticas respecto de los estudiantes de la parte baja de la distribución. El coeficiente negativo de la sola tenencia de computador en la prueba de Inglés estuvo asociado a un menor desempeño académico con relación a los que obtuvieron mayor puntaje. Del 2014 al 2016, en Lenguaje y Matemáticas el coeficiente creciente de la tenencia se mantuvo asociado más a aquellos en la parte alta, mientras que en Inglés el coeficiente fue positivo, pequeño y creciente para aquellos con puntajes por encima de la mediana.
En el caso de la interacción, el nivel de asociación para 2014 se mantiene constante hasta la mediana y decrece luego en Lenguaje, pero aumenta para Matemáticas. En el caso de Inglés, el coeficiente de la interacción es siempre creciente, con una tasa elevada para los últimos percentiles. Esto se traduce en que, aunque en promedio los estudiantes en la prueba de Inglés reportan un importante nivel de asociación entre interacción y rendimiento, son los que mejor dominan el idioma los que reportan los mayores coeficientes. Durante el periodo considerado, el coeficiente de interacción disminuye para la parte alta de la distribución de Lenguaje y Matemáticas, y es creciente, pero menor, en Inglés.
En el caso de la densidad, el coeficiente para Lenguaje y Matemáticas en 2014 es estable hasta la mediana, aunque disminuye para los percentiles superiores en el primer caso y aumenta para los mismos percentiles en Matemáticas. En Inglés, la densidad está más asociada a los que están en la parte alta de la distribución. Durante el periodo, los cambios del efecto densidad son notorios en las tres áreas: para Lenguaje y Matemáticas, el coeficiente de densidad es importante para los estudiantes en la parte media de la distribución, mientras que el efecto cae para los estudiantes en los extremos. El coeficiente para Inglés sigue un patrón monótono, incrementándose más para los que están en la parte alta de la distribución.
A manera de conclusión, las correlaciones diferenciales encontradas por áreas pueden ser explicadas por la existencia de ventajas comparativas que se definen a partir del contenido temático y nivel de dificultad de cada área, de la disponibilidad y calidad de los otros insumos (profesores, currículo, etc.) y del grado de sustituibilidad o complementariedad de tales insumos en el proceso de aprendizaje. Este último es diferente para cada área del conocimiento y nivel de formación. Por tal motivo, la correlación de tener un computador conectado a internet con el desempeño académico es mayor en Inglés que en otras áreas.
El hecho de que en general los estudiantes más habilidosos tengan mayores correlaciones con el acceso a las TIC puede estar asociado a factores inobservables que no podemos controlar en este caso individual. Estos factores pueden estar relacionados con la actitud de los estudiantes hacia las TIC, las habilidades, las motivaciones, entre otros. De acuerdo con Hanushek (1979), omitir dichos factores puede generar un sesgo hacia arriba en las estimaciones. Por lo tanto, al omitir estas variables surge el problema de endogeneidad.
D. Autocorrelación espacial
Con el propósito de discutir si la correlación que tienen las TIC con el rendimiento académico depende del lugar geográfico donde se encuentran los estudiantes, la Tabla 11 presenta los índices de Morán globales, calculados a partir de datos municipales. Se observa que el índice es superior en todos los casos a 0,3; esto indica la presencia de una importante dependencia espacial, particularmente en la proporción de estudiantes con computador.
Variables | 2014 | 2016 |
---|---|---|
Proporción de estudiantes con computador | 0,475 | 0,462 |
Desempeño promedio en Lenguaje | 0,385 | 0,327 |
Desempeño promedio en Matemáticas | 0,313 | 0,307 |
Desempeño promedio en Inglés | 0,312 | 0,313 |
Fuente: elaboración propia.
Las Figuras 2, 3 y 4 presentan los indicadores de aglomeración espacial LISA entre la proporción de estudiantes con computador y el desempeño promedio en cada una de las áreas a nivel municipal. En general, se observa que al interior del país se forman grupos de municipios con un alto acceso a TIC y alto desempeño académico (áreas rojas), mientras que los grupos de municipios con bajo acceso a TIC y bajo desempeño se encuentran con mayor frecuencia en las zonas costeras y periféricas (áreas azules) en los tres casos. Estos resultados confirman que existe una alta dependencia espacial entre el resultado promedio en las pruebas y la proporción de estudiantes con computador a nivel municipal, lo que parece ir en concordancia con las diferencias regionales que tiene el país con relación al nivel de desarrollo económico de sus municipios.
Con relación a este tema, Bonet (2008) encuentra que la desigualdad de dotaciones educativas se puede incrementar por concentración de departamentos con un nivel bajo de infraestructura. En su estudio concluye que los municipios con características favorables pueden generar un efecto spillover con los municipios cercanos. Por su parte, Bonilla y Galvis (2014) evalúan el impacto del grado de profesionalización de los docentes sobre los resultados en las pruebas Saber 11. Utilizando un enfoque de variables instrumentales, encuentran que el nivel educativo de los docentes tiene un efecto positivo y significativo sobre los resultados de los estudiantes. En un estudio más reciente, Bonilla et. al (2018) concluyen que las diferencias de calidad de los docentes están fuertemente correlacionadas con el aprendizaje de los estudiantes en distintos niveles (3, 5, 9 y 11), lo que refuerza las trampas de pobreza que persisten en las regiones más rezagadas del país.
E. Estimaciones a nivel municipal
La Tabla 12 presenta las estimaciones MCO de la relación entre la proporción de computadores y la proporción de computadores conectados a internet con el rendimiento académico promedio a nivel municipal. En general, los coeficientes tienen los signos esperados, y en la mayoría de los casos son estadísticamente significativos. De acuerdo con los resultados, en 2014, un incremento en 1 unidad en la proporción de computadores en el municipio está asociada a un mayor rendimiento en Lenguaje (de 0,26 desviaciones estándar) y en Matemáticas (de 0,17 desviaciones estándar). Para el 2016, este coeficiente cayó levemente en Lenguaje, aumentó en Matemáticas y se volvió estadísticamente significativo en Inglés.
Lenguaje | Matemáticas | Ingles | ||||
---|---|---|---|---|---|---|
2014 | 2016 | 2014 | 2016 | 2014 | 2016 | |
Proporción de estudiantes con computador | 1,338*** (0,257) | 1,326*** (0,249) | 0,891*** (0,322) | 1,3478*** (0,322) | 0,491 (0,274) | 0,898*** (0,237) |
Proporción de estudiantes con computador e internet | 0,980*** (0,256) | 0,542* (0,306) | 1,188*** (0,337) | 0,361 (0,299) | 1,765*** (0,312) | 1,176*** (0,276) |
R2 | 0,66 | 0,61 | 0,61 | 0,62 | 0,62 | 0,63 |
Observaciones | 1119 | 1123 | 1119 | 1123 | 1119 | 1123 |
Nota: *** p<0,01; ** p<0,05; * p<0,10. Errores estándar robustos en paréntesis. Los resultados por área se refieren a estimaciones independientes.
Fuente: elaboración propia.
Respecto a la proporción de computadores conectados a internet, los resultados para 2014 sugieren un coeficiente menor en Lenguaje, y uno mayor para Matemáticas e Inglés, respecto del coeficiente de la proporción de tener solo computador. El coeficiente calculado para Inglés, en este caso, es el más grande de todas las áreas. La Tabla 12 también muestra que estas estimaciones han caído en el tiempo e incluso que han dejado de ser estadísticamente significativas, como en el caso de Matemáticas. Esto podría evidenciar que una mayor disponibilidad de internet a nivel agregado tendría un efecto marginal decreciente sobre el rendimiento académico promedio a nivel municipal. Este conjunto de estimaciones, sin embargo, pueden estar sesgadas debido a la existencia de factores inobservables no controlados en el modelo que afectan las medidas de TIC a nivel municipal.
F. Variables instrumentales
Como se explicó en la metodología, los resultados de la Tabla 12 no pueden ser interpretados como causales, debido al sesgo asociado a la existencia de factores inobservables no controlados en el modelo. En las Tablas 13 y 14 se presentan los resultados de las dos etapas de la estimación utilizando el enfoque de variables instrumentales, en el cual los instrumentos han sido validados por medio del test de Hansen, presentado en la Tabla 14.
Con relación a los coeficientes estimados, en el caso de la proporción de computadores, estos resultan ser estadísticamente significativos y tienen los signos esperados (Tabla 14). Al parecer, una vez se corrige el problema de endogeneidad, el impacto del acceso a las TIC a nivel municipal resulta ser mucho más grande de lo esperado. En particular, un incremento en una unidad en la proporción de estudiantes con computador a nivel municipal en 2014 incrementa en 5,98 desviaciones estándar el rendimiento promedio del municipio en Lenguaje, en 5,19 desviaciones en Matemáticas y en 8,6 desviaciones en Inglés.
Se desconoce la existencia de un estudio similar con el que se pueda comparar la cuantía de los efectos estimados en este trabajo, sin embargo, la intuición económica nos permite interpretar los resultados en el marco de los rendimientos marginales decrecientes. En este caso, y dado el nivel de acceso a TIC reportado en la Tabla 8 (en el que a nivel municipal el porcentaje de estudiantes con computador es como máximo 40 %), se esperaría que, en este nivel, incrementos sucesivos en la proporción de computadores generaran grandes y positivos efectos marginales, los cuales luego decrecerían para niveles cada vez más altos de acceso a TIC. En esta línea, los estudios de corte transversal para economías desarrolladas -en los que la proporción de estudiantes con computador es alta- sugieren efectos positivos, pero pequeños, del acceso a las TIC (Fairlie & London, 2012).
Nota: estimación en dos etapas (método generalizado de momentos); *** p<0,01; ** p<0,05; * p<0,10. Errores estándar robustos en paréntesis.
Fuente: elaboración propia.
Para la variable de proporción de estudiantes con internet, los coeficientes estimados son negativos y principalmente significativos para el último año. El coeficiente negativo puede ser explicado por muchos factores, dentro de los cuales se encuentra el tipo de uso que los estudiantes le dan a dicha herramienta. Si bien es cierto que el acceso a internet puede complementar las actividades académicas, también puede distraer al estudiante y sustituir dichas actividades académicas por actividades de ocio; sin embargo, esta hipótesis queda planteada para futuras investigaciones. En general, el impacto de la intensidad en el uso y en el tipo de uso que los estudiantes les dan a las TIC y su efecto sobre el rendimiento académico es una interesante línea de investigación a fortalecer.
Lenguaje | Matemáticas | Inglés | ||||
---|---|---|---|---|---|---|
2014 | 2016 | 2014 | 2016 | 2014 | 2016 | |
Proporción de estudiantes con computador | 5,896*** (1,801) | 5,933*** (1,813) | 5,19*** (1,717) | 5,796*** (1,789) | 8,606*** (2,18) | 6,291*** (1,794) |
Proporción de estudiantes con computador e internet | -2,531 (1,868) | -3,33* (1,719) | -2,302 (1,617) | -3,783** (1,695) | -5,115** (2,051) | -3,50** (1,712) |
Instrumentos Población < 5 años en 1973 | Si | Si | Si | Si | Si | Si |
Población femenina en 1973 | Si | Si | Si | Si | Si | Si |
Proporción de profesionales en 1973 | Si | Si | Si | Si | Si | Si |
Hansen J Chi-sq(3) | 4,003 | 3,400 | 5,711 | 7,387 | 0,353 | 4,53 |
P-val | 0,13 | 0,18 | 0,06 | 0,02 | 0,838 | 0,10 |
R2 | 0,33 | 0,23 | 0,25 | 0,26 | 0,19 | 1,17 |
Observaciones | 1060 | 1059 | 1060 | 1059 | 106 | 0 1059 |
Nota: estimación en dos etapas (método generalizado de momentos); *** p<0,01; ** p<0,05; * p<0,10. Errores estándar robustos en paréntesis.
Fuente: elaboración propia.
Conclusiones
En este trabajo se estudió la correlación entre diferentes medidas de TIC y el desempeño académico a nivel individual y se estimó el efecto causal de la proporción de computadores a nivel de municipio sobre el rendimiento académico promedio municipal en las áreas de Lenguaje, Matemáticas e Inglés, utilizando para esto las pruebas Saber 11 de los años 2014 y 2016. A nivel individual se utilizó un modelo de regresión cuantílica que permite evaluar la relación de las TIC y el rendimiento académico en diferentes partes de la distribución de habilidades de los estudiantes. A nivel municipal, se calcularon índices de correlación espacial y se estimó un modelo econométrico de variables instrumentales para estudiar el efecto causal del acceso a TIC sobre el rendimiento académico, corrigiendo los problemas de endogeneidad asociados al acceso a estas herramientas.
Los resultados a nivel individual muestran que la tenencia de computador está asociada a un mejor desempeño en Lenguaje y Matemáticas, y a un menor desempeño en Inglés. Así mismo, la tenencia de computador conectado a internet reporta un efecto positivo creciente en casi todas las áreas y periodos. Por su parte, la externalidad de la densidad de computadores tiene efectos positivos diferenciales entre estudiantes y áreas. En Inglés la correlación es más alta para quienes están en la parte alta de la distribución de habilidades, mientras que, en Lenguaje y Matemáticas, los estudiantes de la parte media son los que exhiben una mayor correlación. Ahora bien, las estimaciones del acceso a las TIC sobre el desempeño académico se han reducido en el tiempo.
Con relación al análisis espacial, los resultados sugieren una alta correlación espacial entre el acceso a las TIC y los puntajes de las pruebas. En el documento se identificó un alto rendimiento académico en la zona centro con clústeres de alta proporción de computadores, y un bajo rendimiento académico en la zona periférica con clústeres de baja proporción de computador, lo cual es consistente con las características de las regiones en términos de desarrollo económico. Los resultados econométricos sugieren que las estimaciones positivas del acceso a TIC, en general, se mantienen a nivel municipal. Las estimaciones por variables instrumentales indican un efecto mayor de la proporción de computadores sobre el rendimiento académico y una correlación negativa en la proporción de computadores conectados a internet. Estos resultados son consistentes con la evidencia internacional y permiten corregir los sesgos que en las estimaciones obtenidas a nivel individual no se pudieron abordar.
Las conclusiones obtenidas sugieren la necesidad de ejecutar políticas que permitan equilibrar el efecto de las TIC entre estudiantes con bajo y alto desempeño académico; para ello es necesario establecer estrategias que se enfoquen en cómo los primeros pueden sacar mejor provecho de las TIC. Así mismo, sería conveniente considerar políticas diferenciales por área de conocimiento, dada la existencia de ventajas comparativas evidenciadas principalmente en el caso de Inglés. Esto permitirá un mejor aprovechamiento de las TIC con importantes efectos sobre el rendimiento por área. Finalmente, se recomiendan futuras líneas de investigación relacionadas con la identificación de políticas diferentes a la dotación de TIC, diseño de programas que complementen la enseñanza tradicional y programas que aseguren una distribución más equitativa y eficiente de los recursos en estudiantes, instituciones educativas y unidades geográficas.