Introducción
El bajo rendimiento académico en las instituciones a nivel superior es un tema muy común en México. Actualmente los alumnos a nivel superior que estudian en el Instituto Tecnológico Superior de Pánuco (ITSP) de las carreras de Ingeniería en Sistemas Computacionales, Ingeniería Informática, Ingeniería industrial e Ingeniería en Electrónica se enfrentan desde el primer semestre con asignaturas de principios de programación, fundamentos de programación, lógica de programación y diseño de modelos de programación, que son la base para obtener un conocimiento de lógica y poder comprender las funciones de los lenguajes de programación. En semestres posteriores los alumnos se encuentran con la dificultad de la comprensión e interpretación de lógica de programación que es una de las asignaturas más importantes para el desarrollo de sistemas y sus aplicaciones.
Estudios e investigaciones sobre el rendimiento académico declaran que existen ciertas circunstancias que afectan el desempeño de los estudiantes que abarcan temas relacionados con situaciones personales o socio-culturales. (Torres & Rodríguez, 2006).
El rendimiento académico del alumnado es un problema que aqueja no solo a las instituciones de nivel superior sino también a los estudiantes, padres de familia, profesores y directores, cabe agregar que esto no es un tema exclusivo de México, sino también de otros países en Latinoamérica y otros continentes (Lamas, 2015).
El rendimiento escolar es el nivel o grado de conocimiento demostrado en una asignatura o área comparando la edad y el nivel académico. Es necesario mencionar que el nivel académico debe ser entendido por el proceso de evaluación y las pautas para cumplir con los objetivos de una calidad educativa (Jiménez, 1995).
La enseñanza de los lenguajes de programación, en el Instituto Tecnológico Superior de Pánuco (ITSP), es uno de los temas que han sido investigados por más de 10 años, sin embargo, no se ha llegado a una solución completa de cómo dar solución a este tipo de problema relacionado con el aprendizaje de este lenguaje en los estudiantes de las diferentes carreras. El desarrollo de la programación implica la intervención de elementos como son: el lenguaje de programación, la plataforma utilizada para el desarrollo de las aplicaciones y la lógica e interpretación del lenguaje programación. Esto quiere decir que los alumnos presentan diferentes conceptos en un lapso corto de tiempo y esto hace que para este sea difícil asimilar y fomentar habilidades para el desarrollo de líneas de código (Spigariol & Passerini, 2013).
Una de las complicaciones relacionadas con el aprendizaje de los estudiantes, son la forma en que le dan una solución a un problema utilizando una serie de pasos y los conceptos que intervienen o se tratan en las asignaturas. (Sánchez, Urías & Gutiérrez, 2015).
Todos los problemas asociados con el aprendizaje de las asignaturas de lenguajes de programación se abordan directamente en las academias y se ha observado que no importa la generación de los alumnos, siempre existen dificultades para la comprensión, aplicación y resolución de conceptos que puedan solucionar problemas relacionados con la automatización, que se presentan en cada una de las líneas de código de programación (Ramírez, Lucio, Garza, García & Vargas, 2011).
Por otro lado, una de las complicaciones para el aprendizaje del lenguaje de programación es la frecuente actualización, no solamente de estos lenguajes, sino el entorno en los cuales está involucrada la programación por los avances constantes de las tecnologías, dejando algunas librerías sin uso y agregando muchas otras.
Otra de las afectaciones, son los entornos de programación, ya que son diseñados, no únicamente para especialistas, sino que sus funciones están enfocadas hacia un uso profesional ya que cuentan con una gran variedad herramientas y gráficos que resultan complicados para los estudiantes que apenas inician una vida académica en estos entornos. Si se cubrieran las necesidades del diseño de entornos más amigables y que se adapten a los alumnos, principiantes en este tema, se obtendría un mejor aprendizaje.
Cuando un docente enseña alguna asignatura relacionada con programación en el taller o en un laboratorio de cómputo, existen casos de alumnos que presentan dificultades en cierta parte de la codificación de este y esto está relacionado a las diferentes velocidades individuales de aprendizaje (Sousa, 2002).
Esto implica que, si un estudiante presenta alguna duda o retraso a la hora de programar, habría otros estudiantes con una mayor velocidad de aprendizaje que tendrían que esperar a que el docente terminara de atender a los alumnos retrasados. Esto significa tener un grupo heterogéneo con distintos niveles de avances, dificultando la enseñanza grupal, por lo que es necesario que los alumnos sean atendidos de forma personalizada para atender las dudas de los diferentes niveles de avance.
El propósito de esta investigación es analizar las propiedades de cada uno de los estudiantes para determinar el rendimiento académico en las asignaturas relacionadas con el lenguaje de programación de las carreras de ingeniería de una institución educativa de nivel superior, ubicada en la zona urbana de Pánuco, Veracruz, México. Se implementarán dos técnicas estadísticas para determinar qué variables están relacionadas. La primera técnica será el uso de árboles de decisión CHAID y la segunda, la regresión lineal múltiple utilizando el software de análisis estadístico SPSSv25.
Materiales y Métodos
La población a la que se aplicó el instrumento de evaluación estuvo dirigida a alumnos entre 17 y 21 años inscritos actualmente en el segundo, cuarto y sexto semestre de nivel superior en la zona urbana de Pánuco, Veracruz, México. La muestra fue un total de 341 alumnos matriculados en el año 2020, conforme a registros oficiales proveídos por la Secretaría de Educación Pública (SEP), dependencia nacional de la educación pública mexicana. Los resultados obtenidos fueron analizados con el software estadístico SPSSv25.
Se aplicó el método de muestreo probabilístico por conglomerado. La importancia de una muestra permite inferir los resultados observados en esta, a la población accesible (Otzen, 2017). En la tabla 1 se muestran las carreras y el número de estudiantes encuestados.
Carrera | Cantidad de estudiantes |
---|---|
Ingeniería en informática | 50 |
Ingeniería en Sistemas computacionales | 70 |
Ingeniería en electrónica | 100 |
Ingeniería Industrial | 121 |
Fuente: Elaborado por los autores
El instrumento de evaluación utilizado fue el cuestionario, y se definen las variables de estudio con detalle en la tabla 2. El cuestionario es utilizado como una metodología de investigación que tiene como objetivo la obtención y elaboración de datos de manera rápida y eficiente (Anguita, Labrador & Campos, 2002). Este instrumento de evaluación ha sido desarrollado tomando como referencia el cuestionario de estrés académico elaborado por Cabanach (2016).
Se eligió una cantidad pequeña de variables de estudio con el fin de cuidar y mantener la estabilidad de resultados y la construcción de los modelos estadísticos. La variable de rendimiento académico es la variable para predecir y las demás actúan como predictoras.
Variables | Definición |
---|---|
Aprendizaje en el aula | Captación de los conocimientos, habilidades, actitudes y experiencia en el aula de clases. |
Rendimiento académico | Evaluación del conocimiento adquirido en el aula de clases. |
Tutorías externas | Frecuencia y búsqueda de tutorías personalizadas fuera de la institución. |
Expectativa del futuro | Que se puede esperar en el futuro, relacionada a factores culturales y socio-ambientales. |
Condiciones laborales | Condición de trabajo vinculada al estado del entorno laboral. |
Dificultad de aprendizaje de lenguajes de programación | Dificultades que los alumnos presentan para el aprendizaje de la programación. |
Fuente: Elaborado por los autores
Pruebas de análisis estadístico
Para el análisis de los resultados de este estudio se utilizaron las siguientes pruebas estadísticas:
Árbol de decisión, es una prueba estadística de predicción cuya función objetivo es la de interpretar resultados a partir de observaciones y construcciones lógicas (Barrientos, Cruz & Acosta, 2009). Un árbol de decisión toma las mejores decisiones desde un punto de vista probabilístico.
La técnica de árbol de decisión es muy utilizada en temas de minería de datos (Data Mining, DM) que busca la preparación, investigación y exploración de los datos para obtener toda la información posible que esté oculta en ellos. El árbol de decisión de tipo CHAID consiste en realizar un algoritmo de forma rápida que tiene como objetivo analizar la información y crear asociaciones de los perfiles asociados (variables independientes) con respecto a un resultado deseado (variable dependiente). Cabe mencionar que la combinación entre la minería de datos y los árboles de decisión buscan dar solución a problemas asociados con la predicción, clasificación y segmentación de los datos (Berlanga, Rubio & Vilà, 2013).
Su fundamento básico es poder obtener particiones que se repiten indefinidamente hasta obtener un orden final, y que pueda reconocer ciertos criterios relacionados con el perfil del cliente donde el número de los clientes malos es muy alta o baja y de acuerdo con el resultado obtenido se le asigne un valor probabilístico (Cardona, 2004).
Se seleccionó el método de árbol de decisión CHAID (Chi-squared Automatic) el cual realiza la agrupación de las categorías de las variables predictoras, compara defectos entre distintas variables y realiza un proceso de segmentación (García & Rodríguez, 2013). Este método permite que Chi cuadrado pueda identificar las interacciones y seleccionar las variables independientes que cuentan con una actividad alta con respecto a la variable dependiente (Berlanga, Rubio & Vila, 2013).
También los árboles de decisión tienen la peculiaridad de seleccionar una variable dependiente que sea de interés para el análisis estadístico y elegir un grupo de posibles variables nominales que permitan realizar la descripción y pronóstico de la primera variable (Escobar, 1998).
Regresión lineal múltiple, tiene como objetivo analizar la relación existente entre variables y puede evaluar un amplio rango de situaciones y poder predecir diferentes fenómenos (Vilà, Torrado & Reguant, 2018). Las variables actúan de forma constante para cada fenómeno observado y su función más sencilla es la lineal (Hernández, Ramírez & Ferri, 2005).
La prueba de regresión lineal es una técnica estadística que mide las relaciones entre variables de estudios relacionados al rendimiento académico. La técnica de regresión lineal analiza una variable dependiente y múltiples variables independientes, con el objetivo de predecir el nivel de impacto de la variable dependiente (Pérez & Santín, 2008).
Para poder realizar la prueba de regresión lineal es necesario que cuente con las siguientes características: 1) La relación existente de las variables de estudio sea de tipo lineal, 2) que las variables independientes presenten errores de medición, 3) los errores de los datos presenten una varianza constante, 4) las variables presentan normalidad, 5) que exista una no colinealidad entre las variables de estudio (Vilà, Torrado & Reguant, 2019).
La regresión lineal múltiple ayuda a entender la relación entre las variables de estudio, además de poder estudiar las causas de la variación en Y. Cuando existe en el análisis más de una variable independiente y sólo una dependiente, se implementa esta técnica, para predecir la variabilidad de la variable dependiente utilizando el conjunto de variables independientes (Dagnino, 2014).
Resultados
En este apartado, se muestran los resultados obtenidos de las pruebas estadísticas mencionadas anteriormente, en ambas pruebas estadísticas se tomó como variable dependiente el rendimiento académico y el resto de las variables como independientes.
Prueba Estadística por Árbol de Decisión
El modelo de árbol de decisión CHAID se desarrolló mediante el uso del software de SPSSv25 tomando los datos descritos en el apartado de método, la cual se muestra en la figura 1. En ella se puede apreciar que la variable de aprendizaje en el aula es la principal causante de estrés académico y la mejor variable predictora asociada al rendimiento académico, seguida por la variable de tutorías externas. Del total de la muestra se observa que 291 alumnos presentan valores altos de estrés, relacionado con el aprendizaje en el aula de clases y de estos alumnos 127 declaran valores de estrés asociadas por la necesidad de buscar tutorías externas y de este total, 164 alumnos no lo requieren.
Por último, solo 50 alumnos presentan una buena captación sobre el aprendizaje durante el desarrollo de las asignaturas de programación.
Prueba Estadística por Regresión Lineal Múltiple
La prueba de regresión lineal múltiple y el análisis de los datos fueron desarrollados con ayuda del paquete estadístico SPSSv25.
Los resultados obtenidos se observan en la tabla 3 y muestran los resultados del análisis de regresión lineal donde la sumatoria de elementos al cuadrado, los grados de libertad (gl) y la media cuadrática, son las más frecuentes en toda la prueba de análisis de varianza; la distribución F de Fisher-Snedecor determina las variables significativas para el modelo generado y aquellos resultados que presentan un valor de p-valor menor a una significancia α=0.05. Por otra parte, el análisis del factor de la inflación de la varianza (VIF) indica que no existe algún tipo de problema de colinealidad entre las variables independientes, presentando un resultado máximo de 1.098 (Mandeville, 2008). En la tabla 4 se muestran los resultados de los coeficientes de regresión lineal y estadísticas de colinealidad.
Modelo | Sumatoria de cuadrados | Grados de libertad | Media cuadrática | F | Significancia | |
---|---|---|---|---|---|---|
1 | Regresión | 8.643 | 5 | 1.729 | 5.50 | .000b |
Residuo | 31.071 | 99 | .314 | |||
Total | 39.714 | 104 | ||||
b. Predictores: (Constante) |
Variables | Significancia | VIF | t | Error estándar |
---|---|---|---|---|
Aprendizaje en el aula | .000 | 1.022 | 2.78 | .005 |
Tutorías externas | .902 | 1.021 | 2.03 | .104 |
Expectativas de futuro | .005 | 1.072 | 1.48 | .067 |
Condición laboral | .781 | 1.098 | 1.22 | .112 |
Dificultad de aprendizaje de lenguajes de programación | .023 | 1.022 | 2.80 | .031 |
Fuente: Elaborado por los autores
Los resultados obtenidos del modelo generado permiten identificar las variables principales que están relacionadas a la variable de rendimiento académico en alumnos de nivel superior a través de los resultados de las opiniones de los propios alumnos, la apreciación de su propio aprendizaje en el aula de clases y sus características individualidades.
Discusión
Las técnicas y pruebas estadísticas de árbol de decisión y regresión lineal presentan una forma adecuada para conocer qué variables están asociadas con el rendimiento académico.
El rendimiento académico se asocia con la variable de aprendizaje en el aula y también las tutorías externas. Resulta importante aclarar que el aprendizaje y la confianza deben lograrse en el aula de clases dando como resultado una mejor capacidad de aprendizaje.
González (2010) coincide en dos indicadores que afectan el rendimiento académico en los que menciona a la sobrecarga académica del estudiante y las deficiencias metodológicas del profesor.
Lamos & Giraldo (2011) mencionan que existen diferentes elementos predictivos que pueden ayudar a explicar el rendimiento académico de los alumnos y son: la sinergia entre el docente y el alumno, las estrategias de aprendizaje de los alumnos, la relación existente entre el alumno y la asignatura cursada y el ambiente familiar.
Los resultados obtenidos con el modelo de clasificación por árboles de decisión para descubrir factores asociados al desempeño académico de estudiantes indican buen desempeño académico en las pruebas realizadas (Timarán, et al. 2019).
Se recomienda implementar estrategias de mejora para reducir la sobrecarga de trabajo de los alumnos. También realizar una sensibilización a los alumnos antes de la aplicación de la encuesta y que los cuestionarios sean aplicados en fechas de exámenes ya que los alumnos se encuentran en niveles altos de estrés. En trabajos futuros podrían evaluar el impacto o efecto sobre el rendimiento académico, económico, social y cultural.
Conclusiones
Del 100 % de la muestra total se tiene que 291 alumnos presentan estrés por el aprendizaje en el aula, es decir que los alumnos se estresan y perciben que no están totalmente aprendiendo programación durante el desarrollo de las asignaturas y que de estos solamente 127 alumnos consideran que necesitan tutorías externas o apoyo relacionado a temas de programación extra-clase.
Uno de los beneficios de la regresión lineal múltiple es que es una técnica estadística capaz de estudiar las relaciones entre variables entre un fin de situaciones y poder predecir fenómenos diversos. Es decir, cada variable participa de forma aditiva para todo el fenómeno observado (Hernández, Ramírez & Ferris, 2005).
Los resultados obtenidos en las pruebas descritas en la sección anterior dan evidencia de que es posible construir con precisión árboles de decisión a partir de los datos obtenidos y que la técnica de regresión lineal es buen modelo de comparación ya que ambas ayudan a predecir el comportamiento de las variables de independientes y su impacto con la variable dependiente.
Podemos concluir que a partir de un conjunto de datos aportados por los alumnos es posible desarrollar árboles de decisión como una herramienta de apoyo confiable para el diagnóstico del rendimiento académico. Cabe mencionar que lo más importante es contar con un conjunto de datos consistente y confiable, ya que este tipo de técnicas depende demasiado del momento en que se le aplique la encuesta al alumno que aportará la información.