Introducción
En los últimos años, la comunidad académica se ha interesado por estudiar y determinar aquellas variables que pueden influir en la obtención de logros en el campo académico, profesional y personal. Generalmente, se ha considerado a la inteligencia como un factor predictor de logro, en la medida en que las personas con un coeficiente intelectual alto tienen mejor desempeño en la obtención de logros en el contexto cotidiano (Gottfredson, 1997; Terman & Oden, 1947); sin embargo, otros estudios sugieren que existen atributos de la personalidad y factores extracog-nitivos, entre ellos el grit, relacionados con el logro en diversos contextos (Duckworth et al., 2007).
En particular, el grit se define como la capacidad que tiene un individuo para mantener el interés en objetivos a largo plazo y perseverar para conseguirlos (Duckworth et al., 2007), que cuenta con dos factores: (a) consistencia en el interés (en adelante, consistencia), que refiere a la pasión y el compromiso hacia los objetivos planteados -en el modelo de grit, una persona con alto nivel de consistencia mantendrá los mismos objetivos durante largos periodos de tiempo, sin desviarse ante el surgimiento de nuevas opciones-; y (b) perseverancia en el esfuerzo (en adelante, perseverancia), que refiere al mantenimiento del esfuerzo a lo largo del tiempo a pesar de los obstáculos o los resultados adversos (Duckworth et al., 2007). En resumen, una persona con un elevado nivel de grit no solo tiene propósitos estables, sino que trabaja en pro de ellos sin abandonarlos por las circunstancias.
A partir de la estructura teórica propuesta por Duckworth et al. (2007), se han construido dos escalas para la medición de grit. En el 2007, en primer lugar, los autores mencionados crearon y validaron una escala con 12 ítems para evaluar el grit (en adelante, escala Grit-O), en la cual la mitad de sus reactivos medían la consistencia, y la otra mitad la perseverancia. Posteriormente, Duckworth y Quinn (2009) validaron una versión más corta de la escala original que contenía ocho ítems y mantenía las dos dimensiones originales (en adelante, escala Grit-S). En torno a estas dos escalas se han realizado procesos de validación tanto en su versión Grit-O como en su versión Grit-S, en las que, en su mayoría, se han encontrado estructuras psicométricas coincidentes con la validación original, con pocos estudios que no reportan tal coincidencia (véase Tabla 1).
En general, las mediciones realizadas con las escalas Grit han mostrado relaciones entre sus puntuaciones y buenos desempeños en el éxito personal y profesional (Fernández-Martin et al., 2020); por ejemplo, los puntajes en grit predicen mayor compromiso con la actividad deportiva en atletas (Martin et al., 2015), altas habilidades de gestión de salud y calidad de vida (Sharkey et al., 2017), mayor bienestar psicológico, menor depresión y menor riesgo de desgaste en residentes quirúrgicos (Salles et al., 2017), niveles más bajos de consumo de sustancias psicoactivas y conductas de riesgo (Guerrero et al., 2016), mayores niveles de desempeño y compromiso laboral (Robertson-Kraft & Duckworth, 2014; Suzuki et al., 2015), mayor permanencia en el lugar de trabajo y menores niveles de deserción militar (Eskreis-Winkler et al., 2014), y, por último, mejor desempeño en habilidades perceptuales-cognitivas, como la toma de decisiones (Larkin et al., 2016) y la memoria de trabajo en niños (Nemmi et al., 2016).
Por otra parte, en el contexto académico se ha estudiado el papel del grit en el desempeño, con diversas conclusiones sobre su validez predictiva. Por un lado, se ha encontrado una asociación positiva entre el grit y el desempeño académico (Clark & Malecki, 2019; Cosgrove et al., 2018; Duckworth et al., 2007; Wolf & Jia, 2015; Wolters & Hussain, 2015), en la que el factor perseverancia es mejor predictor que el factor consistencia (Clark & Malecki, 2019; Credé et al., 2017; Hodge et al., 2018). Asimismo, varios estudios han encontrado una relación indirecta del grit con el desempeño académico, en la medida en que correlaciona con factores como el esfuerzo y la meticulosidad, que a su vez se relacionan con el desempeño académico (Aydin, 2019; Bowman et al., 2019; Luthans et al., 2019; Muenks et al., 2017). Por otro lado, hay estudios que no encuentran relaciones significativas entre el grit y el desempeño académico (Bazelais et al., 2016; Bazelais et al., 2018; Dixson et al., 2016; Gruenberg et al., 2019; Rimfeld et al., 2016; Tang et al., 2019). No obstante, a pesar de la aparente disparidad de los hallazgos presentados, se puede afirmar que sí hay una relación positiva entre estas dos variables, pues revisiones sistemáticas en el campo encuentran que la mayor parte de los estudios realizados muestran una relación positiva entre el grit o sus componentes y el desempeño académico (Credé et al., 2017; Lam & Zhou, 2019).
Teniendo en cuenta la consistencia del constructo grit en las distintas validaciones presentadas, es importante contar en el contexto colombiano con un instrumento que permita aproximarse a la evaluación de este factor extracognitivo que influye sobre el desempeño. Asimismo, como parte de la validación de criterio en esta investigación, se considera importante observar si en nuestro contexto se incluyen múltiples indicadores de desempeño académico distintos del promedio que no se han relacionado antes con el grit, pero que brindan un panorama más amplio del éxito académico y su posible relación con este. Por tanto, el presente trabajo tiene un doble objetivo: inicialmente, en el Estudio 1, se busca realizar un proceso de adaptación y validación de constructo de las escalas Grit-O y Grit-S en el contexto colombiano, y, posteriormente, en el Estudio 2, determinar la validez predictiva de la escala Grit-S respecto a diversas medidas del desempeño académico en un contexto universitario.
Estudio 1: Validez de constructo
Como se mencionó más arriba, en la literatura se reconocen dos estructuras validadas de la prueba Grit: la versión original (Grit-O), compuesta por doce ítems (Duckworth et al., 2007), y la versión abreviada (Grit-S) compuesta por ocho ítems (Duckworth & Quinn, 2009). En general, en los análisis psicométricos realizados en distintas validaciones se observa una mayor variabilidad en las estructuras encontradas para la prueba Grit-O, pues en estas se encuentran desde tres factores (Kim & Lee, 2015) hasta la reorganización de ítems entre los dos factores tradicionales (Tyumeneva et al., 2014), e incluso la eliminación de algunos ítems de la original para obtener una estructura similar a la prueba Grit-S (Marentes-Castillo et al., 2019); mientras que, por otra parte, en la prueba Grit-S la gran mayoría de validaciones parecen coincidir con la estructura de la validación original (véase Tabla 1).
A pesar de la aparente estabilidad de la estructura de la prueba, sobre todo en su versión abreviada (Grit-S), en el meta-análisis realizado por Credé et al. (2017) se encontró que no parece existir evidencia psicométrica de un factor general (grit) que agrupe los factores de consistencia y perseverancia. En este sentido, el primer estudio tiene por objetivo realizar una adaptación y validación de la escala Grit-O y Grit-S en el contexto colombiano que aporte datos a propósito de la discusión sobre la posible estructura factorial de la escala original y su versión abreviada.
Método
Diseño
La presente investigación es un estudio de tipo instrumental, ya que permite la validación de instrumentos (Montero & León, 2007).
Participantes
Se contó con la participación de 500 colombianos de entre 18 y 75 años (M = 27.37; DE = 10.25; 35.8 % hombres y 64.2 % mujeres), obtenidos en un muestreo no probabilístico por bola de nieve (Vicanco, 2010). Para realizar el análisis factorial exploratorio y confirmatorio, se tuvo como base los criterios de mínima muestra requerida (N = 200) y número de casos por ítem -que debe ser de cinco- (Vargas & Mora-Esquivel, 2017). Debe indicarse que la muestra total se tomó en dos fases distanciadas por cuatro meses entre cada toma: con la primera muestra, de 256 participantes (M= 27.20; DE = 10.36; 31.64 % hombres y 68.36 % mujeres), se llevaron a cabo los análisis factoriales exploratorios, y con la segunda, de 244 participantes (M = 27.54; DE = 10.13; 40.16 % hombres y 59.84 % mujeres), los análisis factoriales confirmatorios. Los únicos requisitos para participar eran ser colombiano y tener más de 18 años.
Instrumento
Se utilizó la prueba Original Grit Scale (Grit-O) presentada por Duckworth et al. (2007), compuesta por doce ítems que se responden a partir de una escala tipo Likert con calificaciones entre 1 y 5 según el grado de acuerdo que el participante tenga con cada una de las afirmaciones que se le presentan (véase Tabla 2).
Específicamente, la prueba está divida en dos dimensiones: (a) consistencia, compuesta por seis ítems redactados de manera negativa que pretenden evaluar el grado en que una persona mantiene sus objetivos a largo plazo, lo que quiere decir que las personas con un mayor grado de acuerdo con las afirmaciones presentadas tendrán menor consistencia-debido a esto, en el análisis es necesario invertir las calificaciones-; y (b) perseverancia, que pretende evaluar el mantenimiento del esfuerzo a lo largo del tiempo a pesar de los obstáculos o los resultados adversos, a través de seis ítems que se responden en una escala Likert de 1 a 5, siendo 5 el mayor grado de acuerdo con la afirmación -la calificación de estos ítems se realiza de manera directa, ya que todos los reactivos están escritos de manera positiva; así, un mayor nivel de acuerdo representa mayores niveles de perseverancia en el sujeto-.
Respecto a la Short Grit Scale (Grit-S), esta se encuentra compuesta por ocho ítems de la escala original repartidos en grupos de cuatro ítems en cada dimensión. Los ítems que componen esta versión se identifican con un asterisco (*) en la Tabla 2.
Procedimiento
El procedimiento de adaptación y validación contó con dos pasos: un proceso de traducción y la aplicación propiamente dicha. Respecto al primero, se construyó una versión inicial de la traducción de los ítems de la escala Grit-O -a partir del consenso de traducciones realizadas por los autores de manera independiente por subgrupos de investigadores-, que posteriormente fue ajustada con base en la revisión de tres jueces, a saber, un hablante bilingüe cuya lengua nativa es el inglés, un experto en el tema con dominio del inglés, y un filólogo.
En segundo lugar, se construyó una versión virtual del instrumento en el programa Formularios de Google, y se procedió a su aplicación masiva. No se realizaron pilotajes previos a la aplicación. Este formulario presentaba inicialmente las consideraciones éticas de la investigación, y, posteriormente, los doce ítems de la escala en una misma pantalla, en el orden presentado en la Tabla 2.
Consideraciones éticas
Con el fin de garantizar la confidencialidad de los datos de los participantes, en el formato de la prueba virtual se incluyó un apartado inicial con el consentimiento informado que anunciaba la ausencia de riesgos en la investigación, el análisis de los datos de manera grupal y con fines académicos, y que los datos sociodemográficos solicitados impedían el reconocimiento de los participantes. El consentimiento informado tuvo en cuenta las normas éticas señaladas en la Ley 1090 de 2006 y en el Colegio Colombiano de Psicología; además, de acuerdo con la Resolución 8430 de 1993, esta investigación no tuvo riesgo para los participantes.
Análisis de datos
Con la primera muestra se llevó a cabo un análisis factorial exploratorio a través de un método de extracción de mínimos cuadrados no ponderados, con una rotación Oblimin directa, dado que existe una interrelación entre los factores de la prueba (Lloret-Segura et al., 2014; Pérez & Medrano, 2014). Para esto, se garantizaron los supuestos del análisis factorial con la eliminación de casos atípicos (prueba de distancias extremas de Mahalanobis), la normalidad de los reactivos (asimetría y curtosis entre ±1.5), la linealidad y las interrelaciones (correlaciones superiores a 0.3 entre pares de ítems de cada subescala), y la revisión de colinealidad (correlaciones inferiores a .90) (Pérez & Medrano, 2014). Para la obtención de los resultados, se determinó el número de factores a través de las varianzas explicadas, la propuesta teórica de la escala y el análisis paralelo de Horn (Lloret-Segura et al., 2014); y, para determinar la confiabilidad de la escala, se obtuvo el coeficiente alfa de Cronbach general y el omega de McDonald (Dunn et al., 2013).
Con la segunda muestra, previa garantía de los supuestos de normalidad univariante y multivariante (asimetría y curtosis entre ±1.5), se realizó el análisis factorial confirmatorio a través de un método de extracción de máxima verosimilitud, con la obtención de índices robustos, teniendo en cuenta los siguientes indicadores de bondad de ajuste: X2/gl < 3, GF1 > .9, AGF1 > .9, CF1 > .9, TLI > .9, RMSEA < .05 (Brown, 2006). Asimismo, se realizaron modelos rivales con el fin de evaluar cuál de los dos modelos presentaba los mejores índices de bondad de ajuste, y a partir de esto ≥determinar el modelo adecuado para la escala (Cupani, 2012). Los análisis fueron desarrollados con el software JASP, versión 0.12.
Resultados
Con el fin de identificar la suficiencia muestral para realizar los respectivos análisis factoriales, se obtuvo el KMO (.863) y la significancia en la prueba de esfericidad de Bartlett (p = .000), los cuales indicaron puntajes superiores a los mínimos esperados en la prueba de adecuación muestral, y una matriz de correlación apropiada. A continuación, se aplicó el índice de extracción por reactivo, que se muestra en la Tabla 3, para determinar los ítems que se debían conservar.
Como se observa en la Tabla 3, todos los ítems obtuvieron índices de extracción suficientes (≥.30), a excepción del ítem 7, que obtuvo un índice de extracción de .261. Luego, se determinó la estructura factorial con la distribución de los ítems (véase Tabla 4), donde se obtuvieron dos factores que explican el 43.641 % de la varianza total acumulada (Factor 1 = 34.225 %; Factor 2 = 9.416 %).
Nota. Se muestra la distribución de los reactivos por cada factor. El Factor 1 corresponde a perseverancia, y el Factor 2 a consistencia.
En la Tabla 4 se observa que los primeros seis reactivos cargan hacia el Factor 2, y los seis restantes al Factor 1, con valores superiores al mínimo requerido (≥ .3). Al realizar los análisis de confiabilidad, se obtuvo un omega general de McDonald de .838 (Factor 1 = .838; Factor 2 = .810) y un alfa general de Cronbach de .834 (Factor 1 = .836; Factor 2 = .807), que indican una alta confiabilidad.
Para finalizar el análisis exploratorio, y con el fin de identificar la fiabilidad de cada ítem, se procedió a obtener el omega de McDonald y el alfa de Cronbach tras la eliminación de cada reactivo, con lo cual se obtuvieron los resultados que se muestran por factor en la Tabla 5.
Las estadísticas de fiabilidad del ítem presentadas en la Tabla 5 demuestran que todos los ítems de cada factor aportan al valor de cada uno de los coeficientes, ya que en su ausencia estos disminuyen su valor. Asimismo, también se encuentran adecuadas correlaciones entre cada ítem y el resto de la subescala, con valores superiores a 0.3 en todos los casos. En las Figuras 1 y 2 se presentan los modelos de ecuaciones estructurales, y en la Tabla 6 los índices de bondad de ajuste para los modelos propuestos.
Finalmente, para el análisis factorial confirmatorio se llevaron a cabo comparaciones de modelos rivales con el modelo bifactorial con los doce reactivos y con la propuesta de ocho ítems. Ambos modelos muestran índices de ajuste adecuados y bajo nivel de error (véase Tabla 6). Asimismo, en los modelos de ecuaciones estructurales se encontró coeficientes positivos y superiores a .4 entre los reactivos con su factor correspondiente, y, en la mayoría de los ítems, cargas bajas de covarianza entre las variables latentes, así como coeficientes de carga suficiente en cada factor para explicarse de manera independiente (véase Figuras 1 y 2).
Discusión
En general, los resultados de la validación coinciden con el modelo teórico y con estudios anteriores. Tanto el análisis exploratorio como el confirmatorio permiten afirmar que las escalas Grit-O y Grit-S tienen una estructura consistente. De igual manera, los ítems se distribuyen en los dos factores, tal como lo reporta la literatura; para el caso de la escala Grit-O, esta distribución concuerda con la validación original y la realizada en India (Beri & Sharma, 2019; Duckworth et al., 2007). Asimismo, la distribución de ítems de la escala Grit-S coincide con la validación original de Duckworth y Quinn (2009), al igual que con las realizadas en otros países, como España, Filipinas, China, Japón, Portugal, Alemania y Polonia (Arco-Tirado et al., 2018; Datu et al., 2016; Li et al., 2016; Nishikawa et al., 2015; Osório & Cruz, 2013; Schmidt et al., 2017; Wyszyñska et al., 2017).
Por otra parte, en el análisis de modelos rivales se muestran índices de fiabilidad y nivel de error apropiados, lo cual evidencia un ajuste suficiente para las escalas Grit-O y Grit-S. Incluso, en estos análisis también se evidencia que la escala Grit-S tiene un mejor nivel de ajuste, lo cual concuerda con la validación realizada en México (Marentes-Castillo et al., 2019).
Sin embargo, contrario a lo propuesto desde el modelo teórico, los factores de perseverancia y consistencia funcionan de manera independiente, sin agruparse bajo un factor general de grit, y esto se encuentra tanto en el análisis de la estructura de Grit-O como en el de Grit-S, lo cual coincide con el meta-análisis de Credé et al. (2017).
En conclusión, se encontró que las escalas Grit-O y Grit-S tienen adecuados índices de validez y confiabilidad, aunque la escala Grit-S mostró un mejor nivel de ajuste. Adicionalmente, la distribución de los ítems por factor en ambas escalas concuerda con las validaciones originales y las realizadas en otros países. Finalmente, cabe señalar que la estructura del modelo encontrado en las dos escalas no coincidió con el modelo original, ya que los factores de perseverancia y consistencia no se agruparon en un factor de segundo orden (grit).
Estudio 2: Validez de criterio
El poder predictivo de la escala Grit ha sido estudiado especialmente en el escenario educativo. De hecho, en las instituciones educativas, la medición más utilizada del desempeño en relación con el grit es el promedio académico (Lam & Zhou, 2019). No obstante, la literatura ha empezado a sugerir nuevas formas para evaluar el desempeño académico en relación con esta variable, como lo son las autopercepciones hacia el rendimiento académico (Buzzetto-Hollywod et al., 2019; Celik & Saricam, 2015; Usher et al., 2019), la motivación escolar (Eskreis-Winkler et al., 2014; Guzmán-Zamora & Gutiérrez-Garcia, 2020) y las estrategias para el aprendizaje (Córdova, 2021; Sáez-Delgado et al., 2021; Weisskirch, 2018).
Sin embargo, se debe reconocer que la actividad de formación académica de un estudiante va más allá de lo que se reporta a través del promedio, razón por la cual en el presente estudio se seleccionó algunas variables que permiten una mirada más amplia del desempeño académico, pues se entiende que el desempeño académico no solo implica los aprendizajes del estudiante según sus capacidades y habilidades, sino también su participación en espacios educativos (Isaza, 2014). Específicamente, se tuvo en cuenta, además del promedio académico, los siguientes indicadores -que también se han reportado en otros estudios-: la cantidad de materias perdidas (Timarán & Jiménez, 2015; Villamizar & Romero, 2011); la pertenencia a un grupo representativo, entendido como grupos de estudiantes que participan en nombre de la comunidad en escenarios deportivos y culturales (Montes & Lerner, 2011; Pineda, 2019); y la participación en semilleros de investigación, entendidos como grupos de estudiantes guiados por un profesor con un proyecto de investigación (Andrade et al., 2018; Montes & Lerner, 2011). Teniendo en cuenta lo anterior, el objetivo del segundo estudio es determinar la validez predictiva de la escala Grit-S respecto a distintas medidas del desempeño académico en un contexto universitario.
Método
Diseño
La presente investigación consiste en un estudio correlacional, realizado por medio de encuestas, con un muestreo a conveniencia (Montero & León, 2007).
Participantes
La muestra para este estudio estuvo conformada por 89 estudiantes de la Universidad de La Sabana, contactados de manera virtual por un muestreo a conveniencia no probabilístico. Los participantes tenían entre 18 y 28 años (M = 20.45; DE = 1.86; 20.22 % hombres y 79.78 % mujeres), y al momento de la aplicación debían cursar entre cuarto y décimo semestre de su carrera. De estos, 64 hicieron parte del programa de Psicología, 23 de Filosofía y 2 de Licenciatura en Educación.
Instrumento
Se utilizó la Short Grit Scale (Grit-S) anteriormente validada, compuesta por ocho ítems tipo Likert y dividida en las subescalas de consistencia y perseverancia. Esta escala contiene los mismos ítems que la escala Grit-O, a excepción de los ítems 3, 4, 7 y 8 (véase Tabla 2).
Asimismo, con el propósito de tener algunos indicadores adicionales del desempeño académico diferentes al promedio académico, se creó un cuestionario para registrar las actividades extracurriculares a las que el estudiante se haya vinculado durante su pregrado; específicamente, se le preguntó si había hecho parte de alguna de las siguientes actividades: ser monitor (asesorar a otros estudiantes en un tema en particular), pertenecer a un semillero de investigación, o hacer parte de grupos representativos o actividades laborales remuneradas en la universidad. Además, se indagó sobre si eran estudiantes becados o si pertenecían al programa Ser Pilo Paga (programa para promover el acceso a instituciones de educación superior mediante un crédito condonable ofertado a estudiantes con altos puntajes en la prueba Saber 11, entre otros criterios). Finalmente, se indagó por variables de desempeño académico, como el promedio acumulado y el número de materias perdidas durante la carrera.
Procedimiento
Se utilizó la herramienta Formularios de Google, que incluía el consentimiento informado -en el cual se anunciaba la ausencia de riesgos, el manejo confidencial y de investigación sobre sus datos, y la posibilidad de desertar en cualquier momento-, así como la prueba Grit-S, y el cuestionario que incluía las demás variables a analizar. Se realizó la aplicación de la prueba de manera virtual, y el instrumento contenía todas las indicaciones para su resolución dentro del mismo. Los participantes no tenían un tiempo límite para su resolución.
Consideraciones éticas
Con el fin de garantizar la confidencialidad de los datos de los participantes, en el formato de la prueba virtual se incluyó un apartado inicial con el consentimiento informado que anunciaba la ausencia de riesgos en la investigación y el análisis de los datos de manera grupal y con fines académicos. Los datos sociodemográficos solicitados impedían el reconocimiento de los participantes.
Análisis de datos
Para analizar la validez de criterio de la escala Grit-S como predictora del desempeño académico, se realizaron tres tipos de análisis: el primero, un análisis de los estadísticos descriptivos (véase Tabla 7); el segundo, un análisis de correlación bivariada entre los puntajes totales y parciales que arroja la escala Grit-S y las tres medidas seleccionadas de desempeño académico -promedio, materias perdidas y actividades extracurriculares-; y el tercero, un análisis a partir de la construcción de modelos de regresión lineal, tomando como variable dependiente los indicadores de desempeño académico evaluados junto con las distintas medidas relevantes registradas en la toma de datos -para controlar la autocorrelación entre los puntajes parciales y totales de la escala, se calculó para cada variable dependiente dos tipos de modelo, teniendo en cuenta si en el análisis se incluye el puntaje total de la escala Grit-S o los valores obtenidos en cada subescala-.
Resultados
Para llevar a cabo el análisis de correlación se realizaron las pruebas de normalidad de Kolmogorov-Smirnov (n > 50; p > .05) junto con los análisis de asimetría y curtosis (±1.5), en los que se encontró una distribución no normal de los datos para la prueba Grit-S (Z = .124; p = .029; A = .361; C = .025) y las subescalas de perseverancia (Z = .139; p = .008; A = -.876; C = ,574) y consistencia (Z = .137; p = .010; A = -.135; C = -.237), por lo cual se realizó un análisis descriptivo correlacional con el coeficiente de Spearman (correlaciones entre -1 y 1).
Tal como se observa en la Tabla 8, se encontraron correlaciones moderadas y significativas entre el puntaje de la escala Grit-S y las distintas medidas de desempeño académico: promedio académico (rs(88) = .327; p = .002), número de actividades extracurriculares (rs(88) = .213; p = .045) y número de materias perdidas (rs(88) = -.334; p = .001).
En el análisis de correlación de cada una de las subescalas con el desempeño académico se encontró que la subescala de perseverancia correlacionó de forma moderada con el promedio académico (rs(88) = .248; p = .019) y el número de materias perdidas (rs(88) = -33; p = .002); mientras que la subescala de consistencia tuvo una correlación moderada con el promedio académico (rs(88) = .357; p = .001), con el número de programas extracurriculares (rs(88) = .225; p = .034), y con el número de materias perdidas (rs(88) = -.249; p = .018).
El análisis de regresión se realizó siguiendo el método de Mínimos Cuadrados Ordinarios (MCO), con una estrategia jerárquica de eliminación progresiva hacia atrás en el programa estadístico R-Studio, versión 1.1.463, tomando como variable dependiente los tres indicadores de desempeño académico que se muestran en la Tabla 9. Para la construcción de los modelos, se tuvieron, además de las variables de interés, las variables de edad, carrera (pertenecer o no a la carrera de Psicología), semestre, tener una beca y pertenecer al programa Ser Pilo Paga.
Asimismo, con el fin de explorar el aporte de los factores por separado identificados en el Estudio 1, se exploró en la regresión dos configuraciones en la prueba: la primera, incluir en la exploración de los modelos los puntajes de cada una de las subescalas de perseverancia y consistencia por separado; y la segunda, incluir el puntaje total de Grit-S -es decir, la sumatoria de las dos subescalas como un único puntaje-.
Respecto al promedio académico al comparar los dos tipos de modelos, se encuentra que el mejor ajuste lo tiene el modelo que incluye los puntajes de las subescalas por separado (R 2 = .658) frente al que tiene en cuenta el puntaje total de la escala (R 2 = .459). Sin embargo, en el primer modelo el aporte sobre el promedio que realiza el puntaje de la escala de consistencia no resultó significativo (β = .01; p = .110); por el contrario, en el modelo que tiene en cuenta el puntaje total de la escala se encontró un aporte significativo de Grit-S sobre el promedio (β = .016; p = .001).
Por otra parte, en el análisis del número de actividades extracurriculares se encontró una leve diferencia entre los ajustes de los dos modelos explorados, con un mejor ajuste del modelo que toma los puntajes de perseverancia y consistencia por separado (R2 = .268), frente al modelo que incluye el puntaje total de Grit-S (R2 = .260). En el primer modelo se encontró un aporte significativo de perseverancia al número de actividades extracurriculares (β = .098; p = .003); y en el segundo, un mayor aporte de Grit-S en el número de actividades extracurriculares (β = .05; p = .004).
Para finalizar, respecto al número de materias perdidas, se encontró que el mejor modelo es el que incluye el puntaje de la prueba Grit-S en el análisis (R2 = .262), frente al modelo que toma los puntajes por separado (R 2 = .252). En el primer caso, el aporte del puntaje de la escala Grit-S al número de materias perdidas fue significativo y negativo (β = -.068; p < .001); y en el segundo, el puntaje de consistencia tuvo un aporte negativo y significativo (β = -.058; p = .09), mientras que el de perseverancia fue un aporte negativo no significativo (β = -.081; p = .043).
Además, atendiendo a los supuestos del modelo de regresión lineal (es), se evaluó el cumplimiento del supuesto de normalidad y homocedasticidad de los residuos a través de las pruebas Shapiro y Breusch-Pagan, respectivamente. Para el caso de los modelos de regresión sobre el promedio, los residuos se distribuyen normalmente (Persev./Consist.: W = .971; p = .141; grit: W = .986, p = .497) y tienen varianza constante (Persev./Consist.: Chi2(7)=8.353, p = .302; grit: Chi2 (6) = 10.327, p = .111).
En los modelos de regresión sobre el número de actividades extracurriculares desarrolladas por los estudiantes no se cumple el supuesto de normalidad en ninguno de los dos modelos (Persev./Consist.: W = .958;p = .006; grit: W = .964, p = .015), pero sí el de homocedasticidad (Persev./ Consist.: Chi2(3) = 2.325, p = .507; grit Chi2(5) = 5.301, p = .380), y en el caso de los modelos de regresión sobre el número de materias perdidas no se cumple ninguno de los supuestos: ni el de normalidad (Persev./Consist.: W = .908; p = .01; grit: W = .906, p = .008), ni el de homocedasticidad (Persev./Consist.: Chi2(4)=22.659, p < .01; grit: Chi2(7) = 21.661, p ≤ .01), por lo que se puede afirmar que, a diferencia del modelo de regresión para el promedio académico, en el caso de los últimos dos modelos de regresión de las nuevas medidas del desempeño académico -actividades extracurriculares y materias perdidas-, los hallazgos no son generalizables a una muestra más amplia de la aquí analizada.
Discusión
En general, los hallazgos muestran que el puntaje total de la prueba Grit-S resulta ser un predictor más consistente de las diferentes medidas de desempeño académico que cada una de las subescalas por separado, lo cual difiere de lo señalado por Credé et al. (2017), pero coincide con los hallazgos de Duckworth et al. (2007).
Asimismo, se observa que hay una alta consistencia entre las correlaciones de Grit-S y las distintas medidas de desempeño académico, lo cual señala que la perseverancia en el esfuerzo y la consistencia en el interés pueden influir en los distintos aspectos del desempeño académico.
De igual manera, se encontró un bajo poder predictivo de la subescala de perseverancia respecto al promedio académico, lo que va en contravía de la revisión sistemática de Lam y Zhou (2019), aunque mostró una influencia sobre las otras dos medidas de desempeño. Respecto al factor de consistencia, se encontró un menor aporte al desempeño académico, lo cual coincide con estudios que han encontrado que este no parece ser un factor preponderante en todos los contextos sociales (Datu et al., 2016). Asimismo, la relación observada entre la variable de materias perdidas y Grit-S que ubica a la escala como una importante herramienta de predicción de este aspecto del desempeño académico (Timarán & Jiménez, 2015; Villamizar & Romero, 2011).
Para finalizar, cabe resaltar que se encontró que la posesión de una beca aporta de manera significativa en la mejora del promedio, la participación en actividades extracurriculares y la disminución en el número de materias perdidas. Esto muestra que, dada la complejidad del proceso académico, el garantizar condiciones de seguridad económica puede potenciar el desarrollo académico del estudiante (Hernández & González, 2011).
En síntesis, el puntaje total de la escala Grit-S fue un mejor predictor de los indicadores de éxito académico en contraste con las puntuaciones de perseverancia y consistencia por separado, dado que se encontró que el puntaje de la escala Grit-S aporta de manera significativa en los tres indicadores de desempeño, mientras que el de perseverancia únicamente aportó significativamente al número de actividades extracurriculares, y el de consistencia solo influyó significativamente en el número de materias perdidas.
Discusión general
El presente trabajo tuvo como objetivo realizar una validación de constructo y de criterio de las escalas Grit-O y Grit-S; lo cual implicó, por un lado, la adaptación y validación de la escala Grit-O y su versión reducida (Grit-S) al contexto colombiano y, por otro lado, la determinación del nivel de predicción de la escala Grit-S respecto al desempeño académico medido a través del promedio académico, el número de actividades extracurriculares y el número de materias perdidas. Los resultados obtenidos indican niveles satisfactorios de validez y confiabilidad para ambas escalas (Grit-O y Grit-S), aunque la escala Grit-S presentó mejores índices de ajuste. Asimismo, se encontró que las subpruebas de la escala y su puntaje total correlacionan con las medidas de desempeño académico y forman parte de los modelos de regresión que las predicen.
Sin embargo, en la conjunción de los hallazgos de los estudios realizados surgen dos tendencias aparentemente opuestas que merecen ser analizadas: mientras que en el primer estudio se encuentra evidencia en contra del constructo grit como factor de segundo orden dado que en el modelo con mejor ajuste las subescalas de consistencia y perseverancia no se agrupan en un factor común, en el segundo estudio se encuentran evidencias a favor del poder predictivo de tal constructo general, pues el puntaje total de la escala parece ser un mejor predictor del desempeño académico en comparación con cada uno de sus subcom-ponentes, ya que se encontró que los índices de correlación más altos se dan entre los puntajes de la prueba total y las medidas de desempeño académico, y que hay una participación más consistente de los puntajes totales de la escala en los modelos de regresión lineal elaborados para cada una de las medidas de desempeño académico. En resumen, la validación psicométrica parece poner en duda la naturaleza del grit como constructo que agrupa la perseverancia y la consistencia, y la validación de criterio muestra que la sumatoria de estos elementos parece ser un mejor predictor del desempeño que cada uno de ellos por separado.
Lo primero que hay que señalar es que los hallazgos se encuentran en el núcleo de una de las actuales discusiones que se tienen a propósito del grit (Jachimowicz et al., 2018; Usher et al., 2019), en la que, por un lado, hay autores que defienden la necesidad de tener en cuenta los dos componentes del constructo basados en el poder predictivo del mismo (Duckworth & Quinn 2009; Lam & Zhou, 2019), mientras que, por otro, distintos autores señalan que la fuerza predictiva del constructo parece recaer en uno de sus componentes -a saber, perseverancia en el esfuerzo- y que los indicios de validación psicométrica del constructo no son suficientes para sostener su papel como constructo de segundo orden que agrupa a los demás (Credé et al., 2017).
Dentro de las consideraciones que sostienen quienes defienden la necesidad de agrupar los dos elementos en un constructo de segundo orden no solo se encuentran algunas centradas en los hallazgos consistentes de la correlación de la escala con el éxito en distintos escenarios (Cerda et al., 2018; Guerrero et al., 2016; Salles et al., 2017; Suzuki et al., 2015), sino que también se incluyen los estudios en los que se ha encontrado que la perseverancia en el esfuerzo, en ausencia de la consistencia en el interés, no es tan buen predictor de un mejor desempeño (Jachimowicz et al., 2018), o que dadas las características del escenario puede verse privilegiado uno de los atributos que componen el grit (Datu et al, 2016). En términos teóricos, bajo esta visión, los dos componentes del grit son necesarios para enfrentarse a tareas de alta complejidad en las que el avance implique no solo un proceso de superación de obstáculos a través del trabajo constante (perseverancia en el esfuerzo), sino un interés genuino por el objetivo deseado que promueva la motivación y un alto involucramiento durante el trabajo (consistencia en el interés). Estos dos atributos serían condiciones esenciales para el éxito en escenarios en donde la experticia y el logro de metas dependen de largos periodos de trabajo llenos de obstáculos.
Por otro lado, quienes se centran en la perseverancia como único atributo relevante en el grit fundamentan su argumento en que la validación psicométrica no muestra indicios consistentes de la existencia de un atributo de segundo orden. En el centro de esta crítica aparece el trabajo de Marcus Credé, quien en su meta-análisis encuentra que en muchas ocasiones hay un mejor ajuste en los modelos psicométricos cuando se toman los puntajes de las subprue-bas por separado que cuando se elige el puntaje total de la prueba (Créde et al., 2017). Teóricamente, Credé (2018) considera que esto sucede porque en la formulación teórica original del grit se asume una estructura sumativa entre perseverancia y consistencia que genera problemas para establecer los modelos psicométricos más adecuados, y por lo mismo sugiere explorar otras estructuras del aporte de cada uno de los componentes a la escala original.
Así pues, parece ser que el punto central de cada posición está basado en la importancia que se le da a cada tipo de validación y desborda los propósitos de la presente investigación zanjar esta compleja discusión. Sin embargo, teniendo en cuenta que en el presente estudio se encuentra evidencia a favor de las dos posiciones, consideramos conveniente derivar algunas recomendaciones metodológicas que hay que tener en cuenta en el uso de la escala.
La primera recomendación es la necesidad de hacer un análisis de los puntajes totales y parciales con el fin de determinar el mayor o menor impacto que puede tener cada uno de los subcomponentes y la conjunción de los dos. Lo anterior permitirá formular el mejor modelo e identificar cuál de los aspectos tiene mayor influencia en la predicción del desempeño. La anterior recomendación se aplica si se quiere formar grupos de individuos a partir de la escala en los que conviene crear subgrupos en virtud de la mayor o menor posesión de cada uno de los atributos por separado (para un ejemplo, véase Jachimowicz et al., 2018).
La segunda recomendación está relacionada con el impacto que tienen algunas características del contexto en la validez predictiva de la escala. Al respecto, Eskreis-Winkler et al. (2014) señalan que la principal diferencia entre el autocontrol y el grit se encuentra en que el segundo resulta fundamental para los escenarios en los que las metas se proyectan a largo plazo y tienen caminos relativamente complejos -p. ej., desarrollo de experticia, entrenamientos militares, éxito matrimonial, etc.-, y que en escenarios simples de éxito en el corto plazo o en los que no exista la posibilidad de variación en la meta, el puntaje total de la escala no parece ser un buen predictor (para un ejemplo, véase Datu et al., 2016). Es por ello que resulta necesario tener en cuenta las particularidades del contexto respecto a la complejidad y duración de la obtención de la meta, a propósito de usar el instrumento como predictor de desempeño.
Por último, cabe señalar que a pesar de la versatilidad y simple aplicación desde la escala Grit-S, los puntajes de la misma distan mucho de ser un factor definitivo en la predicción del desempeño en cualquier escenario, por lo que un uso adecuado de la misma debe ir acompañado de la inclusión de otras mediciones cognitivas y no cognitivas que permitan modelar bien los resultados en cualquier escenario elegido.