Introducción
El Inventario de Ansiedad de Beck (BAI), desarrollado originalmente por Beck et al. (1988), es el instrumento de evaluación más citado en las bases de datos científicas (Piotrowski, 2018), posiblemente debido a que los trastornos de ansiedad son los de mayor prevalencia a nivel mundial (Datani et al., 2018). Dada su popularidad, distintos estudios se han centrado en analizar las propiedades psicométricas de este instrumento.
En cuanto su estructura factorial, inicialmente, Beck et al. (1988) obtuvieron 21 ítems resultantes de un conjunto de 86 ítems que conformarían la versión final del BAI; y a partir de ellos hallaron una estructura de dos factores, uno que hace referencias a síntomas somáticos y otro que mide sintomatología asociada a síntomas subjetivos de ansiedad y pánico. En cuanto a su consistencia interna, informaron un alfa de .92 (Beck & Steer, 1993).
Posteriormente, como se encuentra en un metaanálisis realizado por Bardhoshi et al. (2016) sobre las propiedades psicométricas de las versiones de habla inglesa del BAI, se encontraron 17 investigaciones que realizaban análisis factoriales exploratorios (AFE), en las cuales se sugirieron estructuras de entre uno y seis factores para la prueba: en 11 de estos estudios se evidenció una adecuación de soluciones de dos factores, en cuatro estudios se sugirió la adecuación de modelos de cuatro factores, una investigación informó una solución de cinco factores, y otra propuso una solución de seis factores. Asimismo, en cuanto a análisis factoriales confirmatorios (AFC), Bardhoshi et al. (2016) informaron de ocho estudios que aplicaron AFC para probar varios modelos de BAI: cinco probaron un modelo unidimensional -aunque solo una halló que los datos mostraban un ajuste adecuado-, y la mayoría encontró que el modelo original de dos factores ofrecía índices de bondad de ajuste adecuados, mientras que las pruebas de modelos de cuatro, cinco y seis factores mostraron valores inadecuados de ajuste. Respecto a la fiabilidad, Bardhoshi et al. (2016) encontraron 117 estudios que reportan la consistencia del instrumento a través del alfa, y 18 que examinan la estabilidad temporal -con una mediana de seis semanas de intervalo-; en cuanto a los coeficientes alfa, los puntajes oscilaron entre .81 y .95, y en los otros casos se reportó una estabilidad temporal de .65 en promedio.
Adicionalmente, en los últimos años se han llevado a cabo distintas investigaciones a nivel internacional respecto a la estructura y las propiedades psicométricas del BAI en distintos tipos de población. Por ejemplo, Benuto et al. (2020) reportaron el ajuste de un modelo de dos factores en una muestra de 149 latinos hispanohablantes pacientes de dispositivos de salud primaria estadounidenses; Chapa (2021) , por su parte, halló la adecuación de un modelo de cuatro factores en una muestra de 416 trabajadores estadounidenses; Liang et al. (2018) reportaron el ajuste de un modelo de cuatro factores y un alfa de .94 en una muestra de 762 médicos chinos; Clark et al. (2016) encontraron que, en 208 pacientes cardíacos norteamericanos en rehabilitación, los mejores valores de ajuste se hallaban en una estructura con una dimensión global y cuatro factores de segundo orden; Palmer et al. (2016), en Estados Unidos, concluyeron que el modelo de cinco factores exhibía mejor ajuste en una muestra de 304 militares retirados que habían sufrido politraumatismos; Lee et al. (2018) informaron un modelo de cinco factores en una muestra de 406 pacientes psiquiátricos coreanos; y, por último, Adhikari (2019) encontró, en 2007 adolescentes de Nepal, índices adecuados de validez concurrentes y un alfa de .86 con una estructura de seis factores.
En cuanto a investigaciones realizadas en español, Sanz y Navarro (2003) hallaron, a través de distintos AFE en 590 estudiantes universitarios españoles, una consistencia interna con un alfa de .88 y una solución factorial de una dimensión de ansiedad compuesta por dos factores interrelacionados, correspondientes a síntomas somáticos y afectivo-cognitivos; Sanz et al. (2012) corroboraron, mediante un AFE, la estructura de una dimensión del BAI y hallaron un alfa de .90 en una muestra de 307 pacientes españoles con trastornos psicológicos; Magán et al. (2008) informaron en 249 adultos españoles un alfa de .85 y una estructura compuesta por una dimensión global de ansiedad con un factor somático y uno afectivo; Robles et al. (2001) adaptaron el BAI a población mexicana adulta e informaron una alfa de .83 y una estructura factorial de cuatro componentes principales; y Guillén Díaz-Barriga y González-Celis Rangel (2019) reportaron un alfa de .89 y confirmaron la estructura de cuatro factores a través de un análisis factorial exploratorio en una muestra de 157 pacientes asmáticos mexicanos.
Por su parte, Padrós Blázquez et al. (2020) realizaron un AFC mediante el cual hallaron un alfa de .91, y probaron modelos unidimensionales y de cuatro factores, aunque no obtuvieron valores de ajuste aceptables en ninguno de los dos; Rodríguez Reynaldo et al. (2001) estudiaron las propiedades psicométricas del BAI en una muestra de 150 adultos mayores portorriqueños cuyas edades oscilaron entre los 60 y los 99 años, y mediante un AFE hallaron la adecuación de una solución de tres factores y un alfa de .94; y, por último, Vizioli y Pagano (2020) hallaron en una muestra de 269 adultos argentinos que el modelo unidimensional evidenció mejores índices de ajuste que la solución bifactorial y la de cuatro factores -aunque las diferencias en los índices de bondad de ajuste de los modelos de una y cuatro dimensiones fue mínima-, y en cuanto a la fiabilidad, informaron un omega ordinal de .95, un alfa ordinal de .93 y un coeficiente rho de .92.
Como se puede observar, las investigaciones muestran que no existe un acuerdo acerca de la estructura factorial del BAI, lo cual da cuenta de la necesidad de continuar con la investigación en las mismas, inclusive a través de distintos métodos de estimación. También, resalta que la mayoría de los estudios estimaron la consistencia interna a través del coeficiente alfa, cuya adecuación para instrumentos con formato de respuesta ordinal -como el BAI- es relativa. Y por último, es de destacar que las investigaciones sobre el BAI en Argentina son aún incipientes.
Análisis factoriales confirmatorios y métodos de estimación para datos ordinales
Los análisis factoriales confirmatorios son una de las aplicaciones de los modelos de ecuaciones estructurales (Hoyle, 2012) y, por ello, permiten especificar y evaluar un modelo, así como comparar distintos modelos, y desarrollar un modelo mediante modificaciones (Cupani, 2012; Kline, 2011), lo cual suele realizarse a partir de seis pasos: especificación, identificación, estimación de parámetros, evaluación del ajuste, reespecificación del modelo, e interpretación de resultados (Cupani, 2012).
En la fase de estimación de parámetros es posible usar distintos métodos de acuerdo con las características de los datos. Ahora bien, la calidad de las estimaciones de los parámetros del modelo, del error y de los índices de bondad de ajuste dependen de la elección del método de estimación (Lei & Wu, 2012), ya que pueden existir diferencias en función de la posible influencia del método utilizado (Kogar & Yilmaz-Kogar, 2015). De hecho, la estimación de parámetros a partir de matrices de correlaciones policóricas ha mostrado resultados robustos (Coenders et al., 1997; Flora & Curran, 2004), por lo que Yang-Wallentin et al. (2010) proponen el uso de métodos robustos, ya que estiman matrices de covarianza asintóticas a partir de matrices de correlaciones policóricas.
Sin embargo, las recomendaciones acerca de qué método utilizar varían. Por ejemplo, Holgado-Tello et al. (2018) recomiendan el uso de mínimos cuadrados no ponderados robustos (RULS); Raykov y Marcoulides (2006), el uso del método máxima verosimilitud robusto (RML) con muestras pequeñas o moderadas, y el de mínimos cuadrados ponderados (WLS) con muestras suficientemente grandes; y DiStefano et al. (2019), el método de mínimos cuadrados con ponderación diagonal (DWLS).
En los últimos años, se han realizado distintas investigaciones que comparan métodos de estimación con datos ordinales. Por ejemplo, Savalei y Rhemtulla (2013) compararon los métodos RULS y DWLS mediante una simulación de Monte Carlo, y hallaron que el RULS rindió mejor que el DWLS en términos de error de Tipo 1, ya que el DWLS tendía a sobreestimarlo, mientras que el RULS rindió mejor que el DWLS cuando las muestras eran pequeñas o moderadas, y que ambos métodos ofrecían un rendimiento pobre en situaciones donde había muestras pequeñas, pocas categorías y valores extremos.
Por otro lado, Bandalos (2014) comparó los métodos de máxima verosimilitud (ML), RML, DWLS y WLS a través de distintas condiciones, y reportó que el método de DWLS presentó menor sesgo en la estimación de parámetros y de errores estándar en la mayoría de las condiciones, que el RML también tuvo un rendimiento aceptable en términos de sesgos al estimar parámetros y errores estándar, y que tanto el DWLS como el RML rindieron de una manera menos adecuada en condiciones caracterizadas por alta asimetría, tamaños de muestra pequeños y especificación incorrecta del modelo. En cuanto al WLS, este método resultó tener mayor sesgo en todas las condiciones.
Asimismo, Kogar y Yilmaz-Kogar (2015) compararon los métodos ML, ULS y DWLS en una muestra de 548 personas asignadas aleatoriamente a dos grupos -uno de 250 y otro de 500-, y hallaron que los índices de bondad de ajuste fueron mayores en el caso de DWLS, seguido de ULS y de ML.
También, Li (2016a) comparó los métodos RML y DWLS mediante una simulación de Monte Carlo, y encontró que el DLWS mostró menos sesgos y mayor precisión que el RML al estimar las cargas factoriales en casi todas las condiciones, aunque el DWLS sobreestimó las correlaciones entre factores cuando los tamaños muestrales eran pequeños y cuando las distribuciones eran moderadamente no normales, y el método RML rindió mejor que el DWLS en cuanto a las estimaciones del error de las cargas factoriales en casos donde las distribuciones latentes no eran normales con un tamaño de muestra pequeño -menor a 200-.
Incluso, Li (2016b), mediante una simulación de Monte Carlo, comparó los métodos RML, DWLS y RULS a través de 84 condiciones caracterizadas por diferentes formas de distribución ordinales observadas, categorías de respuesta y tamaños muestrales, y halló que los métodos DWLS y RULS produjeron estimaciones de cargas factoriales, correlaciones y estimaciones de coeficientes más precisas que el RML en todas las condiciones, aunque los errores estándar de las estimaciones de los parámetros obtenidos con RML fueron más precisos, y el RML fue inferior al DWLS y el ULS en el control del error de Tipo I, excepto en muestras mayores a 1000.
Adicionalmente, Holgado-Tello et al. (2018) analizaron los cambios en chi cuadrado obtenidos al comparar los métodos RML, WLS, ULS y RULS, y hallaron que el método RULS redujo la probabilidad de rechazar modelos con especificaciones correctas y aumentó la probabilidad de rechazar modelos mal especificados, y que el RULS mostró menor probabilidad de error de Tipo 1 que los métodos ML y WLS, pero mayor que el RML bajo ciertas condiciones.
Por último, Nalbantoglu-Yilmaz (2019) comparó los resultados obtenidos mediante los métodos ML, RML y WLS a través de simulaciones de Monte Carlo con muestras que no cumplían los supuestos de normalidad, y encontró que las mejores estimaciones con muestras pequeñas -de 300 o 500 participantes- fueron con el método RML, mientras que con muestras con más de 1000 participantes el WLS fue superior.
Como se puede observar, la elección de un método de estimación es un punto controvertido, por lo que se ha sugerido utilizar varios métodos de estimación en casos donde no se cumplan los supuestos de normalidad (Nalbantoglu-Yilmaz, 2019). No obstante, las investigaciones sugieren que los métodos RULS, RML y DWLS son adecuados cuando se cuenta con datos ordinales y muestras no muy grandes, mientras que el WLS puede ser de utilidad para muestras grandes.
El alfa y coeficientes alternativos para estimar la fiabilidad Otro punto de conflicto en la realización de estudios psicométricos es la fiabilidad, dado que existen distintos coeficientes que permiten estimarla. Entre ellos, por lo general, se encuentran el alfa (Cronbach, 1951), la beta (Revelle, 1979), los omega total, jerárquico y asintótico (McDonald, 1999), el H (Hancock & Mueller, 2001), la theta (Armor, 1973), y el de mayores límites inferiores (greatest lower bound, GBL, Jackson & Agunwamba, 1977), pero el más utilizado históricamente ha sido el coeficiente alfa, y su popularidad se debe, en parte, a su fácil cálculo, su facilidad para comunicar, la posibilidad de calcularlo mediante una sola aplicación de una prueba, y su presencia en distintos softwares estadísticos (Viladrich et al., 2017); incluso, se ha propuesto un alfa para datos ordinales (Oliden & Zumbo, 2008; Zumbo et al., 2007), que se calcula a partir de matrices de correlaciones policóricas con la finalidad de evitar posibles infraestimaciones (Gadermann et al., 2012).
No obstante, existen distintos argumentos por los cuales se ha desaconsejado el uso del coeficiente alfa en distintas situaciones, como que se trata de un coeficiente afectado por el número de ítems que miden un constructo, o que el cálculo del alfa exige el cumplimiento de supuestos que difícilmente se sostienen en situaciones con datos reales -la tau-equivalencia, la unidimensionalidad y la ausencia de errores correlacionados- (McNeish, 2018; Raykov, 1998). Sin embargo, es preciso destacar que, si cumple con estos supuestos, es el coeficiente recomendado y tiene utilidad (Raykov & Marcoulides, 2019). A su vez, en ausencia de tau-equivalencia, el coeficiente alfa funciona bien como mayor límite inferior (Cronbach, 1951; Trizano-Hermosilla & Alvarado, 2016), lo que quiere decir que permite estimar la mayor fiabilidad posible en ausencia del cumplimiento de los supuestos (Sijtsma, 2009).
Otro de los métodos recomendados para calcular la fiabilidad es el coeficiente GLB (Sijtsma, 2009), pero, dada la dificultad para calcularlo, se han propuesto dos procedimientos: el cálculo mediante el análisis factorial de rangos mínimos (Trizano-Hermosilla & Alvarado, 2016) y el llamado GLB algebraico (Moltner & Revelle, 2015).
Adicionalmente, según Revelle y Zinbarg (2009), un estimador alternativo que se puede utilizar como mayor límite inferior es el coeficiente omega, un coeficiente apto para modelos congenéricos, que se calcula a través de cargas factoriales, y cuyos valores suelen ser ligeramente más elevados que los obtenidos mediante el coeficiente alfa (Revelle & Zinbarg, 2009). En casos donde los datos son unidimensionales, el omega total y el omegajerárquico son equivalentes (Trizano-Hermosilla & Alvarado, 2016).
Asimismo, Revelle y Zinbarg (2009) han apuntado la importancia del cálculo del coeficiente beta como forma de estimar la fiabilidad de la peor mitad de un instrumento, debido a que utiliza el análisis de conglomerados jerárquico para hallar la peor mitad del instrumento y calcular su fiabilidad.
Una alternativa adicional es el cálculo del coeficiente theta, que se calcula a partir del análisis de componentes principales con el objetivo de estimar la varianza de las variables observables (Domínguez-Lara, 2012; Elosua & Zumbo, 2008).
Y por último, se ha planteado el coeficiente H como una medida complementaria que permite la estimación de la fiabilidad del constructo, que puede interpretarse como el porcentaje de la variabilidad de la variable latente explicada por los indicadores (Domínguez-Lara, 2016; Hancock & Mueller, 2001).
Dada la utilidad de cada índice de fiabilidad, sería adecuado reportar distintos índices sobre una misma muestra. Por esta razón, en el presente trabajo se propone obtener evidencias sobre la validez estructural y la fiabilidad de la versión argentina del BAI, a partir de la comparación de los modelos de uno, dos y cuatro factores, mediante distintos métodos de estimación. Específicamente, se hizo uso los métodos RULS, RML y DWLS, cuya adecuación para datos ordinales ha sido demostrada en distintas investigaciones, y se realizó la estimación mediante el método de mínimos cuadrados generalizados robusto (RGLS), del cual no se han hallado investigaciones con datos ordinales -no se computaron cálculos con el método WLS, dado que no se pudo obtener una muestra suficientemente grande-; y en cuanto a la fiabilidad, se computaron los índices alfa, omega, GLB algebraico y factorial, la beta, la H y la theta.
Método
Tipo de estudio
Se realizó un estudio instrumental (Montero & León, 2002), mediante el cual se analizaron las propiedades psicométricas del Inventario de Ansiedad de Beck (BAI).
Participantes
Mediante un muestreo intencional no probabilístico, se recogió una muestra de 746 participantes, con edades entre los 18 y los 65 años (M = 33.49; DE = 10.55). 485 (65 %) de los participantes residían en el conurbano Bonaerense y 261 (35 %) en la ciudad de Buenos Aires, Argentina; en cuanto al género, 538 (72 %) informaron género femenino y 208 (28 %), masculino; y con respecto al nivel de instrucción, 239 (32 %) reportaron estudio universitario incompleto, 166 (22 %) universitario completo, 116 (15.5 %) secundario completo, 78 (10.5 %) terciario completo, 59 (8 %) terciario incompleto, 48 (6 %) posgrado, 35 (5 %) secundario incompleto, y 5 (1 %) primario completo.
Instrumentos
Cuestionario sociodemográfico
Se elaboró un cuestionario sociodemográfico específico para este estudio, que buscaba indagar sobre el lugar de residencia, la edad, el género y el nivel educativo de los participantes.
Inventario de Ansiedad de Beck
Se hizo uso de la adaptación argentina de Vizioli y Pagano (2020) del Inventario de Ansiedad de Beck (BAI) (Beck et al., 1988), un instrumento autoadministrable de 21 ítems que mide síntomas característicos de la ansiedad.
La puntuación de los reactivos se realiza sobre una escala Likert de 4 opciones -que van de 0 ("Para nada") a 3 ("Severamente-Me molestó mucho")-. El inventario presenta propiedades psicométricas adecuadas para la población argentina, con evidencias de validez de constructo a través de análisis factoriales confirmatorios, y una consistencia interna de alfa ordinal de .93, y un omega ordinal de .95 (Vizioli & Pagano, 2020).
Aunque el estudio de validación original de Beck et al. (1988) planteaba una estructura bifactorial mediante análisis factoriales exploratorios, Vizioli y Pagano (2020), al comparar estructuras de uno, dos y cuatro factores, hallaron la adecuación de un modelo unifactorial a través de distintos AFC en población argentina; hallazgo que concuerda con lo registrado en población española (Magán et al., 2008; Sanz & Navarro, 2003; Sanz et al., 2012).
Procedimiento
La recolección de datos se realizó bajo responsabilidad de los autores, mediante plataformas virtuales en las que se incluyó el cuestionario sociodemográfico y el BAI. Adicional a esto, los participantes debían completar un consentimiento informado en el cual se especificaban los detalles de los objetivos y los lineamientos generales de la investigación, las garantías de anonimato, que los participantes podían abandonar el estudio en el momento en que lo consideraran necesario, que la participación era voluntaria y sin compensación, y que, en caso de sentir malestar o presentar disconformidad con la investigación, podían comunicarse con responsable de esta, con garantía de la confidencialidad de la comunicación. Los participantes dieron su consentimiento mediante la selección de una de dos opciones de respuesta al comienzo de la administración: "Deseo participar" o "No deseo participar". En total, la administración de los instrumentos tomó entre 15 y 20 minutos.
Aspectos éticos
En todos los casos se respetó el resguardo del anonimato y se obtuvo el consentimiento informado de los participantes que conformaron la muestra. Antes de presentar los instrumentos, se explicó el objetivo de la investigación y se informó a los participantes que podían finalizar su participación cuando quisieran, así como el carácter anónimo y confidencial de los datos.
Finalmente, es importante mencionar que la presente investigación se ciñe a la Declaración de Helsinki (World Medical Association, 2013), en la cual se establecen los principios éticos fundamentales para la investigación con seres humanos.
Análisis de datos
Para obtener las evidencias de validez estructural del BAI, se realizaron distintos AFC, y, dada la naturaleza ordinal de las opciones de respuesta, se trabajó sobre matrices de correlaciones policóricas (Jõreskog & Sõrbom, 1996).
Como paso previo, se analizó la normalidad multivalente de las variables estudiadas, siguiendo las recomendaciones de Morata-Ramírez et al. (2015). Dados los elevados niveles de asimetría y curtosis, se procedió a utilizar métodos robustos (Freiberg Hoffmann et al., 2020; Holgado-Tello et al., 2018), y posteriormente se realizaron estimaciones mediante los métodos RULS, RML, DWLS y RGLS de los modelos de un factor, dos factores y cuatro factores. Los cálculos se realizaron con el software EQS 6.1, con excepción del método DWLS, que se computó con el paquete lavaan (Rosseel, 2012) del programa R.
Específicamente, se utilizaron cuatro índices de bondad de ajuste robustos: (a) el x2 de Satorra-Bentler (S-B X2) dividido por los grados de libertad -valores < 5.0 indican un buen ajuste-; (b) el NNFI (Non-Normed Fit Index); (c) el CFI (Comparative Fit Index); y (d) el RMSEA (RootMean Square Error of Approximation). De acuerdo con los criterios especificados por Kline (2011) y Schumacker y Lomax (2016), se consideró un ajuste aceptable a valores mayores o iguales a .90 en NNFI y CFI. Respecto al RMSEA, valores menores a .05 indican un buen ajuste, y valores entre .05 y .08, un ajuste razonable (Browne & Cudeck, 1993). Para la validez de constructo, se consideraron aceptables cargas estandarizadas mayores a .40 (Brown, 2006).
Antes del cálculo de la fiabilidad, se evaluó el ajuste del modelo tau-equivalente con el fin de determinar la adecuación del cálculo del coeficiente alfa (Dunn et al., 2014). Este modelo asume igualdad estadística de cargas factoriales, por lo que se restringieron las cargas factoriales a fin de probar el modelo.
Luego, se calcularon distintos índices a partir de la matriz de correlaciones policóricas: el alfa, el omega, el GLB algebraico y factorial, el H, la beta y la theta. Los coeficientes alfa, omega, GLB y beta se calcularon mediante el software R, versión 3.6.0, con los paquetes GPArotation (Bernaards & Jennrich, 2005), psych (Revelle, 2018) y Rcmdr (Fox et al., 2019); el coeficiente H se calculó con el software EQS, versión 6.1; y la theta se calculó con el módulo de Excel facilitado por Domínguez-Lara (2018). Siguiendo a Nunnally y Bernstein (1994), se consideraron aceptables valores superiores a .80 en todos los coeficientes (Henseler et al., 2009).
Por último, se calculó el intervalo de confianza del 95 % del coeficiente alfa mediante la herramienta propuesta por Domínguez-Lara y Merino-Soto (2015). Complementariamente, se calcularon las correlaciones corregidas ítem-factor, considerando como adecuados los valores superiores a .40 (Nunnally & Bernstein, 1994).
Resultados
Respecto a las comparaciones entre modelos, los índices de bondad de ajuste indican que el modelo unidimensional ofreció mejores índices de bondad de ajuste, independientemente del método de estimación utilizado (véase Tabla 1). Como se puede observar, el modelo unidimensional obtuvo valores aceptables con todos los métodos de estimación utilizados; incluso, los índices de bondad de ajuste resultaron comparativamente mejores para el modelo unidimensional en cada método de estimación.
Modelo | Método | x2 | GL | NNFI | CFI | RMSEA (IC 90 %) |
---|---|---|---|---|---|---|
1 factor | RULS | 930 712 | 189 | .95 | .96 | .07 (.07-.08) |
RML | 1041.852 | 189 | .94 | .95 | .08 (.07-.08) | |
DWLS | 947 305 | 189 | .98 | .98 | .07 (.07-.08) | |
RGLS | 263 414 | 189 | .99 | .99 | .02 (.01-.03) | |
2 factores | RULS | 8183.176 | 189 | .57 | .61 | .21 (.21-.22) |
RML | 1085.383 | 189 | .94 | .95 | .08 (.08-.08) | |
DWLS | 1073.790 | 189 | .93 | .93 | .08 (.07-.08) | |
RGLS | 1531.215 | 189 | .73 | .76 | .10 (.09-.10) | |
4 factores | RULS | 10 849.334 | 189 | .62 | .67 | .20 (.19-.20) |
RML | 12 140.699 | 189 | .93 | .94 | .09 (.08-.09) | |
DWLS | 12 801.17 | 189 | .94 | .95 | .07 (.06-.07) | |
RGLS | 1585.482 | 189 | .72 | .75 | .10 (.09-.10) |
Teniendo en cuenta que el modelo unidimensional ofrece mejores índices de ajuste, en la Tabla 2 se presentan estadísticos descriptivos y correlaciones corregidas ítem-factor de los ítems del BAI. Como se puede observar, las correlaciones corregidas ítem-factor resultaron adecuadas en todos los casos, con valores que oscilaron entre .50 y .77.
Ítems | M | DE | Correlación corregida ítem-factor |
---|---|---|---|
1. Hormigueo o entumecimiento. | 1.6 | 0.76 | .50 |
2. Sensación de calor intenso. | 1.6 | 0.79 | .51 |
3. Debilidad en las piernas. | 1.5 | 0.76 | .59 |
4. Incapacidad para relajarse. | 2.4 | 0.96 | .69 |
5. Miedo a que pase lo peor. | 2.1 | 1.04 | .72 |
6. Mareos o vértigos. | 1.4 | 0.70 | .68 |
7. Palpitaciones o taquicardia. | 1.6 | 0.85 | .74 |
8. Sensación de inestabilidad. | 1.8 | 0.95 | .74 |
9. Con miedo o aterrorizado/a. | 1.7 | 0.90 | .77 |
10. Nervioso/a. | 2.4 | 0.94 | .77 |
11. Sensación de ahogo. | 1.4 | 0.77 | .72 |
12. Temblor de manos. | 1.3 | 0.64 | .66 |
13. Inquieto/a, tembloroso/a. | 1.6 | 0.80 | .74 |
14. Miedo a perder el control. | 1.6 | 0.92 | .77 |
15. Dificultad para respirar. | 1.3 | 0.65 | .71 |
16. Miedo a morir. | 1.4 | 0.81 | .63 |
17. Asustado/a. | 1.7 | 0.90 | .75 |
18. Indigestión o malestar estomacal. | 1.9 | 0.94 | .51 |
19. Sensación de desvanecimiento desmayos. | 1.1 | 0.32 | .52 |
20. Ruborizarse, sonrojamiento. | 1.3 | 0.63 | .50 |
21. Sudoración (no producida por calor). | 1.4 | 0.69 | .55 |
Nota. M = media; DE = desviación estándar.
En cuanto a las cargas estandarizadas correspondientes al modelo unidimensional obtenidas a partir de los distintos métodos de estimación, los valores oscilaron entre .47 y .78 para RULS, entre .40 y .68 para RML, entre .46 y .85 para DWLS, y entre .72 y .97 para RGLS (véase Tabla 3), de manera que los valores de las cargas estandarizadas resultaron adecuados (mayores a .40), independientemente del método de estimación utilizado. Como se puede observar en la Tabla 3, los valores más bajos se obtuvieron a partir del método RML, seguido del RULS y el DWLS, y los valores más elevados se obtuvieron mediante el RLGS. En definitiva, las cargas estandarizadas de los reactivos aportan evidencia sobre de la validez de constructo del BAI.
Ítem | RULS | RML | DWLS | RGLS |
---|---|---|---|---|
1. Hormigueo o entumecimiento. | .49 | .41 | .48 | .72 |
2. Sensación de calor intenso. | .49 | .41 | .48 | .79 |
3. Debilidad en las piernas. | .58 | .48 | .56 | .82 |
4. Incapacidad para relajarse. | .68 | .59 | .70 | .88 |
5. Miedo a que pase lo peor. | .73 | .64 | .78 | .94 |
6. Mareos o vértigos. | .67 | .57 | .65 | .90 |
7. Palpitaciones o taquicardia. | .74 | .63 | .72 | .94 |
8. Sensación de inestabilidad. | .75 | .65 | .75 | .93 |
9. Con miedo o aterrorizado/a. | .77 | .68 | .85 | .97 |
10. Nervioso/a. | .78 | .68 | .81 | .96 |
11. Sensación de ahogo. | .71 | .61 | .73 | .95 |
12. Temblor de manos. | .65 | .56 | .65 | .89 |
13. Inquieto/a, tembloroso/a. | .74 | .64 | .74 | .95 |
14. Miedo a perder el control. | .78 | .68 | .79 | .95 |
15. Dificultad para respirar. | .70 | .60 | .73 | .96 |
16. Miedo a morir. | .63 | .54 | .67 | .92 |
17. Asustado/a. | .75 | .65 | .82 | .97 |
18. Indigestión o malestar estomacal. | .50 | .42 | .48 | .70 |
19. Sensación de desvanecimiento o desmayos. | .51 | .43 | .49 | .78 |
20. Ruborizarse, sonrojamiento. | .47 | .40 | .46 | .77 |
21. Sudoración (no producida por calor). | .52 | .44 | .51 | .87 |
Por otra parte, para estimar la fiabilidad del BAI, primero se evaluó la función del cálculo del alfa a través del examen de los índices de bondad de ajuste del modelo tau-equivalente. Puntualmente, los valores elevados de chi cuadrado y en el RMSEA resultaron no aceptables, de manera que el cálculo del alfa permitiría estimar la mayor fiabilidad posible en ausencia del cumplimiento del supuesto de tau-equivalencia (véase Tabla 4).
Método | x 2 | GL | NNFI | CFI | RMSEA (IC 90 %) |
---|---|---|---|---|---|
RULS | 1423.272 | 208 | .93 | .93 | .09 (.08-.09) |
RML | 12 267.743 | 208 | .94 | .94 | .08 (.07-.09) |
DWLS | 1439.865 | 189 | .96 | .95 | .09 (.08-.09) |
RGLS | 204.817 | 108 | .97 | .97 | .04 (.03-.04) |
De este modo, con respecto a la fiabilidad, los valores obtenidos a partir de los distintos índices calculados resultaron aceptables en todos los casos, de manera que, en conclusión, también fue posible obtener evidencia sobre de la fiabilidad del BAI (véase Tabla 5).
Discusión
En la presente investigación se propuso obtener evidencias acerca de la validez estructural y la consistencia interna de la versión adaptada a población de Buenos Aires del BAI, mediante el uso de distintos métodos.
Así, en primer lugar, se estimó la validez estructural a partir del examen de los modelos de uno, dos y cuatro factores, para lo cual se realizaron estimaciones desde los métodos cuya adecuación para datos ordinales fuera corroborada empíricamente: RULS, DWLS y RML (Bandalos, 2014; Holgado-Tello et al., 2018; Kogar & Yilmaz-Kogar, 2015; Li, 2016a; Li, 2016b; Nalbantoglu-Yilmaz, 2019). Adicionalmente, se utilizó el método RGLS, del cual no se había hallado estudios empíricos en datos ordinales, y se obtuvieron valores de ajuste aceptables para el modelo unidimensional independientemente del método de estimación utilizado. Por lo tanto, el modelo resultó estable a pesar de las diferencias que pudieran existir en función de la posible influencia del método de estimación (Kogar & Yilmaz-Kogar, 2015). Estos resultados son concordantes con estudios previos respecto a la unidimensionalidad del BAI (Sanz et al., 2012; Sanz & Navarro, 2003; Vizioli & Pagano, 2020).
En el caso de los otros modelos, se observó que los índices de bondad de ajuste podían ser inaceptables de acuerdo con el método de estimación. Asimismo, se encontró que, con cada método de estimación, los índices de bondad de ajuste del modelo unidimensional resultaron mejores que en los otros dos modelos.
Con respecto a la fiabilidad, los distintos métodos de estimación utilizados para el AFC evidenciaron la no adecuación del modelo tau-equivalente -modelo que tiene la característica de restringir las cargas factoriales (Dunn et al., 2014)-. Al no cumplirse este supuesto, se asumió que el cálculo del alfa ordinal funcionaría para estimar el mayor límite inferior (Cronbach, 1951; Trizano-Hermosilla & Alvarado, 2016). Así, el valor obtenido fue de .94 -es decir, muy bueno-; un alfa similar al de .92 de Beck et al. (1988), al de .94 de Rodríguez Reynaldo et al. (2001), al de .94 de Liang et al. (2018), y al de .91 de Padrós Blázquez et al. (2020). De hecho, el alfa obtenido fue relativamente superior al alfa de .88 reportado por Sanz y Navarro (2003), al de .83 de Robles et al. (2001), al de .89 de Guillén Díaz-Barriga y González-Celis Rangel (2019), y al de .90 de Sanz et al. (2012).
De igual manera, se calcularon distintos índices de fiabilidad adecuados para modelos congenéricos; una decisión que tuvo fundamento en la diversidad de recomendaciones acerca de índices de fiabilidad. A partir de ello, se obtuvo un omega ordinal de .95, con lo cual se obtuvieron valores similares a los obtenidos por Vizioli y Pagano (2020), quienes hallaron un alfa ordinal de .93 y un omega ordinal de .95. Como era de esperarse, los valores de omega fueron ligeramente más elevados que los obtenidos mediante el coeficiente alfa (Revelle & Zinbarg, 2009). Al respecto, es preciso mencionar que se estimó solo un omega, dado que, al ser el modelo unidimensional, el omega total y el jerárquico son equivalentes (Trizano-Hermosilla & Alvarado, 2016).
Asimismo, se calcularon índices de fiabilidad que resultan novedosos en estudios psicométricos del BAI, como lo fueron el GLB algebraico, el GLB factorial, el H y la theta. En todos los casos, se obtuvieron valores considerados aceptables: GLB algebraico = .97, GLB factorial = .96, beta = .86; H = .91 y theta = .88. En concordancia, se podría a firmar que la versión del BAI adaptada a población de Buenos Aires demuestra ser fiable independientemente del coeficiente calculado.
Finalmente, este trabajo presenta algunas limitaciones que deben tenerse en cuenta, como que la muestra empleada no incluye participantes de regiones distintas del área metropolitana de Buenos Aires, o que no se realizaron análisis de la estabilidad temporal, la validez discriminante o la invarianza factorial por género. Estas cuestiones deberán contemplarse en nuevos estudios para que se recolecten muestras más heterogéneas de distintas regiones, e incluso con métodos de muestreo probabilísticos que briden la posibilidad de extrapolar los resultados obtenidos al total de la población local.
De igual forma, se propone que futuras investigaciones indaguen evidencias de estabilidad temporal del instrumento, así como de la validez discriminante en relación con variables como la sintomatología depresiva. Además, se sugiere analizar la invarianza factorial según el género, dado que esta variable no ha sido muy abordada dentro de la literatura investigativa. No obstante, aunque se entiende que las propiedades psicométricas de un instrumento deben ser puestas a prueba constantemente y con diferentes procedimientos y muestras, se debe reconocer que se trata de un proceso continuo que debe contar con múltiples evidencias que no pueden ser abordadas todas en una única investigación.
En líneas generales, la presente investigación permitió obtener evidencias acerca de la validez estructural y la fiabilidad del BAI a través de distintos métodos, pues los resultados obtenidos dan cuenta de la solidez de las propiedades psicométricas del instrumento. De esta manera, el instrumento se presenta como una alternativa importante para su uso en ámbitos como el investigativo o el clínico, dada la brevedad de su administración (Bardhoshi et al., 2016), y una característica importante del BAI radica en que, a diferencia de otros instrumentos que miden la ansiedad, evalúa síntomas que no se comparten con la depresión, lo que facilita la discriminación entre ambos cuadros (Sanz, 2014). Finalmente, se espera que la presente investigación ayude a promover la utilización de distintos métodos de estimación en AFC, así como el cálculo de distintos coeficientes de fiabilidad, con el fin de asegurar la independencia de las propiedades psicométricas de los instrumentos frente a los cálculos realizados