INTRODUCCIÓN
Datos sobre la depresión evidencian que más de la mitad de las personas que la padecen no reciben tratamiento de manera oportuna, a pesar de tener un impacto significativo en la calidad de vida, funcionamiento general, años de vida saludables y representa costos elevados para la economía mundial 1,2.
Estimando que no se ha logrado avanzar de manera significativa en el estudio y comprensión de los procesos fisiopatológicos y cognitivos subyacentes a los trastornos mentales como la depresión 4, y valorando que la manifestación sintomática de la misma está determinada por variables contextuales que brinda la cultura propia de cada territorio 5, una forma de contribuir al desarrollo de estudios en la materia es la validación y adaptación de medidas de autoinforme que permitan identificar la presencia, frecuencia y clasificación de síntomas depresivos para su uso en investigación y escenarios clínicos en diversos contextos socioculturales.
Uno de los instrumentos más usado en la depresión es el Beck Depression Inventory [BDI] 6, el cual desde 1961 ha sido adaptado y validado en diferentes culturas y se considera el instrumento más utilizado para investigación sobre sintomatología depresiva 7, aun cuando existen otras medidas con fines similares 8,9,10.
La primera versión del inventario (BDI-I) surge con pacientes deprimidos, en los que se realizaron observaciones sistemáticas y registros de los síntomas, y se contrastaron los hallazgos con lo citado en la literatura psiquiátrica de la época; así, se generaron 21 reactivos que evalúan la frecuencia e intensidad de sintomatología depresiva el mismo día de la evaluación 6.
Posteriormente se realizaron dos actualizaciones a la primera versión, considerando los cambios en los manuales diagnósticos DSM-III y DSM-IV 11: a) BDI-IA en la que se optó por evaluar la frecuencia de síntomas durante la última semana previa a la valoración y se modificó la redacción de 15 reactivos de la primera versión 12, y b) BDI-II, que es la versión actual y en esta se modificaron 18 reactivos de la segunda versión para evaluar la sintomatología durante las dos últimas semanas 13.
El BDI-II ha sido validado y adaptado al castellano en España con población clínica 14, estudiantes 15 y población general 16, y ha mostrado buenos resultados en su estructura factorial y confiabilidad.
Los intentos por validar el instrumento en población mexicana han sido varios, incluyendo muestras de estudiantes, personas con alguna afección médica o mexicanos residentes en el extranjero 11,17,18,19,20, y son escasos los trabajos en población que radica fuera de la capital del país, con excepción de uno que incluye una muestra de estudiantes y una de población general de un estado del norte del país 11.
Dicho estudio reporta un ajuste de los datos obtenidos al modelo de dos factores correlacionados, pero de acuerdo con los criterios vigentes de Análisis Factorial Confirmatorio (AFC) 21, los índices de ajustes a la población general no se probaron con otros modelos, como el de dos factores anidados en un factor de segundo orden y el unifactorial, que también han sido propuestos en la literatura.
Se han reportado diversas estructuras factoriales del BDI-II que caracterizan la depresión de diferentes maneras:
El modelo unifactorial: depresión como constructo único y sin una división clara de la sintomatología 22.
El modelo con dos factores correlacionados, es el más reportado (23), los reactivos se dividen en dos dimensiones: cognitivo-afectiva y somática-vegetativa 13.
En población mexicana, modelo de tres factores correlacionados, se agrupan los reactivos en tres subescalas: síntomas somáticos, dificultades cognitivas y dificultades de ejecución 24,25,17.
Modelo de dos factores anidados en una medida general de depresión (un factor de segundo orden). Esta estructura proporcionaría tres medidas de depresión: una general y dos de dominios específicos de la depresión 26,27,28.
Modelo con factores específicos integrados por los reactivos más un factor general independiente relacionado con todos los reactivos 29,30,31. Este modelo justificaría el análisis de los reactivos por medio de la teoría de respuesta al ítem 32, y permitiría que cada reactivo se utilice como una medida de depresión.
El objetivo de este trabajo es presentar la estructura factorial del BDI-II versión mexicana en una muestra de poblacional de un municipio del estado de Oaxaca (México), comprobando el grado de ajuste de los datos obtenidos en esta población a los modelos unifactorial, con dos y tres factores relacionados, bifactorial jerárquica y bifactorial no jerárquica. Todo con la finalidad de identificar la estructura del constructo que se ajusta mejor a los datos obtenidos.
MÉTODO
Participantes
La muestra estuvo integrada por 3701 habitantes entrevistados en sus domicilios del municipio de Oaxaca de Juárez de siete colonias diferentes. La edad promedio de la muestra fue de 36.61 años (DT = 13.96), y 67.8 % fueron mujeres.
Instrumento
Cuestionario de datos sociodemográficos, que incluyó datos generales como la edad, el sexo, la escolaridad y la religión.
El Beck Depression Inventory-II 13 en su versión mexicana 17 es un instrumento que mide la presencia y gravedad de sintomatología depresiva autoinformada en adultos a través de 21 reactivos con una escala tipo Likert que va de 0 a 3 en función de la intensidad de cada síntoma. El instrumento refleja los criterios diagnósticos para depresión mayor establecidos en los manuales diagnósticos más utilizados en psiquiatría.
Para la adaptación cultural del instrumento, un grupo de 12 psicólogos residentes del municipio de Oaxaca de Juárez evaluó con una escala de 0 (ausente) a 1 (presente) los siguientes aspectos de cada reactivo y sus respuestas propuestos por Manson 33: a) nivel de comprensión (sencillez y claridad), b) aceptabilidad (lenguaje amable, no ofensivo), c) relevancia (utilidad y pertinencia para el objeto de estudio) y d) integridad cultural (utilización de lenguaje local). Todos los reactivos y sus respuestas fueron considerados con las cuatro características antes descritas por parte de los evaluadores. Posteriormente se llevó a cabo un pilotaje del cuestionario con 30 personas de población general; todas expresaron que comprendían con claridad cada reactivo.
Procedimiento
El protocolo de la investigación fue aprobado por un comité revisor del Instituto de Investigaciones Psicológicas de la Universidad Veracruzana. Se capacitó en la aplicación del instrumento a 23 encuestadores, todos licenciados en Psicología. Se visitó a los participantes en su domicilio particular, se les explicó los objetivos del estudio y se solicitó su consentimiento informado para continuar con la aplicación de los instrumentos. No hubo dificultades en la comprensión del contenido de los instrumentos y el tiempo de llenado osciló entre 10 y 15 minutos.
Análisis estadístico
Para determinar el poder discriminativo de los reactivos del cuestionario se realizó el análisis de grupos contrastantes por medio de la prueba U de Mann-Whitney, comparando las puntuaciones del 25 % de los participantes que puntuaron más alto contra el 25 % de los que puntuaron más bajo 34.
Posteriormente se llevó a cabo un análisis factorial confirmatorio por el método de Máxima Verosimilitud. El ajuste de los datos al modelo se evaluó utilizando las recomendaciones vigentes 26, mediante el cociente X2/df, la raíz cuadrada media del error de aproximación (RMSEA), con su intervalo de confianza asociado del 90 %; el índice de ajuste comparativo (CFI) y el índice de ajuste de Tucker-Lewis (TLI). Además, se utilizó el estadístico de Hoelter para comprobar si el tamaño de la muestra proporciona una estimación adecuada del ajuste del modelo utilizando un punto de corte mínimo de 200 26.
Fueron evaluados los cinco modelos factoriales descritos en la introducción para determinar el grado de ajuste de cada uno a la estructura del cuestionario: el modelo unifactorial, el modelo con dos factores correlacionados, el modelo con tres factores, el modelo con dos factores anidados en un factor de segundo orden, y el modelo con un factor común y dos factores específicos independientes no anidados.
La confiabilidad se obtuvo mediante el coeficiente alfa de Cronbach, y siguiendo la sugerencia clásica de Nunally y Bernstein 35 se utilizó un punto de corte de .70 para considerar valores aceptables.
RESULTADOS
Poder discriminativo y homogeneidad de reactivos
La prueba de Shapiro-Wilks y el análisis de los histogramas y las gráficas P-P y Q-Q determinaron que los datos no se ajustaban a una distribución normal, por lo cual el análisis de poder discriminativo se llevó a cabo mediante la prueba U de Mann-Whitney. Todos los reactivos demostraron adecuado poder discriminativo, ya que las diferencias de puntuación entre el 25 % superior y el 25 % inferior de las puntuaciones fueron significativas para cada reactivo (p<0.001).
Así, todos los reactivos correlacionaron de manera positiva y significativa con el total de la escala (rho de Spearman de 0.341 para el reactivo 4 a 0.672, para el reactivo 21, con p<0.001 para todos los casos).
Análisis factorial confirmatorio
De los cinco modelos evaluados, ninguno mostró inicialmente un ajuste adecuado a los datos. El modelo con dos factores correlacionados propuesto por Sanz et. al 14 fue el que logró los mejores índices iniciales, con un ajuste modesto según los criterios actuales (X2/df =5.9; TLI =.913; CFI =.922; RMSEA =.059; IC 90%: .057-.061).
La inspección de los índices de modificación mostró que no era posible lograr un ajuste satisfactorio de los modelos de uno y tres factores, así como del modelo bifactorial, y el modelo anidado con factor general de segundo orden. En cambio, el modelo de dos factores correlacionados pudo ser modificado exitosamente para obtener índices de ajuste adecuados. Las modificaciones realizadas fueron: plantear regresiones de los reactivos 12 y 13 sobre ambos factores y añadir una covarianza de error entre los reactivos 17 y 18 (figura 1). Los índices de ajuste obtenidos tras estas modificaciones fueron X2/df =3.04; TLI =.95; CFI =.95; RMSEA =.048; IC 90%: .046-.050; con un índice de ajuste de Hoelter de 465 para una n = 3701. La tabla 1 muestra los índices de ajuste para cada modelo una vez hechas todas las modificaciones con sentido teórico sugeridas por el programa.
Estructura factorial | X2/df | TLI | CFI | RMSEA |
---|---|---|---|---|
Unifactorial: Todos los reactivos se agrupan en un solo factor | 15.87 | 0.918 | .923. | .070 (.068-.072) |
Dos factores con un factor general de segundo | ||||
orden: Los reactivos se agrupan en dos factores, | 11.5 | 0.929 | 0.936 | .057 (.054-.059) |
anidados en un factor general de nivel superior | ||||
Tres factores: Los reactivos se agrupan en tres factores diferentes pero correlacionados | 11.54 | 0.929 | 0.937 | .053 (.051-.055) |
Bifactorial: Los reactivos se agrupan en dos facto- | ||||
res, y a la vez en un factor general independiente, | 8.48 | 0.936 | 0.94 | .055 (.053-.057) |
sin relación directa con los otros dos | ||||
Dos factores correlacionados: Los reactivos se agrupan en dos factores diferentes pero correlacionados | 3.04 | 0.95 | 0.95 | .048 (.046-.050) |
El coeficiente de correlación entre los dos factores fue de 0.79.
Confiabilidad
La confiabilidad de la escala total fue de 0.92. El primer factor presentó una confiabilidad de .89 y el segundo factor de .83; las cuales se consideran altas de acuerdo con los criterios utilizados 35.
DISCUSIÓN Y CONCLUSIÓN
El objetivo de este estudio fue presentar el grado de ajuste del BDI-II en una muestra de población general mexicana a los modelos unifactorial, con dos y tres factores correlacionados, jerárquico con dos factores anidados en uno de segundo orden, y con factores específicos más un factor general independiente relacionado con todos los reactivos; todos ellos previamente reportados en la literatura.
Los resultados obtenidos muestran que de las estructuras aquí analizadas, el modelo con dos factores correlacionados 14 es el que mejor se ajusta a los datos obtenidos en la población estudiada. Los índices de ajuste son apropiados de acuerdo con las recomendaciones vigentes, y el tamaño de muestra es apropiado para obtener conclusiones estables 22.
Los dos factores obtenidos son muy similares a los que se encuentran en los trabajos de Sanz et. al. 14 y el de Estrada 11, realizado en población mexicana. Los factores obtenidos se corresponden con una dimensión cognitivo-afectiva (reactivos 1 a 10, 12 a 14) y una somático-vegetativa (reactivos 11 y del 15 al 21). El grado de ajuste de esta estructura fue también muy similar en población abierta y con estudiantes de Ciudad de México 18. De acuerdo con una revisión sistemática 25, la estructura de dos factores correlacionados es la más encontrada en los estudios reportados en la literatura.
El resto de los modelos considerados no tiene un ajuste óptimo a los datos de la muestra. El modelo unifactorial, en el que un solo factor (depresión) es suficiente para explicar el comportamiento de los reactivos, es el que tiene peor grado de ajuste a los datos (tabla 1). El modelo jerárquico y el modelo que propone factores específicos más un factor general independiente relacionado con todos los reactivos son propuestas recientes de la literatura psicométrica sobre el BDI-II. Son propuestas importantes que, de recibir respaldo por los datos empíricos, podrían contribuir a obtener caracterizaciones alternativas del constructo con utilidad clínica; pero en esta muestra no fueron respaldados por los datos. Finalmente, el modelo trifactorial 18 en población mexicana tampoco tuvo el mejor nivel de ajuste (tabla 3).
El modelo final obtenido difiere de los reportados en la literatura al menos en un aspecto: para obtener un ajuste óptimo, es necesario plantear que los reactivos 12 y 13 están relacionados con ambos factores. En realidad, esto no es sorprendente, ya que se han encontrado estas cargas factoriales cruzadas en otros estudios 18. En la tabla 2 del trabajo referido se observa que el reactivo 12 carga significativamente en ambos factores. Otros reactivos están en la misma situación (como el reactivo 1, referente a la tristeza, y el reactivo 4, relativo al placer), lo cual no se observó en este estudio.
La evidencia empírica demuestra que no es raro que uno o varios reactivos correlacionen con más de un factor, y por ello, el ajuste del modelo mejora cuando se plantean estas correlaciones entre un reactivo y más de un factor 28. Por supuesto, de acuerdo con el principio de parsimonia, sería preferible que cada reactivo estuviera relacionado con un solo aspecto del constructo. De acuerdo con ello, en estos casos suele plantearse la posibilidad de eliminar el reactivo con carga múltiple, pero la eliminación de este tipo de reactivos es un asunto problemático que merece cuidadosa consideración teórica y clínica. La eliminación de un reactivo plantea siempre una pérdida de información sobre el estado de la variable medida, la cual en algunos casos puede ser clínicamente relevante.
Siendo la depresión un problema de salud mental pública, la validación de este instrumento en población abierta permitirá utilizarlo como instrumento de valoración en estudios con enfoque epidemiológico, ya que permite reconocer la intensidad de la sintomatología, lo que facilitaría (en conjunto con otras medidas) la detección oportuna de la depresión y probablemente su prevención. Entre las implicaciones para la práctica clínica en psicología y psiquiatría, una de las ventajas de contar con un modelo de dos factores relacionados (síntomas somáticos y cognitivo afectivos) permite la clasificación e interpretación de la sintomatología depresiva en población general, lo que apoyaría a una mejor comprensión del fenómeno y facilitaría las decisiones del equipo de salud. El BDI-II podría también utilizarse para medir el efecto de psicofármacos o intervenciones psicológicas, ya que la validación aquí presentada puede ser utilizada en población abierta mexicana, y los resultados arrojarían información específica sobre el efecto diferencial de las terapias sobre los factores somáticos y/o psicológicos.
El uso del BDI-II en investigaciones con enfoque de salud mental pública permitiría estudiar factores predictores asociados, amortiguadores, mediadores y moderadores de la depresión, además de que constituye una medida de bajo costo y fácil aplicación.
Entre las limitaciones de esta validación están: la utilización de una muestra por conveniencia, pues los aspectos socioculturales específicos de la muestra estudiada dificultan la generalización de los resultados. Para futuras investigaciones se recomienda incluir medidas convergentes, comparar las estructuras factoriales entre poblaciones clínicas y no clínicas y procurar gestionar condiciones que permitan el estudio de la confiabilidad test retest de la escala.
En conclusión, este estudio determinó que la estructura factorial apropiada del BDI-II en una muestra de población abierta del sureste mexicano es la que tiene dos factores correlacionados, uno de ellos con sintomatología cognitivo-afectiva y otro que incluye síntomas somáticos. Por lo tanto, este instrumento puede ser utilizado en población abierta con el mismo enfoque interpretativo que se considera en la población clínica, lo que permite su utilización en estudios epidemiológicos para la detección de casos y comprensión de la sintomatología depresiva.