Introducción
La pandemia por COVID-19, declarada por la Organización Mundial de la Salud (OMS), se viene desarrollando en sucesivas olas 1; debido a sus características propias y su magnitud impredecible 2, ha traído consigo una pandemia de afecciones psicológicas que impacta la salud mental (SM) de la población y, por tanto, también la salud general de los trabajadores sanitarios.
La definición de salud que da la OMS abarca una serie de componentes, entre los que se incluye el bienestar mental. La SM es definida como un proceso continuo de satisfacción que posibilita a las personas desarrollar sus habilidades y potencialidades, afrontar el estrés cotidiano de la vida, trabajar de manera productiva y, en consecuencia, realizar contribuciones relevantes en sus comunidades 3.
La prevalencia de afecciones mentales a nivel mundial es alta 4, y en los últimos años diversos países enfocaron sus estrategias de intervención en la generación de políticas y prácticas de investigación en SM 5. En el Perú se ha incrementado la incidencia de enfermedades psíquicas 6; asimismo, el lugar de trabajo, donde una persona permanece gran parte de su tiempo, impacta su SM, especialmente en el caso del personal de salud 7. En este sentido, el estudio de la SM como base del bienestar de los individuos recobra importancia en tiempos de pandemia debido al comportamiento psicopatogénico de esta 8, de ahí que resulte necesario contar con instrumentos validados para realizar una medición oportuna del estado mental, especialmente en trabajadores de salud.
El cuestionario de salud general (GHQ) es el más utilizado para valorar la SM. Desde su versión inicial, de 60 preguntas, se ha reducido a versiones más cortas hasta llegar a la actual que se compone de 12 ítems (GHQ-12) 9. Si bien el instrumento de autoreporte es ampliamente difundido y empleado, aún persisten cuestiones por aclarar, como el sistema de puntuación y la estructura factorial de la escala.
Según Goldberg et al. 9, la versión inicial del GHQ-12 es monolítica. No obstante, diversos trabajos notifican que este supuesto no se estaría cumpliendo. Tal es así, que Hystad et al. 10 concluyen que es multidimensional, y Gnambs et al. 11 que tiene una estructura bidimensional. Sin embargo, se recomienda no utilizar e interpretar las puntuaciones de las subescalas porque estas reflejan principalmente la salud mental general y no constructos distintos. Un primer estudio de traducción al español, adaptación y evaluación de las propiedades métricas del GHQ-12 reveló un constructo de dos factores y buenas características psicométricas 12. Similares resultados, pero en una configuración unidimensional, fueron reportados en España 13.
La validación es un proceso complejo que debe ser verificado de manera continua para garantizar la correcta y concreta objetividad de un instrumento de medición 14. Es una exigencia contar con cuestionarios contextualizados y con propiedades métricas adecuadas 8 para evaluar la SM. En el Perú no existe evidencia de la validez del GHQ-12 en el personal de salud, por lo que el objetivo de este estudio fue adaptar y hacer dicha validación de constructo y fiabilidad del cuestionario de salud general (GHQ-12) en trabajadores de salud del Perú.
Metodología
Diseño y participantes
Se hizo un estudio de diseño de validación de instrumentos documentales15, realizado de junio a diciembre del 2021. La población fue de 6384 trabajadores de hospitales y centros de atención primaria de la Dirección Regional de Salud de Ica-Perú. Se realizó un muestreo aleatorio estratificado en dos etapas: primero se seleccionaron 15 establecimientos de salud y luego se asignó la muestra proporcional en cada uno de ellos. Como paso previo se determinó una muestra global de 432 trabajadores con el algoritmo matemático para poblaciones finitas.
El nivel de confianza fue del 95 %; la proporción esperada de población con las características de interés fue del 50 %; el error de estimación fue del 5 % y hubo una proporción esperada de pérdidas de aproximadamente el 19 %. Se incluyó participantes de ambos sexos que aceptaron involucrarse en el estudio, y se excluyó a quienes no aceptaron o dejaron en blanco al menos una pregunta del instrumento.
Instrumentos
Cuestionario de salud general (GHQ-12)
Se utilizó una versión cubana que hizo una traducción y adaptación al español del GHQ-12 (12), el cual fue diseñado por Goldberg et al. 9. Se trata de un instrumento de uso libre, ampliamente difundido y utilizado para detectar morbilidad psicológica. Consta de 12 preguntas, de las cuales 6 son de orientación positiva (1, 3, 4, 7, 8, 12) y 6 negativa (2, 5, 6, 9, 10, 11) en una escala de respuesta tipo Likert de cuatro opciones (0-1-2-3). Los valores para calificar las categorías de los ítems redactados de forma positiva deben ser previamente invertidos, para así obtener un puntaje total que oscile entre 0 y 36 (a mayor puntuación, mayor gravedad de los síntomas). Para Latinoamérica se ha sugerido un puntaje de corte ≥11 16,17, el cual significa mala salud mental. Para las dimensiones se utilizó la fórmula Puntaje total de la escala/Número de ítems 18, y en el continuo 0-3 se consideró la presencia de disforia general y disfunción social para valoraciones ≥1.
Procedimientos
El equipo de investigación realizó modificaciones mínimas en tres ítems del instrumento para facilitar el entendimiento por parte de la población peruana. Así, en el ítem 3 se cambió “¿Ha sentido que está jugando un papel útil en la vida?” por “¿Ha sentido que está desempeñando un papel útil en la vida?”; en el ítem 6 “¿Ha sentido que no puede superar sus dificultades?” se modificó por “¿Ha tenido la sensación de que no puede superar sus dificultades?”. El ítem 8, “¿Ha sido capaz de hacer frente a sus problemas?” se reemplazó por “¿Ha sido capaz de afrontar adecuadamente sus problemas?”.
Esta propuesta fue presentada a un equipo de cinco expertos -cuatro de ellos profesionales de psicología y con formación de doctorado, y un especialista en diseño y validación de instrumentos de medición-, quienes no sugirieron modificaciones adicionales en los ítems. Luego se realizó una prueba piloto en 60 trabajadores con las mismas características de la muestra final (Edad M = 40,32; DT = 12,46). El objetivo de esta prueba fue examinar la comprensión de las preguntas. Como resultado de este procedimiento no hubo cambios en su redacción.
Se aplicó el instrumento a 432 trabajadores de salud bajo la técnica de encuesta autoadministrada. Se incluyó un cuestionario con variables generales y un consentimiento informado que confirmaba la participación voluntaria y la confidencialidad de la información. El estudio fue aprobado por el Comité de Ética del Hospital Santa María del Socorro de Ica (CO-001-35-2021/CE).
Análisis estadístico
Se incluye un análisis descriptivo preliminar de cada ítem y se reportan datos estadísticos descriptivos como la asimetría, curtosis y varianza, que consideró aceptables índices de variabilidad ≥0,20 19. El análisis paralelo de Horn (APH) se utilizó para establecer el número de factores. Se consideraron valores superiores a 0,40 en las comunalidades y 0,30 para cargas factoriales 20.
Se evaluó la normalidad multivariada con el coeficiente de Mardia, y por tratarse de un instrumento con ítems politómicos se ajustaron los análisis a una matriz de correlación policóricas. Se aplicó la prueba de adecuación muestral de Kaiser, Meyer y Olkin (KMO) y el test de esfericidad de Bartlett para determinar la factibilidad de realizar el análisis factorial exploratorio (AFE), tomando como un ajuste correcto valores superiores a 0,70 21. Para la extracción de factores se empleó el método de mínimos cuadrados no ponderados robustos (RULS), porque es adecuado para datos ordinales 14,22. También se usó el método de rotación promin robusto.
Se realizó el análisis factorial confirmatorio (AFC) con el método de máxima verosimilitud robusta (RML), mínimos cuadrados generalizados robustos (RGLS), mínimos cuadrados no ponderados robustos (RULS) y mínimos cuadrados ponderados diagonales (DWLS). Los índices para comparar los modelos fueron: el chi cuadrado entre los grados de libertad ((x²)/gl), el índice de aproximación de la raíz de cuadrados medios del error (RMSEA), la raíz del residuo cuadrático promedio estandarizado (SRMR), el índice de ajuste comparativo (CFI) y el índice de ajuste no normalizado (NNFI). Para un buen ajuste se esperan valores de (x²)/gl > 2, que se considera un excelente ajuste, mientras que unos resultados entre 2 y 5 se consideran un ajuste razonable 23. Para CFI y NNFI ≥0,90 y a partir de 0,95 son ajustes excelentes, mientras que RMSEA <0,06 son óptimos y <0,08 aceptables 24, asimismo SRMR <0,05.
La consistencia interna se evaluó con el coeficiente omega de McDonald. Se estimaron sus intervalos de confianza al 95 % y se adoptaron valores superiores a 0,70 para garantizar la fiabilidad de la escala 25. La normalidad univariada se analizó mediante el estadístico de Kolmogorov-Smirnov y se aplicaron pruebas no paramétricas. Para demostrar la validez discriminativa del GHQ-12 se evaluaron diferencias con el chi-cuadrado entre la mala salud mental y las variables generales como edad, género, profesión, área de trabajo, nivel de atención y condición laboral.
Se procedió a realizar el análisis de correlación explorando las interrelaciones entre las puntuaciones de la escala global y de los factores mediante el coeficiente de correlación de Spearman. La validez predictiva incluyó una regresión logística binaria. Se tomó como variable dependiente la mala salud mental, mientras que la independiente fue la presencia de disforia general y disfunción social (dimensiones del instrumento). Se consideró un valor de p < 0,05 como estadísticamente significativo.
Para el análisis se elaboró una base de datos en SPSS versión 25. El AFE se realizó en el software Factor versión 10.3.10; el AFC y la confiablidad con el programa JASP.
Resultados
En el estudio participaron 432 trabajadores de la salud, la mayoría de género femenino (77,5 %), 34,4 % profesionales en enfermería. El 32,2 % tiene como área de trabajo admisión o triaje, y el 53,9 % trabaja en primer nivel de atención. En cuanto a la condición laboral, el 62 % está vinculado en el establecimiento de salud. El rango de edad fue de 23 y 66 años (M = 42,37; DE = 10,35).
Validez de constructo
Se exploró la estructura interna del GHQ-12, tras lo cual el análisis de variabilidad de reactivos reveló la buena calidad de los mismos, con valores superiores a 0,3. Se comprobó que los ítems en su conjunto son muy homogéneos en cuestión de varianza, y por tanto son adecuados para discriminar entre los participantes, con diversos valores en la variable cuantificada. El examen de las comunalidades reveló valores entre 0,29 y 0,70, y se evidenció la baja contribución de los reactivos 1, 7 y 12 al resultado total. No obstante, se tomó la decisión de mantenerlos. En el análisis Mardia se halló un coeficiente de asimetría de 23,68 (gl = 364; p = 1,0) y de curtosis de 195,55 (p = 0,000), lo que confirmó en los datos la ausencia de distribución normal multivariada. Por ello, se utilizó el método de extracción RULS y la matriz de correlaciones policóricas, opciones más acordes con la condición ordinal de los reactivos. El APH sugirió retener dos factores en la medida que el autovalor real supere al autovalor aleatorio, constatando así la estructura bidimensional del constructo (Tabla 1).
Autovalor promedio aleatorio | Autovalor percentilar aleatorio | Asimetría Curtosis Varianza Comunalidad | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
1 | 4,65 | 1,28 | 1,34 | 0,322 | -0,197 | 0,587 | 0,332 | |||
2 | 1,33 | 1,20 | 1,25 | -0,069 | -1,033 | 0,876 | 0,488 | |||
3 | 1,11 | 1,14 | 1,19 | 1,364 | 1,380 | 0,606 | 0,524 | |||
4 | 0,75 | 1,10 | 1,13 | 0,685 | 0,017 | 0,561 | 0,704 | |||
5 | 0,72 | 1,05 | 1,08 | -0,228 | -0,840 | 0,799 | 0,609 | |||
6 | 0,63 | 1,01 | 1,04 | 0,508 | -0,667 | 0,705 | 0,596 | |||
7 | 0,59 | 0,97 | 1,00 | -0,017 | -0,466 | 0,643 | 0,295 | |||
8 | 0,53 | 0,93 | 0,96 | 0,324 | 0,337 | 0,429 | 0,455 | |||
9 | 0,45 | 0,89 | 0,92 | 0,099 | -1,003 | 0,861 | 0,664 | |||
10 | 0,42 | 0,84 | 0,88 | 1,425 | 0,994 | 0,610 | 0,709 | |||
11 | 0,40 | 0,80 | 0,83 | 3,119 | 9,346 | 0,300 | 0,443 | |||
12 | 0,36 | 0,74 | 0,79 | 0,273 | -0,372 | 0,630 | 0,368 |
Fuente: creación propia
Con los dos factores reportados por el APH se corrió el AFE. Los valores de la prueba de esfericidad de Bartlett (x2 = 2642,3; gl = 66; p < 0,000) revelaron que los reactivos eran dependientes, y el índice Kaiser-Meyer-Olkin (0,870) mostró buena adecuación muestral y correlación entre los ítems, permitiendo su factorización. El primer componente explicó el 46,74 % de varianza, y el segundo el 11,93 %. Los dos factores obtenidos explicaron el 58,67 % de varianza total. Las cargas factoriales fueron superiores a 0,46. La primera dimensión, disforia general (DF), quedó integrada por las preguntas 1, 2, 5, 6, 7, 8, 9, 10, 11 y 12, y la segunda, disfunción social (DS), por los reactivos 3 y 4. Se tuvo en cuenta, además, la coherencia teórica del ítem para el factor (Tabla 2).
Posteriormente se realizó un análisis de ecuaciones estructurales con la finalidad de comprobar si el modelo desarrollado era idóneo en comparación con propuestas alternativas. Para tal efecto, se analizaron los coeficientes del modelo obtenido de dos factores con 12 reactivos (M1). De mismo modo se hizo para tres modelos adicionales: uno de base unidimensional (M2) para evaluar si todos los ítems del instrumento representan un solo factor, el modelo teórico de Politi et al. (26 con los reactivos cargando a dos factores (M3), y el de Farrell 27 de tres factores (M4). El AFC reveló que los modelos bifactoriales presentaron mejores índices de calidad de ajuste de los datos, independientemente del método de estimación utilizado. Los índices de bondad de ajustes de estos modelos fueron casi similares. No obstante, en el modelo propio estos fueron comparativamente mejores, confirmándose la estructura interna del GHQ-12 en su versión peruana (Tabla 3).
Validez discriminativa o por prueba de hipótesis
El GHQ-12 reveló puntuaciones totales de 0 a 3, mientras que en la dimensión DG fueron de 0 a 29 y en DS de 0 a 6. No mostraron distribución normal con la prueba de Kolmogorov-Smirnov, por lo que se estimaron medidas de tendencia central y dispersión para la escala global M = 12,12 y DE = 5,87 (KS = 0,108; p = 0,000); ME = 11,0; RIC = 8,0-16,0).
La prevalencia de mala salud mental fue del 56 %, la cual fue mayor en mujeres (58,2 %) y obstetras (69,4 %), entre quienes las diferencias resultaron significativas. En el personal de consulta externa fue del 63 %, mientras que entre los del primer nivel de atención fue del 57,5 %. Entre los trabajadores con condición laboral nombrado fue del 56,3 % y en mayores de 30 años el 63 %. En estos últimos las diferencias estadísticas no fueron significativas. En conclusión, el instrumento es capaz de discriminar la mala salud mental en las variables generales de los trabajadores (Tabla 4). Asimismo, en la distribución de los ítems se observa variabilidad en sus diferentes opciones de respuesta (Tabla 5).
Variable | Mala salud Sí | mental No | Valor | Disf Sí | oria general No | Dimens Valor | iones Disfunción social Sí No | Valor | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
n = 242 (%) | n = 190 (%) | p | n = 232 (%) | n = 200 (%) | p | n = 182 (%) | n = 250 (%) | p | ||||||||
Género | ||||||||||||||||
Masculino | 47 (48,5) | 50 (51,5) | 0,012 | 44 (45,4) | 53 (54,6) | 0,061 | 41 (42,3) | 56 (57,7) | 0,975 | |||||||
Femenino | 195 (58,2) | 140 (41,8) | 188 (56,1) | 147 (43,9) | 141 (42,1) | 194 (57,9) | ||||||||||
Profesión | ||||||||||||||||
Médico | 40 (56,3) | 31 (43,7) | 0,004 | 39 (54,9) | 32 (45,1) | 0,016 | 29 (40,8) | 42 (59,2) | 0,173 | |||||||
Enfermera | 93 (63,8) | 55(37,2) | 88 (59,5) | 60 (40,5) | 60 (40,5) | 88 (59,5) | ||||||||||
Obstetra | 43 (69,4) | 19 (30,6) | 40 (64,5) | 22 (35,5) | 35 (56,5) | 27 (43,5) | ||||||||||
Laboratorista | 10 (45,5) | 12 (54,5) | 11 (50,0) | 11 (50,0) | 7 (31,8) | 15 (68,2) | ||||||||||
Técnico de enfermería | 43 (45,3) | 52 (54,7) | 43 (45,3) | 52 (54,7) | 40 (42,1) | 55 (57,9) | ||||||||||
Otros | 13 (38,2) | 21 (61,8) | 11 (32,4) | 23 (67,6) | 11 (32,4) | 23 (67,6) | ||||||||||
Área de trabajo | ||||||||||||||||
Admisión/triaje | 77 (55,4) | 62 (44,6) | 0,667 | 76 (54,7) | 63 (45,3) | 0,787 | 51 (36,7) | 88 (63,3) | 0,003 | |||||||
Consulta externa | 46 (63,0) | 27 (37,0) | 44 (60,3) | 29 (39,7) | 39 (53,4) | 34 (46,6) | ||||||||||
Hospitalización | 30 (61,2) | 19 (38,8) | 26 (53,1) | 23 (46,9) | 31 (63,3) | 18 (36,7) | ||||||||||
Emergencia | 39 (53,4) | 34 (46,6) | 38 (52,1) | 35 (47,9) | 24 (32,9) | 49 (67,1) | ||||||||||
UCI* | 11 (50,0) | 11 (50,0) | 10 (45,5) | 12 (54,5) | 8 (36,4) | 14 (63,6) | ||||||||||
Otros | 39 (51,3) | 37 (48,7) | 38 (50,0) | 38 (50,0) | 29 (38,2) | 47 (61,8) | ||||||||||
Nivel de atención | ||||||||||||||||
Primer nivel | 134 (57,5) | 99 (42,5) | 0,499 | 131 (56,2) | 102 (43,8) | 0,256 | 97 (41,6) | 136 (58,4) | 0,820 | |||||||
Segundo nivel | 108 (54,3) | 91 (45,7) | 101 (50,8) | 98 (49,2) | 85 (42,7) | 114 (57,3) | ||||||||||
Condición laboral | ||||||||||||||||
Nombrado | 151 (56,3) | 117 (43,7) | 0,862 | 147 (54,9) | 121 (45,1) | 0,541 | 133 (42,2) | 155 (57,8) | 0,985 | |||||||
Contratado | 91 (55,5) | 73 (44,5) | 85 (51,8) | 79 (48,2) | 69 (42,1) | 95 (57,9) | ||||||||||
Grupos de edad (años) | ||||||||||||||||
<30 | 46 (63,0) | 27 (37,0) | 0,524 | 43 (58,9) | 30 (41,1) | 0,797 | 31 (42,5) | 42 (57,5) | 0,208 | |||||||
30-40 | 60 (53,6) | 52 (46,4) | 60 (53,6) | 52 (46,4) | 39 (34,8) | 73 (65,2) | ||||||||||
41-50 | 79 (53,4) | 69 (46,6) | 77 (52,0) | 71 (48,0) | 71 (48,0) | 77 (52,0) | ||||||||||
<50 | 57 (57,6) | 42 (42,4) | 52 (52,5) | 47 (47,5) | 41 (41,4) | 58 (58,6) | ||||||||||
Total escala | 242 (56,0) | 190 (44,0) | 232 (53,7) | 200 (46,3) | 182 (42,1) | 250 (57,9) |
*UCI = unidad de cuidados intensivos. Fuente: creación propia
Nº Ítems/dimensión | No, en absoluto | No más que lo habitual | Bastante más que lo habitual | Mucho más que lo habitual |
---|---|---|---|---|
(%n) | (%n) | (%n) | (%n) | |
Disforia general | ||||
1 ¿Se ha sentido poco feliz o deprimido/a? | 114 (26,4) | 136 (31,5) | 149 (34,5) | 33 (7,6) |
2 ¿Se ha sentido constantemente agobiado/a y en tensión? | 82 (19,0) | 119 (27,5) | 194 (44,9) | 37 (8,6) |
3 ¿Ha tenido la sensación de que no puede superar sus dificultades? | 164 (38,0) | 162 (37,5) | 93 (21,5) | 13(3,0) |
4 ¿Ha perdido confianza en sí mismo/a? | 288 (66,7) | 84 (19,4) | 51 (11,8) | 9 (2,1) |
5 ¿Sus preocupaciones le han hecho perder mucho sueño? | 104 (24,1) | 118 (27,3) | 173 (40,0) | 37 (8,6) |
6 ¿Ha pensado que usted es una persona que no vale para nada? | 379 (87,7) | 29 (6,7) | 20 (4,6) | 4 (0,9) |
7 ¿Ha sido capaz de afrontar adecuadamente sus problemas? | 10 (2,3) | 101 (23,4) | 267 (61,8) | 54 (12,5) |
8 ¿Ha podido concentrarse bien en lo que hace? | 34 (7,9) | 133 (30,8) | 223 (51,6) | 42 (9,7) |
9 ¿Ha sido capaz de disfrutar de sus actividades normales de cada día? | 42 (9,7) | 176 (40,7) | 172 (39,8) | 42 (9,7) |
10 ¿Se siente razonablemente feliz considerando todas las circunstancias? | 21 (4,9) | 116 (26,9) | 211 (48,8) | 84 (19,4) |
Disfunción social | ||||
11 ¿Se ha sentido capaz de tomar decisiones? | 9 (2,1) | 57 (13,2) | 196 (45,4) | 170 (39,4) |
12 ¿Ha sentido que está desempeñando un papel útil en la vida? | 15 (3,5) | 33 (7,6) | 135 (31,3) | 249 (57,6) |
Fuente: creación propia
Relación entre las dimensiones (subescalas)
Las correlaciones entre las puntuaciones del cuestionario y las dimensiones DG (Rho = 0,977; p = 0,000) y DS (Rho = 0,498; p = 0,000), y entre las sub escalas (Rho = 0,321; p = 0,000) resultaron significativas y directas. En general estas correlaciones explicarían la convergencia de las dimensiones del GHQ-12.
Validez predictiva
Las dos dimensiones del instrumento, DG (relacionados con ansiedad y depresión) y DS, resultaron ser predictoras de una mala salud mental. Así, se evidenció que los participantes profesionales en enfermería (p = 0,016; OR = 2,60; IC 95 % 1,19-5,67) y obstetricia (p = 0,007; OR = 3,42; IC 95 % 1,39-8,38) tuvieron una probabilidad más de dos veces mayor de presentar mala salud mental. El trastorno psicológico que más variabilidad explicó entorno a la mala salud mental, según el R2 de Cox y Snell, fue la DG (74 %).
Fiabilidad
El análisis de la consistencia interna con el coeficiente omega de McDonald reveló valores aceptables para la escala global [ω = 0,853 (IC 95 % (0,83-0,87)]; en la dimensión DG [ω = 0,856 (IC 95 % (0,83-0,87)] y DS [ω = 0,660 (IC 95 % (0,59-0,72)]. No obstante, el alfa ordinal reportado por el programa Factor Análisis 28 para la primera dimensión fue de 0,919 y la segunda dimensión 0,828. En los reactivos si el ítem se elimina alcanzaron valores de ω de 0,831 a 0,854, y la correlación ítems-total de 0,332 a 0,653 (Tabla 6).
Discusión
La finalidad del estudio fue adaptar y hacer una validación del constructo y la fiabilidad del cuestionario de salud general (GHQ-12) en trabajadores de la salud del Perú, para lo cual se utilizó un instrumento diseñado para identificar el malestar psicológico. No obstante, se desconocía la validez de contenido y de sus propiedades métricas para ser aplicada en trabajadores del sistema sanitario peruano.
Si bien el GHQ-12 fue concebido como un constructo unitario 9, en esta investigación el APH sugirió dos factores para trabajadores de salud. El primero, denominado disforia general, agrupó diez ítems relacionados con síntomas de ansiedad y depresión; el segundo, denominado disfunción social, incluyó dos preguntas relacionadas con actividades diarias y habilidades de afrontamiento a situaciones difíciles. Una estructura similar fue hallada por Farrell 27, pero en tres dominios: ansiedad (reactivos 2, 5, 10, 11 y 12), depresión (ítems 1, 6, 7, 8 y 9) y disfunción social (interrogantes 3 y 4).
Por su parte, Politi et al. 26 revelaron la existencia de dos factores (DG y DS), denominación que fue adoptada para los factores encontrados en este estudio. En otras investigaciones se encontraron dos dominios 11,29, tres factores 30 y cuatro dimensiones respectivamente 31. Los reactivos con mayor importancia en la medición de la salud mental de los trabajadores fueron los relacionados con ansiedad y depresión (DG), con las mayores cargas factoriales.
El AFC mostró un ajuste aceptable del modelo bifactorial, de acuerdo con los estándares requeridos 24 y en correspondencia con otros estudios 30,31,17. Similares índices de ajuste revelaron el modelo competitivo de dos factores. Estos hallazgos son totalmente coincidentes con los de Urzúa et al. 32, quienes concluyen que los modelos de dos y tres factores con formato de puntuación 0-1-2-3 presentan mejor ajuste y tienen indicadores aceptables y más estables.
La consistencia interna del GHQ-12 reveló buena fiabilidad por omega de McDonald (0,85) y alfa ordinal para la dimensión DG (0,91) y DS (0,82). A ese respecto, Kline 33 recomienda tener índices de confiabilidad por encima de 0,85 para pruebas de uso clínico, y para investigación tenerlos mayores de 0,70. Así, el instrumento es fiable con capacidad para realizar mediciones estables y consistentes, tanto en la práctica clínica como en investigación 8,34. Diversos estudios revelan una confiabilidad adecuada 30,31,17.
La variabilidad de los ítems es aceptable y se evidencia que el cuestionario discrimina según el género y profesión la variable mala salud mental, demostrando que la prueba permite diferenciar entre subgrupos de trabajadores de la salud.
Las dimensiones DG y DS se encuentran correlacionadas significativamente, siendo complementarias a la hora de evaluar la mala salud mental. Por otro lado, la validez convergente del GHQ12 respecto a otros instrumentos que miden el mismo constructo ha sido demostrada 29. También mostró buena correlación con la entrevista de carga de Zarit, el índice de Katz de independencia en las actividades de la vida diaria y la escala modificada de tácticas de conflicto para el abuso de personas mayores 35.
En el análisis de la validez predictiva se encontró que la DG y la DS predicen la mala salud mental, y que los trabajadores obstetras y enfermeros tienen mayor probabilidad de desarrollar un deterioro en su SM, demostrando así este tipo de validación.
En cuanto a las limitaciones del trabajo, se puede discutir si los participantes de una región sanitaria son válidamente representativos del Perú. Esto debe ser evaluado en próximos estudios con un tamaño de muestra mayor y un muestreo estratificado o por conglomerados de todas las regiones del Perú, el cual contemple además un test-retest y un análisis de sensibilidad al cambio. Por otro lado, el número de ítems por dimensión podría considerarse una limitación. Si bien el GHQ-12 tiene una estructura preferentemente bidimensional, podría obviarse la interpretación de las subescalas 11. La brevedad del cuestionario es una fortaleza para evaluar el constructo 36.
Para concluir, la validez de constructo y la consistencia interna del GHQ-12, en su nueva versión para el Perú, demuestran que el instrumento es apropiado y fiable para valorar la salud mental de los trabajadores de la salud, por lo que se recomienda su uso en futuras investigaciones.