INTRODUCCIÓN
La Organización Mundial de la Salud (OMS) define la calidad de vida como "la percepción individual de la propia posición en la vida dentro del contexto del sistema cultural y de valores en que se vive y en relación con sus objetivos, esperanzas, normas y preocupaciones" (The WHOQOL Group, 1995); de esta manera, a partir de esta definición desarrolló un conjunto de instrumentos para su medición. Inicialmente, se creó el cuestionario de calidad de vida WHOQOL-100, y luego surgieron diversos módulos como, por ejemplo, la forma corta denominada WHOQOL-BREF (World Health Organization, 1996), y formas para poblaciones específicas como, por ejemplo, el WHOQOLOLD, el cual se diseñó para su uso con adultos mayores (Power, Quinn, Schmidt y WHOQOLOLD Group, 2005). Un estudio realizado en España a fin de comparar estos instrumentos concluyó que ambos son apropiados para su uso con adultos mayores (Lucas-Carrasco, Laidlaw y Power, 2011).
En el ámbito de la medición de la calidad de vida en adultos mayores se han dado discusiones acerca de la pertinencia de recurrir a instrumentos genéricos versus instrumentos específicos. Discusiones similares se han dado en la literatura para grupos específicos por patologías (St-Louis et al., 2016; Wacker et al., 2016), e incluso en niños y adolescentes (Kiotseridis et al., 2013; Lukács, Sasvári, Tórók, & Barkai, 2016). El principal argumento para el uso de instrumentos específicos se sustenta en la posibilidad de reconocer condiciones particulares que afectan a los adultos mayores de forma diferencial (Xavier, Ferraz, Marc, Escosteguy, & Moriguchi, 2003); por otra parte, el principal argumento a favor de los instrumentos genéricos está dado por la posibilidad de comparar resultados obtenidos en diferentes grupos, lo cual es de alto valor para la evaluación y la toma de decisiones en políticas, así como a fin de posibilitar estudios de evaluación económica en salud (Merlo, Page, Ratcliffe, Halton, & Graves, 2014).
En el caso particular del WHOQOL-BREF se encuentran varios estudios sobre sus propiedades psicométricas en adultos mayores (Castro, Driusso, & Oishi, 2014; Chachamovich, Trentini, & Fleck, 2007; Chien, Wang, Yao, Hsueh, & Hsieh, 2009; Chien, Wang, Yao, Sheu, & Hsieh, 2007; Eser, Saatli, Eser, Baydur, & Fidaner, 2010; Espinoza, Osorio, Torrejón, Lucas-Carrasco, & Bunout, 2011; Fleck, Chachamovich, & Trentini, 2006; Gholami et al., 2016; Leplège et al., 2013; Lin, Li, Lin, & Chen, 2016; Lucas-Carrasco, 2012; Mello dos Santos, Hugo, Leal, & Hilgert, 2013; Silva, Soares, Santos, & Silva, 2014; Vilar, Sousa, & Simóes, 2016).
No obstante la amplia disposición de estudios sobre propiedades psicométricas del WHO-QOL-BREF en adultos mayores, la mayoría de estos se centran en valorar su confiabilidad y su estructura factorial sin que sea evidente un fundamento conceptual definido sobre la lógica de los estudios de validez. Contar con evidencias y argumentos de validez que abarquen de forma integral sus diferentes facetas permite una mejor valoración de los usos y las interpretaciones posibles para un instrumento psicométrico (Messick, 1995). De esta forma, el presente artículo tiene como propósito evaluar las evidencias de validez de una aproximación unidimensional al WHOQOL-BREF en adultos mayores, de acuerdo con la propuesta de evidencias por facetas de validez de Wolfe y Smith (2007) para análisis basados en el modelo de Rasch.
MÉTODO
Diseño
En el marco de un estudio transversal se realizó un análisis de validez del WHOQOL-BREF para la medición de calidad de vida en adultos mayores de las ciudades de Bucaramanga y Manizales. Con este propósito se siguió la propuesta de evidencias por facetas de validez de Wolfe y Smith (2007) para análisis basados en el modelo de Rasch, y las recomendaciones específicas para medición de atributos en salud del Scientific Advisory Committee of the Medical Outcomes Trust (1995) (Aaronson et al., 2002).
Participantes
Como población de estudio se consideraron los adultos mayores adscritos a centros vida o centros día de Bucaramanga y Manizales. En función de las proyecciones de población (Departamento Administrativo Nacional de Estadísticas, s. f.), y los supuestos del estudio primario, se calculó una muestra de 549 adultos mayores. Estos se seleccionaron mediante muestreo bietápico estratificado por conglomerados; se consideró la ciudad como estrato, el centro día/vida como primera etapa de muestreo y al adulto mayor como segunda etapa de muestreo. La selección de los conglomerados se realizó de forma proporcional a su tamaño, y la selección de los adultos mayores dentro de cada centro día/vida por muestreo aleatorio simple. En Bucaramanga, de un total de 188 muestras esperadas, se obtuvieron 185; en Manizales, de un total de 361 muestras esperadas se obtuvieron 325, para un total en ambas ciudades de 510 casos, esto es, el 93% de la muestra esperada.
Instrumento
El "Cuestionario de calidad de vida WHOQOLBREF" consta de 26 preguntas: dos preguntas generales sobre calidad de vida y satisfacción con el estado de salud (no incluidas en ninguna escala), y 24 preguntas agrupadas en cuatro dimensiones: "Salud física", "Salud psicológica", "Relaciones sociales" y "Condiciones del entorno". Los ítems tienen formato de respuesta tipo Likert de cinco categorías con tres diferentes instrucciones de respuesta: 1. Grado de experimentación (ítems Q3-Q15), con las opciones "nada", "un poco", "lo normal", "bastante" y "totalmente"; 2. Grado de satisfacción (ítems Q16-Q25), con las opciones "muy insatisfecho", "insatisfecho", "ni satisfecho ni insatisfecho", "satisfecho" y "muy satisfecho"; y 3. Frecuencia (ítem Q26), con las opciones "nunca", "a veces", "con frecuencia", "con mucha frecuencia" y "siempre" (World Health Organization, 1996).
Análisis de datos
Dada la naturaleza politómica de los ítems que componen el WHOQOL-BREF se utilizó el modelo de Rasch-Andrich. El modelo de Rasch se enfoca en establecer si los datos obtenidos a partir de un instrumento proveen una representación invariante, unidimensional y en escala de intervalo de un atributo latente de interés. En este sentido, los ítems que componen el instrumento deben cumplir con una serie de requisitos fundamentales de la medición, los cuales se establecen al analizar el ajuste de los datos al modelo de Rasch (Bond, & Fox, 2015). A continuación, se presenta la forma en que se evaluó el ajuste de los datos a dichos supuestos.
Ajuste de categorías de respuesta
El análisis de las escalas de valoración se realizó mediante el cumplimiento de los criterios de optimización de categorías de Linacre (2002): 1. Al menos diez observaciones por categoría; 2. Distribución regular de las respuestas; 3. Aumento monotónico de la medida promedio; 4. Medias cuadráticas Outfit menores a 2,0; 5. Aumento en los umbrales de Andrich; 6. Coherencia medida >categoría y categoría->medida; y 7. Diferencia entre umbrales de Andrich > 1,4 logitos; y 8. Diferencia entre umbrales <5,0 logitos.
Ajuste de los ítems y de las personas
El ajuste de los ítems se valoró mediante medias cuadráticas de Infit y Outfit con valores esperados en el rango 0,5-2,0. Se comprobó el supuesto de independencia local entre los ítems mediante correlaciones entre sus residuales con valores esperados menores a 0,7. Además, se estimaron correlaciones ítem-medida con valores esperados >0,3. El ajuste de las personas se valoró con las mismas condiciones sobre las medias cuadráticas planteadas para los ítems.
Funcionamiento diferencial de los ítems (DIF)
Se analizó según ciudad (Bucaramanga versus Manizales), grupos de edad (< 70 años versus >70 años), reporte de enfermedad (no enfermo versus enfermo o no está seguro), y sexo (mujeres versus hombres). La prueba de hipótesis de DIF se realizó mediante la prueba de Mantel con ajuste por comparaciones múltiples mediante el método de Benjamini-Hochberg (Thissen, Steinberg, & Kuang, 2002). Se reporta la medida y el error estándar de los ítems por grupo y el contraste DIF, el cual se clasificó según el modelo del Educational Test Service (1999) como DIF moderado a importante (tipo C), cuando el valor absoluto fue >0,64 logitos y estadísticamente significativo. El efecto del DIF en la estimación total de calidad de vida se analizó por el método de Bland y Altman (1986) al verificar el acuerdo entre la forma original de 24 ítems y la forma insesgada que se obtuvo eliminando los ítems DIF tipo C.
Unidimensionalidad y confiabilidad
La unidimensionalidad se estableció mediante análisis de componentes principales sobre los contrastes residuales de la medida Rasch. Se consideraron como criterios de unidimensionalidad: 1. Autovalor del primer componente residual <2,0; 2. Varianza explicada por la medida > 40%; y 3. Correlación disatenuada entre los conglomerados del primer componente residual >0,7. La confiabilidad se estimó para los ítems y las personas, y se expresó mediante el índice de separación, el cual indica el número posible de estratos en los que pueden separarse los ítems y las personas (Wright, & Masters, 1982). Se muestra el mapa de Wright para la escala total del WHOQOL-BREF.
Los análisis se ejecutaron en Winsteps 3.92.1 (Linacre, 2016), y en Stata 12 (StataCorp, 2011).
RESULTADOS
Características de los participantes
El 64% de los participantes residía en Manizales, y el 36% restante en Bucaramanga; cuatro de cada cinco participantes fue una mujer (78,2%), la mitad de ellos tenían más de 70 años (53,7%) y reportaron estar enfermos (54,5%). En términos de sus condiciones de vida, aproximadamente la mitad de los participantes reportó no contar con un cuidador (44,3%), ser cabeza de hogar (46,9%), y no tener fuentes de ingresos propios (51,2%). Nueve de cada 10 adultos mayores (88,7%) reportó no contar con apoyo del Estado.
Ajuste de categorías de respuesta
El análisis de la función de respuesta original de cinco categorías del WHOQOL-BREF evidenció al menos 10 respuestas por categoría, distribución regular de respuestas con moda en la categoría 4, aumento monotónico de la medida promedio, medias cuadráticas menores a 2,0 y aumento de los umbrales de Andrich (tabla 1). No obstante, las categorías 2 y 3 muestran un bajo valor de coherencia de la medida respecto a la categoría (M-C), y las opciones 1, 2 y 5 muestran una baja coherencia de la categoría respecto a la medida (C-M). La diferencia entre umbrales de Andrich fue menor a 1,4 logitos. En función de estos resultados se decidió colapsar las categorías 2 y 3 y pasar del modelo 12345 al modelo 12234, el cual mejora la coherencia y el requisito de diferencias esperadas entre umbrales de Andrich (criterios 7 y 8), y así dar cumplimiento a los ocho requisitos de Linacre (2002).
Ajuste de los ítems y de las personas
El análisis de ajuste de los ítems con el modelo de respuesta colapsado (12234) se muestra en la tabla 2. Todos los ítems cumplen el criterio de ajuste Infit con valores entre 0,56 "Actividades cotidianas" y 1,53 "Dependencia medicación". De forma similar se observa un buen ajuste Outfit con valores entre 0,57 "Actividades cotidianas" y 1,53 "Dependencia a medicación". Las correlaciones ítem-medida oscilan entre 0,36 "Dependencia a medicación" y 0,75 "Autoestima". Las correlaciones ente los residuales de los ítems fueron menores a 0,5 ó negativas en todos los casos.
En relación con el ajuste de las personas, el 79,4% de los adultos mayores muestran ajuste adecuado en Infit, y el 80,8% de los adultos mayores muestran ajuste adecuado en Outfit.
Funcionamiento diferencial de los ítems (DIF)
La tabla 3 muestra los contrastes DIF entre las medidas de los ítems del WHOQOL-BREF por ciudad, edad, enfermedad y sexo. Se identificó DIF tipo C- en los ítems "Dolor y disconfort" y "Sueño y descanso" según ciudad de residencia (referencia: Manizales), y en los ítems "Movilidad" y "Finanzas" según enfermedad (referencia: sí/no seguro) y sexo (referencia: hombres), respectivamente. Por otra parte, se observó DIF tipo C+ en los ítems "Finanzas" y "Actividades placenteras" según ciudad de residencia. No se identificó DIF tipo C según edad con corte a los 70 años.
Nota. (3: Medida, e.e.: error estándar; Contr.: contraste DIF; negrita: DIF tipo C, según criterio del Educational Test Service, ETS.
La figura 1 muestra los límites de acuerdo de Bland y Altman para la estimación de la medida de calidad de vida obtenida a partir de la forma sin ítems DIF tipo C (Q3, Q12, Q14, Q15, Q16) y la forma original de 24 ítems. Al tomar como referente la forma sin ítems DIF tipo C, se observa cómo la forma original tiende a subestimar la calidad de vida en los adultos con alta calidad de vida. No obstante, estas diferencias solo son relevantes en una baja proporción de casos, de manera que se ubica la mayoría dentro de los límites de acuerdo (líneas verdes).
Unidimensionalidad y confiabilidad
La aproximación unidimensional al WHOQOL-BREF explica el 40,1% de la varianza total de las puntuaciones en los 24 ítems. El análisis de componentes residuales muestra que el contraste de mayor peso explica menos del 6% de la varianza con 2,4 autovalores. La correlación disatenuada entre el clúster 1 y el 3 de este componente fue de 0,69, respectivamente. La confiabilidad para las personas fue de 0.,90, lo cual permite una separación en 2,95 estratos; la confiabilidad de los ítems fue de 0,98, lo cual permite una separación en ocho estratos. La consistencia interna de la escala bruta fue de 0,92. La figura 2 muestra el mapa de ítems-personas (mapa de Wright), en el cual se observa un rango de los valores de locación de los ítems entre -0,94 y 1,78 logitos, y un rango de puntuaciones de las personas entre -2,33 y 3,49 logitos. La mayoría de los ítems tienen valores de medida <1 logitos con excepción de finanzas. Esto conlleva a que un alto porcentaje de adultos mayores muestren una medida de calidad de vida mayor al rango de la escala.
DISCUSIÓN
El propósito de este artículo es evaluar las evidencias de validez de una aproximación unidimensional en la medición de la calidad de vida en adultos mayores mediante el WHOQOLBREF. Para esto, se consideraron la propuesta de evidencias por facetas de validez de Wolfe y Smith (2007), y las recomendaciones del Scientific Advisory Comitee of the Medical Outcome Trust (1995).
Los principales resultados que se obtuvieron pueden resumirse por facetas de validez de acuerdo con la lógica de Messick (1995):
Validez sustantiva. Las categorías de respuesta a los ítems mostraron ajuste y consistencia suficientes después de colapsarlas de 12345 a 12234. Esto sugiere que, al contestar el cuestionario, los adultos mayores no realizan una discriminación de su estado tan detallada como lo supone el instrumento, y esto ocurre al valorar la baja calidad de vida. Es importante resaltar que las opciones intermedias de tipo neutro o ambiguo, como, por ejemplo, las empleadas en el WHOQOL-BREF ("lo normal" o "ni satisfecho/ni insatisfecho"), han sido cuestionadas por la dificultad que plantea a las personas discriminar entre estas y las categorías negativas (Weijters, Cabooter, & Schillewaert, 2010), situación que justifica haber colapsado las opciones 2 y 3.
Validez de contenido. Los ajustes de los ítems y de las personas, así como las correlaciones ítem-medida observadas sugieren que la operacionalización de la calidad de vida a partir de los 24 ítems es adecuada para el atributo latente. Esto sugiere que las tendencias de respuesta según el nivel de medida de los ítems y el nivel de calidad de vida de los adultos mayores siguen la regla supuesta por el modelo de Rasch.
Validez estructural. Si bien el WHOQOLBREF fue originalmente diseñado para medir cuatro dimensiones, los resultados del presente estudio sugieren que una aproximación unidimensional es apropiada en términos estructurales. Sobre los residuales de la medida propuesta no se identifican factores relevantes en términos de varianza explicada. Además, si bien el primer factor obtuvo más de dos autovalores, la correlación disatenuada entre sus componentes extremos fue alta, lo cual es evidencia adicional a favor de la unidimensionalidad.
Genreralización. Tanto las confiabilidades de los ítems y las personas como la consistencia interna fueron >0,9. Esto permite separar en aproximadamente tres y ocho estratos a las personas y los ítems, respectivamente. La generalizabilidad del WHOQOL-BREF por subgrupos sociodemográficos se vio afectada por la presencia de DIF en cinco ítems. Si bien esto solo tuvo un impacto significativo en una pequeña proporción de los adultos mayores, y en general la evidencia no es suficiente para sugerir eliminar ítems, los resultados obtenidos generan incertidumbre en relación con el nivel de generalización del concepto de calidad de vida subyacente al WHOQOL-BREF. Para las comparaciones de calidad de vida entre características sociodemográficas con este instrumento, se sugiere considerar la posibilidad de excluir los ítems con funcionamiento diferencial identificados en este estudio.
En comparación con otros estudios, la consistencia interna obtenida en los adultos mayores de Bucaramanga y Manizales en una única dimensión es ligeramente mayor a la reportada para las dimensiones del WHOQOL-BREF en Brazil (Castro et al., 2014; Chachamovich et al., 2007), Chile (Espinoza et al., 2011), y España (Lucas-Carrasco, 2012). Entre los antecedentes disponibles, solo el trabajo de Liang et al. (2009) se realizó desde el modelo de Rasch. En los resultados de Manizales y Bucaramanga, solo los ítems "Finanzas" y "Actividad sexual" obtuvieron medidas >1 logito; en Taiwán, esto sucedió con los mismos ítems y, adicionalmente, con "Sentimientos positivos" y "Actividades placenteras". Los ítems con las medidas más bajas en la muestra colombiana fueron "Imagen corporal" y "Relaciones personales" con valores cercanos a -0,9 logitos; y en Taiwán las medidas más bajas se obtuvieron en los ítems "Dolor y disconfort" y "Sentimientos negativos" con valores ligeramente inferiores a -1,0 logito. En este sentido es importante considerar que los adultos mayores adscritos a los centros día cuentan con unas condiciones socioeconómicas desfavorables, y cómo esta investigación muestra la importancia de la satisfacción con las finanzas en la percepción de calidad de vida de estos adultos mayores, en concordancia con otros estudios realizados con adultos mayores colombianos (Melguizo et al., 2015).
Con relación al funcionamiento diferencial no se encontraron antecedentes directos. No obstante, otro estudio reciente realizado en Taiwán concluyó que el WHOQOL-BREF es apropiado para comparaciones por sexo en adultos mayores (Lin et al., 2016). De forma similar, en nuestro estudio se encontró un único ítem DIF tipo C por sexo, el cual no invalida las comparaciones en la medida total. La principal limitación de este estudio se encuentra en la dificultad para comparar los resultados con otras investigaciones, dada la aproximación unidimensional que acá se plantea. Se espera que investigaciones posteriores profundicen en esta forma de operacionalizar el WHOQOL-BREF, por medio de un único resultado de calidad de vida, la cual podría aportar a los procesos de toma de decisiones y a su uso en estudios de efectividad de intervenciones en el adulto mayor. En ningún momento los resultados de esta investigación contradicen la aproximación original por dimensiones del instrumento, la cual puede ser más útil para caracterizar la calidad de vida. Todo lo contrario, se espera que sea un complemento dependiendo de los propósitos particulares de cada estudio.
Esta investigación presenta fortalezas importantes. Se basa en un muestreo probabilístico y en un trabajo de campo realizado por profesionales de la salud mental y la salud pública entrenadas y estandarizadas para la ejecución del proyecto. Además, hasta donde se pudo constatar en la literatura, es la primera evaluación de la validez del WHOQOL-BREF realizada desde el modelo de Rasch que retoma recomendaciones específicas para la medición de atributos en salud como lo son el trabajo de Wolfe y Smith (2007) y el del Medical Outcome Trust (1995). Esto permite una valoración integral de las diferentes facetas de la validez. Por último, el presente trabajo es la primera aproximación integral a la generalizabilidad del WHOQOLBREF en adultos mayores que presenta, además de la confiabilidad y la consistencia interna, un análisis del DIF y de su impacto en la estimación del atributo en términos de sesgo de medición.
En conclusión, es posible obtener una medida unidimensional a nivel de intervalo de calidad de vida en adultos mayores a partir del WHOQOL-BREF, la cual está soportada por suficientes evidencias obtenidas para diversas facetas de validez. La satisfacción con la situación financiera del adulto mayor adscrito a los centros día guarda una fuerte relación con su nivel de calidad de vida.