INTRODUCCIÓN
Diversos estudios muestran que algunas situaciones/ condiciones de la vida diaria, incluyendo alteraciones del estado de salud bucal, pueden impactar la calidad de vida (CV) de un individuo 1,2. El impacto generado sobre la salud bucal se cuantifica -deforma objetiva- utilizando escalas o índices, lo cual ha dado origen a un concepto que ha recobrado importancia en las últimas décadas: Calidad de Vida Relacionada con Salud Bucal: CVRSB3. Recientemente se sugirió que la CVRSB es un constructo conformado por cuatro dimensiones: apariencia oro facial, dolor, impacto psicosocial y función 4. Entre los instrumentos para su cuantificación están: el Oral Health Impact Profile: OHIP 5, Dental Impact on Daily Living: DIDL 6, Oral Impact on Daily Performances: OIDP 7 y el General Oral Health Assesment Index-GOHAI 8.
Este último instrumento, denominado en español Índice General de Valoración en Salud Bucal, fue diseñado por Atchison y Dolan en 1990 (versión original en inglés); ha sido ampliamente utilizado en diversas investigaciones posterior a la determinación de sus propiedades psicométricas y adaptación a otros idiomas, como el malayalam 9, tamil 10, holandés 11, serbio 12, hindú 13, maltés 14, libanés 15 e incluso español 16, y se han reportado estudios en España, México y Chile 17-19. Propuesto inicialmente como Geriatric Oral Health Assessment Index para valoración de CVRSB en adultos mayores (Geriatric), en 1998 se sugirió la extensión de su uso a población general (General)20 para medir los problemas de función oral reportados por el paciente, cuantificar la efectividad de los tratamientos odontológicos, pero de forma específica para estimar el impacto psicológico asociado con enfermedades bucodentales 8.
Las tres adaptaciones realizadas a español en España, México y Chile son consistentes en cuanto a su extensión y aparentan tener equivalencia conceptual entre los ítems. Sin embargo, el análisis de cada reactivo revela ciertas diferencias entre ellos, lo cual puede ser atribuible al contexto cultural de cada locación.
GOHAI es una escala de 12 ítems, expresados de forma interrogativa y evaluados en una escala tipo Likert que varía de 1 a 5. Así, los puntajes globales de la escala pueden variar entre 12 y 60. Es una escala dimensional, puesto que no presenta punto de corte, a pesar de que muchos autores lo han propuesto 17,19,21. Sin embargo, esto debe considerarse metodológicamente incorrecto, debido a que para poder determinar puntos de corte a través del rendimiento operativo de esta prueba diagnóstica (sensibilidad y especificidad) se debe comparar con un gold-standard o patrón de oro, que para CVRSB no existe 3. Esto puede generar posibles sesgos de medición en estudios epidemiológicos. Por ello es necesario que siempre que se utilice una escala diseñada en un idioma original distinto al idioma de la población objeto de estudio, o incluso empleado el mismo lenguaje pero en un nuevo emplazamiento, se debe dar cuenta de su desempeño psicométrico o por lo menos, su consistencia interna 22,23.
Como hecho de interés, a pesar de que en Colombia diversos estudios han empleado este instrumento para cuantificación del impacto de CVRSB y su asociación con la presencia de enfermedades bucodentales 17-19, no se conocen estudios que reporten en una investigación original medidas de validez y confiabilidad para este país. Así, el objetivo de esta investigación fue determinar las propiedades psicométricas (validez de constructo, confiabilidad y funcionamiento diferencial de los ítems) del Índice de Valoración General de Salud Bucal (GOHAI) en idioma español en una población de pacientes adultos de Cartagena de Indias (Colombia).
MATERIALES Y MÉTODOS
Estudio de validación de escalas sin criterio de referencia que contó con aprobación por parte del Comité de Ética en investigación de la Universidad de Cartagena, realizado a través de un censo a 1011 pacientes atendidos en una clínica odontológica universitaria de Cartagena de Indias entre febrero de 2012 y diciembre de 2015.
INSTRUMENTO
A todos los pacientes se les aplicó el GO-HAI de forma consecutiva con un set de preguntas sociodemográficas. GOHAI es una escala de 12 reactivos expresados de forma interrogativa y que indaga sobre la autopercepción de CVRSB en los últimos tres meses con preguntas como: ¿cuántas veces ha tenido que utilizar algún medicamento para aliviar el dolor de sus dientes o las molestias de su boca? y ¿cuántas veces ha tenido molestias o dolor en sus dientes por el frío, calor o las cosas dulces? (tabla 1).
Como se mencionó anteriormente, existen versiones en español en países como España, Chile y México. La versión española se publicó en 1999 y la mexicana en 2010, sin embargo, la versión que se empleó en este estudio fue la propuesta por Misrachi y Espinoza en 2005 por ser la población (suramericana) culturalmente más parecida a la colombiana 24 (tabla 1).
En la propuesta original del GOHAI (8) la medición de CVRSB está representada de forma unidimensional, pero también existen reportes sobre tres dominios: 1) función física (ítems 1 a 4) que influye en comer, hablar, deglutir; 2) función psicosocial (ítems 6-7 y 9 a 11), que incluye preocupación por su salud oral, insatisfacción con la apariencia, autoconciencia acerca de la salud oral y dificultad en el contacto social debido a problemas orales, y 3) dolor e incomodidad (ítems 5, 8 y 12), que incluye el uso de medicamentos para aliviar el dolor en la cavidad oral. El formato de respuesta es de tipo Likert, desde 1 (nunca) a 5 (siempre), excepto para los ítems 2, 4 y 6, que por estar redactados de forma positiva, su puntaje debe invertirse; esto controla el sesgo de respuesta, también conocido como wording effect. El puntaje global se calcula mediante la sumatoria de los 12 reactivos (mínimo puntaje posible 12 y máximo 60). Un mayor puntaje indica una mejor autopercepción de la CVRSB del individuo.
Análisis estadístico
Inicialmente se realizó estadística descriptiva. Para las variables cualitativas se calcularon proporciones e intervalos de confianza al 95 % y para variables continuas media y desviación estándar o mediana y rango intercuartílico dependiendo de la simetría de la distribución (test de Shapiro Wilks). La evaluación de las propiedades psicométricas incluyó: consistencia interna, validez de constructo y funcionamiento diferencial de los ítems (FDI).
La consistencia interna se estimó con el coeficiente alfa de Cronbach de forma global y también de acuerdo con subescalas (dominios del GOHAI). Para la evaluación de la validez de constructo inicialmente se determinó la factorizabilidad de la matriz con la prueba de esfericidad de Barlett y la prueba de adecuación de la muestra de Kaiser-Meyer-Olkin (KMO). La prueba de Barlett es un estadístico de alta sensibilidad al tamaño de la muestra y es apropiada si muestra X2 alto y p-valor<0,05. KMO es una prueba más conservadora, que se entiende aceptable si muestra un valor >0,70. Posteriormente se realizó AFE con la técnica de máxima verosimilitud para conocer la dimen sionalidad del constructo (número de factores, dimensiones o dominios). El número de factores por extraer se determinó a través de los valores propios (criterio de Kaiser: autovalores>1) y un gráfico de sedimentación de Catell. No obstante, el gráfico de sedimentación muestra ser unmejor parámetro respecto del criterio de Kaiser, el cual sobre-estima el número de factores por retener 25. Para definir la conformación de factores se tomaron en cuenta las cargas factoriales >0,40. Se empleó rotación oblicua (promax), puesto que se hipotetizó que los posibles factores estarían correlacionados entre sí.
Para proceder con el AFC, inicialmente se verificó la normalidad multivariada empleando el Test de Mardia. Aunque no se encontró normalidad multivariada, el AFC es robusto a este tipo de supuestos cuando se tienen tamaños de muestra amplios (>200) y no existe normalidad multivariada 26. El AFC se realizó para confirmar la estructura de factores previamente estimada en el AFE y así la validez de constructo a través de Mínimos Cuadrados Parciales con Media y Varianza Ajustada: MCPMVA.
Para la evaluación del ajuste del modelo se determinaron los siguientes estadísticos: X2 y p-valor para X2, grados de libertad (gl), raíz cuadrada del error medio de aproximación: RCEMA e intervalo de confianza al 90 %, índice comparativo de ajuste: ICA e índice de Tucker-Lewis: ITL.
La evaluación del ajuste del modelo se realizó empleando los criterios propuestos por Hu & Bentler: p-valor para X2>0,05, RCEMA<0,06, ICA e ITL>0,95 27.
Teniendo en cuenta la propuesta teórica de estructura de factores del GOHAI (uni y tridimensional), la validez de constructo se probó para estas dos formas sin modificaciones y también con las modificaciones sugeridas del AFE de acuerdo con las cargas factoriales. Así, se probaron 4 modelos en total: uno y tres factores originales, uno y tres factores modificados.
Por su parte, el FDI se calculó empleando el coeficiente de correlación Tau de Kendall. Este coeficiente permite valores entre -1 y+1. Se consideró la presencia de desempeño diferencial de los ítems que mostraron valores >0,30 sin importar el signo del coeficiente y el valor de probabilidad, dado que se contó con una muestra >100 participantes 28. Se observó FDI según ciclo vital individual para probar la hipótesis de extensión de uso del GOHAI geriátrico a general, en el que los más adultos se codificaron con 1 (mayor probabilidad de responder más alto) y los más jóvenes 0 (<44 años).
El análisis descriptivo, el AFE, la consistencia interna y el FDI se calcularon empleando Stata v.13.2 para Windows (StataCorp., TX., USA) y el AFC se realizó empleando Mplus v.7.31 para Windows (Muthén & Muthén, Los Angeles, CA., USA).
RESULTADOS
Características de la población
La mitad de los encuestados fueron mujeres (50 %), con una edad promedio de 48,96 (DE: 15,9) años y en su gran mayoría (87,7 %) casados o en unión libre. La media global del puntaje total del GOHAI fue 29,06±9,37; la estadística descriptiva por ítems y dominios se muestra en la tabla 2.
Ítem | Media | DE | CIPT | CIO |
---|---|---|---|---|
Limitó Alimentos | 2,15 | 1,73 | 0,645 | 0,860 |
Tragar cómodamente | 3,80 | 1,62 | 0,527 | 0,868 |
Hablar como quería | 1,96 | 1,68 | 0,685 | 0,857 |
Comer sin molestias | 2,86 | 1,67 | 0,542 | 0,867 |
Evitó contacto | 1,77 | 1,60 | 0,712 | 0,855 |
Satisfecho con apariencia | 2,75 | 1,66 | 0,436 | 0,874 |
Preocupado o Intranquilo | 2,85 | 1,50 | 0,604 | 0,863 |
Nervioso o consciente | 2,41 | 1,57 | 0,701 | 0,856 |
Incómodo frente a personas | 2,18 | 1,65 | 0,750 | 0,852 |
Evitó reirse | 2,15 | 1,69 | 0,757 | 0,851 |
Dolor o molestias | 2,06 | 1,51 | 0,730 | 0,853 |
Dientes o encías sensibles | 2,08 | 1,56 | 0,614 | 0,862 |
Dominio Función Física | 10,78 | 3,07 | N/A | N/A |
Dominio Función Psicosocial | 12,00 | 4,85 | N/A | N/A |
Dominio Dolor/ Limitación | 6,26 | 3,71 | N/A | N/A |
DE: desviación estándar - CIPT: correlación item-puntuación total - CIO: consistencia interna si el ítem se omitiera
Fuente: datos tabulados por los autores.
Propiedades Psicométricas
Consistencia Interna
El coeficiente alfa de Cronbach global fue 0,87 (IC 95 %: 0,859 - 0,880). De acuerdo con dominios, para función física fue 0,699 (IC 95 %: 0,673 - 0,725), función psicosocial 0,752 (IC 95%: 0,731 - 0,773) y para dolor/limitación 0,68 (IC 95%: 0,654 - 0,712).
Validez de Constructo
La prueba de esfericidad de Barlett aplicada en el AFE arrojó X2=3749,8, gl=45, y p-valor<0,001; la prueba de adecuación de la muestra de Kaiser-Meyer-Olkin: 0,860. El gráfico de Catell (parallel analysis) sugirió 5 factores como mejor solución de factores (gráfico 1). El AFE del modelo de un factor modificado sugirió la eliminación de los ítems 2, 4 y 6 (ítems positivos), mientras que el modelo de tres factores modificado sugirió la eliminación de los ítems 1 y 3, dado que no alcanzaron el umbral de carga factorial requerido (0,40). De acuerdo con el conocimiento de la teoría existente, el modelo de tres factores quedó conformado así: el factor I que se reconoció como psicosocial, alcanzó un autovalor de 3,47 y dio cuenta del 82,4 % de la varianza, el factor II que se denominó como dolor alcanzó un autovalor de 2,59 y dio cuenta del 61,6% de la varianza y finalmente el factor III que se denominó función alcanzó un autovalor de 1,82 y dio cuenta del 43,4% de la varianza. La tabla 3 muestra las cargas factoriales y comunalidades de cada reactivo de acuerdo con los factores encontrados.
Los resultados del AFC para las estructuras factoriales hipotetizadas y la mejor solución encontrada se muestran en la Tabla 4. Para la mejor solución y después de aplicar dos índices de modificación (correlación de los errores de la covarianza entre los ítems 10 y 6 y 7 y 8), el ajuste para este modelo fue X2=3769,15, gl=45, p-valor para X2=0,000, RCEMA=0,06 (IC 90%: 0,05 - 0,07), ICA=0,971 e ITL=0,956.
Un Factor*: modelo que no contiene los ítems 2, 4 y 6. Tres Factores*: modelo que no contiene los ítems 1 y 3 y que se aplicó correlación de los errores de la covarianza de los ítems 10 y 6 y 7 y 8.
Fuente: datos tabulados por los autores.
FDI
El FDI según ciclo vital individual mostró coeficientes adecuados para todos los ítems. Los valores para cada ítem se muestran en la tabla 5.
Ítem | T de Kendall |
---|---|
Limitó Alimentos | 0,09 |
Tragar cómodamente | -0,07 |
Hablar como quería | 0,08 |
Comer sin molestias | -0,09 |
Evitó contacto | 0,05 |
Satisfecho con apariencia | -0,03 |
Preocupado o Intranquilo | 0,06 |
Nervioso o consciente | 0,07 |
Incómodo frente a personas | 0,06 |
Evitó reirse | 0,06 |
Dolor o molestias | 0,06 |
Dientes o encías sensibles | 0,05 |
Fuente: datos tabulados por los autores.
DISCUSIÓN
Desde la descripción de Slade y cols. de la transición entre la percepción de salud de la pura ausencia de enfermedad a un completo estado de bienestar físico, mental y social relacionado con salud bucal, este concepto relativamente nuevo ha tenido un exponencial crecimiento en las últimas dos décadas 3.
La CVRSB captura el objetivo de una nueva perspectiva, por ejemplo, el fin último del cuidado bucal: buena salud bucodental. De acuerdo con el US Surgeon General, las enfermedades y condiciones bucales pueden afectar la auto-imagen, autoestima, limitar la interacción social y causar otros problemas de salud, incluso conllevando a estrés crónico y depresión 29. CVRSB se define entonces como un constructo multidimensional que refleja, entre otras cosas, la comodidad del paciente al comer, dormir y su capacidad de interacción social; su autoestima y su satisfacción con respecto a su salud bucal. La importancia de medir CVRSB radica en que permite: identificar y priorizar problemas, facilitar la comunicación, tamizaje de problemas ocultos, facilitar el proceso de toma de decisiones clínicas o incluso monitorear cambios/respuestas a tratamientos. No obstante, algunas de las propiedades de estos instrumentos de medición deben ser: validez, adecuabilidad, aceptabilidad, confiabilidad, respuesta al cambio y fácil interpretabilidad 30.
Ala luz de los autores, este es el primer estudio en Colombia en validar el GOHAI empleando técnicas de análisis factorial, e incluso el primero a nivel internacional en emplear análisis de FDI para probar la hipótesis de su extensión de geriátrico a general. GOHAI es un instrumento que desde su diseño en 1990 ha mostrado múltiples ventajas y cumple con algunas de las propiedades anteriormente mencionadas. Los resultados de este estudio muestran que instrumento da cuenta de buena validez de constructo (modelo de tres factores modificado), consistencia interna y que puede ser empleado tanto en población geriátrica como en población general, ya que ninguno de los ítems mostró funcionamiento diferencial de acuerdo con ciclo vital individual.
Los hallazgos del buen ajuste del modelo de 3 factores para GOHAI son consistentes con los resultados de Campos y cols. en 2015, quienes, empleando también técnicas de AFC surgieron que el GOHAI puede emplearse e interpretar sus puntajes bien como una escala unidimensional o tridimensional 31. No obstante, el estudio de Campos y cols. empleó los criterios para evaluación del ajuste de modelos de AFC propuestos por Maroco 32, que son más flexibles respecto de los propuestos por Hu & Bentler en 1999 27, universalmente empleados en la literatura biomédica para la evaluación del ajuste en validación de escalas de medición en salud 33.
Otros autores, solo empleando técnicas de AFE, en Turquía y Suecia han reportado modelos de dos factores para GOHAI, mientras que en Arabia Saudita se encontró que el mejor modelo es el unidimensional 34-36.
En México se encontró que la estructura de cuatro factores es la mejor para explicar la variable latente 16 pero sin desarrollar técnicas de AFC.
Estos hallazgos solo reflejan un hecho bien conocido: la validez de una escala no es per se una característica del instrumento, pero sí del instrumento cuando sea aplicado a la muestra. Esto reafirma que la valoración de propiedades psicométricas de una escala es una premisa básica, previo a la presentación de cualquier desenlace que surja del uso de estas 37. Así, el AFE y AFC se convierten en dos herramientas imprescindibles para el análisis de validez de constructo de un instrumento, las cuales fueron empleadas en este estudio y constituyen una de sus principales fortalezas.
Otro estudio que indagó por las propiedades psicométricas del GOHAI -versión persa-, reveló que su estructura de tres factores es la mejor solución. No obstante, en ese estudio la constitución de factores no siguió la distribución de ítems de acuerdo con los 3 factores inicialmente hipotetizada, lo cual es consistente con los hallazgos de esta investigación y muestra la inestabilidad del constructo 38.
En consonancia con lo anterior, y a pesar de haber obtenido buen ajuste en el AFC, la validez de constructo es limitada, puesto que en el modelo con mejor ajuste (tres factores modificado) se debieron eliminar 2 ítems: ¿Limitó la clase o cantidad de alimentos debido a problemas con sus dientes o prótesis dentales? y ¿Sus dientes o prótesis dentales le impidieron hablar del modo en que usted quería?, lo cual afectó la capacidad de medición (captura de información) del instrumento 37. Además, el ítem ¿Se sintió satisfecho o contento con la apariencia de sus dientes, encías o prótesis dentales?, incluido en el dominio función, no representa adecuadamente el contenido de ese factor y podría sugerirse estar en el psicosocial.
Otras razones para hipotetizar la limitada aplicabilidad de este modelo son: 1. al evaluar cada uno de los ítems de la versión empleada adoptada de la versión chilena no existe una adecuada equivalencia conceptual entre la redacción de los ítems con otras versiones en español, lo cual puede comprometer su validez de criterio y de contenido 22; esto se soporta por el hecho de que en la propuesta del GOHAI en 2005 no se aplicaron guías metodológicas estandarizadas como FACIT o la sugerida por Beaton para traducción y adaptación trans-cultural de una escala 39,40. Así las cosas, es probable que la versión chilena no represente el contenido adecuado de CVRSB, y por tanto pueda suponer sesgos de medición. Incluso, mientras que en la mayoría de las versiones los ítems que se revierten son 3, 5 y 7 8,16,21, en la versión chilena y empleada en este estudio eran 2, 4 y 6. 2. en el análisis de factores un dominio con menos de tres ítems es generalmente débil e inestable; 5 o más ítems que carguen de forma sólida (0,50 o más) es lo deseable para la conformación de un factor estable 41. El resultado del modelo con mejor ajuste en el AFC sugirió la conformación del segundo factor (dolor) con solo dos ítems.
De otro lado, los resultados de la confiabilidad relacionada con el instrumento -consistencia interna- de este estudio (α =0,87) son comparables a lo sugerido por otros autores en diversas locaciones, incluido Brasil (α =0,80), pero no México (α=0,61) en Latinoamérica 16,31,37.
La diferencia en la consistencia interna entre los resultados de México y este estudio pueden atribuirse a que esa versión Mexicana empleó una previamente desarrollada en España 21 y que, a su vez, no reportó procesos de adaptación transcultural.
Es de resaltar que a pesar de que se ha empleado GOHAI previamente en Colombia en estudios epidemiológicos de asociación, ninguno ha evaluado -al menos- su consistencia interna 17-19,42.
Respecto al análisis de FDI, este es el primer estudio que evalúa la hipótesis de extensión de uso geriátrico a general para GOHAI. El análisis de FDI es una buena estrategia para apoyar los resultados de la validez de constructo; el FDI se basa en la teoría de respuesta al ítem (TRI), el cual se usa ampliamente en diferentes áreas del conocimiento y recientemente se introdujo en la valoración del desempeño de ciertas escalas de medición 43,44. Tiene la ventaja que comparado con las valoraciones hechas sobre teoría clásica es capaz de identificar sesgos en la respuesta de cada ítem 45. En este sentido, los resultados de este estudio apoyan la teoría que el GOHAI pueda usarse también en población general como se propuso en 1998 20.
Cabe destacar que este estudio presenta ciertas debilidades y fortalezas. Entre sus debilidades están no haber desarrollado un correcto proceso de adecuación/adaptación transcultural de la escala y la no evaluación de otras propiedades psicométricas, como validez convergente o la estabilidad test re-test. Sin embargo, entre sus marcadas fortalezas se encuentran el tamaño de la muestra incluida, el empleo de técnicas como AFE y AFC para la evaluación de la validez de constructo; uno de los tipos de validez más importantes y por primera vez la comparación de uso en población geriátrica o general a través de análisis de FDI.
En resumen y teniendo en cuenta las debilidades y fortalezas de este estudio, GOHAI versión en idioma español aplicado en pacientes adultos de Cartagena (Colombia) evidencia ser una escala con limitada validez de constructo pero con buena consistencia interna y adecuado FDI, lo que permite su uso tanto en población geriátrica como general. Como se ha sugerido previamente, las escalas diseñadas para medición de CVRSB permiten a los clínicos obtener medidas estandarizadas del constructo, las cuales pueden ser utilizadas para comparación con valores iniciales, documentación y evaluación de los efectos de tratamientos bucodentales 46. No obstante, es importante considerar que, dadas las condiciones metodológicas, los resultados de este estudio advierten limitada interpretabilidad y capacidad de generalización de resultados de esta versión del GOHAI en previos y/o futuros estudios epidemiológicos.
CONCLUSIONES
GOHAI versión en idioma español en pacientes adultos de Cartagena es un instrumento de adecuada consistencia interna y sin funcionamiento diferencial de ítems pero con limitada validez de constructo y por tanto, la aplicabilidad clínica en esta población debe hacerse con cuidado. Es necesario que se diseñen otros estudios en los que se realicen procedimientos de adaptación transcultural con guías metodológicas estandarizadas y universalmente conocidas a fin de obtener versiones y modelos que reflejen la existencia del constructo y además, permita generalizar los hallazgos de las mediciones realizadas.