Introducción
Al ser impactadas por factores externos como los determinantes sociales de la salud (DSS), las inequidades sociales constituyen un gran reto para los servicios sanitarios. Por ende, es necesario abordar estos determinantes más allá de la atención en salud; es decir, que las investigaciones referentes a su medición se deben basar en fundamentos teóricos y aplicativos sólidos que guíen la formulación de políticas públicas para su posterior intervención, y que contribuyan a optimizar intermediaciones para mejorar situaciones en la población (Oliver-Parra y González-Viana, 2020).
Por lo anterior, resulta necesario contar con instrumentos de valoración objetiva de los DSS, pues para garantizar su calidad es imprescindible que sean sometidos a un proceso de validación que dé sentido al evento estudiado con criterios de objetividad (Mújica y Moreno, 2019; Juárez-Hernández y Tobón, 2018) y que posibilite la medición confiable de un fenómeno en concreto; es decir, que pueda repetirse la misma medida en similares condiciones (López et al., 2019).
En países de bajos y medianos ingresos, la medición de las desigualdades en salud se ha realizado por medio de observatorios de desigualdades y DSS (Krause y Ballesteros, 2018; Martín-Hernández et al., 2020). En el caso de Chile, se llevó a cabo bajo el modelo de ecuaciones estructurales, a través de encuestas como la CASEN 2015 y la Encuesta Nacional de Salud 2009 (Subsecretaría de Salud Pública de Chile, 2018); en Portugal, se desarrolló a través del Índice Europeo de Privación, bajo la teorización Townsend con datos de la Unión Europea y la encuesta de estadísticas sobre ingresos y condiciones de vida (Ribeiro et al., 2017). Por otro lado, en Brasil se ha realizado este estudio con datos del censo demográfico del Instituto Brasileiro de Geografia e Estatística (IBGE) (Moura de Gois et al., 2020); y en Colombia, con el Análisis de la Situación en Salud ASIS (Ministerio de Salud y Protección Social, 2015).
Las investigaciones frente a la medición de los DSS se han basado en experiencias llevadas a cabo en países desarrollados desde un abordaje más teórico que práctico. En consecuencia, la postura crítica de los posibles estratificadores sociales se ha abordado parcialmente, lo que evidencia una existencia poco numerosa de estudios que explícitamente asocien el contexto social, la salud y la implementación de instrumentos para su medición (Barboza et al., 2020; Schülter Buss Heidemann, 2020).
La evidencia científica constata que en nuestro medio no se cuenta con instrumentos empleados para la medición de los DSS; por ende, es indispensable crear evidencia empírica, medir y monitorizar los factores que inciden en las inequidades en salud en los distintos ejes de desigualdad social. En ese sentido, el presente trabajo tuvo como objetivo diseñar y determinar la validez facial y de contenido de un instrumento para la medición de los determinantes sociales de la salud (DSS) (DESOSA 81), que podrá ser usado por profesionales, investigadores y gobiernos que quieran abordar las inequidades a través de la salud pública, según el contexto de actuación de cada uno de ellos.
Materiales y métodos
La presente es una investigación cuantitativa de corte instrumental (Manqueros y Barraza, 2018), que se centró en el tipo construcción y validación de instrumentos. De un lado, se realizó validez facial (de apariencia o de expertos) que presenta el grado en que la escala parece medir lo que debe medir. La escala no supone un concepto estadístico, sino que depende de los juicios que los expertos hagan sobre la pertinencia de los ítems. De otro lado, la validez de contenido permite concluir si los ítems incluidos en el instrumento representan adecuadamente los dominios o factores del concepto que se pretende medir (Galicia et al., 2017; Manrique et al., 2019).
Procedimiento
Para el proceso de validación de contenido se utilizó la técnica Delphi, la cual consiste en la revisión de un instrumento por parte de un grupo de especialistas en el área de interés, que analizan la complejidad de los ítems, la coherencia entre estos y sus objetivos (López-Gómez, 2018; Zamora et al., 2020). En el proceso se aplicaron las cuatro fases descritas por Reguant-Álvarez y Torrado-Fonseca (2016), las cuales se relacionan en la figura 1:
Fase 1 de definición: para el diseño del instrumento y la fundamentación del constructo, conceptos, variables, dimensiones, categorías y sus respectivos ítems, se partió de una revisión documental integrativa de 27 publicaciones (2010 y 2020) y de la experiencia de tres miembros del grupo de investigación para construir la versión inicial del instrumento. Se evidenció la medición de los DSS a través de documentos de instituciones oficiales, indicadores e instrumentos validados. Se analizaron la estructura, el contenido, la manera de preguntar, la aplicación, el entorno, la condición de salud y la población; para esto, se empleó el software Atlas Ti., versión 9. Este proceso permitió definir y refinar el constructo (Cruz-Avelar y Cruz- Peralta, 2017), y complementar con elementos emergentes.
Para la identificación de las condiciones a valorar por el grupo de expertos en términos de completitud, se realizó otra revisión bibliográfica de 24 artículos y se seleccionó la propuesta de Escobar-Pérez y Cuervo-Martínez (2008) para la medición de ítems en términos de suficiencia (cuando los ítems que pertenecen a una misma dimensión bastan para su medición), claridad (el ítem se comprende fácilmente), coherencia (el ítem tiene relación lógica con la dimensión o indicador que está midiendo) y relevancia (el ítem es esencial). Así, los ítems para medir los DSS se organizaron en dimensiones generales y específicas de los determinantes estructurales e intermedios, lo cual hizo posible que cada experto las valorara en una escala de 1 a 4, donde 1 era no cumple con el criterio; 2, bajo nivel de acuerdo; 3, moderado nivel de acuerdo y 4, alto nivel de acuerdo. Cada experto recibió la planilla de evaluación con las instrucciones.
Fase 2 de conformación del grupo de expertos: se tuvieron en cuenta dos tipos de informantes: i) los afectados y ii) los especialistas, según Reguant-Álvarez y Torrado-Fonseca (2016). Los primeros, considerados clave por su acción investigativa y conocedora de la situación de estudio (los del grupo de investigación), y los segundos compuestos por un grupo de expertos. Inicialmente, el grupo de investigación, con base en los instrumentos encontrados en la revisión bibliográfica, discutió y definió las dimensiones e ítems que conformaron el instrumento preliminar.
Posterior a ello, se elaboró una base de datos con 50 expertos en el tema (López-Vidal y Calvo-Lluch, 2019), se analizaron los perfiles con el Currículum vitae de Latinoamérica y el Caribe (CvLAC), la información contenida en los perfiles académicos e investigativos de Google Scholar, ORCID, Researchgate y Scopus. Los perfiles fueron seleccionados tomando como base los siguientes criterios de inclusión: formación académica, de maestría o doctorado; conocimiento y experiencia sobre el campo de estudio; cinco años de experiencia asistencial, académica o investigativa; experiencia profesional en relación al tema (experiencia en construcción y validación), voluntad para participar en el estudio y disponibilidad de tiempo.
Fase 3 de ejecución de las rondas de consulta: por correos electrónicos se envió a expertos una invitación para participar del proceso de evaluación del instrumento, a los 14 que aceptaron se les solicitó una evaluación cualitativa en cuanto a la creación de nuevas dimensiones, exclusión o creación de ítems, o ajuste de su contenido y redacción, tanto en aspectos morfológicos como sintácticos. Cuantitativamente, se invitó a que analizaran si los ítems eran adecuados (Juárez-Hernández y Tobón, 2018).
Se realizaron dos rondas de forma virtual, la primera versión del instrumento fue enviada al grupo de expertos; ellos analizaron el contenido de forma individual, calificando suficiencia, claridad, coherencia y relevancia de cada dimensión y sus respectivos ítems, y asignando a estos una puntuación con cuatro posibilidades: 1 el ítem es innecesario (no cumple con el criterio), 2 el ítem es útil, pero prescindible (bajo nivel de acuerdo), 3 el ítem es útil (moderado nivel de acuerdo) y 4 el ítem es esencial (alto nivel de acuerdo). Se contó con un espacio para sustentar esta calificación. En este sentido, los expertos indicaron la necesidad de que los ítems formasen, o no, parte del instrumento. Este proceso se hizo de forma anónima por medio de un feedback controlado. Antes de enviar la segunda versión a los expertos, se realizó una prueba piloto con el fin de analizar la comprensión por parte del encuestado. El equipo investigador analizó e integró la información enviada por los expertos con el propósito de preparar y ajustar (ver figura 1) (Sigalat-Signes et al., 2021).
Fase 4 de resultados: una vez recibida la respuesta de los expertos, se creó una matriz de Excel con los aportes propuestos y se realizó un análisis comparativo de la información cualitativa que permitió definir los ítems finales para la versión validada del instrumento.
Para el análisis cuantitativo, el equipo investigador realizó los procedimientos estadísticos de cada ronda, verificando el coeficiente de validez de contenido (CVC), la razón de validez de contenido (RVC) y, finalmente, el índice de validez de contenido (IVC), apoyados en los lineamientos de Lawshe. Cuando el resultado fue igual o superior al 0.80, se admitió en el instrumento; si fue menor a esa cifra, se modificó y se sometió a nueva validación, o se eliminó (Medina, 2020).
Para evaluar la consistencia interna del instrumento se utilizó el Coeficiente Alfa de Cronbach, el cual fue calculado a las dos versiones del instrumento. Un valor superior a 0.7 reveló una fuerte relación entre las preguntas; un valor inferior, una débil relación (Rodríguez- Rodríguez y Reguant-Álvarez, 2020).
Resultados
Fase 1 de definición
Definición de constructo: la revisión documental evidenció en mayor proporción estudios cualitativos de investigación realizados en mayores de 18 años sin diagnóstico. Estados Unidos fue el país con el mayor número de instrumentos, con predominancia del idioma inglés. Los sistemas de salud fue el determinante social de la salud más evaluado, y el estrato socioeconómico el menos valorado de forma directa. El análisis de resultados evidenció cómo la medición de los DSS por medio de un instrumento validado permite una mejor comprensión de las inequidades sociales, lo que se reconoce como el aporte central de esta investigación.
Definición operacional: para la medición de los DSS se asumieron los determinantes estructurales e intermedios como los términos que dieron origen a las dimensiones y, posteriormente, los ítems que conformaron el instrumento. Los determinantes estructurales son particularidades que fortalecen la estratificación de una sociedad y concretan la posición socioeconómica y política de la población, mientras que los intermedios son el puente a través del cual se operacionalizan los estructurales. Allí intervienen circunstancias psicosociales, factores conductuales y biológicos, relaciones sociales y con el entorno, así como los sistemas de salud. Se identificaron, también, dimensiones generales y específicas, las primeras abarcan una temática central integrada por diversas dimensiones concretas y las segundas agrupan los ítems relacionados frente a un mismo ámbito.
Construcción de los ítems: la versión final del instrumento se consolidó después de un proceso de construcción, modificación, eliminación, reducción, ampliación y determinación de los ítems definitivos.
El instrumento determinantes sociales de la salud (DESOSA81) es genérico, consta de 81 ítems que serán aplicados por un encuestador capacitado. Se estructuró en 7 dimensiones generales, 30 específicas con la valoración de 19 determinantes estructurales y 62 intermedios (ver tabla 1). Se compone de preguntas cerradas (11), abiertas (10), dicotómicas (7), tipo Likert (10) y mixtas (43).
Fase 2 de conformación del grupo de expertos
Se obtuvo respuesta positiva de 14 expertos. El 54 % fueron hombres, predominaron los participantes nacionales (61 %); el 92 % pertenecía a instituciones de educación superior, 54 % a nivel nacional y 38 % a nivel internacional, y los restantes pertenecían a una organización o ente gubernamental. El 23 % informaron estudios de maestría; y el 77 %, formación doctoral finalizada o en curso. 12 de los 14 expertos reportaron estar en el escalafón docente: asistente (25%), asociado (33 %) y titular (42 %). En cuanto a experiencia, el valor mínimo fue 9 años y el máximo fue 30 años. El índice de citaciones (H) fluctuó entre 2 y 18, lo que refleja su producción académica y científica (tabla 2).
Fase 3 de ejecución de las rondas de consulta
La primera versión del instrumento surgió de la revisión documental, se realizaron ajustes en relación con la redacción, gramática, población, los reactivos más frecuentes y la forma de preguntar. Se compuso de 86 ítems (16 correspondientes a los determinantes estructurales y 70 a los determinantes intermedios).
Para la segunda versión, el equipo investigador analizó y discutió las calificaciones y observaciones dadas por el panel de expertos, lo cual permitió refinar el constructo, reducir y precisar los ítems. Se eliminaron algunos reactivos y dimensiones referentes a raza y necesidades insatisfechas; se rediseñaron preguntas sobre núcleo familiar, ciudad de residencia, situación laboral, actividad física, consumo de sustancias psicoactivas, consumo de cigarrillo y consumo de alcohol. De igual forma, se ingresaron dimensiones e ítems emergentes frente al sexo, nacionalidad en población inmigrante, barreras de acceso a la educación, espacios públicos, atención en salud y alimentación. Así, el instrumento final quedó compuesto por 81 ítems, 19 correspondientes a los determinantes estructurales y 62 a los determinantes intermedios.
Fase 4 de resultados
Cualitativos: después de la valoración cualitativa de los expertos, los ajustes permitieron mejoras de la representatividad de los ítems frente a los dominios evaluados, así como en aspectos gramaticales, de redacción, cohesión y coherencia. Se destaca que la propuesta del instrumento para medir los DSS es muy importante, ya que posibilita analizar y evaluar las políticas públicas y las distintas intervenciones.
Cuantitativo: para estimar la consistencia interna, se calculó el Alfa de Cronbach para cada uno de los determinantes ‒estructurales e intermedios‒, por cada dimensión y por cada ítem. La tabla 3 evidencia los resultados de ambas rondas, con un alfa de Cronbach global de 0.972 para la primera y de 0.952 para la segunda, lo cual reveló una fuerte relación entre los ítems y un alto grado de consistencia interna del instrumento.
La tabla 4 muestra el número de dimensiones generales y específicas que componen el instrumento, el número de ítems destinados para cada determinante y el índice de validez de contenido (IVC). En esta se aprecia un IVC global de 0.626 para la primera ronda, lo cual suscitó cambios frente a la estructura inicial del instrumento. Conforme a las sugerencias de los expertos y el consenso del equipo investigador, se realizaron ajustes, se modificaron preguntas con una calificación menor a 3 en las categorías y se solicitó nuevamente calificación a los especialistas. Lo anterior permitió obtener un IVC de 0.909 para la segunda ronda, dato que confirma la esencialidad del instrumento.
Discusión
En el presente estudio se realizó el diseño y la validación de un instrumento para la medición de los DSS, el cual se concretó en un cuestionario con validez de contenido y confiable para ser usado con este propósito. Al instrumento construido se le estudió la validez de contenido a través del método Delphi, el cual se consideró una técnica que ofrece alcanzar un consenso fiable entre las observaciones de un equipo de expertos. Esta consiste en un trabajo en grupo de forma anónima y a distancia, donde los integrantes no establecen una comunicación directa (Hernández-Corral et al., 2019) y, adicionalmente, da libertad de respuesta frente al contenido explorado. En la presente investigación, las rondas y el anonimato de los expertos proporcionó igualdad de oportunidades a cada uno para exponer, comentar y calificar cada ítem; así mismo, posibilitó autonomía para la realización de las adecuaciones que consideraron pertinentes a la redacción de los reactivos.
Las rondas estimularon la reflexión crítica y la confrontación con la propia experiencia del equipo investigador, lo cual se constituyó en un feedback bi-direccionado, al proporcionar un espacio de intercambio de ideas, pensamientos y saberes. Al respecto, Sánchez et al. (2019) constatan la importancia de estos espacios para la creación de opiniones, posicionamientos y preferencias que influyen ante la situación a evaluar, lo que permitió plantear la necesidad de resumir, reestructurar, confirmar o eliminar diferentes ítems que conformaron el DESOSA81.
En este sentido, los expertos realizaron calificaciones que llevaron a mejorar el instrumento, y observaron estimaciones positivas en todas las dimensiones e ítems y sus categorías de valoración: suficiencia de los reactivos que pertenecen a una misma dimensión; claridad de la pregunta, con semántica y sintaxis adecuada; coherencia, en relación con la dimensión que está midiendo; y relevancia, que permite su inclusión. El análisis cuantitativo correspondió al hecho de contar con una calificación que brindó información para determinar la fuerza de correlación entre las variables, más allá de la falta o el exceso de ítems representativos del constructo (Juárez-Hernández y Tobón, 2018).
De igual forma, los expertos dieron a conocer aportes cualitativos que fueron indispensables en la elaboración final del instrumento, y dieron pie para analizar a detalle la información y sugerencias dadas, lo que permitió delimitar la inclusión o exclusión de reactivos, estructuración gramatical y redacción, y creación de nuevos ítems y dimensiones. Acorde a lo anterior, Wiersema (como se citó en Juárez-Hernández y Tobón, 2018) afirma que el análisis cualitativo admite ajustar el contenido y la redacción de los ítems, tanto en lo “morfológico como sintáctico”, esto genera un instrumento con mayor calidad en comparación a aquellos en los que solo se realiza una evaluación, ya sea de corte cuantitativo o cualitativo. Por lo tanto, para el desarrollo de este estudio se implementó un proceso con ambos tipos de valoración, con el fin de dar mayor veracidad, calidad y validez a la investigación.
Frente a la validez facial, se observó un acuerdo entre los expertos respecto a la evaluación del instrumento en mención. Este proceso permitió ver tanto la correlación general y específica contemplada por los especialistas, como la comprensión de cada uno de los reactivos examinados acorde a la medición de los DSS. Lo anterior demuestra que estos fenómenos deben ser valorados a partir de la indagación de diferentes condiciones físicas, sociales, culturales y políticas, tal como lo mencionan Salvador-Moysén et al. (2021), Kusnoor et al. (2018), Browne et al. (2019), entre otros autores (Martinez-Valle, 2021; Elias et al., 2019; Mújica y Moreno, 2019; Suárez-Álvarez et al., 2018).
En relación con la consistencia interna del instrumento, se observa una buena fiabilidad por Alfa de Cronbach, tanto en las dimensiones específicas como para el instrumento en general. Estos resultados satisfactorios son similares a los alcanzados en los diferentes estudios que reportan una adecuada fiabilidad frente a la medición de los DSS en diversos ámbitos, como la alfabetización en salud en adultos japoneses (Matsumoto y Nakayama, 2017) y su versión validada al coreano en una población de trabajadores (Cho et al., 2019), así como en la relación de los determinantes con el tráfico urbano en la ciudad de Irán y su impacto en la salud (Nadrian et al., 2014).
El DESOSA81 facilitará el desarrollo de futuras investigaciones que tengan la finalidad de estudiar y relacionar su constructo con diferentes variables, como los sistemas de salud, la educación, las condiciones socioeconómicas, entre otras. Su implementación proporcionará información sobre una variedad de necesidades que inciden en el curso de la vida misma, su desarrollo y disfrute, lo que, finalmente, determina la salud de las poblaciones.
Conclusión
La medición de los DSS es indispensable para abordar de manera idónea la situación problemática de inequidad social que marca la condición de salud de las poblaciones, y requiere de instrumentos construidos y validados con una sólida fundamentación teórica, conceptual y práctica. Para el diseño de las dimensiones e ítems que componen los instrumentos de medición se deben surtir procesos como el desarrollado en este estudio, con el fin de demostrar que la información obtenida es válida, que se puede aplicar en diversos campos y que es útil, tanto a investigadores como a actores gubernamentales. Una adecuada manera de hacerlo es a través del concepto de un grupo de expertos que brinden solidez y veracidad al estudio. Así mismo, la realización de análisis estadísticos da validez a los instrumentos, lo que posibilita soluciones integrales con beneficios amplios a una población. De igual forma, la rigurosidad metodológica favorece la obtención de resultados acordes a la realidad, fiables, y permite a los responsables tomar decisiones adecuadas y coherentes a las necesidades y recursos disponibles.
En la revisión documental integrativa que permitió el diseño del instrumento, se hizo evidente la necesidad de los países en vías de desarrollo de contar con más instrumentos de medición ajustados y validados acorde a sus realidades, que permitan recolectar información propia según el contexto. Por esta razón, trabajos de investigación como el presente son relevantes para ser usados por entes gubernamentales para la construcción de políticas públicas, planes, programas, proyectos y acciones, así como por investigadores en la construcción de conocimiento que asocien el siempre dinámico contexto social con la salud y la implementación de instrumentos para su medición.
Finalmente, al determinar la validez facial y de contenido del instrumento DESOSA81 a través del análisis realizado por el grupo de expertos de diferentes países, se posibilita que esta herramienta pueda ser aplicada en diferentes campos y áreas de experticia, niveles y nacionalidades, lo que amplía el rango de estudio de las características de la población en los diversos territorios. Para lo anterior, sería necesario hacer las correspondientes adaptaciones, dado que es un instrumento genérico. Así mismo, su aplicación debe ser realizada por personal previamente capacitado y con conocimientos en los campos social y de la salud.