Introducción
El personal de salud, pacientes, familiares, aseguradores y tomadores de decisión se enfrentan a juicios y valoraciones sobre la posibilidad de acceso, beneficios, riesgos, costos y preferencias sobre la provisión o no, de un servicio de salud específico. Es ideal que estos procesos se realicen en un marco ético y con información suficiente que permita establcer preferencias individuales sobre una intervención o servicio de salud que se espera recibir.
Existen metodologías para evaluar preferencias y herramientas de análisis: métodos de disposición a pagar (willingness to pay methods), evaluación del impacto económico, métodos de análisis conjunto (conjoint analysis methods), escala visual análoga, procesos de ordenamiento de alternativas y evaluación de riesgos vs. beneficios de las alternativas (standard gamble y time trade-off)1.
La más usada y conocida en salud son los años de vida ajustados por calidad de vida (Quality Adjusted Life Years -QALY-), que intentan capturar los beneficios globales en salud percibidos por el individuo cuando se realiza una intervención o tratamiento específico. Estas metodologías fallan al evaluar beneficios específicos de una intervención, proceso de entrega, satisfacción y preferencia de los usuarios en términos de tiempo, calidad y atributo específico2-4.
Los experimentos de elección discreta (DCE, su sigla en inglés) son una metodología que se usa para evaluar preferencias y fue desarrollada inicialmente en teoría de mercado. Este diseño incluye un grupo de participantes a quienes se les presentan dos o más alternativas (intervención, servicio, etc.), con diferentes niveles de atributos (conocidos previamente) y, posteriormente, se evalúan las preferencias de los participantes entre diferentes niveles y combinaciones de atributos, logrando capturar las preferencias y variables que influyen al momento de realizar la elección2.
Por ejemplo, usted desea evaluar las preferencias de pacientes sobre dos opciones de tratamiento para una enfermedad específica, disponibles y con efectividad comprobada; sin embargo, tienen algunas diferencias que se presentan en la tabla 1.
Atributo/característica | Tratamiento 1 | Tratamiento 2 |
---|---|---|
Vía de administración | Oral | Endovenosa |
Tiempo de tratamiento | 3 meses | 1 mes |
Náuseas | +++ | + |
Estreñimiento | + | +++ |
Frecuencia de controles | Semanal | Quincenal |
Probabilidad de fracaso | ++ | + |
Precio por total de tratamiento | 1.000 USD* | 750 USD* |
*USD: dólares americanos.
Para ejecutar un DCE es necesario que los atributos y niveles de los atributos sean conocidos por los usuarios (individuos). En la tabla 1, la primera columna ejemplifica siete atributos en cada opción y en las columnas 2 y 3 se presentan diferentes niveles del atributo. En un DCE se vuelven a presentar varias combinaciones de las opciones con diferentes niveles de atributos, lo que permite estimar la importancia relativa de cada atributo en las preferencias de los usuarios. Las combinaciones de los atributos y niveles permiten capturar preferencias y atributos que influencian la decisión. Esta característica agrega un valor adicional a los DCE, en comparación con otros métodos de evaluación de preferencias.
A través de la aplicación y estructuración de modelos estadísticos logran evaluar el grado de influencia sobre la decisión de cada uno de los atributos (su nivel o una combinación específica), que resultan en perfiles específicos que son analizados mediante un diseño experimental que utiliza la teoría de la utilidad aleatoria.
El desarrollo de los DCE tiene tres fases. La primera (orígenes) inicia cuando Thurstone5, en 1927, describió la Ley de Juicio Comparativo de Thurstone y la herramienta de escalado. Este autor introdujo tres métodos de escalado: comparaciones emparejadas, intervalos sucesivos e intervalos de igual aparición. Las técnicas de escalamiento de Thurstone fueron bastante populares en su momento, pero hoy no se emplean debido a múltiples limitaciones de análisis. Sin embargo, muchos métodos que se utilizan hoy son extensiones del método de escala de Thurstone5.
En la segunda fase se identifican y popularizan términos y técnicas relacionadas con reglas de decisión algebraica y función de utilidad indirecta. Entre 1950 y 19606-8, se introdujeron herramientas estadísticas y modelos probabilísticos para clasificar opciones y demostrar de forma indirecta sus preferencias1.
La tercera fase inicia en 1980, cuando comienza la aplicación de teorías psicológicas y económicas en salud. Surgen los DCE como métodos alternativos de evaluación de preferencias mediante el modelamiento de los procesos de escogencia, uso de modelos estadísticos basados en regresión logística simple, logit, logit condicional y sofisticados análisis de datos categóricos. Son múltiples los ejemplos de uso en áreas clínicas9-15.
Decisión: preferencia o asimetría de la información
El conocimiento tiene un papel fundamental en el proceso de selección o determinación de las preferencias de los individuos. Bajo esta perspectiva, y con base en la teoría económica y de mercados, existen tres tipos de conocimiento: el conocimiento subjetivo, entendido como el conocimiento autopercibido o el conocimiento que piensa el usuario tener; el conocimiento objetivo, que es el conocimiento teórico evaluado a partir de un test (conocimiento cuantitativo) y el conocimiento derivado de la experiencia o exposición previa16-18.
Los tipos de conocimiento están correlacionados entre sí y explican gran parte del comportamiento, razón de elección y costumbres de uso o consumo de un producto. Cuando una persona debe elegir un servicio en salud, usualmente, carece o tiene mínimo conocimiento de los tres tipos descritos. En el mejor escenario, su conocimiento deriva de la percepción de enfermedad y explicación de su grupo médico. Sin embargo, podrían existir escenarios en los cuales puede ser relevante evaluar las preferencias de pacientes luego de haber recibido una intervención. Para el caso de la toma de decisiones de médicos sobre alternativas de tratamiento o preferencias, el conocimiento es mayor y usualmente derivado de la combinación de los tres tipos de conocimiento; sin embargo, el escenario médico presenta dos características especiales: ausencia de enfermedad (en él mismo) y aplicación de la decisión en un tercero que no afectará su propio estado o condición de salud actual.
Al momento de elegir se asume un claro entendimiento de la condición y del proceso o intervención a la que será sometido, la falta de conocimiento presupone un dilema interesante al momento de tomar la decisión sobre un servicio en salud. Entra en juego el juicio de valores, donde se contraponen las necesidades insatisfechas, aspectos socioculturales específicos y oportunidad de acceso, con la capacidad individual y estatal de suplir dicha necesidad, y los costos de oportunidad. Esto puede empeorar por condiciones médicas que generan deterioro o ponen en riesgo el estado de salud a corto, mediano y largo plazo.
Las responsabilidades conceptuales del Estado y de los sistemas de salud son claras, deben garantizar los derechos en salud y asegurar su acceso. No obstante, las diferencias y subjetividades que se presentan en las necesidades percibidas, concepción de las mismas, noción de satisfacción y los innumerables problemas administrativos hacen evidente el grado de vulnerabilidad al momento de elegir.
Quizás sea la asimetría de información una de las grandes dificultades al momento de considerar este tipo de diseño. Se contrapone el amplio conocimiento del médico (o tomador de decisiones) sobre la condición específica de salud y conocimiento del paciente. El conocimiento del médico está derivado de un largo proceso de educación, asistencia y confluencia de saberes, que le permiten tener una visión amplia y transversal de las posibilidades de recuperación, opciones de tratamiento y pronóstico. Reconocen de manera más clara los beneficios de intervenciones en casos específicos o la existencia de esfuerzos fútiles. Pese a ello, no escapan a la incertidumbre sobre los potenciales resultados de su decisión, y esta, a su vez, es heterogénea entre diferentes médicos y situaciones específicas (enfermedades, tratamientos, poblaciones, etc.).
En general, el paciente adolece de la profundidad del conocimiento del médico, aunque en algunos casos logre adquirir información de calidad variable (Internet, revistas, etc.), que suministran de forma rápida información, en algunos casos distorsionada, sobre su padecimiento, opciones de tratamiento, pronóstico, condición de riesgo o deterioro de su salud, que, al final, modifican en algún grado su conocimiento y determinan su preferencia por algún tratamiento en particular.
Para el caso de la elección de productos en salud de los médicos para sus pacientes, la ausencia de experiencia de la enfermedad y riesgo de deterioro de su estado de bienestar, hacen que la decisión esté influenciada por el grado de conocimiento y experiencia en su uso. Es aquí donde los DCE muestran una ventaja específica sobre otras formas de evaluación de preferencias, porque permiten establecer el tipo y nivel de atributo que influencia la decisión sobre las alternativas disponibles y los pesos diferenciales que aporta cada uno de los atributos en esta decisión. Además, permite la evaluación de estas preferencias independiente del grado de experiencia o exposición previos al momento de expresar su preferencia por alguna de las alternativas.
Diseño: ¿cómo presentar las opciones?
Uno de los aspectos críticos al momento de implementar un DCE, es el diseño, específicamente, el proceso para determinar las opciones, niveles de atributos y formas de presentación de la información (lenguaje o gráficos utilizados). Este proceso involucra estudios de corte cualitativo, grupos focales y reuniones de expertos que presentan múltiples retos y limitaciones metodológicas: saturación, validez y representatividad, que limitan la posibilidad de extrapolar información y resultados entre diferentes poblaciones. Sin embargo, el éxito de este proceso estará determinado por la selección adecuada y la presentación de las opciones por parte de los investigadores.
Otras limitaciones que existen al momento de combinar atributos o el nivel de los mismos, es la existencia de opciones o escenarios alejados de la realidad; por ejemplo, la inclusión de edad y expectativa de vida (atributos edad del paciente y expectativa de vida). Una combinación de edades de 30 y 90 años con expectativas de vida de 20 años no es plausible biológicamente para el caso de edad 90 años, situación que genera una alternativa inviable para el ejercicio. Este tipo de problemas tienen gran impacto estadístico o dificultades en el análisis de resultados, y no existe una solución estandarizada que permita establecer la forma para solventar estas situaciones.
Diseño: eficiencia estadística y eficiencia de respuesta ¿Qué hacer?
De forma tradicional, el uso de diseños factoriales y presentación de opciones incluye el cálculo del máximo de parejas, opciones y perfiles derivados del proceso inicial de diseño. El número de atributos y los niveles de los atributos a evaluar, determinan el número de perfiles a presentar [n - (n-1)/2]. Para el caso hipotético de dos opciones a evaluar, cada una con 4 atributos y 3 niveles, tendríamos 81 (34) perfiles, y para el caso de dos opciones 3.240 combinaciones [34 * (34-1)/2], situación que impone retos en el diseño, formato de presentación, tiempo de administración y necesidad de sujetos (respondientes). El proceso estadístico de modelamiento y análisis, las interacciones entre los diferentes perfiles o los diferentes niveles de atributos, no se tienen en cuenta y esto puede generar estimadores sesgados2.
La forma de selección del número de atributos y sus niveles, no sigue un proceso estandarizado y, a su vez, se contrapone con la cantidad de perfiles de información necesaria. Este problema aumenta si se tienen en cuenta aspectos relacionados con eficiencia de respuesta que se refiere a la medición del error por la falta de atención de los encuestados, comprensión de preguntas u otras influencias contextuales no observadas2.
Existen diferentes efectos cognitivos que dan como resultado respuestas de mala calidad a estímulos experimentales y causan errores de medición: simplificar la heurística de decisión utilizada por encuestados que son inconsistentes para maximizar la presunta utilidad o modelo de elección; fatiga del entrevistado como resultado de un gran número de preguntas; interpretación heterogénea por los encuestados como resultado de un atributo mal construido o pobres definiciones de nivel del atributo; y falta de atención del encuestado como resultado del contexto hipotético2.
Cálculo del tamaño de la muestra
La estimación del tamaño muestral de un DCE es uno de los principales vacíos y, al mismo tiempo, plantea grandes retos en la planeación y financiación de este tipo de estudios porque se deben considerar el número y los niveles de atributos y posibles perfiles resultantes en adición al número de respondedores necesarios para obtener suficientes datos para realizar el análisis requerido. A la fecha no existe una fórmula específica para el cálculo del tamaño de muestra. La ISPOR (International Society For Pharmacoeconomics and Outcomes Research) propone un tamaño de muestra de al menos 150 personas2, pero reconoce las limitaciones del cálculo y de las posibles herramientas de estimación disponibles. Estas limitaciones son derivadas del desconocimiento de parámetros relevantes para el cálculo: número de respondedores, variabilidad esperada en la respuesta y aspectos derivados de la escala de heterogeneidad en la decisión de elección, peso de las preferencias, desviación estándar y niveles de significancia estadística.
En comparación con otras metodologías para la evaluación de preferencias, se resalta la inclusión de parámetros estadísticos y propuestas de modelamiento como gran avance conceptual para los DCE. Estas soluciones intentan reducir el grado de subjetividad y no son comparables con otras metodologías, como saturación de la muestra, muestreo propositivo o marcos muestrales a conveniencia.
Aspectos estadísticos
Tal vez el aspecto más complejo de los DCE es el proceso de modelamiento y análisis estadístico. Entre los modelos más utilizados están los diseños de tipo factorial y los modelos logit y logit condicional, los cuales tienen serias desventajas y limitaciones en su aplicación para la evaluación de preferencias19.
La primera limitación es que este tipo de modelos no tienen en cuenta la escala de heterogeneidad en la decisión de los sujetos, asumen una igualdad de pesos y varianza de 1 para respondedores. Obviamente, la realidad esperada en la respuesta de los sujetos o evaluación de perfiles no cumple con estos supuestos y se traduce en estimadores sesgados lo cual limita la posibilidad de analizar fuentes de esta heterogeneidad19.
El segundo problema es la heterogeneidad de preferencias. El modelo asume que todos los individuos, en esencia, tienen las mismas preferencias o pesos relativos al momento de su decisión y es incapaz de captar la variabilidad entre individuos. Este problema puede solucionarse parcialmente con el uso de modelos sofisticados: modelos logit con parámetros aleatorios, modelamiento a través de Bayes jerárquico y modelos de mezcla finita de clase latente. Sin embargo, ninguno de estos se encuentra exento de crítica, todos tienen limitaciones relacionadas con su construcción e interpretación, y tienen una complejidad creciente para su ejecución y análisis19.
Implementación y utilidad
Las metodologías de evaluación de preferencias en salud buscan dar información a tomadores de decisiones, sobre preferencias de individuos de un producto de salud específico y para el caso de médicos, atributos que determinan la elección de una intervención específica. Se espera que esta información esté libre de sesgos y represente la población que padece la condición. Sin embargo, los argumentos descritos plantean incertidumbre proveniente del diseño, determinación de atributos y análisis estadístico, que pueden generar sesgos importantes en los resultados y alejarse de forma sistemática o aleatoria del resultado verdadero, sin claras opciones de limitar el impacto del proceso de modelamiento en el resultado de la elección. Esta herramienta intenta dar el mejor uso a todos los desarrollos estadísticos de los últimos cincuenta años y no debe ser utilizada como fuente única de decisión. Sus resultados deberán evaluarse con extrema precaución y pueden ser incluidos como información adicional en el complejo proceso de asignación de recursos y elección de intervenciones en salud.
Las situaciones o escenarios en los que claramente existe la necesidad de una decisión dominante por efectividad, seguridad o relación de costos del uso, beneficios o utilidad esperada, no deben ser evaluados mediante DCE, dado que el ejercicio consumiría una gran cantidad de recursos en términos de tiempo, dinero y análisis. Si una intervención tiene obvios beneficios en comparación con las alternativas en todos estos aspectos, un DCE no modificaría la decisión final. Así mismo, en contextos o poblaciones específicas, en los que los atributos no se encuentren disponibles o no se perciban como una opción para los individuos evaluados por razones sociales, económicas o culturales, no son útiles los DCE.
Existen situaciones en las que las diferencias de los desenlaces clínicos o costos son limítrofes; las preferencias de los usuarios entran a jugar un papel fundamental dentro del proceso de aceptación e implementación de intervenciones, que, se supone, tendrán un beneficio o riesgo esperado y potencialmente percibido por el usuario o tomador de decisiones. Esta evaluación de preferencias que realiza el individuo, específicamente en el campo de la salud, usualmente, va más allá de situaciones evaluadas a través de otras metodologías que se basan en la evaluación o combinación de dos atributos, como son tiempo, dinero, estado/calidad de vida o la realización de una apuesta específica (willingness to pay, standard gamble y time trade-off). Los DCE permiten evaluar de forma simultánea varios atributos y pueden determinar probabilidades, pesos o perfiles específicos que establecen las preferencias de los individuos.
Así mismo, ofrecen reproducibilidad metodológica para la evaluación de preferencias y permiten establecer los atributos que determinan la elección. Al comparar los DCE con otros métodos para determinar preferencias, son el único diseño que intenta reducir estas limitaciones mediante el uso de herramientas estadísticas, y, a pesar de su complejidad, permiten identificar y representar de mejor forma el proceso de elección que realizan los sujetos.
Conclusiones
Los DCE son una potente herramienta para la evaluación de preferencias, ya que permiten, de forma estructurada y complejidad estadística creciente, establecer preferencias, no escapan a limitaciones derivadas de la asimetría de información, necesidad de supuestos estadísticos e imposibilidad de capturar de forma completa la heterogeneidad de los participantes y peso asignado a cada uno de los atributos, que al final, determinan las preferencias de los usuarios. A diferencia de otras técnicas, los DCE combinan en la generación de atributos y modelamiento matemático, complejas tareas de diseño y ejecución para mejorar la calidad y optimizar la cantidad necesaria de información, logrando un uso eficiente de recursos con resultados de excelente calidad. Sus resultados no deben extrapolarse entre poblaciones o intervenciones en salud y su análisis e implementación deberán realizarse en el marco de información proveniente de la efectividad de las intervenciones, los costos y el contexto social, político y cultural específico.