Introducción
El cáncer es la principal causa de muerte en el mundo desarrollado, presentándose 12.7 millones de nuevos casos para el año 2008 1 y proyectándose 22.2 millones de nuevos casos para el 2030 2. Sin embargo, los avances en el tratamiento de las neoplasias han mejorado las tasas de supervivencia de esta población, alcanzando remisión y curación en varias patologías, aunque estos adelantos a menudo se logran a través de terapias agresivas 3 llevando a mayor estancia hospitalaria e ingresos a la unidad de cuidado intensivo (UCI) para la atención aguda de la enfermedad, cuidados posoperatorios, o complicaciones del cáncer y su tratamiento 4.
La admisión de pacientes oncológicos a UCI puede estar rodeada de incertidumbre con respecto al impacto de la misma sobre su pronóstico 5 teniendo en cuenta su alta mortalidad que puede llegar incluso al 53%. siendo mayor en pacientes con trasplante de médula ósea, necesidad de ventilación mecánica y choque séptico 6,7 en comparación con la mortalidad de otras patologías graves y crónicas 8,9.
Recientemente, un estudio multicéntrico realizado con la base de datos holandeses National Intensive Care Evaluation (NICE) indicó que la mortalidad a 60 días en pacientes con neoplasias hematológicas fue similar a la de personas con tumores sólidos y también en pacientes con otras comorbilidades graves, tales como insuficiencia cardiaca crónica, cirrosis hepática y enfermedad pulmonar obstructiva crónica (EPOC) 10.
Alrededor del mundo se han venido desarrollando diferentes puntajes pronósticos como Acute Physiology and Chronic Health Evaluation (APACHE IV). Simplified Acute Physiologic Score (SAPS III). Cancer Mortality Model (CMM). The Mortality Prediction Model (MPM II) a los que se les han incluido criterios oncológicos que bien pueden subestimar o sobreestimar la mortalidad 11; por lo cual resulta apropiada la evaluación y comparación de su desempeño en pacientes colombianos de acuerdo con las características propias del contexto.
Existen diferentes puntajes predictivos que han hecho una aproximación a la predicción de mortalidad en este subgrupo de pacientes a través de variables específicas del estado de avance y tratamiento del cáncer como APACHE IV que es la versión más reciente de este modelo y MPM II; sin embargo, en el país sigue siendo ampliamente utilizado APACHE II que es una versión anterior y menos precisa para subgrupos específicos como cáncer 12. Por lo tanto el objetivo de este estudio es evaluar el desempeño pronóstico de los puntajes Acute Physiology and Chronic Health Evaluation (APACHE IV) y The Mortality Prediction Model (MPM II) para la predicción de mortalidad a siete días en pacientes oncológicos críticamente enfermos admitidos a la unidad de cuidado intensivo (UCI) durante enero de 2014 a enero de 2016.
Material y métodos
Tipo y diseño del estudio
Estudio de tipo observacional analítico de cohorte: se trata de una investigación en la que no se realiza intervención sobre la población en estudio, en el que se exploran relaciones entre variables y se prueba una hipótesis que surge de estudios previos.
Población
Registros clínicos de pacientes con diagnóstico oncológico ingresados a la unidad de cuidado intensivo de una institución prestadora de servicios de salud especializada en oncología en la ciudad de Bogotá durante enero de 2014 a enero de 2016.
Diseño muestral
Se tomaron todos los registros de pacientes ingresados a la UCI con diagnóstico de cáncer de los dos últimos años.
Para el cálculo del tamaño de muestra se utilizó fórmula de Freeman: [n = 10 * (k + 1)] lo cual indica que el número de sujetos en un estudio con regresión logística debe ser superior a 10 * (k + 1) donde k expresa el número de covariables.
Criterios de inclusión y exclusión
Criterios de inclusión
Registros de pacientes mayores de 18 años de edad.
Diagnóstico oncológico con conformación histopatológica.
Para pacientes con reingresos durante el periodo de estudio se tomó el ingreso más reciente y
Estancia mayor de cuatro horas en la UCI
Criterios de exclusión
Readmisión de otra UCI.
Información incompleta en las variables medidas.
Gran quemado.
Diagnóstico de evento coronario.
Trauma.
Trasplantados
Variables: se tomaron las variables con las cuales se validaron los modelos pronósticos en sus estudios originales (Figura 1).
Métodos
Técnicas de recolección de información
Fuente de información. La fuente de información es secundaria, los datos de cada paciente fueron obtenidos de forma directa de la historia clínica física y electrónica institucional.
Proceso de obtención de la información. Para la recolección de la información de cada paciente se diseñó un formato con los datos de identificación, las características sociodemográficas y las variables clínicas ya validadas para el cálculo de cada puntaje de predicción de mortalidad.
La recolección de la información de cada paciente fue realizada por el investigador principal, consultando en la historia clínica electrónica institucional, se utilizó el censo de la unidad de cuidado intensivo de enero de 2014 a enero de 2016 para identificar los pacientes que tenían ingreso durante este periodo y que tuvieran diagnóstico oncológico. Para determinar el estado a siete días de la variable desenlace de mortalidad se realizó revisión de la historia de UCI y para aquellos pacientes que habían sido dados de alta antes de completar el tiempo de seguimiento, se indagó en los registros del servicio tratante, unidad de crónicos, consulta externa, laboratorio clínico y ayudas diagnósticas.
Análisis estadístico
En el análisis univariado para las variables cualitativas se reportan proporciones y para las variables cuantitativas se reportan medidas de tendencia central media, desviación estándar y coeficiente de variación y para las variables que no siguen distribución normal se reportaron medianas y cuartiles 1 y 3.
En el análisis bivariado para las variables cualitativas se construyeron tablas de contingencia y prueba de asociación con el estadístico de X 2, para las variables cuantitativas se utilizó t de Student para la comparación de promedios y para las variables que no siguen distribución normal se reporta U Mann Whitney para la comparación de medianas.
Para el análisis multivariado se estimó un modelo de regresión logística binaria al cual se ingresaron las variables predictivas ya validadas para cada puntaje pronóstico.
Para determinar la calibración de cada modelo se llevó a cabo la prueba de bondad de ajuste de Hosmer y Lemeshow, que comprueba si el modelo propuesto explica los datos observados, a través de la evaluación de la distancia entre los datos observados en el estudio y lo esperado que es el valor teórico calculado mediante el modelo construido, se comparan observados y esperados en 10 categorías correspondientes aproximadamente a los deciles de riesgo o probabilidad predicha de presentar el evento. Las dos distribuciones se comparan mediante una prueba de X 2 con 8 grados de libertad 13.
Para evaluar la capacidad discriminativa del modelo se calculó el área bajo la curva ROC con el estadístico C, a través de la construcción de la curva ROC es posible determinar el poder predictivo y discriminación del modelo, se presenta en un diagrama de dos ejes, donde el eje X es el complementario de la especificidad (1- especificidad) y el eje Y es la sensibilidad. Por lo tanto es una forma de presentar ambas características del modelo logístico en todos los puntos de corte 13.
Para determinar la eficiencia del modelo se estimaron los estadísticos criterio de información Akaike (AIC) y criterio de información Bayesiano (BIC). Cuando se cuenta con diferentes modelos con sus respectivos parámetros o variables es utilizada para su comparación la función de máxima verosimilitud ((likelihood). Esta función permite determinar el modelo que realiza el mejor ajuste de los datos, sin embargo no penaliza su complejidad, por lo cual resulta útil emplear medidas de contraste como el AIC y el BIC. Los criterios hacen uso del Log-likelihood (log Lik) que es el logaritmo de máxima verosimilitud, y sustraen un término proporcional al número de parámetros (K) en el modelo, así: log Lik αK donde α corresponde a 2 para el AIC y a log(N) para el BIC 14-16.
Resultados
Durante el periodo de estudio fueron admitidos 303 pacientes con diagnóstico oncológico a UCI, de los cuales 283 (93.4%) cumplieron los criterios de inclusión y tuvieron información clínica completa (Figura 2).
Características clínicas de los pacientes y comprobación de asociación entre variables
Se realizó la descripción de las características clínicas basales de los pacientes que fueron validadas como predictores en los estudios originales para la construcción de los puntajes pronósticos APACHE IV y MPM II 17,18 Encontrando diferencias significativas entre el grupo de pacientes que sobrevivieron y los que fallecieron durante los primeros siete días de estancia en UCI en las siguientes variables: edad, siendo llamativo que el grupo que presentó mortalidad tenía un promedio de edad menor con una diferencia de seis años con respecto a los que vivieron, tanto la frecuencia cardiaca como la respiratoria se encontraron elevadas en el grupo de fallecidos; las variables de los gases arteriales mostraron ser un predictor clave de mortalidad dado que los pacientes que murieron mostraron alteración del estado de oxigenación reflejado en estos parámetros, requerir ventilación mecánica también mostró ser un indicador de mal pronóstico igualmente, el estado de inmunosupresión sugiere que los sujetos que presentan esta condición clínica tienen mayor probabilidad de fallecer, al igual que tener un diagnóstico de admisión quirúrgico de cualquier tipo, como se muestra en la Tabla 1.
Se estimó un modelo de regresión logística binaria para el puntaje APACHE IV en la que se incluyeron todas las variables usadas para la validación del puntaje en su versión original, encontrando que para la población en estudio mostraron significancia estadística las variables edad, frecuencia cardiaca, FiO2, los parámetros de gases arteriales, creatinina, BUN, albúmina, bilirrubina, hematocrito, diagnóstico de admisión médico y desarrollar sepsis, validando que son predictores clínicos de mortalidad en esta cohorte (Tabla 2).
Se estimó un modelo de regresión logística binaria en la que se incluyeron todas las variables usadas para la validación de la escala MPM II en su versión original, encontrando que para la población en estudio mostraron significancia estadística las variables taquicardia, edad, ventilación mecánica y admisión por causa médica, validando que son predictores de mortalidad en concordancia con el modelo para APACHE IV (Tabla 3).
Para determinar el modelo con mejor desempeño se utilizaron los estadísticos de Hosmer y Lemeshow, la comparación de AUC que se muestra en la Figura 3 y la prueba de homogeneidad, además de los coeficientes de información de Akaike (AIC) y coeficiente de información Bayesiano (BIC) como se muestra en la Tabla 4.
La Figura 3 muestra que APACHE IV tiene un mayor poder predictivo dado por mayor área bajo la curva y que se evidencia con curva ROC situada más cerca de la esquina superior izquierda.
De acuerdo con los resultados que se muestran en la Tabla 4 el puntaje pronóstico con mayor capacidad predictiva es el APACHE IV dado por una mayor AUC con prueba de homogeneidad de áreas estadísticamente significativa en comparación con MPM II, con respecto a la calibración evaluada con estadístico de Hosmer y Lemeshow no se encontraron diferencias estadísticamente significativas entre los valores observados versus los esperados para ninguno de los modelos.
Para determinar el modelo con mayor eficiencia la Tabla 3 reporta el estadístico BIC para los dos modelos, siendo mayor para APACHE IV, lo que sugiere una menor eficiencia dado que MPM II utiliza un menor número de variables para realizar su predicción; sin embargo, el Δ BIC es de 2.9 que muestra evidencia positiva en contra de este modelo pero no fuerte, es decir, que la diferencia del estadístico entre los dos modelos no es significativa, teniendo como referencia que diferencias mayores a seis entre los estadísticos BIC de dos modelos en comparación indican que el modelo con mayor valor muestra evidencia fuerte que indica ser menos eficiente.
También se reporta el estadístico AIC siendo menor para APACHE IV, lo que indica que dicho modelo realiza el mejor ajuste de los datos.
Discusión
Este estudio observacional analítico de cohorte en pacientes oncológicos críticos manejados en UCI a quienes se les estimó la probabilidad de mortalidad con los puntajes pronósticos APACHE IV y MPM II. Mostró que APACHE IV tiene un buen desempeño en la predicción de mortalidad de pacientes oncológicos críticamente enfermos. APACHE IV se reitera y se constituye en una herramienta útil para el clínico en su labor diaria, al permitirle distinguir los pacientes con alta probabilidad de mortalidad.
Se han desarrollado modelos específicos para predicción de mortalidad en pacientes con cáncer; sin embargo, es un desafío la implementación en UCI dado que tienden a subestimar la probabilidad de muerte que podría estar dado por la propia heterogeneidad de la enfermedad maligna. Además de generar controversias como el hecho de si un tumor sólido y una neoplasia hematológica son demasiado diferentes para un único sistema de puntuación y si el cáncer no es un factor de pobre pronóstico per se y por tanto no es una razón de exclusión para la admisión de estos pacientes a UCI 19.
Con respecto a los resultados de nuestro estudio, los puntajes pronósticos mostraron una adecuada calibración (Test de Hosmer y Lemeshow no significativo) de los modelos, resultados que son discordantes con otros estudios donde han reportado pobre calibración como el de George 20, en el cual se derivó un modelo específico para cáncer y el de Soares en el cual se compararon seis puntaje entre los que se incluyen MPM II (p = 0.001) y APACHE III (p = 0.001) con CMM que es un modelo derivado específicamente para pacientes oncológicos críticamente enfermos 11. Sin embargo, en el estudio de derivación de APACHE IV se reportó adecuada calibración (p= 0.08) 17 no se encontraron estudios adicionales donde se compara esta versión reciente de APACHE con otros puntajes.
En el presente estudio la evaluación del poder predictivo a través del estadístico C y AUC, sugiere que los dos puntajes pronósticos tienen adecuada capacidad de predicción de acuerdo con su capacidad de discriminación, aunque, APACHE IV mostró mayor AUC (0.95) que MPM II (0.78) y que es corroborada al realizar prueba de homogeneidad de áreas que muestra diferencias estadísticamente significativas, estos hallazgos son concordantes con el estudio de Zimmerman 17 en el cual se validaron las variables predictoras para APACHE IV el cual reporta adecuada AUC (0.88). Para MPM II Soares en una de sus publicaciones reporta un AUC (0.73) 11 cercana a nuestros resultados; sin embargo, en otro estudio de Groeger 20, MPM II no mostró buena capacidad predictiva con AUC (0.63) con menor desempeño con relación a nuestra evaluación de los puntajes.
La eficiencia de los modelo fue evaluada con los estadísticos AIC y BIC encontrado un BIC superior para APACHE IV lo que inicialmente sugiere un modelo menos eficiente con respecto a MPM II, ya que requiere de múltiples parámetros para realizar su predicción y al evaluar el Δ BIC aunque se presenta una diferencia positiva con evidencia contra APACHE IV dicha diferencia no llega a ser una evidencia fuerte contra el modelo 21.
Con respecto al estadístico AIC fue inferior para APACHE IV en comparación con MPM II, lo que sugiere que es un modelo con buen ajuste a los datos observados, es decir, explica gran parte de la variabilidad de los datos, aunque complejo por el gran número de parámetros utilizados.
Estas diferencias encontradas entre los resultados del BIC y AIC de ambos modelos y cuya interpretación es similar, estaría explicada por el término de penalización por el número de variables del modelo que es mayor en el BIC y que tiene en cuenta no sólo la cantidad de parámetros sino el tamaño de la muestra. No se encontraron estudios relacionados con puntajes pronósticos comparativos en el uso de estos estadísticos.
Esta investigación encontró como ventaja el hecho de no requerir para el uso de MPM II el ingreso de un diagnóstico específico, por lo cual no es necesario seleccionar entre varios diagnósticos principales o importantes en un paciente complejo, previniendo errores en la clasificación y disminuyendo la afectación sobre la calibración. Por otra parte proporciona una evaluación aguda a través de la variable edad y quince variables binarias en el momento del ingreso o en la primera hora de admisión a la UCI dado que no requiere de reportes de ayudas diagnósticas, mientras que APACHE IV se basa en gran parte en los peores valores de los parámetros fisiológicos obtenidos en las primeras 24 horas del ingreso.
Por lo tanto MPM II está basado en la condición y estado clínico del sujeto previo al inicio de la atención y cuidado en la unidad crítica, lo que resulta de gran utilidad, ya que permite estimar la calidad del cuidado mediante una evaluación del paciente ajustada al riesgo estimado de mortalidad y los resultados de la atención.
Se evidenciaron limitaciones de MPM II para pacientes que tienen cambios rápidos en su estado vital al ser admitidos y recibir atención, en razón a que no tiene en cuenta la evolución de las primeras horas y el impacto de la atención sobre el estado clínico. Adicionalmente no tiene en cuenta subgrupos de riesgo como cirugía cardiaca, infarto agudo de miocardio y reingreso a la UCI, lo que reduce su utilidad en algunas UCI. También se encontró que la discriminación de MPM II es inferior en comparación con APACHE IV, por lo que este modelo requiere de nuevas revisiones y adaptaciones.
Por otra parte. APACHE IV se desarrolló debido a que la exactitud de APACHE II ha sufrido cambios significativos en la década previa, en esta investigación APACHE IV mostró una alta discriminación y buena calibración incorporando un gran número de variables, este aumento en la complejidad de APACHE IV denota un cambio significativo en la simplificación de las versiones anteriores, sin embargo, la puntuación APACHE II continúa siendo una medida resumen útil de gravedad de la enfermedad.
El aumento en la complejidad de los puntajes pronósticos de mortalidad por un mayor número de variables predictoras podría llegar a ser una desventaja en la práctica al requerir experticia y tiempo de los profesionales para su aplicación rutinaria en las UCI, por lo que se requiere el desarrollo y utilización de herramientas tecnológicas que permitan la extracción de la información de forma práctica y ágil para los profesionales.
Los modelos pronósticos para pacientes de UCI en general tienden a subestimar el riesgo de muerte en pacientes con cáncer críticamente enfermos. Esto es importante cuando se interpretan tasas de mortalidad como medida de comparación entre unidades, ya que unidades con mayor ocupación por pacientes oncológicos tienden a presentar una mayor tasa de mortalidad. Sin embargo, estos modelos tienen la capacidad de identificar subgrupos de pacientes con alto riesgo. Por lo tanto puede tener un papel importante para la asignación de recursos y proveer información sobre el pronóstico para personal de atención, pacientes y familiares 22.
En conclusión este estudio observacional analítico de cohorte en pacientes oncológicos críticos manejados en UCI a quienes se les estimó la probabilidad de mortalidad con los puntajes pronósticos APACHE IV y MPM II, mostró que APACHE IV tiene un buen desempeño en la predicción de mortalidad de pacientes oncológicos críticamente enfermos. APACHE IV se reitera y se constituye en una herramienta útil para el clínico en su labor diaria, al permitirle distinguir los pacientes con alta probabilidad de mortalidad. En este orden de ideas, es importante destacar la importancia de continuar desarrollando herramientas tecnológicas que permitan la extracción de la información de forma práctica y ágil para los profesionales en pacientes oncológicos críticos a tratar en UCI.