Introducción
La predicción en medicina ha sido un tema central, especialmente en el área cardiovascular. Un modelo predictivo que estratifique el riesgo de incidencia de un evento, establece grupos que le permiten al clínico no solo conocer la probabilidad de desenlaces, sino escoger las alternativas diagnósticas y terapéuticas óptimas y la intensidad del tratamiento de acuerdo con el balance riesgo/beneficio de cada opción1.
En este sentido, se han utilizado diversos puntajes para determinar y cuantificar el pronóstico en pacientes con síndrome coronario agudo2 y, aunque emplean variables similares, se distinguen en algunas que se consideran importantes. Otra diferencia en el desarrollo de algunas de estas escalas es que se han obtenido en ensayos clínicos con asignación aleatoria, que están limitados por los criterios de inclusión utilizados, en contraposición a los puntajes construidos con base en registros internacionales, multicéntricos, con mayor representación de la población del llamado ''mundo real''3-9.
Los puntajes más conocidos son el GRACE (The Global Registry of Acute Coronary Events) y el TIMI (Thrombolysis In Myocardial Infarction). El primero8-10fue desarrollado con base en un registro internacional, multicéntrico, con participación de 123 hospitales de 14 países, en pacientes con síndrome coronario agudo (SCA) con y sin elevación del segmento ST para estratificar el riesgo de infarto y muerte a un mes y a seis meses. El segundo6 se diseñó con base en dos estudios de intervención en SCA sin elevación del ST: el TIMI 11B11 y el ESSENCE12. Los dos modelos anteriores se usan de manera rutinaria en los servicios de urgencias para determinar el subgrupo de pacientes con infarto agudo del miocardio sin elevación del segmento ST/angina inestable (IAMNST/AI) de más alto riesgo, a quienes se les debe realizar estratificación invasiva13. No todas las cohortes a través del mundo han obtenido resultados iguales con la aplicación de estos puntajes14. En Iberoamérica se han realizado estudios con resultados variables15-17. En Colombia se han hecho dos aproximaciones a la validación de los puntajes TIMI y GRACE con resultados contradictorios18,19.
El objetivo de este estudio fue determinar si el puntaje de riesgo GRACE predice con mayor exactitud que el TIMI, el riesgo de muerte como desenlace aislado y el combinado de muerte o reinfarto no fatal en el escenario intrahospitalario, al mes y a los seis meses.
Materiales y métodos
Diseño del estudio
Estudio de validación de dos puntajes de pronóstico con una cohorte prospectiva de pacientes mayores de 18 años de edad con diagnóstico de síndrome coronario agudo atendidos en la unidad de cuidados coronarios de dos instituciones de alta complejidad de la ciudad de Medellín desde enero de 2013 hasta septiembre de 2014.
Criterios de inclusión
Pacientes con SCA sin elevación del segmento ST: angina inestable o infarto agudo de miocardio sin elevación del segmento ST, que se presentaron con angina típica clasificada como inestable por las siguientes características: angina en reposo de más de 20 minutos de duración en las 48 horas previas al ingreso, de reciente comienzo (últimos 60 días) o in crescendo (que haya cambiado un estado funcional de la clasificación canadiense de angina y sea mínimo estado III), más uno de los siguientes:
Cambios electrocardiográficos: depresión del segmento ST ≥ 0,1 mV de más 80 ms de duración en dos derivaciones contiguas o elevación transitoria del segmento ST ≥ 0,1 mV o inversión de la onda T profunda ≥ 0,1 mV.
Marcadores enzimáticos de necrosis positivos: troponina I por encima del percentil 99 (valores de referencia de la prueba en ambas instituciones).
En pacientes con angina sin cambios eléctricos y enzimas negativas, se necesita para la inclusión al menos un criterio de alto riesgo: edad ≥ 60 años, infarto de miocardio previo, revascularización percutánea o quirúrgica previa, enfermedad arterial coronaria previa documentada mayor al 50% en al menos un vaso, enfermedad cerebrovascular isquémica previa o ataque isquémico transitorio, estenosis carotídea mayor al 50%, enfermedad arterial periférica, diabetes mellitus, disfunción renal crónica definida como depuración de creatinina menor a 60 ml por minuto por 1,73 m2 de superficie corporal.
Criterios de exclusión
Se excluyeron pacientes que rehusaran participar en el estudio o asistir a las citas de seguimiento, pacientes con expectativa de vida menor a 6 meses, pacientes con SCA con elevación persistente del segmento ST, pacientes con angina de Prinzmetal o portadores de marcapasos.
Tamaño de la muestra
La aproximación convencional al cálculo del tamaño de la muestra para los modelos predictivos, define un valor entre 5 y 20 desenlaces por cada variable independiente20,21. Sin embargo, para la indicación específica de validación de modelos predictivos no existe evidencia que sustente la consideración anterior, aunque algunos autores sugieren al menos un número similar de desenlaces y no desenlaces22. Dado que el objetivo general del estudio parte de la hipótesis de una mayor exactitud de una escala versus la otra, se tomaron como referencia los valores originales de áreas bajo la curva ROC (AUC-ROC de los dos modelos TIMI=0,63 y GRACE=0,85)6,8. Para probar la hipótesis de la diferencia entre las dos anteriores AUC-ROC, con error alfa de 0,05 y beta de 0,2, y con base en la fórmula de Hanley-Mc Neil y Obuchowsky23,24, se necesitan alrededor de 119 individuos para el cálculo de cada una de las dos AUC-ROC para una población total de al menos 238 pacientes.
Análisis estadístico
La distribución de las variables continuas se describe con medidas de tendencia central y de dispersión, y para las variables discretas se hace con frecuencias y porcentajes. Para la validación de los modelos predictivos se utilizaron las mismas estrategias de los estudios originales. Para el puntaje TIMI se ajustó un modelo de regresión logística con las variables dicotómicas descritas originalmente y para el GRACE un modelo de regresión logística con la introducción de las variables originales con sus respectivos puntajes. En ambos modelos se usó el desenlace compuesto de muerte y reinfarto no fatal, al igual que el de muerte en forma aislada, intrahospitalaria, al mes y a los 6 meses.
Para la validación de los dos modelos se analizó su capacidad discriminativa y su calibración. Para la discriminación, respecto a los desenlaces descritos previamente, se realizó un área bajo la curva de las características operativas del receptor (AUC-ROC), considerando clínicamente importante un valor ≥ 0,7. Para la calibración se hizo una prueba de bondad de ajuste de Hosmer Lemeshow con 10 deciles de riesgo (8 grados de libertad), en la cual se esperan valores de p altos (>0,05) que indiquen que no hay diferencias significativas entre las frecuencias de eventos observadas y las predichas por el modelo para cada grupo de riesgo. Para la comparación de las curvas AUC-ROC de los dos modelos se utilizó una prueba de igualdad de las áreas bajo la curva con el algoritmo de DeLong, DeLong y Pearson, con estadístico Chi2 y p<0,0525.
Ética
El protocolo de investigación fue aprobado por los comités de ética de las instituciones participantes y no se requirió consentimiento informado, dado que se clasifica como estudio de ''riesgo mínimo'', según el numeral b del Artículo 11, de la resolución 008430 de 1993 del Ministerio de Salud de la República de Colombia.
Resultados
Se analizaron 507 pacientes, con promedio de edad de 65 ± 11 años; el 54,4% (n = 276) tenía más de 65 años, el 55,6% (n = 282) era de sexo masculino, el 43,8% (n = 222) tenía al menos tres factores de riesgo coronario y el tipo de síndrome coronario fue angina inestable en un 52,3% (n = 265) e infarto de miocardio sin elevación del segmento ST en un 47,7% (n = 242), con distribuciones similares a las del registro GRACE (tabla 1).
Manejo intrahospitalario
Los siguientes son los resultados de las ayudas diagnósticas solicitadas al ingreso:
Troponinas: 100% de la medición fue convencional (no ultrasensible), con niveles promedio de 6,43 ± 24,5 ng/l.
Hemoglobina inicial: 13,8 ± 2 g/dl.
Hematocrito: 40,9 ± 5,6%.
Glicemia: 139 ± 96 mg/dl (383 pacientes).
Hemoglobina glicosilada: 7,3 ± 3,9% (358 pacientes).
Creatinina: 1,6 ± 5,14 mg/dl.
Depuración de creatinina promedio: 68 ± 30 ml/m. - Niveles de péptido natriurético cerebral: 681 ± 1840 pg/dl (98 pacientes).
Fracción de eyección: 54 ± 15% (rango 10-84).
El 6,5% (33 pacientes) tuvo complicaciones relacionadas con el síndrome coronario agudo, 4,5% (n = 23) de tipo eléctrico y 2% (10) mecánico. De los pacientes ingresados a tan solo el 2,2% (11 pacientes) no se les realizó angiografía coronaria y se les dio manejo médico. De los 496 pacientes estratificados en forma invasiva, el 69,8% (346 pacientes) tenía lesión en al menos una arteria coronaria mayor del 50% y de estos 34 (9,6%) recibieron solo manejo médico, el 78% intervención coronaria percutánea y el 12,4% requirió cirugía de puentes coronarios. El 6,3% (n=30) tuvo alguna complicación relacionada con la angiografía, de las cuales el 2,8% (14 pacientes) correspondió a hematoma del sitio de punción, el 1,6% (8 pacientes) a nefrotoxicidad, el 0,4% (2 pacientes) a seudoaneurisma, el 0,4% (2 pacientes) a ruptura arterial radial y el 0,2% (1 paciente) a disección de arteria radial.
En cuanto a medicamentos prescritos durante la hospitalización y al alta el 97,9% recibió un inhibidor del receptor P2Y12, el 94,5% clopidogrel (479), el 0,2% (n=1) prasugrel y el 3,2% (n=16) ticagrelor; el 97,4% (n=494) ASA, el 92,3% terapia antiagregante dual, el 16% (n=81) inhibidor de glicoproteína IIb/IIIa (tirofibán), el 92,1% (n=467) un inhibidor de la enzima convertidora de angiotensina/bloqueador de receptor II de angiotensina, el 92,9% (n=471) un betabloqueador (metoprolol o carvedilol), el 33,5% (n=170) nitratos, el 96,4% (n=489) estatinas, el 47,1% (n=239) diuréticos, el 30,2% (n=153) un calcioantagonista y el 24,5% (n=124) un antialdosterónico. Para la anticoagulación se utilizó: enoxaparina 93,3% (n=473), heparina intravenosa 30,6% (n=155) y el 4,3% (n=22) fondaparinux. Otros medicamentos menos utilizados fueron: digoxina 2,2% (n=11), inotrópicos 25,4% (129) y vasopresores 7,5% (n=38).
Desenlaces
Durante la hospitalización, de 507 pacientes ingresados se presentaron 5 reinfartos (1%), 8 intervenciones percutáneas urgentes (n=1,6%) y dos casos de enfermedad cerebrovascular (n=0,4%). Fallecieron 21 pacientes (4,1%), 3,7% (n=19) de causa cardiovascular y 0,4% (n=2) de causa no cardiovascular. Se observó algún tipo de sangrado en el 4,7% (n=24) de los casos, de los cuales 2% (n=10) fueron sangrado mayor. En el primer mes, de 500 pacientes en seguimiento se presentaron 17 casos de reinfarto, uno de enfermedad cerebrovascular y 6 de sangrado; la frecuencia de muertes acumulada fue de 27 pacientes (5,4%), 4,4% y 1% de causa cardiovascular y no cardiovascular, respectivamente. A los seis meses, de 482 pacientes que completaron el seguimiento se presentaron 34 casos de reinfarto, 3 de enfermedad cerebrovascular y 7 de sangrado; la frecuencia de muertes acumulada fue de 37 pacientes (7,6%), 6,6% y 1% de causa cardiovascular y no cardiovascular, respectivamente.
Estratificación de riesgo por las escalas TIMI y GRACE
Los 507 pacientes de la cohorte se clasificaron según la escala TIMI en riesgo bajo 2,17% (11 pacientes), intermedio 77,91% (395 pacientes) y alto 19,92% (101 pacientes); la escala GRACE clasificó los pacientes intrahospitalarios en riesgo bajo 0,2% (1 paciente), intermedio 65,29% (331 pacientes) y alto 34,52% (175 pacientes), en tanto que los extra-hospitalarios en riesgo bajo 0,2% (1 paciente), intermedio 65,48% (332 pacientes) y alto 34,32% (174 pacientes). De acuerdo con la estratificación por TIMI se revascularizó al 36% (100% percutáneo) de los pacientes de riesgo bajo, al 60% de riesgo intermedio (85% percutáneo y 15% quirúrgico) y al 76% de riesgo alto (90% percutáneo y 10% quirúrgico); por la escala GRACE se revascularizó al 0% de riesgo bajo, al 62% de riesgo intermedio (84% percutáneo y 16% quirúrgico) y al 65% de riesgo alto (90% percutáneo y 10% quirúrgico).
La distribución de mortalidad hospitalaria por cualquier causa difiere entre los diversos grupos de riesgo, con diferencias significativas tanto para el TIMI (chi2 homogeneidad 24,26 y p=0,0000, 2 gl; chi2 de tendencia 22,5 y p=0,0000, 1 gl), como para el GRACE (chi2 homogeneidad 10 y p=0,0067, 2 gl; chi2 de tendencia 9,97 y p=0,0016, 1 gl); al igual que para el GRACE extrahospitalario (chi2 homogeneidad 30,39 y p=0,0000, 2 gl; chi2 de tendencia 30,21 y p=0,0000, 1 gl (fig. 1).
Calibración y discriminación de los puntajes
Desenlace mortalidad
La calibración de los modelos fue adecuada en la población de estudio de acuerdo con el estadístico de HosmerLemeshow (tabla 2). La discriminación del desenlace aislado de muerte fue buena para ambos puntajes en el escenario intrahospitalario, al mes y a 6 meses. Sin embargo, hay diferencias significativas de los modelos al mes y a 6 meses, a favor de la escala GRACE que conserva un AUC-ROC mayor de 0,8 (figs. 2, 3,4).
HL,p | AUC-ROC | IC 95% | p* | |
TIMI intrahospitalario | 0,75 | 0,7513 | 0,64-0,85, | 0,37 |
GRACE intrahospitalario | 0,97 | 0,7972 | 0,70-0,88 | |
TIMI 1 mes | 0,86 | 0,71 | 0,59-0,82 | 0,0049 |
GRACE 1 mes | 1 | 0,85 | 0,80-0,90 | |
TIMI 6 meses | 0,43 | 0,75 | 0,65-0,82 | 0,0194 |
GRACE 6 meses | 1 | 0,84 | 0,78-0,89 |
HL,p: valor de p correspondiente a un estadístico de Hosmer-Lemeshow con 8 grados de libertad; AUC-ROC: área bajo la curva ROC.
* Prueba de igualdad de las áreas bajo la curva con el algoritmo de DeLong, DeLong y Pearson.
Desenlace mortalidad o reinfarto
La discriminación del desenlace combinado de muerte o reinfarto fue adecuada para ambas escalas en el escenario intrahospitalario, con AUC-ROC de 0,73 (IC 95% 0,64-0,82)
para la escala TIMI y de 0,76 (IC 95% 0,67-0,85) para la escala GRACE (Chi2 0,34, p=0,55), con comportamiento similar al observado con el desenlace de muerte aislado al mes y a seis meses.
Discusión
Los resultados de este estudio confirman el valor predictivo de dos puntajes utilizados rutinariamente en la evaluación médica en el servicio de urgencias de los pacientes con síndrome coronario agudo sin elevación del segmento ST, con hallazgos a favor del puntaje GRACE al mes y a los 6 meses en comparación con el TIMI. Las variables utilizadas en ambos puntajes son de fácil obtención en el contacto médico inicial, lo que permite estratificar con rapidez el riesgo de muerte y por ende la utilización de estrategia intervencionista temprana; sin embargo, el puntaje TIMI posee la ventaja de su fácil aplicación en servicios de alto volumen de pacientes.
La validación de este tipo de puntajes es necesaria puesto que en la práctica muchos de ellos no funcionan igual en poblaciones diferentes para las que fueron desarrollados, por diferencias étnicas, socio-demográficas, genéticas, culturales o idiosincráticas entre otras27. Adicionalmente, el espectro de tratamiento para el síndrome coronario agudo ha cambiado en forma importante desde el desarrollo y la publicación de los puntajes, si bien el modelo predictivo GRACE ha sido actualizado recientemente26.
En los estudios que sirvieron de base para el desarrollo del puntaje TIMI, los estudios TIMI 11B y ESSENCE, fue revascularizado el 11,1% y el 32,2% de los pacientes, respectivamente, y en el GRACE alrededor del 34% de los pacientes recibieron esta misma intervención. En nuestra cohorte se estratificaron en forma invasiva la mayoría de los pacientes, de los cuales 69,8% tenían compromiso de al menos un vaso de más, 50% en al menos un vaso, el 78% fue revascularizado en forma percutánea y el 12,4% quirúrgica. La revascularización miocárdica tiene mayor efecto en la reducción del desenlace de infarto de miocardio no fatal que en el de mortalidad, ya sea como desenlace aislado o combinado en el seguimiento (reducción del riesgo absoluto del 2-3,8% en riesgo bajo e intermedio vs. 11,1% en riesgo alto)28. Otro aspecto paradójico reportado en la literatura es la subutilización de la estrategia invasiva en pacientes estratificados en riesgo alto o intermedio29, en contravía con el efecto benéfico demostrado en este grupo de pacientes y a pesar del aumento en el número de procedimientos percutáneos a través del tiempo. En nuestra cohorte se revascularizó el 63% de los pacientes, con tendencia a mayor intervención de acuerdo con el nivel de riesgo, la mayoría en forma percutánea, de los cuales un 65% se clasificó en riesgo alto según la escala GRACE y un 76% en riesgo alto según la TIMI, en contraposición al 0% y 36% de los pacientes en riesgo bajo por GRACE y TIMI, respectivamente.
Diversos ensayos clínicos han demostrado el impacto de ciertos medicamentos en la evolución y el pronóstico de los pacientes con síndrome coronario agudo, cuya adherencia ha mejorado desde los primeros reportes del registro GRACE30 hasta nuestros días, aunque persisten diferencias regionales31. El patrón de tratamiento con medicamentos es similar al reportado en otros países respecto al uso de betabloqueador: 76% Reino Unido (UK), 88,6% Suecia (SW), 89,4% Estados Unidos (EU) y 92,9% en la cohorte (C); uso de antiagregantes plaquetarios 94,6% UK, 94,5% SW, 95,4% EU y 97,9% C; terapia antiagregante dual: 76,2% UK, 68,1% SW, 66,4% EU y 92,3% C; estatinas: 91,5% UK, 81,1% SW 84,5% EU y 96,4% C; IECA/ARA II 78,7% UK 68,8% SW, 64,5% EU y 92,1% C. Sin embargo, conviene aclarar que los datos son extraídos de registros como el MINAP (UK), RIKS-HIA (SW) y ACTION (EU) y contrastarlos con datos de una cohorte seguida en dos unidades de manejo especializado podría no reflejar la situación real de la población colombiana31.
La estratificación del riesgo es discretamente diferente de otras series como la validación española 17, en la cual se reporta riesgo bajo por GRACE en el 12,8%, intermedio en el 26,7% y alto en el 60,5%, en contraposición con la nuestra con 0,20%, 65,29% y 34,52% respectivamente, diferencias explicadas por el tipo de población incluida en hospitales de referencia. Se observó en la cohorte una tendencia clara al incremento en la frecuencia de desenlaces respecto al nivel de riesgo tanto en el puntaje TIMI como en el GRACE, similar a lo demostrado en su desarrollo y validación6.
La exactitud en la predicción se determina por medio de dos medidas estadísticas complementarias y relacionadas pero diferentes: la discriminación y la calibración. En el análisis realizado se demostró adecuada calibración de los dos modelos (Hosmer-Lemeshow >0,05) en los distintos escenarios (intrahospitalario, un mes y seis meses) y para el desenlace aislado de mortalidad y el combinado de muerte o reinfarto, lo que implica que se ajusta a la población de estudio y las probabilidades observadas son cercanas a las esperadas, corroborando los datos iniciales encontrados en la cohorte retrospectiva19. Para la discriminación se utiliza el estadístico C o el área bajo la curva ROC, que es la proporción de pares de pacientes, uno sin desenlace y otro con desenlace, en el cual el paciente con el desenlace tiene la más alta probabilidad predicha del evento. Un modelo que discrimine con exactitud los pacientes 85% de las veces tendrá un estadístico C de 0,85; predicciones aleatorias como al lanzar una moneda, tendrá un estadístico C de 0,50; se considera que estadísticos C de 0,6 o menos no tienen valor clínico, de 0,6-0,7 tienen valor limitado, de 0,7 a 0,8 tienen un valor modesto y mayores a 0,8 tienen un valor clínico importante32,33. En cuanto a la discriminación, los datos son similares a los publicados inicialmente para el TIMI en su artículo original (0,74) con estadístico C de 0,75 para mortalidad intrahospitalaria, pero con diferencias importantes para el desenlace combinado de muerte o reinfarto, con estadístico C de 0,73 en la cohorte vs. 0,63 en el TIMI. Aunque el puntaje fue desarrollado para predicción a 14 días, ha sido validado a largo plazo34 y conserva un estadístico C > de 0,7 a 30 días y 6 meses en nuestro estudio. Al puntaje GRACE se le ha reconocido su excelente capacidad de discriminación35, especialmente para el desenlace de mortalidad, corroborado por los hallazgos en la cohorte prospectiva actual, con estadístico C > 0,7 intrahospitalario y > 0,8 al mes y 6 meses.
La comparación de ambos puntajes demuestra desempeño similar en el ambiente intrahospitalario, con diferencias estadísticamente significativas al mes y a los 6 meses, explicado en parte por la forma en que se construyeron, con desenlaces en tiempos diferentes y con algunas variables también distintas para la predicción a mediano (6 meses) y largo plazo (1 y 3 años)26.
Limitaciones del estudio
Una de las principales limitaciones del estudio, común en este tipo de investigaciones, es su realización en solo dos centros especializados, hecho que podría no reflejar el comportamiento en la población general y en otros centros de menor complejidad, sin disponibilidad de laboratorio de hemodinámica o adherencia a las recomendaciones de las guías de práctica clínica actuales. Aunque el tamaño de la muestra cumple con el cálculo realizado durante el diseño para la comparación de dos escalas, hubiese sido ideal poder construir un modelo de predicción con base en una mayor población de estudio. Pese a que la tasa de pérdidas fue muy baja, la predicción a 6 meses se relaciona no solo con las variables incluidas en los modelos, sino con otros factores de riesgo con datos longitudinales y medidas repetidas, que son difíciles de modelar, al igual que con factores relacionados con la adherencia al tratamiento y el acceso a la salud de la población sujeto de estudio. Por último, es importante señalar que aunque algunas de las variables del modelo GRACE tienen un comportamiento con tendencia lineal, no lo son completamente, en especial la frecuencia cardiaca, lo que implica dificultades en su ajuste en la regresión logística. Esta limitación, no obstante, está presente desde el desarrollo y la validación del modelo original y apenas se está considerando su corrección en una reciente investigación26.