Introducción
De acuerdo con los reportes de la UNAIDS se han presentado más de 40 millones de muertes y más de 78 millones de personas infectadas por el virus de inmunodeficiencia humana (VIH) hasta 20171. En la actualidad existen más de 36, 9 millones de personas afectadas, constituyendo uno de los principales problemas de salud pública a nivel mundial2,3. El seguimiento de la efectividad de las terapias antirretrovirales de los pacientes en el tiempo se efectúa en gran medida por medio de la evaluación de la cantidad de linfocitos T CD4+ pues se trata de uno de los tipos de linfocitos mayormente afectado por el incremento del virus. La citometría de flujo es el examen que permite el conteo específico de la cantidad de CD4+ de un paciente. Sin embargo, se trata de un examen costoso y que no cuenta con la suficiente cobertura a nivel mundial para garantizar su acceso a todos los afectados, especialmente en países en vías de desarrollo. Por esta razón se hace necesario el desarrollo de métodos menos costosos para establecer los recuentos de linfocitos T CD4+4-6.
Se ha buscado generar métodos predictivos a partir de otro tipo de marcadores menos costosos utilizando para ello métodos observacionales o algoritmos computacionales como el aprendizaje de máquinas logrando resultados que sugieren que es posible obtener predicciones; sin embargo, presentan deficiencias que han dificultado su aplicabilidad clínica7-10. En este contexto, el propósito de esta investigación es desarrollar una metodología predictiva temporal en rangos de linfocitos CD4+ menores a 200 células/mm3, entre 200 a 500 células/mm3, mayores a 500 células/mm3 y dinámicas entre estos, en pacientes infectados por HIV en manejo antirretroviral a partir de los recuentos absolutos de leucocitos.
Material y método
Población
Se tomaron registros de 80 pacientes en el tiempo, provenientes de bases de datos de la empresa servicios y asesorías en infectología (SAI). Se incluyeron pacientes sin distinción de sexo mayores de 18 años que se encontraran con diagnóstico confirmado de infección por VIH en terapia antirretroviral con o sin supresión virológica; los pacientes menores de 18 años y que no tuvieran certeza del diagnóstico fueron excluidos. De la totalidad de los pacientes analizados, 9 casos fueron usados para realizar una búsqueda de patrones matemáticos debido a sus características matemáticas y los 71 restantes se usaron para desarrollar un estudio ciego. Los registros incluían el recuento de leucocitos totales, así como de linfocitos T CD4+ en las diferentes fechas registradas desde 2016 hasta 2019, supervisados por un infectólogo experto. Otras variables de la base de datos fueron excluidas de este estudio.
Procedimiento
Esta metodología es original y no se ha aplicado en trabajos previos. La metodología de este estudio se diseñó en el contexto de la física teórica, seleccionando sólo dos variables para encontrar las relaciones matemáticas esenciales: la cantidad de leucocitos (miles/mm3) y CD4+ (células/mm3). Se realizó un proceso inductivo para desarrollar la predicción, para esto se tomaron las secuencias de registros de 9 pacientes con un comportamiento representativo observado desde patrones matemáticos, en busca de establecer una evaluación predictiva de la población de linfocitos CD4+ a partir del valor de leucocitos hallado, y de la secuencia de los valores de los registros previos, para esto se establecieron 5 grupos de posibles dinámicas:
Dinámicas en las que todos los registros de las secuencias presenten valores de linfocitos CD4+>500 células/mm3.
Dinámicas en las que todos los registros de las secuencias presenten valores de linfocitos CD4+ entre [200,500]células/mm3.
Dinámicas en las que todos los registros de las secuencias presenten valores de linfocitos CD4+<200 células/mm3.
Dinámicas en las que los registros de las secuencias presenten valores de linfocitos CD4+>500 células/mm3 y también entre [200,500] células/mm3.
Dinámicas en las que algunos de los registros de las secuencias presenten valores de linfocitos CD4+<200 células/mm3 y otros presenten valores entre [200,500] células/mm3.
A partir de las 9 dinámicas prototípicas que se encuentran en estos grupos se analizaron los valores de leucocitos de los diferentes registros para cada una de dichas dinámicas, posteriormente se hallaron los parámetros matemáticos predictivos. Se desarrolló un software en C++ que aplicó estos parámetros para realizar un estudio ciego con los demás casos del estudio calculando sensibilidad y especificidad, finalmente se aplicó la teoría de la probabilidad para calcular la posibilidad de acierto de la predicción en la totalidad de los pacientes, comparando el rango predicho con la metodología con respecto al valor real, para esto se calculó dicha probabilidad en cada uno de los grupos de dinámicas que se definieron, grupos 1 al 5, mediante la siguiente ecuación 1:
Finalmente se calculó la probabilidad de acierto de la predicción para la totalidad de los pacientes mediante la ecuación 2:
Resultados
Fueron analizados 314 registros correspondientes a los 80 pacientes, de los cuales 1 paciente presentó sólo 1 registro, 12 pacientes presentaron 2 registros, 14 pacientes presentaron 3 registros, 27 pacientes presentaron 4 registros, 17 pacientes presentaron 5 registros y 9 pacientes presentaron 6 registros. Para el primer grupo se presentaron 33 pacientes con 128 registros, 13 pacientes presentaron dinámicas del segundo grupo, siendo 48 el número de registros, 1 paciente del grupo 3 con 2 registros, para las dinámicas del grupo 4 se presentaron 26 pacientes y 111 registros, mientras que 7 pacientes con dinámicas del grupo 5, presentaron 25 registros. Los valores mínimos y máximos para los recuentos de linfocitos CD4+ oscilaron entre 34 y 1360 células/mm3 mientras que los valores para los recuentos absolutos de leucocitos oscilaron entre 2.2 a 11.7 células/mm3 (tabla 1). Las dinámicas de los recuentos de CD4+ y leucocitos para algunas de las distintas configuraciones analizadas se pueden observar en las figura 1 y 2.
Resultado predictivo o metodología matemática para hallar la predicción:
Para el análisis de la dinámica de cada paciente, se toman 1 o 2 medidas del mismo paciente y se analiza si se presenta alguna de las siguientes condiciones:
Las medidas tienen población de CD4+>500 células/mm3 y leucocitos ≥ 3,7 miles/mm3.
Las medidas tienen población de CD4+ entre [200,500] células/mm3 y mínimo una de la medida de leucocitos presenta valores mayores o iguales a 4 miles/mm3.
Las medidas tienen población de CD4+ <200 células/mm3, y medidas de leucocitos entre [2 - 3,9] miles/mm3.
Una de las medidas presenta CD4+>500 células/mm3, y la otra, CD4+ entre [200,500] células/mm3.
Una de las medidas presenta CD4+ entre [200,500] células/mm3, y la otra presenta CD4+<200 células/mm3.
Posteriormente, se llevan a cabo las siguientes evaluaciones de acuerdo a la condición encontrada (a,b,c,d o e):
Si se da el caso a, en las siguientes medidas al presentarse poblaciones de leucocitos ≥ 3,7 miles/mm3, las poblaciones de CD4+ asociadas serán de >500 células/mm3.
Si se da el caso b, si en las siguientes medidas los valores de leucocitos son mayores a 4 miles/mm3, la población de CD4+ se encontrará entre [200,500] células/mm3.
Si se da el caso c, y al presentarse un valor de leucocitos entre 2 y 3 miles/mm3, en la siguiente medida la población de CD4+ será menor a 200 células/mm3.
Si se da el caso d, y los valores de leucocitos están entre [3 - 3,9] miles/mm3, y la siguiente medida de leucocitos también se encuentra en ese rango, entonces los valores de CD4+ serán mayores a 500 células/mm3 o estarán entre [200,500] células/mm3.
Si se da el caso d, y la medida que presenta un valor de CD4+ entre [200,500] células/mm3, presenta también un valor de leucocitos ≥4 miles/mm3 y la medida con valor de CD4+>500 células/mm3 presenta también un valor de leucocitos ≥ 3,7 miles/mm3, entonces si la siguiente medida presenta un valor de leucocitos≥4 miles/mm3, entonces los valores de CD4+ se encontrarán entre [200,500] células/mm3, o serán mayores a 500 células/mm3.
Si se da el caso e, y el valor de leucocitos de la medida que presenta los CD4+<200 células/mm3, es menor a 3 miles/mm3, y para la medida que presentó un valor de CD4+ entre [200,500] células/mm3 tiene un valor de leucocitos ≥4 células/mm3, si en la siguiente medida se presenta un valor de leucocitos entre [4 - 6] miles/mm3, el valor de CD4+ se encontrará entre [200,500] células/mm3, pero si el valor de leucocitos es >6 miles/mm3 puede darse que se presente un valor de CD4+<200 células/mm3.
De esta forma se realiza la predicción correspondiente a la población de linfocitos CD4+ del siguiente registro en la secuencia temporal para cada paciente; tómese como ejemplo la dinámica denominada [200,500] de la figura 1, lo cual indica su pertenencia al grupo 2. Este caso presenta 5 registros con los cuales se puede predecir uno de los registros, por ejemplo el 4. Para esto, se toman los registros del 1 al 3 y se analiza a qué grupo pertenecen, en este caso al 2 y posteriormente se observa cuál de las condiciones (a, b, c, d o e) se cumplen. En este caso, se cumple la condición b, lo cual indica que debe observarse el valor de leucocitos del cuarto registro, el cual es 5,6 miles/mm3, de manera que se cumple la evaluación No. 2. Por lo tanto, la población de linfocitos se encontrará entre 200 y 500 células/mm3, logrando así obtener una predicción sin necesidad de realizar la citometría de flujo, sino sólo con los valores del cuadro hemático.
Al hallar la probabilidad de acierto para cada grupo con la ecuación 1, se encontró que su valor varió entre 0.92 a 1 (tabla 2), y la probabilidad de acierto para todos los pacientes calculada con la ecuación 2 arrojó un valor de 0.99. Se obtuvieron resultados de sensibilidad y especificidad del 99% y se realizó un análisis con una curva ROC (figura 3).
Discusión
Este es el primer trabajo en el que se establece una predicción de rangos de linfocitos T CD4+ a partir del seguimiento en el tiempo del recuento de leucocitos totales y linfocitos T CD4+ en un mismo paciente, mediante una inducción realizada con 9 casos y confirmada con 71 casos, logrando una probabilidad de acierto global de 0.99, así como valores de sensibilidad y especificidad de 99%.
La aplicación de esta metodología diagnóstica predictiva, dada su alta precisión y simplicidad, permitiría realizar seguimientos efectivos en el tiempo de los pacientes infectados por HIV de los recuentos de linfocitos CD4+, posibilitando a los profesionales de la salud anticipar los futuros valores de esta variable, contribuyendo a mejorar la sobrevida de estos pacientes11.
Se han desarrollado múltiples trabajos que buscan establecer relaciones entre la cantidad de linfocitos totales y el conteo de CD4+ y que permitan el desarrollo de predicciones12-15. De igual forma se ha buscado utilizar la proporción CD4+/CD8 y el conteo de CD8 para predecir el número de CD4+16. Recientemente se han aplicado algoritmos para analizar gran cantidad de variables conjuntas, incluyendo J48, minería de datos y Random Forest, logrando con este último valor una sensibilidad y precisión superiores al 99%17. La presente investigación supera los estudios de tipo observacional estadístico y empírico desarrollados hasta el momento logrando establecer patrones matemáticos subyacentes a la aparente complejidad de la dinámica, tomando para ello solamente la dinámica de dos variables (leucocitos totales y CD4+) en el tiempo.
La predicción fue lograda mediante un proceso inductivo de carácter acausal siguiendo la forma de razonamiento de la física teórica y la matemática para el establecimiento de patrones subyacentes a fenómenos complejos, tales como los estudiados en la cuántica o la mecánica estadística18. Los valores de sensibilidad y especificidad corresponden a las medidas estadísticas con las que comúnmente se evalúan este tipo de medidas en el ámbito médico, mientras que el valor de probabilidad de 0.99 corresponde a un valor de tipo predictivo, del mismo modo que los valores que se establecen en otros campos de la física, como la cuántica. Este tipo de razonamiento ha permitido generar soluciones de carácter diagnóstico y predictivo en áreas de la medicina como la cardiología19,20, epidemiologia21 y oncología22.