La malaria es una causa importante de morbi-mortalidad en países tropicales. De acuerdo con la OMS, hubo más de 23 826 496 casos de malaria en el 2011 a nivel mundial 1. La mortalidad, actualmente estimada alrededor de 1000 000 de personas por año, ha aumentado en los años recientes 2. Por su ubicación y características climáticas, en Colombia la población está expuesta a la malaria, transmitida prevalentemente por Plasmodium falciparum y P. vivax, por lo que requiere control y vigilancia epidemiológica. Actualmente 25 millones de colombianos, presentan riesgo de infección, notificándose 79 909 casos en el año 2009 3. El índice anual de incidencia parasitaria (IPA), ha presentado una tendencia variable, pasando de 5,90 en el 2000 a 4,93 en el 2005 y 7,9 en el 2009. Las tendencias son preocupantes en Guaviare, Antioquia y Amazonas, Departamentos con el mayor IPA en el 2009 3. Pese a las estrategias implementadas para el control de la malaria, esta sigue siendo un problema de salud pública.
Estudios han evidenciado factores climáticos y biológicos que inciden en la dinámica de la epidemia 4,5, y se sugiere una relación entre los picos de las enfermedades de origen acuático con anomalías climáticas producidas por el Niño-Southern Oscillation (ENSO). Se han asociado picos de Malaria al ENSO en Pakistán 6, Venezuela 7, y Colombia 8. Las correlaciones climáticas de los modelos estadísticos tienen utilidad limitada, son difíciles de extrapolar en espacio y tiempo, y tienen dificultad en la predicción; los modelos que representan las múltiples interacciones de la dinámica de la epidemia 8,9, son complejos con ecuaciones diferenciales ordinarias no lineales y tienen la impredecibilidad del caos. Algunos modelos han probado que la educación comunitaria incide en la variación del número de infectados de malaria 10.
En el estudio de las epidemias, se han desarrollado metodologías físico-matemáticas con base en la probabilidad, la entropía o el uso de ecuaciones diferenciales de segundo orden, que han realizado predicciones anuales y semanales de la malaria, con exactitud superior al 90 % 11-13, y del dengue con efectividad superior al 91,82 % 14,15.
La probabilidad es una medida matemática adimensional que cuantifica la posible ocurrencia futura de un evento 16,17. En este trabajo se tomó el modelo probabilístico desarrollado por el creador de la cibernética 18 y representaciones de caminatas al azar a partir de este modelo, que representan una analogía con la representación del número de infectados de malaria anualmente, mediante la unión de rectas.
La caminata al azar probabilística definida por Norbert Wiener caracteriza un movimiento probabilístico acotando su dinámica y encontrando valores que predicen dentro de ciertos rangos la evolución de su dinámica 19; en este trabajo, la caminata al azar caracteriza la evolución de la dinámica anual del número de infectados por malaria en Colombia.
La desviación media cuadrática cuantifica la mecánica de la caminata y determina si hay equiprobabilidad de los eventos de un espacio muestral o un cargamiento de la probabilidad para eventos específicos, al ser comparada con el valor esperado 17.
El objetivo de este trabajo es predecir la dinámica de la malaria en Colombia, mediante el estudio acausal del fenómeno y desde cuantificaciones probabilísticas de su representación geométrica. Con rectas, medidas de longitud y la ecuación de la longitud probabilística, se predecirá temporalmente el número de casos para 2007.
MÉTODOS
Definiciones
Longitud: hace referencia a la longitud de una variación anual, definida como L, así:
Las coordenadas cartesianas del valor del año inicial son y , mientras que y son las coordenadas cartesianas del año siguiente. De acuerdo con el modelo de caminata al azar, las coordenadas en son siempre las mismas, pues el movimiento es estudiado en el eje . Esto significa que no hay variación en el eje , por lo cual su valor es siempre igual a cero, mientras que el número de infectados reportados para cada año es representado en el eje .
Probabilidad de la longitud L: corresponde a la división de la longitud de una variación anual entre el total de longitudes, esto es, la suma de todas las longitudes de variación anual del espacio muestral en rangos de tiempo acotados y consecutivos:
Probabilidad de casos infectados: es el número de casos para cada año estudiado dividido entre el total de casos, que corresponde a la suma total del número de infectados de malaria que conforman el espacio muestral:
Aclaración: La cuantificación de la probabilidad para las longitudes anuales cuantifica variaciones geométricas año a año y la probabilidad para el número de casos cuantifica el número de casos anuales respecto a la totalidad. La primera fue usada para predecir en el contexto de las ecuaciones de segundo grado, y la segunda para estudiar el cargamiento de la probabilidad de la dinámica de la epidemia.
Desviación media cuadrática del número de casos: se utiliza la fórmula de la desviación equiprobable de la caminata al azar para establecer si la dinámica del número de casos es equiprobable o no; esta medida se empleó a partir de la definición de Feynmann para la caminata al azar probabilística, usada para cuantificar el cargamiento de un espacio muestral y no como una medida de dispersión alrededor de la media (17):
es el número de eventos del espacio muestral o el total de casos.
Cálculo de probabilidades de las distancias anuales
Se construyó una gráfica del número de casos de infectados de malaria en Colombia (Figura 1), con los datos del Instituto Nacional de Salud de Colombia (INS) del Sistema de Vigilancia -SIVIGILA- y se calcularon las distancias de las variaciones anuales (ecuación 1), para construir el espacio muestral total de la dinámica de la malaria, donde cada variación anual es definida como un evento. Se calcularon los valores de probabilidad para cada longitud correspondiente a cada variación anual (ecuación 2) y la proporción de cada variación anual respecto a la distancia mínima encontrada para la variación anual en la gráfica, estudiando las variaciones a partir de estos cálculos para todos los años.
Cálculo de probabilidades del número de infectados anuales y desviación media cuadrática
Se determinó el espacio muestral que cuantifica el número de infectados anuales durante el período 1960-2006, calculando los valores de probabilidad de infección anual, (ecuación 3), para determinar los valores de la desviación media cuadrática para cada probabilidad, (ecuación 4), y finalmente calcular las diferencias entre los valores de probabilidad (valor esperado) y su desviación, con el fin de estudiar si las probabilidades son equiprobables o no en este rango.
Posteriormente, se determinaron tres espacios muestrales que cuantifican el número de infectados anuales para los períodos 1960-1972, 1973-1990 y 1991-2006, calculando los valores de probabilidad de infección anual, (ecuación 3), la desviación media cuadrática para cada probabilidad, (ecuación 4), y las diferencias entre los valores de probabilidad y su desviación. Estos rangos temporales fueron escogidos porque presentan valores en el número de infectados bien diferenciados en la dinámica de la epidemia.
Cálculo de la probabilidad de aumentos y disminuciones anuales
Se determinaron dos nuevos espacios muestrales compuestos por dos eventos: aumento y disminución del número de casos con respecto al año anterior; se evaluaron los aumentos y las disminuciones de la dinámica como si fueran las dos caras de una moneda, calculando la frecuencia y probabilidad de presentación de aumentos o disminuciones en años consecutivos para los períodos 1960-1986 y 1987-2006 respectivamente. Estos períodos se escogieron para evaluar si hay diferencias en los aumentos y disminuciones en años consecutivos y cuantificar las variaciones con la probabilidad.
Predicción del número de casos de malaria para el 2007
Se determinó un espacio muestral que cuantifica los últimos tres años consecutivos, para delimitar la dinámica y saber el futuro valor cuantitativo de su variación; para esto, se definió el promedio aritmético de estos tres años como el valor de la probabilidad para la longitud del año 2007, y se reemplazó este valor en la ecuación 2, que se desarrolló hasta una ecuación cuadrática en función de Y1, (ecuación 5), para obtener como solución de la ecuación dos valores que corresponden a la predicción para el año 2007.
es el promedio aritmético de la probabilidad para los tres últimos años, y la sumatoria de las distancias para estos años. La representación de los datos del número de casos como una caminata al azar, permite su estudio como un fenómeno probabilista, y una predicción de la longitud del segmento correspondiente al año estudiado.
Con la predicción de aumentos y disminuciones consecutivos, se seleccionó uno de los dos valores obtenidos para determinar un valor de predicción para el 2007.
Evaluación de la predicción
Para evaluar la objetividad de la predicción, se comparó porcentualmente el valor específico, escogido a partir de la predicción de aumentos y disminuciones con el número total de casos registrados en el Instituto Nacional de Salud de Colombia para el 2007, considerando válida la predicción si esta se encuentra primero, encima del 90 % y luego del 95 %; si se encuentra arriba del 95% se considera más acertada.
RESULTADOS
Las distancias de las variaciones anuales calculadas para los casos anuales de infectados, variaron en rangos de 0-83000, siendo el valor mínimo diferente de cero de este rango, correspondiente al patrón de comparación para la gráfica (Tabla 1). La probabilidad de la longitud de la variación anual para los casos anuales de infectados, varió en rangos de 0-0,095. Los valores de probabilidad de las longitudes no fueron equiprobables en todo el período.
D: Valores de Distancia, D/M: Proporción respecto al patrón de comparación, P: Probabilidad para cada longitud correspondiente a cada variación anual del número total de infectados en Colombia, 1960-2006
La probabilidad para el número de casos anuales reportados para 1960-2006 varió en un rango de 0,002-0,049, la desviación media cuadrática para estos valores varió en un rango de 0,018-0,13; las diferencias entre estos últimos y el valor de probabilidad (valor esperado) variaron en un rango de 0,013 a 0,12 (Tabla 2).
P: Valores de probabilidad del Número de Infectados Anuales. (+Dmc ), (-Dmc): Desviación media cuadrática. (+Dmc -P), (-Dmc -P): Diferencia entre estos, para 1960-2006
La probabilidad para el número de casos anuales cuantificados en tres períodos diferentes 1960-1972, 1973- 1990 y 1991-2006 variaron en un rango de 0,019- 0,13, la desviación media cuadrática de estos valores varió en un rango de 0,018-0,131; las diferencias entre estos últimos y el valor de probabilidad variaron en un rango de -0,0009 a 0,0009 (Tabla 3).
P: Valores de probabilidad respecto a los tres espacios muestrales definidos. (+Dmc ), (-Dmc): Desviación media cuadrática (+Dmc -P), (-Dmc -P): Diferencia entre estos.
Las diferencias entre los valores de probabilidad y la desviación media cuadrática muestran que el comportamiento de la malaria tiende más a la equiprobabilidad en los rangos de tiempo seleccionados con respecto al período total (1960-2006) y que la menor diferencia entre el valor esperado y la desviación, es decir la zona con mayor cargamiento en la probabilidad, se encuentra en el período 1991-2006, pues el factor de la ecuación 4 con el que se calcula la desviación respecto al valor esperado, se hace más pequeño en este rango de tiempo y es inversamente proporcional a la suma del número total de infectados (N), que es mayor para ése período.
Respecto a los aumentos y disminuciones, para el período de 1960 a 1986, 18 de estos años presentaron comportamiento de aumento respecto al año anterior, 7 de disminución y 1 año a un valor igual; para este período, el número de aumentos consecutivos varió entre uno y cinco años y el número de disminuciones consecutivas entre uno y dos años; para los rangos de años consecutivos las probabilidades variaron entre 0-0,23, y variaciones mayores a cinco años consecutivos tenían un valor de cero (Tabla 4). Para el período de 1987 a 2006, 8 de estos años presentaron comportamiento de aumento respecto al año anterior, 10 de disminución y 2 años a un valor igual; para este período el número de aumentos y disminuciones consecutivas variaron entre uno y dos años; para los rangos de años consecutivos las probabilidades variaron entre 0-0,40, y variaciones mayores a dos años consecutivos tanto en aumentos como en disminuciones tenían un valor de probabilidad igual a cero (Tabla 5).
El valor promedio de la probabilidad de la variación anual para 2004-2006 es 0,33, encontrándose que los dos valores predichos del número de casos para el 2007 fueron 81 003 y 104 098 (Tabla 1).
Las variaciones para los años 2005 y 2006 presentan disminución respecto al año anterior, lo que predice partiendo de los resultados anteriores que el valor para el año 2007 aumentará respecto al año anterior, pues la probabilidad de tres variaciones consecutivas iguales es cero, por lo tanto el valor predicho para el año 2007 fue 104 098 infectados (Tabla 2), valor corroborado con los datos del INS, donde en la semana epidemiológica 51, correspondiente a la semana del 16 al 22 de diciembre del año 2007 se habían reportado 108 886 infectados, encontrando que el valor predicho corresponde al 95,60 % respecto al valor real. Este corresponde al acumulado para la fecha mencionada.
DISCUSIÓN
Este es el primer trabajo en el cual, con base en la caminata al azar probabilística, se predice el número total de casos de infectados de malaria en Colombia, al margen de relaciones causales, evidenciando una auto-organización del fenómeno, lo que contribuye a su estudio desde una perspectiva sencilla, a partir de la longitud probabilística y de su desarrollo algebraico en una ecuación de segundo grado, que cuantifica la posibilidad futura del número de infectados para el 2007, aplicable a sistemas de vigilancia epidemiológica, que permitiría tomar decisiones en salud pública.
Se han desarrollado varios modelos matemáticos que tienen en cuenta múltiples factores, y presentan limitaciones, impidiendo una generalización metodológica 5-9. En contraposición, se han desarrollado investigaciones que predicen la dinámica de las epidemias desde una perspectiva acausal; tal es el caso de una metodología que emplea medidas de probabilidad, entropía y relaciones S/k y predice espacio temporalmente la aparición de brotes de malaria en 820 municipios colombianos en tres semanas; con esta metodología se superan las predicciones temporales basadas en canales epidemiológicos, que requieren información previa de 5 a 7 años, logrando un nivel de predicción del 99,86% 11. También, se desarrollaron dos predicciones de la dinámica anual de malaria en Colombia, una con base en el análisis probabilista de rangos de infectados con una exactitud para el año 2007 del 100 % 12 y otra basada en la ecuación diferencial de segundo orden para la aceleración, aplicada a la trayectoria de la epidemia establecida para rangos de infectados, prediciendo que la totalidad de trayectorias posibles de la epidemia se confinan en atractores circulares concéntricos, prediciendo los rangos de valores de las trayectorias para 2005, 2006 y 2007 13. El presente trabajo plantea una metodología probabilística acausal de predicción simple, buscando órdenes matemáticos y físicos subyacentes a la epidemia, lo que permite realizar una predicción acausal simple en un rango que posteriormente es igualado a un punto dentro del mismo y que corresponde a un número específico de infectados, que se comparó con el valor real.
Se desarrollaron medidas análogas a las realizadas en el presente trabajo, para la predicción de dengue en Colombia, logrando un porcentaje de efectividad del 90,4 % 20, también, para la predicción del índice de obesidad en Estados Unidos, Finlandia, Australia e Inglaterra para 1997, logrando porcentajes de efectividad iguales o superiores al 97,85 % 21. Se establecieron simulaciones predictivas de la obesidad infantil y juvenil en México y Colombia para el 2015 21. Los resultados obtenidos en dichas investigaciones y el alto porcentaje de predicción de este trabajo, evidencian que estas metodologías son útiles en epidemias, tanto infecciosas como no infecciosas.
La evaluación de los incrementos y disminuciones comparados consecutivamente cada año y divididos en dos períodos evidenciaron el comportamiento probabilístico y “determinista” de la malaria, pues para 1987-2006 no se encuentra un rango de tres o más años consecutivos con el mismo comportamiento; la probabilidad de que la epidemia aumente o disminuya durante tres años consecutivos es cero, lo que sustenta las relaciones predictivas consecutivas, y predice que para el año 2007 el número de casos aumentará pues para el 2005 y el 2006 disminuyó (Figura 1 y 2)
Así mismo, el cálculo de la desviación media cuadrática evidenció que la dinámica de la epidemia posee una “inercia probabilística” o que existe un cargamiento de las probabilidades, es decir, que el número de infectados anuales se mantiene más o menos constante durante períodos de tiempo consecutivos, lo que sustenta la evaluación de la malaria a partir de los últimos años, pues estos valores se encuentran en un rango acotado y ninguno se desvía considerablemente de su valor esperado.
Una caminata al azar, tendría una trayectoria impredecible; pero este estudio, en un tema tan aparentemente complejo, encontró dinámicas simples y predecibles en rangos acotados. Desde el punto de vista teórico, cabe resaltar que se obvió el tiempo, igualándolo a cero y estudiando solamente las variaciones en el eje Y, pues la longitud probabilística realiza la predicción temporal.
Inicialmente, se predice un rango, obtenido al desarrollar la ecuación de la longitud probabilística como una función del número de infectados que corresponde a la predicción; las probabilidades de aumentos y disminuciones consecutivas son evaluadas para predecir sistemáticamente y sin establecer hipótesis de trabajo 22, un valor específico de este rango. Así, el rango de predicción no es un intervalo de confianza estadístico, pues no existe un parámetro poblacional desconocido 22, sino una distribución de probabilidad en el contexto de una demostración algebraica, donde está contenido el punto que determina la predicción para el año 2007.
Se han aplicado metodologías físico-matemáticas en la cardiología 23-27, la inmunología, la biología molecular (28, 29), el comportamiento neoplásico de células de cérvix 30 y el número de linfocitos TCD4 en pacientes con VIH/SIDA 31,que permiten hallar soluciones a nivel clínico, experimental y en salud pública.