El uso de modelos matemático-computacionales para proyectar cómo se desarrolla el comportamiento de la infección por COVID-19, qué niveles de infección puede alcanzar y en qué periodo de tiempo se va a desarrollar desempeña un papel fundamental para el control de la infección, el uso óptimo de recursos y servicios en el sector salud, y la reapertura de la vida diaria normal de los ciudadanos 1,2.
Entre los primeros modelos desarrollados para el COVID-19 se presentan modelos fenomenológicos basados en comportamientos epidémicos de otras enfermedades, los cuales pretendían obtener y valorar las proyecciones de los casos confirmados reportados a corto plazo, los cuales alcanzan un buen ajuste visual a la curva epidémica 3. Además, se han propuesto modelos de tipo SIR o SEIR 4,5, que dividen a los individuos en cuatro clases de infección: susceptibles, expuestos (pero aún no infectados), infectados y recuperados (aislados, recuperados o que ya no son infecciosos). Estos modelos han permitido conocer la dinámica de la infección y sus características. No obstante, en países suramericanos con problemas latentes de migración descontrolada pueden modificarse considerablemente las hipótesis iniciales de este tipo de modelos 6. Por otro lado, el criterio de recuperados propuesto por organizaciones internacionales de salud puede modificar altamente las estadísticas de cada país 7. En la literatura también se encuentran reportes de modelos SEIR que incorporan componentes estocásticos que, al analizar datos sobre casos de enfermedad por COVID-19 en ciertas regiones del mundo, permitieron estimar cómo la transmisión había variado en el tiempo durante enero y febrero de 2020 8.
En este artículo se propone la construcción de modelos matemáticos para estimar los casos de infección por COVID-19 en Colombia. Los supuestos generales considerados para el desarrollo de los modelos son los siguientes:
El modelo fue construido a partir de las series de tiempo de casos confirmados de infección por COVID-19 reportadas por el Ministerio de Tecnologías de la Información y las Comunicaciones de Colombia para el periodo del 6 de marzo de 2020 al 28 de mayo de 2020 9.
Los casos importados se refieren a pacientes que ingresaron a Colombia después de venir de un país con circulación de COVID-19, mientras que los casos relacionados corresponden a pacientes que tuvieron contacto con las personas infectadas en el país.
Los casos confirmados de infección por COVID-19 reportados como casos importados presentan un comportamiento sigmoidal 10.
Los casos confirmados de infección por COVID-19 reportados como casos relacionados presentan un crecimiento exponencial inicial asociado a un brote no controlado de la infección 11,12.
Los casos confirmados relacionados de infección por COVID-19 son proyectados, adicionalmente, a través de una función algebraica polinomial cúbica 13.
MÉTODOS
El trabajo se orientó al desarrollo de dos modelos matemáticos para la proyección de los casos confirmados por infección de COVID-19 en Colombia, uno para los casos confirmados importados y otro para los casos confirmados relacionados.
Modelo para los casos importados
Los modelos sigmodales fundamentan la fase de crecimiento de una curva epidémica estimada por un modelo SIR 14,15. Tal modelo sigmodal describe una población que crece meramente de manera exponencial, que luego es ajustada por la no linealidad cuadrática, lo que produce una curva de crecimiento con una concavidad (joroba) cuya inclinación se ajusta a medida que se frena la infección. En este sentido, los casos de infección por COVID 19 reportados como importados se modelaron en este trabajo con este tipo de funciones debido a que disminuyeron por medidas como el cierre de las fronteras y la operación restringida en los aeropuertos nacionales 16. Se considera la función Gompertz como estructura del modelo sigmoidal:
En la cual x ¿ representa el instante de tiempo i-esimo de la serie de tiempo considerada,^yIi corresponde al valor estimado del caso en el instante i. Los parámetros a, b y c son los obtenidos al ajustar la función de Gompertz al conjunto de datos considerados para tal ajuste.
El inicio de la infección en Colombia fue reportado el 6 de marzo de 2020 con el primer caso importado. La serie de tiempo considerada para construir el modelo de casos importados corresponde al periodo del 6 de marzo de 2020 al 28 de mayo de 2020 y se tomó de la base de datos de casos positivos de COVID-19 en Colombia, solo para los casos importados 9. Tales datos se dividieron en dos conjuntos, uno denominado conjunto de ajuste y otro, conjunto de estimación. El conjunto de ajuste consideró los casos reportados entre el 6 de marzo de 2020 y el 6 de mayo de 2020. Estos se usaron para encontrar los valores de los parámetros a, b y c de la función de Gompertz, y permitieron que la sigmoide se ajustara a los datos en ese conjunto. El proceso de ajuste se realizó usando el algoritmo simplex de Nelder-Mead, el cual implementa un método de búsqueda directa que no incorpora algún gradiente analítico complejo en sus cálculos 17.
Por su parte, el conjunto de estimación considera los casos reportados para el periodo del 7 de mayo de 2020 al 28 de mayo de 2020, y el mismo es utilizado para valorar el desempeño del modelo sigmoidal obtenido al aplicar el algoritmo simplex de Nelder-Mead. En este sentido, los valores estimados con el modelo de casos importados para el conjunto de estimación fueron comparados con los valores reales mediante la raíz del error cuadrático medio normalizado (NRMSE).
Modelo para casos relacionados
El modelo para predecir los casos confirmados relacionados por infección de COVID-19 en Colombia se realiza en dos etapas. Inicialmente, se construye un modelo polinomial a partir de la serie de datos de casos relacionados entre 11 de marzo de 2020 y el 6 de mayo de 2020. Para el 11 de marzo de 2020 se reporta el primer caso confirmado relacionado. Con base en que las funciones polinomiales cúbicas se curvan hacia arriba hasta un determinado valor de su variable independiente y en que a partir de ese valor se curvan en el sentido opuesto, se escoge un polinomio de orden tres como modelo polinomial:
En el cual p 3 ,p 2 ,p 1 ,p 0 son constantes y corresponden con los coeficientes del polinomio. Los valores constantes de los coeficientes se calculan al obtener la solución del sistema lineal de ecuaciones sobredeterminado, Xp=y, definido por
En el cual y. denota los casos confirmados relacionados y x los instantes de la serie de tiempo. La solución numérica a este problema de optimización, debido a que la matriz X no posee inversa, se realizó por medio de mínimos cuadrados mediante el uso del concepto de matriz pseudoinversa 18.
Una vez se obtuvo el modelo polinomial de tercer orden, como segunda etapa en la construcción del modelo matemático para predicción de los casos confirmados relacionados por infección de COVID-19 en Colombia, se incorporó al modelo polinomial un componente exponencial encargado tanto de establecer el crecimiento inicial de la infección asociada al brote no controlado como de ajustar la inclinación de la curva a medida que se frena la infección, de la forma
en la cual los parámetros h, j, k y l se encargaron de controlar el comportamiento de la componente exponencial.
Los valores de los parámetros h, j, k y l se obtuvieron al ajustar el modelo matemático considerando ambas componentes, polinomial y exponencial, con el algoritmo simplex de Nelder-Mead. El algoritmo ajustó solo la componente exponencial, ya que la optimización por mínimos cuadros ha permitido previamente ajustar la componente polinomial.
Desempeño de los modelos matemáticos
Los conjuntos de datos de casos confirmados importados y relacionados, denotados en cualquiera de los casos por y , y los datos obtenidos del modelo predictivo denotados por y., para toda i=1:m fueron comparados con el objetivo de valorar la confiabilidad de la estimación obtenida con el modelo numérico propuesto a través de la raíz del error cuadrático medio normalizado (NRMSE). Para el cálculo del NRMSE se consideró la siguiente formulación robusta 19:
en la cual SI es el índice de dispersión de los datos; BC, el componente de sesgo del NRMSE proporcional al valor de sesgo normalizado (NBI); y, la "media aritmética del conjunto de datos de casos confirmados; y, la inedia aritmética del conjunto de datos estimados; o y 2 , la varianza del conjunto de datos de casos confirmados, y se, el componente de dispersión del NRMSE.
RESULTADOS
Proyecciones del modelo para los casos importados
El modelo sigmodial, denotado por ŷ Li obtenido al ajustar la función de Gompertz a los casos importados reportados entre el 6 de marzo de y el 6 de mayo de 2020, mediante el método considerado por el algoritmo de Nelder-Mead, se muestra a continuación:
Los valores de los parámetros del modelo fueron reportados con un único dígito decimal. No obstante, es importante señalar que la precisión numérica utilizada para la cuantificación de los resultados mostrados en esta sección es de 14 dígitos decimales.
El modelo sigmoidal previamente presentado fue usado para predecir el comportamiento de la infección por COVID-19 en Colombia, en cuanto a casos importados, entre el 7 de mayo y el 28 de mayo de 2020.
La Figura 1 muestra la gráfica asociada con los casos confirmados importados reportados, en líneas punteadas, y además muestra, en línea sólida, los valores aproximados por el modelo sigmoidal al conjunto de ajuste, y los proyectados en el periodo de tiempo de conjunto de estimación.
La Tabla 1 muestra los resultados obtenidos al cuantificar el desempeño del modelo sigmodial como función de ajuste y como función de estimación. El desempeño se mide usando el NRMSE y la componente de sesgo del NRMSE.
Proyecciones del modelo para los casos relacionados
La primera componente del modelo para los casos relacionados se obtiene mediante el ajuste por mínimos cuadrados, que permite resolver el sistema lineal sobre-dimensionado señalado. Tal proceso genera el siguiente polinomio:
La segunda componente asociada al comportamiento exponencial supuesto para el modelo, se obtiene ajustan-do los casos confirmados relacionados en el conjunto de ajuste (datos entre 11 de marzo de 2020 y el 6 de mayo de 2020), mediante el algoritmo simplex de Nelder-Mead aplicado a la función:
Lo cual indica que el ajuste se realiza únicamente para la función ŷ 2 Ri . La componente exponencial del modelo resulta:
Por lo que el modelo para los casos confirmados relacionados por infección de coviD-19 en Colombia será
El modelo es entonces aplicado para predecir el comportamiento de la infección asociado a casos relacionados en el cojunto de estimación (datos entre el 07 de mayo de 2020 y el 28 de mayo de 2020). La gráfica asociada de los casos confirmados relacionados reportados, en líneas punteadas, y la gráfica de los valores aproximados por el modelo de casos relacionados, en línea sólida, se presentan en la Figura 2.
El desempeño del modelo para casos relacionados que se midió usando el NRMSE y la componente de sesgo del NRMSE se observa en la Tabla 2
DISCUSIÓN
Con base en los datos disponibles hasta el 28 de mayo de 2020, se puede comprobar que la cantidad de casos confirmados importados de la infección por coviD-19 utilizando el modelo sigmoidal ya ha alcanzado la fase de transición a su estado estacionario. El modelo sigmoidal analizado mediante las medidas de desempeño consideradas en el periodo de tiempo considerado para su ajuste alcanza un NMRSE del 2,7% y la componente de sesgo es valorada en 0,003; teóricamente se establece que valores cercanos a cero de estas mediadas valoran una buena aproximación.
Al analizar el modelo sigmoidal como modelo predictivo para los casos confirmados importados, se observa en la Tabla 1 que el error de predicción expresado en términos del NRMSE es del 0,5 % y que el sesgo sigue cuantificándose como positivo, con un valor de 0,003. Es importante, en este momento, señalar que valores positivos del sesgo indican que no hay sobreestimación, lo cual es bien importante para la predicción de casos confirmados importados, ya que la cantidad de ellos debe permanecer estable, debido a que la pandemia se encuentra (en ese momento) en estado estacionario para este tipo de casos, lo cual se debe a las medidas de confinamiento establecidas por el Estado colombiano.
En cuanto al modelo exponencial-polinomial desarrollado para estimar el comportamiento de los casos confirmados relacionados por infección de coviD-19 en Colombia, se observó, al usar el mismo como modelo de ajuste para el conjunto de ajuste, que el error de aproximación con base en el NRMSE es del 3,2 %; además, se verificó en este periodo de tiempo una componente de sesgo positiva de 0,003. Para estos valores, el modelo para casos confirmados relacionados por infección de COVID-19 en Colombia se desempeña como un buen modelo aproximador.
Cuando el modelo se usó para predecir los casos confirmados relacionados en el periodo de tiempo comprendido entre el 7 de mayo de 2020 y el 28 de mayo de 2020, el error de predicción alcanzado fue de 3,5 %, mientras que el sesgo es negativo pequeño (-0,01). El error de predicción fue bajo, lo cual demostró que el modelo es útil en la predicción de los casos confirmados relacionados en la pandemia. No obstante, el sesgo negativo indicó que este modelo exponencial-polinomial tiende a la sobreestimación de los casos, fundamentalmente al final del periodo de tiempo considerado en el conjunto de estimación, lo cual no es del todo perjudicial, básicamente por el comportamiento que la infección tuvo en los últimos 3 días (25 de mayo de 2020 al 28 de mayo de 2020), periodo en el cual se evidenció un crecimiento sostenido de más 1000 casos confirmados diariamente.
Para ambos modelos, a saber, modelo sigmoidal y modelo exponencial-polinomial, los valores pequeños de los indicadores de error generalizados NRMSE y BC, están asociados con rendimientos de un modelo numérico que reproduce el comportamiento de la infección por COVID-19 en Colombia, para los casos confirmados importados y los casos confirmados relaciones, respectivamente.
El modelo sigmoidal es un modelo fenomenológico que se ajusta muy bien al conjunto de datos asociados a los casos confirmados importados. En consecuencia, sus proyecciones capturan de forma confiable la dinámica de la infección por COVID-19. A partir de este modelo, se verifica que las proyecciones diarias de la cantidad de casos confirmados importados comienzan a converger, lo cual establece que la infección está bajo control para casos importados.
Por su parte, el modelo exponencial-polinomial construido para los casos confirmados relacionados muestra que la aproximación y la predicción realizadas en este trabajo estiman el valor del número acumulado de casos reportados por el Estado colombiano con un error pequeño. El crecimiento sostenido que predice el modelo de casos confirmados relacionados comprueba que las medidas de confinamiento impuestas por el Gobierno de Colombia no han sido lo suficientemente efectivas para mitigar la infección.
Como trabajo futuro, se sugiere aplicar ambos modelos de estimación para proyectar el comportamiento de la epidemia en cada uno de los departamentos colombianos. Adicionalmente, se considera importante desarrollar modelos estocásticos para predecir el comportamiento de la infección por COVID-19 en Colombia: por ejemplo, funciones de regresión construidas sobre la base de datos de entrenamiento para estimar valores numéricos usando operadores inteligentes basados en redes neurales, máquinas de soporte vectorial, aprendizaje profundo o aprendizaje extremo ♠