Introducción
La evolución del crimen organizado hacia formas más cambiantes, resilientes y peligrosas representa un desafío para las autoridades encargadas de hacer cumplir la ley y para la seguridad en general (Europol, 2021), a tal punto que, en muchas ocasiones, las organizaciones delincuenciales superan la capacidad de las mismas instituciones (Piedrahíta, 2020). Muchos grupos criminales delinquen a nivel internacional, aprovechando las fronteras porosas y las redes globales (Cabrera, 2017; Morillas, 2022), lo que dificulta la coordinación y cooperación entre las agencias de seguridad de diferentes países (Muñoz, 2020; Sansó-Rubert, 2021; Zúñiga, 2021, 2022).
La capacidad de resistencia y adaptación es otra característica clave. Los grupos criminales pueden reformular sus estructuras, cambiar sus tácticas y reorganizarse rápidamente para enfrentar las intervenciones de las fuerzas del orden y ataques de grupos rivales (Ayling, 2009; Catanese et al., 2016; Leuprecht et al., 2016; Salcedo y Garay, 2016). Además, una estructura organizativa flexible y adaptable, sumado a la ausencia de una jerarquía rígida y centralizada, puede dificultar el desmantelamiento de la organización mediante la captura de sus principales líderes (Mantilla et al., 2021; Mejía et al., 2021).
Asimismo, tienden a diversificar sus actividades ilícitas para reducir riesgos y aumentar sus oportunidades de ganancias, lo que incluye el tráfico de drogas (Europol, 2021a), armas (Ballestin y Dalby, 2022), personas (De los Mozos, 2021; UNODC, 2023), así como la participación en actividades de blanqueo de capitales (Romero, 2023), la implementación de franquicias (Ditta, 2016), la subcontratación (Badillo y Trejos, 2022), la extorsión, el cibercrimen (Valls y Gallo, 2022; Viano, 2017) y la corrupción (Rojas, 2021). Ahora, la infiltración y la corrupción de instituciones gubernamentales es una estrategia utilizada por el crimen organizado para asegurar su impunidad y proteger sus actividades ilícitas (Transparency International, 2023).
Por otra parte, los grupos criminales han demostrado una capacidad para adoptar rápidamente nuevas tecnologías y aprovecharlas en sus actividades ilegales como el uso de criptomonedas (De Hoyos, 2022), redes oscuras en internet (Valls, 2016; Valls y Gallo, 2022) y tecnologías de comunicación cifrada para eludir la detección de las autoridades (Carretero y Lezcano, 2021). En cuanto a sus métodos coercitivos, utilizan tácticas violentas para establecer su dominio. Recurren a homicidios (Fundación Paz & Reconciliación, 2022), secuestros, desplazamientos forzados (Asmann, 2018; CODHES, 2022) e intraurbanos (Duriez, 2019; Mesa Municipal de Participación Efectiva de Víctimas, 2022), confinamientos (CICR, 2022), amenazas, agresiones físicas y psicológicas (Gómez et al., 2020), entre otros actos violentos que generan miedo en la población. También, pueden hacer uso de acuerdos entre grupos ilegales para minimizar las interacciones violentas y mantener a las autoridades alejadas del territorio (Castañeda, 2023). Otro mecanismo según Blattman et al. (2020), es por medio del orden y el cobro de “impuestos”, lo que puede disuadir la entrada del Estado al mantener ordenados los vecindarios (Uribe et al., 2022).
Por otra parte, el crimen en Latinoamérica viene ocasionando desde hace varias décadas, y continúa hasta el día de hoy, múltiples problemas a la seguridad en sus territorios (Rojas, 2008; 2021; Zepeda, 2023), siendo uno de los escenarios más preocupantes el control y la gobernanza criminal por parte de grupos delincuenciales (Lessing, 2022), como el constante reclutamiento de nuevos miembros para aumentar sus acciones violentas, llegando incluso como los cárteles mexicanos a ser uno de los principales empleadores del país (Prieto-Curiel et al., 2023). De esta manera, los países de la región encuentran dificultades para enfrentar y desmantelar en su totalidad a los grupos criminales, toda vez que los actores ilegales poseen la capacidad para constituirse en una seria amenaza para los Estados, que no solo lo afecta a él mismo y a su población, sino también puede afectar y extenderse a sus vecinos locales y regionales.
En cuanto a Colombia, luego de la firma del Acuerdo de Paz entre el Gobierno Nacional y las Fuerzas Armadas Revolucionarias de Colombia (Farc-EP), el crimen organizado es uno de los desafíos de mayor intensidad por el fortalecimiento de los grupos armados ilegales que contravienen al Estado colombiano, al establecerse como autoridad en lugares donde no imperan las normas del poder central y frente a la cual cada habitante debe aceptar las normas impuestas por los criminales (CICR, 2022a), derivando en un control poblacional en las regiones donde se concentran, permitiéndoles desarrollar economías ilícitas y ejercer una violencia más selectiva y optando por un tipo de anonimato para eludir el radar de las autoridades (Defensoría del Pueblo, 2018; Fundación Paz & Reconciliación, 2021; Indepaz, 2020).
En este sentido, los grupos armados ilegales como las disidencias de las Farc-EP, pasaron de hacer presencia en 56 municipios en el 2018 a 113 en agosto del 2020. La organización guerrillera ELN pasó de estar en 99 municipios a más de 160 en el 2020, y el grupo narcoparamilitar Clan del Golfo tiene presencia en 13 departamentos y en más de 211 municipios, convirtiéndose en la estructura criminal más grande de Colombia (Fundación Paz & Reconciliación, 2020; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021).
Por último, el crimen organizado en el territorio colombiano viene mutando a grupos más localizados con fuerte arraigo local (Álvarez, 2017) y evolucionando de estructuras criminales altamente centralizadas y jerárquicas a redes criminales con alcance transnacional (Badillo y Trejos, 2022), motivados por la participación en una amplia gama de actividades ilícitas y para adaptarse a los nuevos escenarios en el posacuerdo (Turkewitz, 2022). Por tanto, investigar a los grupos armados ilegales hoy en día, requiere de un trabajo articulado desde una perspectiva de ocupación territorial y la dinámica social en el entorno criminal.
Ahora, es correcto señalar que existen factores subyacentes como la pobreza, la deserción escolar, la violencia sexual, el maltrato infantil, el fácil acceso a las armas y a las drogas, la falta de oportunidades y el desempleo que pueden motivar a los jóvenes de manera voluntaria o forzada a unirse a grupos armados ilegales. Muchos se incorporan a los grupos como una manera de escapar de una realidad de violencia y de múltiples carencias económicas en sus hogares (Charles, 2022; De Rivero, 2022, 2023; Defensoría del Pueblo, 2022; González et al., 2020). Sin embargo, debemos tener en cuenta que la relación con factores subyacentes es un tema complejo y multifacético. Aunque no se puede generalizar en todos los casos, hay ciertos patrones y dinámicas que se observan con frecuencia en contextos donde existe una vinculación entre estos factores y la participación de jóvenes en grupos armados ilegales (Comisión Interamericana de Derechos Humanos, 2023; Giraldo et al., 2015; Pérez, 2021; Torrado et al., 2021).
En relación con lo anteriormente señalado, Torrado et al. (2021) encontraron que la baja adherencia al ámbito escolar y el consumo de sustancias psicoactivas, el maltrato infantil, familiares con antecedentes delictivos, separación de los padres, consumo de drogas en el grupo familiar, ausencia del padre o la madre como cuidador primario, violencia intrafamiliar y bajo nivel educativo de los padres, bajo nivel socioeconómico, exposición a la delincuencia en el contexto social, disturbios en el barrio y exposición a la delincuencia en la escuela, son factores de riesgo que inciden en la aparición de conductas delictivas durante la adolescencia. De hecho, ante las escasas oportunidades laborales, los grupos armados ilegales aprovechan para ofrecer a los jóvenes actividades ilícitas que implica el cobro de deudas ligadas a préstamos ilegales o por extorsiones, microtráfico e incluso la participación directa o indirecta en homicidios selectivos (Aldana, 2019; Pérez, 2021).
Visto lo anterior, la minería de datos ofrece un enfoque integral y holístico que al analizar conjuntos de datos permite detectar patrones, tendencias y mapear la distribución geográfica de los grupos armados ilegales y sus delitos, estableciendo las áreas de riesgo o de mayor actividad delictiva que, unido al contexto social, cultural y económico en el que delinque un grupo criminal, permite entender las motivaciones y los medios utilizados para resistir las intervenciones de las autoridades a lo largo del tiempo. También, identificar factores subyacentes como la pobreza, el desempleo, la deserción escolar, entre otros, que pueden contribuir al surgimiento y sostenimiento de un grupo ilegal.
Dicho esto, se vienen desarrollando diferentes investigaciones que contribuyen al estudio del riesgo de ocupación criminal por parte de grupos armados ilegales. Sin embargo, están más relacionados con usar datos georreferenciados de crimen para analizar la distribución espacial y temporal de los delitos. Pongo por caso, el estudio llevado a cabo por Gutiérrez et al. (2022), para caracterizar espacialmente el delito e identificar los principales focos de inseguridad utilizando datos de homicidios, lesiones personales y hurtos a personas. Otro, dedicado a caracterizar la microextorsión en unas ciudades de Colombia (Norza y Peñalosa, 2016), y uno más, utiliza un modelo de machine learning para predecir el delito en una ciudad intermedia por medio del procesamiento de señales para grafos (Gelvez et al., 2022). También están los estudios de varias técnicas de minería de datos para el análisis, la detección y la predicción del delito (Das y Nayak, 2021; Deshmukh y Annappa, 2019; Revatthy y Satheesh, 2016; Usman et al., 2021) y para detectar patrones espaciales del crimen (Aiman et al., 2022; Arango et al., 2016; Elezaj et al., 2021; Perversi et al., 2007; Silva et al., 2019; Wang et al., 2013). También, encontramos diferentes estudios relacionados con sistemas de alerta temprana para determinar el riesgo de conflictos armados, inestabilidad, violencia, desplazamiento interno y refugiados (Bock, 2015; Colaresi et al., 2016; Rød et al., 2023; Sweijs y Teer, 2022; Wirkus y Piereder, 2019).
Por último, el método estadístico de análisis de componentes principales (ACP) y las técnicas Fuzzy c-Means (FCM) y kriging utilizadas en la investigación, vienen siendo implementados con mayor frecuencia por sus beneficios en la complejidad computacional lineal y la determinación automática del número óptimo de clústeres, en contextos próximos con el objetivo del trabajo, calcular riesgos de ocupación criminal por parte de grupos armados ilegales por medio del agrupamiento difuso. Aquí algunos ejemplos, Martínez-Lanz et al. (2021) realizan un estudio con el fin de establecer factores que potencialmente pueden facilitar la delincuencia, así como el estado de bienestar emocional que presenta la población penitenciaria. Encuentran correlaciones entre factores sociodemográficos, violencia doméstica, adicciones y síntomas depresivos. Concluyen que la variable de condiciones socioeconómicas bajas mostró un mayor grado de correlación con la actividad criminal. Ahora, Arango et al. (2016), utilizando una malla hexagonal para la ciudad de Medellín, Colombia, encontraron patrones espaciales de agrupación de la criminalidad juvenil, así como una mayor variabilidad en su dinámica criminal y territorios de injerencia más pequeños. Igualmente, Revatthy y Satheesh (2016), proponen el diseño de un algoritmo de agrupamiento para encontrar subconjuntos similares con datos numéricos y categóricos de delitos, y muestran que la técnica FCM propuesta, desempeña un papel importante en el ámbito del crimen para una mejor predicción. Por otra parte, Deshmukh y Annappa (2019), implementan un modelo espaciotemporal utilizando kriging junto con datos de ubicación, la hora y el tipo de delito; es decir, las ubicaciones de puntos críticos de delitos pasados, para predecir posibles ubicaciones de delitos futuros. Por último, Usman et al. (2021) realizan un estudio para predecir la variabilidad espacial de la tasa de criminalidad utilizando técnicas geoestadísticas; los resultados muestran que la tasa encontrada en las diferentes locaciones objeto de estudio aumentará en el largo plazo, y que el alto nivel de jóvenes desempleados como la tasa de pobreza, influyen en la tasa de criminalidad.
Por tal motivo, surge la necesidad de analizar e integrar por medio de la técnica Fuzzy c-Means y el análisis de componentes principales, dos conjuntos de datos. Por una parte, información criminal y, por otra, registros de mediciones sociales, económicas, laborales y educacionales para detectar, utilizando una clasificación del riesgo (bajo, medio, medio-alto, alto y muy alto), los municipios con diferentes niveles de riesgo de ocupación por parte de grupos armados ilegales. Además, veremos que los resultados dan forma a un sistema integrado de alerta temprana para identificar las variables criminales, sociales o económicas, entre otras, que configuran las condiciones necesarias para que grupos ilegales lleguen a establecerse en territorios donde su presencia es mínima, o no está lo suficientemente identificada y así detectar áreas geográficas en las que es más probable la presencia de estructuras criminales.
Para ello, el objetivo de la presente investigación consiste en calcular por medio de una agrupación difusa, los riesgos de ocupación criminal por parte de los grupos armados ilegales Clan del Golfo, ELN y Los Pachelly para los municipios del departamento de Antioquia, Colombia.
Para terminar, la estructura del trabajo está formada así: primero, se abordan los detalles teóricos del análisis de componentes principales y de Fuzzy c-Means. Luego, se describe la metodología CRISP-DM, la selección del departamento y los grupos armados ilegales, las estadísticas descriptivas y los algoritmos para los agrupamientos: ACP y Fuzzy c-Means. Posteriormente, se presentan los resultados obtenidos. Enseguida, se discuten los resultados. Finalmente, se exponen las conclusiones del trabajo.
Soporte teórico
La minería de datos en el contexto del riesgo de ocupación criminal por parte de grupos armados ilegales, se presenta como una herramienta útil para la identificación y comprensión de patrones que pueden indicar la presencia y actividad de organizaciones criminales (Das y Nayak, 2021; Wang et al., 2013). En un entorno cada vez más complejo y dinámico donde las amenazas criminales adoptan formas sofisticadas y se diseminan de manera constante (Giménez-Salinas y Fernández, 2016; King et al., 2020; Romero, 2023; Spiezia, 2022), la aplicación de técnicas de minería de datos se convierte en un componente importante para analizar grandes conjuntos de información y extraer conocimientos significativos. No obstante, el uso ético y responsable de esta tecnología es esencial, ya que su implementación debe equilibrar la necesidad de seguridad con la protección de la privacidad y los derechos individuales (Buenadicha et al., 2019).
Explorar vastas cantidades de datos desde fuentes diversas lleva a detectar correlaciones, tendencias y comportamientos que podrían indicar la presencia de actividades criminales. En nuestro caso, los algoritmos para el análisis de datos, Fuzzy c-Means (FCM) y análisis de componentes principales (ACP), revelan conexiones entre las variables y los riesgos de ocupación criminal. En el análisis de componentes principales, cada variable podría considerarse como una dimensión diferente. El análisis genera un nuevo conjunto de variables, llamado “componentes principales”. Cada componente es una combinación lineal de las variables originales y todos son ortogonales entre sí, por lo que no hay información redundante1 (James et al., 2021; Raschka y Mirjalili, 2019). En otras palabras, reduce la dimensionalidad de un dato multivariado a dos o tres componentes principales que pueden visualizarse gráficamente con una mínima pérdida de información (James et al., 2021; Jolliffe, 2002; Renchery Christensen, 2012).
Por otra parte, Fuzzy c-Means es una técnica de agrupación del machine learning, en la que un conjunto de datos se agrupa en N grupos y cada muestra del conjunto pertenece a cada grupo hasta cierto punto. Por ejemplo, una muestra que se encuentra cerca del centro de un grupo tendrá un alto grado de “membresía” en ese grupo2.
El agrupamiento por FCM está definido como una técnica cuyo algoritmo realiza un “agrupamiento no pesado” o soft clustering; en otras palabras, cada muestra de datos puede formar parte de cada agrupamiento en un grado de pertenencia parcial, en lugar de seguir la lógica booleana de pertenecer o no pertenece3 (Raschka y Mirjalili, 2019).
Metodología
Para la implementación computacional con Fuzzy c-Means y el análisis de componentes principales, utilizamos el método CRISP-DM (Cross-Industry Standard Process for Data Mining) un enfoque estructurado para llevar a cabo proyectos de ciencia de datos4 (IBM, 2021). El método es flexible y se puede personalizar, está compuesto por seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. Las fases dan forma a los elementos descritos en los siguientes apartados.
En cuanto a las bases de datos, se utilizaron como fuentes de información para la investigación: la Dirección de Investigación Criminal e INTERPOL (DIJIN) y el Sistema de Información Estadístico, Delincuencial, Contravencional y Operativo de la Policía Nacional de Colombia (SIEDCO); el Sistema de Información de Drogas de Colombia (SIDCO); el Instituto Nacional de Medicina Legal; el Observatorio de Tierras; el Instituto de Estudios para el Desarrollo y la Paz (Indepaz); la Unidad para la Atención y Reparación Integral a las Víctimas; la Defensoría del Pueblo; la Dirección de Sustitución de Cultivos de Uso Ilícito; el Ministerio de Defensa Nacional; la E.S.E. Hospital Carisma; la Dirección de Información Departamental-Gobernación de Antioquia; el Departamento Administrativo Nacional de Estadística (DANE) y el Ministerio de Educación Nacional.
En síntesis, los datos provienen de 17 fuentes: 14 bases de datos de entidades públicas (12 de cobertura nacional y dos de cobertura departamental). Por otro lado, las restantes tres fuentes son de centros de pensamiento dedicados al monitoreo del conflicto armado en Colombia. Además, las bases de datos de entidades públicas adoptan el marco legal de la Ley 1712 de 2014, que establece los procedimientos para garantizar el derecho de acceso a la información pública respetando los datos reservados y clasificados.
Selección del territorio y estadísticas descriptivas
El conjunto de datos seleccionados corresponde a los 125 municipios del departamento de Antioquia en Colombia. La elección del departamento está motivada por la cantidad de grupos armados ilegales que tienen presencia histórica y persiste en este territorio; según las autoridades, la Defensoría del Pueblo y centros de pensamiento, están presentes el ELN, las disidencias de las Farc-EP y el Clan del Golfo (Defensoría del Pueblo, 2018; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021). En cuanto a los grupos delictivos organizados (GDO) y grupos de delincuencia común organizados (GDCO), el “Inventario Criminal Unificado” de la Policía Metropolitana de Medellín (capital del departamento), la Fiscalía General y los organismos de inteligencia, identificaron solo en la subregión del Valle de Aburrá5 alrededor de 350 organizaciones delincuenciales (Blattman et al., 2020; Fundación Paz y Reconciliación, 2022; Matta, 2021), algunas con más de 30 años en la criminalidad (Castañeda, 2023).
Los datos recopilados corresponden al periodo 2018-20196 y están relacionados con información de homicidios, extorsión, amenazas, masacres y líderes sociales asesinados, presencia de grupo armado ilegal, desplazamiento forzado, incautaciones de estupefacientes: pasta base de coca (PBC), clorhidrato de cocaína, bazuco, marihuana prensada y heroína, incautaciones de armas de fuego, hectáreas con cultivos de coca, víctimas de violencia intrafamiliar, unidades de las Fuerzas Militares y de Policía, tasa de deserción escolar, instituciones educativas, índice de pobreza multidimensional, tasa de ocupación, tasa de desempleo, tasa de informalidad y tasa de trabajo infantil.
Se prepararon y se adaptaron las bases de datos de manera que se ajusten a los objetivos de la investigación, toda vez que los mismos corresponden a datos secundarios (Grijalva, 2019; Hox y Boeije, 2005). Para ello, realizamos una exploración inicial de los datos para entender su estructura, características y calidad. Luego, una limpieza de los datos para abordar los problemas identificados durante la exploración inicial, como la imputación de valores faltantes o la corrección de errores. En seguida, una estandarización de los datos. Por último, la selección de las variables que finalmente se almacenaron en un formato adecuado.
Se clasificaron las variables en diferentes tipos, teniendo como criterio las características de los datos; es decir, criminalidad, economías ilícitas, seguridad, consumo de sustancias psicoactivas, violencia intrafamiliar, mercado laboral, pobreza multidimensional y educación (véase Tabla 1). Para la implementación con el ACP y FCM, se construye una matriz (csv) con las 54 variables descritas en la Tabla 1, junto con los valores provenientes de las bases de datos recopiladas para cada uno de los municipios.
Selección de grupos armados ilegales (GAI)
Por una parte, tenemos a los grupos armados organizados “Clan del Golfo” y al Ejército de Liberación Nacional (ELN) y, por otra, al grupo delictivo organizado “Los Pachelly”. Con relación al primero, según la Fundación Paz & Reconciliación (2020), es la estructura armada ilegal más grande del país y tiene presencia en alrededor de 210 municipios, es decir, en el 19 % del territorio nacional. Este grupo sucesor del paramilitarismo ha mantenido el control de las zonas históricas de las Autodefensas Unidas de Colombia (AUC) y en la actualidad hace presencia con hombres armados principalmente en los departamentos de Antioquia, Córdoba y Chocó (la región del Urabá). A su vez, implementan la modalidad de subcontratación de grupos criminales locales, lo cual les ha permitido diversificar su portafolio criminal y extenderse en varios municipios ofreciendo franquicias.
Del mismo modo, el ELN está en varios municipios de las subregiones Norte, Nordeste, Bajo Cauca, Suroeste, Urabá y Occidente de Antioquia (Corporación Jurídica Libertad y Fundación Sumapaz, 2022). Más allá de esos territorios, también están en zonas de frontera como en los departamentos de Arauca, Norte de Santander y Nariño; en áreas de explotación petrolera y alrededor de los principales oleoductos del país; en torno a zonas de explotación mineroenergética, particularmente extracción de oro, como el sur de Bolívar, nordeste de Antioquia y el Chocó; asimismo, en zonas de producción cocalera como en Nariño, Cauca, Chocó, Norte de Santander y el sur de Bolívar (Defensoría del Pueblo, 2018).
El grupo delictivo Los Pachelly es considerado por las autoridades colombianas como una de las estructuras más peligrosas del departamento de Antioquia: tendría alrededor de 220 hombres con armas, ha logrado sobrevivir por más de 30 años cometiendo múltiples delitos, particularmente extorsión, tráfico de estupefacientes y homicidios, y tiene presencia reportada en varios municipios (principalmente en el municipio de Bello). Además, su alcance delincuencial7 y nexos con el Clan del Golfo y el Frente 36 de las disidencias Farc-EP, pone en constante riesgo a la población civil (Fundación Paz & Reconciliación, 2022).
Implementación computacional
Para llevar a cabo esta tarea, la minería de datos utiliza herramientas que permiten la transformación, el análisis y la visualización de datos (Makhabel et al., 2017). En este sentido, para la implementación con el análisis de componentes principales (ACP) y Fuzzy c-Means (FCM), junto con la base de datos construida, se utilizaron las herramientas y bibliotecas proporcionadas por el software R, tales como FactoMineR, factoextra, cluster, fclust, gstat, ppclust, entre otras.
La Figura 1 representa la secuencia de pasos dentro de la implementación para detectar los municipios con un potencial de riesgo de presencia de los grupos ilegales. Primero, crear los “indicadores sintéticos”8. Con la reducción de la dimensionalidad de ACP generar los componentes principales; es decir, las asociaciones en la varianza explicada para cada uno de los planos y las variables que los representan, luego creamos un indicador sintético para cada componente a partir de la distancia al punto de origen (medias generales). Por último, interpretar cada componente en función de sus características. Segundo, crear un “indicador de riesgo” para cada componente utilizando la técnica FCM y generar un semáforo de riesgo (bajo, medio, medio-alto, alto y muy alto). Tercero, realizar un kriging9 para estimar un riesgo hipotético para los municipios de acuerdo con la distancia espacial. Para ejecutar el kriging se requiere haber generado la matriz de riesgo fuzzy para cada indicador, medimos las distancias euclidianas entre los centroides, luego creamos los agrupamientos de acuerdo con los municipios con información, y finalmente se crea una estimación de riesgo para los municipios sin información basados en el agrupamiento.
Algoritmos para la clusterización6
El “análisis de componentes principales” como herramienta para la exploración de datos no supervisada, considera un conjunto de variables (x1, x2,..., xp ) sobre un grupo de objetos o individuos y con base en ellos se calcula un nuevo conjunto de variables y1, y2,..., yp, estas nuevas variables no están correlacionadas entre sí, y sus varianzas disminuyen gradualmente (Rencher y Christensen, 2012).
Cada yj, donde j = 1,2,..., p, es una combinación lineal del conjunto original x1, x2,..., xp, como se muestra en la ecuación (1):
donde a’j = (a1j, a2j ,..., apj) es un vector de constantes y x el conjunto de variables:
El objetivo es maximizar la varianza, por lo que se aumentan los coeficientes a ij . Además de eso, para mantener la ortogonalidad de la transformación se requiere que el módulo del vector a’ j sea igual a 1, es decir, (2)
Ahora, el “primer componente” se calcula eligiendo a’ 1 de tal manera que y1 obtenga la mayor varianza sujeta a la restricción de que a’ 1 a 1 =1. El “segundo componente principal” se calcula mediante un a’ 2 que hace que y 2 no esté correlacionado con y 1. Se aplica el mismo procedimiento para seleccionar y 3 hasta y p (Agudelo et al., 2016).
Por otra parte, el algoritmo de Fuzzy c-Means se basa en la distancia euclidiana (3):
entonces, al realizar el Fuzzy c-Means se pretende minimizar la función objetivo o costo10 (4):
teniendo en cuenta que (5),
donde,
un conjunto de puntos de datos, conjunto de grupos o clústeres, matriz de partición difusa, distancia euclidiana entre el centro del clúster i y el conjunto de puntos o el punto j-ésimo, grado de borrosidad (fuzziness) o exponente ponderador (m > 1), valores de pertenencia, están entre 0 y 1, centro del clúster del grupo i.
El objetivo consiste en que ese costo sea mínimo; es decir, que los puntos de datos encuentren su centro más cercano. Las condiciones necesarias para encontrar el mínimo con esta función objetivo están dadas por las ecuaciones (7) y (8):
El siguiente pseudocódigo muestra el algoritmo implementado por la técnica de agrupamiento (véase Figura 2).
Por último, la técnica kriging permite generar un riesgo hipotético por grupo armado ilegal para cada uno de los municipios, por medio de una interpolación espacial en la que los valores medidos circundantes se ponderan para generar un valor previsto de una ubicación no medida. Las ponderaciones se basan en la distancia entre los puntos medidos, las ubicaciones de predicción y la disposición espacial general entre los puntos (Krivoruchko, 2011). En otras palabras, es una técnica que permite estimar valores desconocidos en lugares específicos, dados los valores disponibles de otros lugares para dar respuesta a qué tanto la medición en un lugar se parece a la de los lugares cercanos (Miller, 2004).
El procedimiento aplicado con el kriging consiste en (a) calcular las distancias euclidianas entre un centroide y cinco vecinos; (b) crear una estimación de riesgo para los municipios sin información basados en el agrupamiento (distancia espacial); (c) distribuir el riesgo muy alto, es decir, entre municipios con una muy alta probabilidad y sus vecinos y, por consiguiente, establecer una dependencia espacial de los datos para cada uno de los municipios.
Resultados
Se dividen en tres partes. La primera, corresponde a los resultados obtenidos con la implementación del ACP (las variables mejor representadas que mayormente aportan a la variable presencia de grupo armado ilegal, y primer semáforo de riesgo con los interceptos). La segunda, a los resultados de Fuzzy c-Means (tablas, mapas y semáforos de riesgo), y la tercera, muestra los respectivos mapas de riesgo hipotético utilizando la técnica de interpolación kriging.
Variables mejor representadas ante la presencia de grupos armados ilegales
A partir del gráfico de sedimentación, seleccionamos los primeros tres componentes principales (en adelante, PC), toda vez que a partir de ese componente el gráfico no presenta pendientes fuertes.
Los resultados del ACP permitieron identificar las variables mejor representadas para los componentes (PC1, PC2 y PC3) en relación con la inclusión de la variable presencia de grupos armados ilegales, junto con el porcentaje de la variable que está recogiendo cada componente (véase Tabla 2).
La Tabla 3 presenta las correlaciones entre la variable presencia de grupos armados ilegales con los componentes principales (ejes) que tienen información de tipo social, económico, laboral, educacional y criminal. Es así que las variables mejor representadas en PC1 y PC2 están correlacionadas con la presencia de las organizaciones criminales Clan del Golfo y el ELN, de igual forma, PC1 y PC3 con el grupo delictivo Los Pachelly. Una explicación sería que las variables correlacionadas con el Clan del Golfo y el ELN corresponden a grupos ilegales que tradicional e históricamente han tenido presencia en territorios de característica rural. Caso contrario con el bloque formado por PC1 y PC3, están presentes las variables para una estructura criminal que delinque en territorios de tipología urbana o municipios intermedios.
La manifestación de las variables de características socioeconómicas, algunas de ellas: violencia intrafamiliar contra menores de edad, deserción escolar, pobreza, desempleo y consumo de sustancias psicoactivas, contribuyen a incrementar y, podríamos decir, a configurar las condiciones necesarias para los territorios con posible riesgo de ocupación o presencia de estructuras criminales. Asimismo, a partir de los interceptos de las componentes principales, se logró determinar, por ejemplo con PC1 y PC2, que la presencia en los municipios de los grupos armados ilegales: Clan del Golfo y el ELN, hacen que las variables mejor representadas en PC1: amenazas, eventos de desplazamiento, homicidios, hectáreas de coca, líderes sociales asesinados, reclutamiento ilícito de niños, niñas y adolescentes, incautación de PBC y deserción escolar en primaria se incrementen en 8.32 % y 8.82 %, respectivamente, en los territorios analizados (véase Tabla 4). Igualmente, su presencia hace que PC2: instituciones educativas, técnicas y tecnológicas11; consumo de sustancias psicoactivas y capturas a integrantes de GDCO por secuestro simple o extorsivo, aumente en 71.12 % y 67.63 %, respectivamente. Ahora, cuando la presencia corresponde al grupo ilegal Los Pachelly, los valores de las variables de PC3 aumentan en 34.82 % (véase Tabla 5).
Semáforos y mapas de riesgo
Utilizando el resultado del ACP, con las variables mejor representadas en cada componente principal ante la presencia de una organización criminal, y la implementación con la técnica FCM, obtenemos el semáforo de riesgo (bajo, medio, medio-alto, alto, muy alto) para cada una de las estructuras criminales. Conviene especificar que, para estos semáforos, no se incluyeron los municipios de Cáceres, Medellín, Tarazá y Turbo, territorios que presentan riesgos por fuera o por encima de los niveles considerados, producto de una mayor concentración de casos o denuncias para las diferentes variables. Incluirlos “invisibiliza” el riesgo en los otros municipios; es decir, los omitimos en el semáforo, dado que previamente el resultado de contribución individual muestra que son los municipios donde las variables están contribuyendo mayormente y, por consiguiente, son territorios en muy alto riesgo.
En este sentido, los semáforos para cada uno de los grupos armados ilegales contienen cada nivel de riesgo establecido por el número de casos, denuncias, tasas y eventos de las variables que aportan mayormente (fila de encabezado) a la variable presencia de un grupo criminal en los municipios. Tomemos como ejemplo el semáforo de la Tabla 6, los municipios con registros: eventos de desplazamiento forzado mayor o igual que 83.1 y menor que 512.5, es decir, (83.1, 512.5); amenazas (22.4, 143.8); tasa de deserción en primaria (3.2, 4.1); pobreza multidimensional (26.7, 33.2); homicidios (16.5, 36.4), y hectáreas de coca (25.9, 317.2), estarían en un riesgo medio-alto, con una probabilidad del 51.4 % de presencia del Clan del Golfo en sus territorios. De la misma forma para el ELN y Los Pachelly (véanse Tablas 7 y 8).
Por otra parte, la Tabla 9 muestra los pronósticos de riesgo para el Clan del Golfo en cada uno de los municipios. Además, en ese semáforo podemos identificar tipos de riesgo, como un riesgo entre dos riesgos con prevalencia para el municipio de Vegachí (subregión Nordeste); esto es, 10.5 en riesgo alto y 68.9 en riesgo muy alto. Asimismo, para el municipio de Abriaquí (subregión Occidente) exhibe un riesgo entre dos riesgos sin prevalencia, 33.3 en riesgo bajo y 32.3 en riesgo medio. Los pronósticos del semáforo adquieren un gran valor; conocer de manera anticipada los municipios del departamento, con una tendencia clara de mayor riesgo de ocupación criminal, permite priorizar e intervenir estos territorios y mantener bajo monitoreo los de menor riesgo.
Otro resultado con la técnica FCM son los mapas de riesgo, y para una mayor comprensión de la distribución del riesgo en el departamento de Antioquia, consideremos el mapa de referencia de las subregiones (véase Figura 3) para tener una panorámica del riesgo en las nueve subregiones y, por consiguiente, en sus municipios.
En los mapas de riesgo para el Clan del Golfo, observamos en la probabilidad de riesgo medio-alto, la concentración de este en los municipios ubicados en las subregiones Suroeste, Oriente y Valle de Aburrá; igual tendencia es detectada en los municipios de las subregiones Norte, Nordeste y Bajo Cauca con un riesgo alto y muy alto (véase Figura 4); es decir, son territorios con un alto riesgo de posible ocupación criminal que puede extenderse hacia otros territorios del departamento por su proximidad geográfica y por factores sociales, laborales, educacionales y criminales similares a los lugares en alto riesgo. De igual forma, podemos observar que los riesgos más altos están presentes en municipios de la subregión Bajo Cauca, Nordeste y Urabá; esta última es conocida como el territorio donde se localiza mayormente la estructura criminal. Por otra parte, Medellín (capital del departamento) es la ciudad de la subregión del Valle de Aburrá, donde persiste un riesgo muy alto de posible presencia del grupo armado ilegal Clan del Golfo.
En cuanto a la presencia del ELN y Los Pachelly, el primero genera un mayor riesgo para los municipios en el Bajo Cauca, Norte, Nordeste y Urabá (véase Figura 5).
El segundo ocasiona un alto riesgo en los territorios que comprenden las subregiones del Valle de Aburrá, Norte, Nordeste y Bajo Cauca (véase Figura 6).
Al analizar las probabilidades del semáforo de riesgo (véase Tabla 9), extraemos los municipios con mayor riesgo de una posible ocupación criminal por parte de los grupos armados ilegales seleccionados. La Tabla 10 contiene los municipios con mayor riesgo, y el criterio utilizado para incluirlos corresponde a la suma de los porcentajes de riesgo alto y riesgo muy alto que estuviera por arriba del 50 %; ello para señalar los territorios de prioridad para una atención focalizada por las autoridades civiles y las Fuerzas Armadas del Estado. No obstante, es posible con las tablas de riesgo, modificar el criterio o ampliarlo incluyendo otro nivel de riesgo para aumentar el número de municipios a priorizar e intervenir, con el objetivo de considerar territorios que pueden ser estratégicos en la dinámica de expansión criminal de los grupos ilegales.
Como se observa en la Tabla 10, el 26 % de los municipios del departamento de Antioquia tendrían un riesgo alto de posible ocupación o presencia criminal del grupo armado organizado Clan del Golfo. Por otra parte, el Ejército de Liberación Nacional (ELN) ocasionaría un riesgo en el 11% de los municipios. Lo mismo ocurre con el grupo delictivo organizado Los Pachelly, el 12 % también estaría en riesgo. Como resultado adicional, los municipios de Briceño, Segovia y Tarazá registran un alto riesgo para las tres estructuras criminales analizadas. Asimismo, los municipios de Cáceres, Caucasia, El Bagre, Medellín, Nechí, Turbo y Zaragoza tienen en común un alto riesgo de posible presencia criminal del ELN y el Clan del Golfo.
Riesgo kriging de los municipios
En cada mapa kriging se observa una dependencia espacial entre los municipios próximos. Para la influencia del riesgo por el Clan del Golfo en la subregión Bajo Cauca, vemos en la Figura 7 un comparativo entre el riesgo muy alto medido y el kriging para esa organización criminal; Cáceres y Tarazá cambian de alrededor de un cien por ciento a 56 % y 32 %, respectivamente. Ahora, si comparamos el mapa de riesgo muy alto y el mapa kriging para Los Pachelly (véanse Figuras 6 y 8), tenemos para el municipio de Tarazá una reducción del riesgo en 63 puntos porcentuales; es decir, tendría un riesgo hipotético del 35 %. En cuanto a sus cinco vecinos, el riesgo en Mutatá pasa de 3 % a 6 %, Cáceres de 24 % a 30 %, Anorí de 44 % a 18 %, Valdivia de 24 % a 26 % e Ituango de 41 % a 23 %. Por tanto, la técnica kriging revela un riesgo hipotético, que hay municipios que no tienen un riesgo tan alto y otros lo tienen, aunque no aparezcan en el mapa. El resultado es coherente y se ajusta con la forma de delinquir de los grupos ilegales. Extienden su presencia y rentas ilícitas hacia los territorios más próximos, como sucede con varios grupos delincuenciales del Valle de Aburrá que tienen como objetivo la subregión Suroeste (NoCopio, 2022; Restrepo, 2020).
Prototipo del sistema integrado de alerta temprana
Los resultados anteriores pueden ser utilizados con el propósito de dar forma a un sistema integrado de alerta temprana para detectar riesgos de posible presencia de grupos armados ilegales. El siguiente diagrama describe el flujo de cada proceso necesario para alcanzar el principal objetivo, emitir la alerta temprana (véase Figura 9). Además, muestra los detalles generales para cada pieza del sistema, en particular sus productos, semáforos de riesgo, tablas de riesgo y mapas de riesgo, todos generados con agrupaciones de tipo difuso.
Ahora bien, el objetivo de una alerta temprana es originar una respuesta proactiva y oportuna; en este sentido, un semáforo de riesgo con una aproximación de cuándo y cómo intervenir es de gran utilidad, porque permite comprender rápidamente el nivel de riesgo asociado con la actividad criminal en una determinada área geográfica, y responder de una manera más focalizada (véase descripción de los niveles de riesgo en la Tabla 11).
Discusión
El ACP muestra cómo las variables de amenazas, eventos de desplazamiento forzado, homicidios, líderes sociales asesinados, cultivos de coca, eventos de vinculación de niños, niñas y adolescentes en actividades de grupos ilegales, deserción escolar en primaria, secundaria y media, consumo de sustancias psicoactivas en los jóvenes, víctimas de violencia intrafamiliar contra hombres y mujeres menores de edad, entre otras, persisten y contribuyen en una posible ocupación criminal mediante la presencia de grupos armados ilegales en los territorios.
Al mismo tiempo, el componente cuantitativo de los resultados confirma los hallazgos presentes en la literatura alrededor de la naturaleza compleja de los fenómenos de ocupación, gobernanza criminal y su impacto en las comunidades, investigada en este trabajo y por diferentes fuentes, autores y centros de pensamiento (Blattman et al., 2020, 2022; Charles, 2022; Comisión Interamericana de Derechos Humanos, 2023; Corporación Jurídica Libertad y Fundación Sumapaz, 2022; De Rivero, 2023; Defensoría del Pueblo, 2022; Giraldo et al., 2015; Martínez-Lanz et al., 2021; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021; Restrepo, 2020; Torrado et al., 2021; Uribe et al., 2022).
Encontramos que las variables del PC1 son las que mejor representan la presencia en los territorios del ELN, el Clan del Golfo y Los Pachelly. Sin embargo, los otros componentes aportan un segundo nivel de representación que ocasiona una distinción en la presencia de los grupos ilegales, incluyen otras variables que complementan de manera particular, los factores que podrían aumentar la presencia en el territorio de determinados grupos en concordancia con su naturaleza y forma de delinquir en territorios con características rurales o urbanas.
Lo anterior permitió construir un primer semáforo de riesgo utilizando el intercepto de cada componente principal. El intercepto para el Clan del Golfo, promedio de los porcentajes de PC1 para cada municipio sin presencia del grupo ilegal, es igual a 50.61 y al cambiar su estado, tener presencia, ese promedio toma el valor de 54.82, lo que ocasiona un incremento del 8.32 % en las variables que mejor representan el PC1. Ahora, la presencia del ELN aumenta las variables en 8.82 % y, en contraste, Los Pachelly generan una reducción de -0.92 %. Los resultados confirman que las variables del PC1 están más relacionadas con la presencia de grupos armados ilegales, los eventos y las actividades ilícitas que tradicionalmente han tenido lugar en territorios de tipo rural o municipios intermedios. Por otra parte, los grupos ilegales en territorios con características más urbanas, su presencia ocasiona una reducción de las variables para estos municipios. Visto todo lo anterior, la presencia más nociva para los territorios rurales la ocasiona el ELN, seguido por el Clan del Golfo. Por último, la reducción marginal de las variables en el PC1 por parte de Los Pachelly (véase Tabla 4), estaría confirmando la capacidad de esta estructura criminal para vincularse también en las actividades ilícitas propias de los territorios rurales.
Con los resultados de Fuzzy c-Means tenemos un nuevo semáforo, tablas y mapas de riesgo. Detrás de la probabilidad de cada riesgo están las variables que mejor representan la presencia de un grupo armado ilegal. Después de realizar el análisis fuzzy inicial para cada grupo ilegal, se decidió no incluir unos municipios que concentran la mayor cantidad de registros para las variables. En este sentido, Medellín, Cáceres, Tarazá y Turbo tienen un elevado riesgo cuando se analizan sus datos con la presencia del Clan del Golfo y el ELN. Además, el municipio de Tarazá también presenta un riesgo elevado con la presencia de Los Pachelly.
Ahora, el semáforo de riesgo por cada grupo armado ilegal reveló las probabilidades para los niveles de riesgo de ocupación criminal, junto con la cantidad de eventos mínimos y máximos que deben tener las variables de mayor aporte para ocasionarlo. Asimismo, el límite superior de cada nivel es el parámetro a monitorear en los territorios. La información suministrada por el semáforo permite tener una visión completa de cuándo intervenir los municipios y cuáles variables priorizar en concordancia con el nivel de riesgo detectado.
Por otra parte, encontramos diferentes tipos de riesgo; esto es, riesgo único, riesgo entre dos riesgos con prevalencia y riesgo entre dos riesgos sin prevalencia. Una información que muestra la tendencia de los diferentes niveles de riesgo. Por ejemplo, en la tabla de riesgo para el Clan del Golfo, hallamos un riesgo único para el municipio de Caldas (subregión Valle de Aburrá), de 98.8 en riesgo medio de posible presencia en el territorio de este grupo criminal.
Por último, al analizar las probabilidades en las tablas de riesgo, el 26 % de los municipios tendrían un riesgo alto de posible presencia criminal del grupo armado organizado Clan del Golfo. En cuanto al ELN y Los Pachelly, ocasionan un riesgo en el 12 % de los municipios.
Con base en la información de los mapas de riesgo, el aporte individual de las variables analizadas muestra que los riesgos más altos se encuentran en la subregión Bajo Cauca, seguida por las subregiones Valle de Aburrá, Norte, Nordeste y Urabá. Asimismo, a medida que aumenta el riesgo, es posible identificar una agrupación de las probabilidades en cada uno de los riesgos, con una tendencia a concentrarse en las subregiones mencionadas y, por tanto, territorios que requieren constante monitoreo y ser priorizados, sin olvidar las demás subregiones. Sin embargo, esta tendencia depende de la naturaleza delincuencial del grupo armado ilegal y su capacidad para ocupar nuevos territorios.
Del mismo modo, los mapas de riesgo muy alto ajustados con la técnica de interpolación kriging, muestran la dependencia espacial entre los municipios cercanos. Tal como ocurrió con Tarazá y sus cinco vecinos para la presencia de Los Pachelly. Con la técnica, Tarazá tuvo una reducción del riesgo en 63 puntos porcentuales, quedando con un riesgo hipotético del 35 %. Ahora, los municipios vecinos como Mutatá, el riesgo pasó de 3 % a 6 %, Cáceres de 24 % a 30 %, Anorí de 44 % a 18 %, Valdivia de 24 % a 26 % e Ituango de 41 % a 23 %. Por consiguiente, la técnica kriging reveló con un riesgo hipotético una dependencia espacial del riesgo muy alto entre los municipios cercanos.
Estos resultados pueden ser integrados en un sistema de alerta temprana para detectar el riesgo de una posible presencia criminal de grupos armados ilegales. Un sistema que contribuye al campo de la prevención situacional, ya que no solo incluye variables de tipología criminal, sino que también logra integrar en sus análisis, variables sociales, económicas, educacionales y laborales que coexisten con la dinámica criminal de los grupos armados ilegales, suministrando información de gran valor para intervenir el riesgo desde diferentes frentes de acción.
El prototipo del sistema de alerta temprana permite realizar los ajustes necesarios para replicarlo en otros territorios, adicionar o eliminar variables de interés para los municipios, en concordancia con la información disponible. La estructura de la base de datos permite hacer cambios; además, el software utilizado en la programación es libre, multiplataforma y de código abierto, y muchas de las herramientas necesarias para el análisis de los datos ya vienen incorporadas.
En cuanto a las limitaciones encontradas, si bien gran parte de la información utilizada es de acceso público, para los registros de las capturas de integrantes de grupos armados ilegales por diferentes delitos, tuvimos que hacer una solicitud a la DIJIN de la Policía Nacional de Colombia, lo mismo para acceder a la información de consumo de sustancias psicoactivas por grupos de edad y sustancia, se hizo la solicitud en el Hospital Carisma en Medellín (institución especializada en conductas adictivas).
Otra limitación tiene que ver con el acceso a las bases de datos relacionadas con la pobreza multidimensional a nivel municipal, solo están disponibles para el 2018 en el Departamento Administrativo Nacional de Estadística (DANE). Ahora, el departamento de Antioquia es uno de los pocos en el país que recopila esa información, por medio de la Encuesta de Calidad de Vida que lleva a cabo cada dos años. Algo similar se presenta con los datos de mercado laboral de los municipios: acceder a esta información para otros departamentos no sería posible, toda vez que se recopila para las principales ciudades de Colombia; ello obligaría a realizar cambios en la etapa de recopilación de datos, adicionar o eliminar variables en concordancia con el contexto y la disponibilidad de la información, o generar puentes y un trabajo articulado con organismos del tercer sector y la academia para su recolección.
Conclusiones
El análisis realizado muestra que la presencia de grupos armados ilegales en los territorios se erige como una amenaza grave que socava los fundamentos de la seguridad y estabilidad en las comunidades. Un preocupante escenario que va más allá de la mera presencia de actividades delictivas cuando se configura la gobernanza criminal, lo que representa un desafío complejo que plantea riesgos sustanciales tanto para las autoridades como para los habitantes. Además, al explorar esta problemática se revelaron los factores subyacentes, los peligros que enfrentan las poblaciones, los territorios en riesgo a priorizar e intervenir, y la necesidad apremiante de adoptar enfoques cuantitativos para la toma de decisiones.
Asimismo, se identificaron los municipios con el mayor riesgo de presencia criminal ocasionado por el Clan del Golfo, el ELN y Los Pachelly. Cada municipio dispone de un semáforo de riesgo que permite tener una panorámica más amplia y pertinente de lo que está ocurriendo en los territorios. También, los mapas proporcionan una visión espacial de los riesgos, las tendencias y dinámicas similares entre municipios y grupos armados ilegales.
Por otra parte, la propuesta de un prototipo para el sistema integrado de alerta temprana cuenta con un diseño sencillo. También, el sistema dispone de una guía para los indicadores de riesgo (bajo, medio, medio-alto, alto y muy alto), que describe qué características tiene cada riesgo y cómo deberían intervenir las autoridades correspondientes. Un elemento de juicio práctico que puede ser ajustado, según los contextos de los territorios y la experticia del equipo detrás del sistema de alerta temprana.
Finalmente, una extensión lógica del trabajo podría centrarse en la incorporación de tecnologías emergentes como la inteligencia artificial, entre otras, para predecir en tiempo real riesgos y patrones de ocupación criminal por parte de grupos armados ilegales. Esta evolución tecnológica podría optimizar la capacidad del sistema para anticipar y responder a las tácticas cambiantes de los grupos criminales, ofreciendo a las autoridades un sistema más sólido y proactivo.12