SciELO - Scientific Electronic Library Online

 
vol.66 issue2Edu-communication for the prevention of delinquency and school violence in adolescentsMotivation towards learning, association with depression, bullying and psychoactive substances in school-aged adolescents author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Criminalidad

Print version ISSN 1794-3108

Rev. Crim. vol.66 no.2 Bogotá May/Aug. 2024  Epub Sep 23, 2024

https://doi.org/10.47741/17943108.610 

ESTUDIOS ESTADÍSTICOS

La minería de datos con agrupamiento difuso para el cálculo del riesgo de ocupación criminal por parte de grupos armados ilegales

Fuzzy clustering data mining for calculating the risk of criminal occupation by illegal armed groups

Mineração de dados de agrupamento difuso para calcular o risco de ocupação criminosa por grupos armados ilegais

Leonardo Granados Garzón1  * 
http://orcid.org/0009-0002-2979-0862

1Doctor en Criminología Universidad de Granada Granada, España, Email: ogranados@correo.ugr.es


Resumen

La minería de datos en el contexto del riesgo de ocupación criminal, se centra en la aplicación de técnicas analíticas para identificar patrones, tendencias y correlaciones que puedan indicar la presencia de grupos armados ilegales en los territorios. El estudio presenta el cálculo de los riesgos de ocupación por parte de los grupos ilegales Clan del Golfo, Ejército de Liberación Nacional (ELN) y Los Pachelly en los municipios del departamento de Antioquia en Colombia. Para ello, las bases de datos utilizadas corresponden a fuentes abiertas como el Sistema de Información Estadístico, Delincuencial, Contravencional y Operativo de la Policía Nacional (SIEDCO), la Dirección de Investigación Criminal e INTERPOL (DIJIN), el Sistema de Información de Drogas de Colombia (SIDCO), el Ministerio de Defensa, el Instituto Nacional de Medicina Legal, el Observatorio de Tierras, la Unidad para la Atención y Reparación Integral a las Víctimas, la Defensoría del Pueblo, la Dirección de Sustitución de Cultivos de Uso Ilícito, la E.S.E. Hospital Carisma, la Dirección de Información Departamental-Gobernación de Antioquia, el Departamento Administrativo Nacional de Estadística (DANE) y el Ministerio de Educación Nacional. Asimismo, utilizamos la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) y se combinó el análisis de componentes principales (ACP) y la técnica Fuzzy c-Means (FCM) para identificar en los datos las variables sociales, económicas, laborales, educacionales y criminales que mayormente aportan al riesgo de presencia de las estructuras criminales en los municipios, lo que permitió clasificarlos en riesgo bajo, riesgo medio, riesgo medio-alto, riesgo alto y riesgo muy alto. Los resultados muestran que el 26 % de los municipios tendrían un riesgo alto para el Clan del Golfo, el 11 % con el ELN y otro 12 % para Los Pachelly. Además, se encontró que los resultados pueden utilizarse en un prototipo de un sistema integrado de alerta temprana para detectar riesgos de ocupación criminal.

Palabras clave: Sistema de alerta temprana; delincuencia organizada; factores sociales; factores económicos; medición de la criminalidad

Abstract

Data mining in the context of criminal occupation risk focuses on the application of analytical techniques to identify patterns, trends and correlations that may indicate the presence of illegal armed groups in the territories. The study presents the calculation of the risks of occupation by the illegal groups Clan del Golfo, Ejército de Liberación Nacional (ELN) and Los Pachelly in the municipalities of the department of Antioquia in Colombia. For this purpose, the databases used correspond to open sources such as the Statistical, Criminal, Contraventional and Operational Information System of the National Police (SIEDCO), the Directorate of Criminal Investigation and INTERPOL (DIJIN), the Colombian Drug Information System (SIDCO), the Ministry of Defence, the National Institute of Legal Medicine, the Land Observatory, the Unit for the Attention and Integral Reparation of Victims, the Ombudsman’s Office, the Directorate of Substitution of Illicitly Used Crops, the E. S.E. Hospital Carisma, the Departmental Information Directorate-Government of Antioquia, the National Administrative Department of Statistics (DANE) and the Ministry of National Education. We also used the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology and combined principal component analysis (PCA) and the Fuzzy c-Means (FCM) technique to identify in the data the social, economic, labour, educational and criminal variables that most contribute to the risk of the presence of criminal structures in the municipalities, which allowed us to classify them as low risk, medium risk, medium-high risk, high risk and very high risk. The results show that 26% of the municipalities would have a high risk for the Clan del Golfo, 11% for the ELN and another 12% for Los Pachelly. Furthermore, it was found that the results can be used in a prototype of an integrated early warning system to detect risks of criminal occupation.

Keywords: Early warning system; organised crime; social factors; economic factors; crime measurement

Resumo

A mineração de dados no contexto do risco de ocupação criminosa concentra-se na aplicação de técnicas analíticas para identificar padrões, tendências e correlações que possam indicar a presença de grupos armados ilegais nos territórios. O estudo apresenta o cálculo dos riscos de ocupação pelos grupos ilegais Clan del Golfo, Ejército de Liberación Nacional (ELN) e Los Pachelly nos municípios do departamento de Antioquia, na Colômbia. Para isso, os bancos de dados utilizados correspondem a fontes abertas, como o Sistema de Informação Estatística, Criminosa, Contravencional e Operacional da Polícia Nacional, a Direção de Investigação Criminosa e Interpol, o Sistema de Informação sobre Drogas da Colômbia, o Ministério da Defesa, o Instituto Nacional de Medicina Legal, o Observatório da Terra, a Unidade de Atenção e Reparação Integral de Vítimas, a Defensoria do Povo, a Direção de Substituição de Cultivos de Uso Ilícito, o E.S.E. Hospital Carisma, o Centro de Estudos de Drogas e o Centro de Estudos de Drogas da Colômbia. S.E. Hospital Carisma, a Direção de Informação Estadual-Governo de Antioquia, o Departamento Administrativo Nacional de Estatística e o Ministério de Educação Nacional. També musamos a metodologia Cross Industry Standard Process for Data Mining e combinamos a análise de componentes principais e a técnica Fuzzy c-Means (FCM) para identificar nos dados as variáveis sociais, econômicas, trabalhistas, educacionais e criminais que mais contribuem para o risco de presença de estruturas criminosas nos municípios, o que permitiu classificá-los como de baixo risco, médio risco, médio-alto risco, alto risco e muito alto risco. Os resultados mostram que 26 % dos municípios estão em alto risco para o Clã do Golfo, 11 % para o ELN e outros 12 % para Los Pachelly. Além disso, verificou-se que os resultados podem ser usados em um protótipo de um sistema integrado de alerta precoce para detectar riscos de ocupação criminosa.

Palavras-chave: Sistema de alerta antecipado; crime organizado; fatores sociais; fatores econômicos; medição da criminalidade

Introducción

La evolución del crimen organizado hacia formas más cambiantes, resilientes y peligrosas representa un desafío para las autoridades encargadas de hacer cumplir la ley y para la seguridad en general (Europol, 2021), a tal punto que, en muchas ocasiones, las organizaciones delincuenciales superan la capacidad de las mismas instituciones (Piedrahíta, 2020). Muchos grupos criminales delinquen a nivel internacional, aprovechando las fronteras porosas y las redes globales (Cabrera, 2017; Morillas, 2022), lo que dificulta la coordinación y cooperación entre las agencias de seguridad de diferentes países (Muñoz, 2020; Sansó-Rubert, 2021; Zúñiga, 2021, 2022).

La capacidad de resistencia y adaptación es otra característica clave. Los grupos criminales pueden reformular sus estructuras, cambiar sus tácticas y reorganizarse rápidamente para enfrentar las intervenciones de las fuerzas del orden y ataques de grupos rivales (Ayling, 2009; Catanese et al., 2016; Leuprecht et al., 2016; Salcedo y Garay, 2016). Además, una estructura organizativa flexible y adaptable, sumado a la ausencia de una jerarquía rígida y centralizada, puede dificultar el desmantelamiento de la organización mediante la captura de sus principales líderes (Mantilla et al., 2021; Mejía et al., 2021).

Asimismo, tienden a diversificar sus actividades ilícitas para reducir riesgos y aumentar sus oportunidades de ganancias, lo que incluye el tráfico de drogas (Europol, 2021a), armas (Ballestin y Dalby, 2022), personas (De los Mozos, 2021; UNODC, 2023), así como la participación en actividades de blanqueo de capitales (Romero, 2023), la implementación de franquicias (Ditta, 2016), la subcontratación (Badillo y Trejos, 2022), la extorsión, el cibercrimen (Valls y Gallo, 2022; Viano, 2017) y la corrupción (Rojas, 2021). Ahora, la infiltración y la corrupción de instituciones gubernamentales es una estrategia utilizada por el crimen organizado para asegurar su impunidad y proteger sus actividades ilícitas (Transparency International, 2023).

Por otra parte, los grupos criminales han demostrado una capacidad para adoptar rápidamente nuevas tecnologías y aprovecharlas en sus actividades ilegales como el uso de criptomonedas (De Hoyos, 2022), redes oscuras en internet (Valls, 2016; Valls y Gallo, 2022) y tecnologías de comunicación cifrada para eludir la detección de las autoridades (Carretero y Lezcano, 2021). En cuanto a sus métodos coercitivos, utilizan tácticas violentas para establecer su dominio. Recurren a homicidios (Fundación Paz & Reconciliación, 2022), secuestros, desplazamientos forzados (Asmann, 2018; CODHES, 2022) e intraurbanos (Duriez, 2019; Mesa Municipal de Participación Efectiva de Víctimas, 2022), confinamientos (CICR, 2022), amenazas, agresiones físicas y psicológicas (Gómez et al., 2020), entre otros actos violentos que generan miedo en la población. También, pueden hacer uso de acuerdos entre grupos ilegales para minimizar las interacciones violentas y mantener a las autoridades alejadas del territorio (Castañeda, 2023). Otro mecanismo según Blattman et al. (2020), es por medio del orden y el cobro de “impuestos”, lo que puede disuadir la entrada del Estado al mantener ordenados los vecindarios (Uribe et al., 2022).

Por otra parte, el crimen en Latinoamérica viene ocasionando desde hace varias décadas, y continúa hasta el día de hoy, múltiples problemas a la seguridad en sus territorios (Rojas, 2008; 2021; Zepeda, 2023), siendo uno de los escenarios más preocupantes el control y la gobernanza criminal por parte de grupos delincuenciales (Lessing, 2022), como el constante reclutamiento de nuevos miembros para aumentar sus acciones violentas, llegando incluso como los cárteles mexicanos a ser uno de los principales empleadores del país (Prieto-Curiel et al., 2023). De esta manera, los países de la región encuentran dificultades para enfrentar y desmantelar en su totalidad a los grupos criminales, toda vez que los actores ilegales poseen la capacidad para constituirse en una seria amenaza para los Estados, que no solo lo afecta a él mismo y a su población, sino también puede afectar y extenderse a sus vecinos locales y regionales.

En cuanto a Colombia, luego de la firma del Acuerdo de Paz entre el Gobierno Nacional y las Fuerzas Armadas Revolucionarias de Colombia (Farc-EP), el crimen organizado es uno de los desafíos de mayor intensidad por el fortalecimiento de los grupos armados ilegales que contravienen al Estado colombiano, al establecerse como autoridad en lugares donde no imperan las normas del poder central y frente a la cual cada habitante debe aceptar las normas impuestas por los criminales (CICR, 2022a), derivando en un control poblacional en las regiones donde se concentran, permitiéndoles desarrollar economías ilícitas y ejercer una violencia más selectiva y optando por un tipo de anonimato para eludir el radar de las autoridades (Defensoría del Pueblo, 2018; Fundación Paz & Reconciliación, 2021; Indepaz, 2020).

En este sentido, los grupos armados ilegales como las disidencias de las Farc-EP, pasaron de hacer presencia en 56 municipios en el 2018 a 113 en agosto del 2020. La organización guerrillera ELN pasó de estar en 99 municipios a más de 160 en el 2020, y el grupo narcoparamilitar Clan del Golfo tiene presencia en 13 departamentos y en más de 211 municipios, convirtiéndose en la estructura criminal más grande de Colombia (Fundación Paz & Reconciliación, 2020; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021).

Por último, el crimen organizado en el territorio colombiano viene mutando a grupos más localizados con fuerte arraigo local (Álvarez, 2017) y evolucionando de estructuras criminales altamente centralizadas y jerárquicas a redes criminales con alcance transnacional (Badillo y Trejos, 2022), motivados por la participación en una amplia gama de actividades ilícitas y para adaptarse a los nuevos escenarios en el posacuerdo (Turkewitz, 2022). Por tanto, investigar a los grupos armados ilegales hoy en día, requiere de un trabajo articulado desde una perspectiva de ocupación territorial y la dinámica social en el entorno criminal.

Ahora, es correcto señalar que existen factores subyacentes como la pobreza, la deserción escolar, la violencia sexual, el maltrato infantil, el fácil acceso a las armas y a las drogas, la falta de oportunidades y el desempleo que pueden motivar a los jóvenes de manera voluntaria o forzada a unirse a grupos armados ilegales. Muchos se incorporan a los grupos como una manera de escapar de una realidad de violencia y de múltiples carencias económicas en sus hogares (Charles, 2022; De Rivero, 2022, 2023; Defensoría del Pueblo, 2022; González et al., 2020). Sin embargo, debemos tener en cuenta que la relación con factores subyacentes es un tema complejo y multifacético. Aunque no se puede generalizar en todos los casos, hay ciertos patrones y dinámicas que se observan con frecuencia en contextos donde existe una vinculación entre estos factores y la participación de jóvenes en grupos armados ilegales (Comisión Interamericana de Derechos Humanos, 2023; Giraldo et al., 2015; Pérez, 2021; Torrado et al., 2021).

En relación con lo anteriormente señalado, Torrado et al. (2021) encontraron que la baja adherencia al ámbito escolar y el consumo de sustancias psicoactivas, el maltrato infantil, familiares con antecedentes delictivos, separación de los padres, consumo de drogas en el grupo familiar, ausencia del padre o la madre como cuidador primario, violencia intrafamiliar y bajo nivel educativo de los padres, bajo nivel socioeconómico, exposición a la delincuencia en el contexto social, disturbios en el barrio y exposición a la delincuencia en la escuela, son factores de riesgo que inciden en la aparición de conductas delictivas durante la adolescencia. De hecho, ante las escasas oportunidades laborales, los grupos armados ilegales aprovechan para ofrecer a los jóvenes actividades ilícitas que implica el cobro de deudas ligadas a préstamos ilegales o por extorsiones, microtráfico e incluso la participación directa o indirecta en homicidios selectivos (Aldana, 2019; Pérez, 2021).

Visto lo anterior, la minería de datos ofrece un enfoque integral y holístico que al analizar conjuntos de datos permite detectar patrones, tendencias y mapear la distribución geográfica de los grupos armados ilegales y sus delitos, estableciendo las áreas de riesgo o de mayor actividad delictiva que, unido al contexto social, cultural y económico en el que delinque un grupo criminal, permite entender las motivaciones y los medios utilizados para resistir las intervenciones de las autoridades a lo largo del tiempo. También, identificar factores subyacentes como la pobreza, el desempleo, la deserción escolar, entre otros, que pueden contribuir al surgimiento y sostenimiento de un grupo ilegal.

Dicho esto, se vienen desarrollando diferentes investigaciones que contribuyen al estudio del riesgo de ocupación criminal por parte de grupos armados ilegales. Sin embargo, están más relacionados con usar datos georreferenciados de crimen para analizar la distribución espacial y temporal de los delitos. Pongo por caso, el estudio llevado a cabo por Gutiérrez et al. (2022), para caracterizar espacialmente el delito e identificar los principales focos de inseguridad utilizando datos de homicidios, lesiones personales y hurtos a personas. Otro, dedicado a caracterizar la microextorsión en unas ciudades de Colombia (Norza y Peñalosa, 2016), y uno más, utiliza un modelo de machine learning para predecir el delito en una ciudad intermedia por medio del procesamiento de señales para grafos (Gelvez et al., 2022). También están los estudios de varias técnicas de minería de datos para el análisis, la detección y la predicción del delito (Das y Nayak, 2021; Deshmukh y Annappa, 2019; Revatthy y Satheesh, 2016; Usman et al., 2021) y para detectar patrones espaciales del crimen (Aiman et al., 2022; Arango et al., 2016; Elezaj et al., 2021; Perversi et al., 2007; Silva et al., 2019; Wang et al., 2013). También, encontramos diferentes estudios relacionados con sistemas de alerta temprana para determinar el riesgo de conflictos armados, inestabilidad, violencia, desplazamiento interno y refugiados (Bock, 2015; Colaresi et al., 2016; Rød et al., 2023; Sweijs y Teer, 2022; Wirkus y Piereder, 2019).

Por último, el método estadístico de análisis de componentes principales (ACP) y las técnicas Fuzzy c-Means (FCM) y kriging utilizadas en la investigación, vienen siendo implementados con mayor frecuencia por sus beneficios en la complejidad computacional lineal y la determinación automática del número óptimo de clústeres, en contextos próximos con el objetivo del trabajo, calcular riesgos de ocupación criminal por parte de grupos armados ilegales por medio del agrupamiento difuso. Aquí algunos ejemplos, Martínez-Lanz et al. (2021) realizan un estudio con el fin de establecer factores que potencialmente pueden facilitar la delincuencia, así como el estado de bienestar emocional que presenta la población penitenciaria. Encuentran correlaciones entre factores sociodemográficos, violencia doméstica, adicciones y síntomas depresivos. Concluyen que la variable de condiciones socioeconómicas bajas mostró un mayor grado de correlación con la actividad criminal. Ahora, Arango et al. (2016), utilizando una malla hexagonal para la ciudad de Medellín, Colombia, encontraron patrones espaciales de agrupación de la criminalidad juvenil, así como una mayor variabilidad en su dinámica criminal y territorios de injerencia más pequeños. Igualmente, Revatthy y Satheesh (2016), proponen el diseño de un algoritmo de agrupamiento para encontrar subconjuntos similares con datos numéricos y categóricos de delitos, y muestran que la técnica FCM propuesta, desempeña un papel importante en el ámbito del crimen para una mejor predicción. Por otra parte, Deshmukh y Annappa (2019), implementan un modelo espaciotemporal utilizando kriging junto con datos de ubicación, la hora y el tipo de delito; es decir, las ubicaciones de puntos críticos de delitos pasados, para predecir posibles ubicaciones de delitos futuros. Por último, Usman et al. (2021) realizan un estudio para predecir la variabilidad espacial de la tasa de criminalidad utilizando técnicas geoestadísticas; los resultados muestran que la tasa encontrada en las diferentes locaciones objeto de estudio aumentará en el largo plazo, y que el alto nivel de jóvenes desempleados como la tasa de pobreza, influyen en la tasa de criminalidad.

Por tal motivo, surge la necesidad de analizar e integrar por medio de la técnica Fuzzy c-Means y el análisis de componentes principales, dos conjuntos de datos. Por una parte, información criminal y, por otra, registros de mediciones sociales, económicas, laborales y educacionales para detectar, utilizando una clasificación del riesgo (bajo, medio, medio-alto, alto y muy alto), los municipios con diferentes niveles de riesgo de ocupación por parte de grupos armados ilegales. Además, veremos que los resultados dan forma a un sistema integrado de alerta temprana para identificar las variables criminales, sociales o económicas, entre otras, que configuran las condiciones necesarias para que grupos ilegales lleguen a establecerse en territorios donde su presencia es mínima, o no está lo suficientemente identificada y así detectar áreas geográficas en las que es más probable la presencia de estructuras criminales.

Para ello, el objetivo de la presente investigación consiste en calcular por medio de una agrupación difusa, los riesgos de ocupación criminal por parte de los grupos armados ilegales Clan del Golfo, ELN y Los Pachelly para los municipios del departamento de Antioquia, Colombia.

Para terminar, la estructura del trabajo está formada así: primero, se abordan los detalles teóricos del análisis de componentes principales y de Fuzzy c-Means. Luego, se describe la metodología CRISP-DM, la selección del departamento y los grupos armados ilegales, las estadísticas descriptivas y los algoritmos para los agrupamientos: ACP y Fuzzy c-Means. Posteriormente, se presentan los resultados obtenidos. Enseguida, se discuten los resultados. Finalmente, se exponen las conclusiones del trabajo.

Soporte teórico

La minería de datos en el contexto del riesgo de ocupación criminal por parte de grupos armados ilegales, se presenta como una herramienta útil para la identificación y comprensión de patrones que pueden indicar la presencia y actividad de organizaciones criminales (Das y Nayak, 2021; Wang et al., 2013). En un entorno cada vez más complejo y dinámico donde las amenazas criminales adoptan formas sofisticadas y se diseminan de manera constante (Giménez-Salinas y Fernández, 2016; King et al., 2020; Romero, 2023; Spiezia, 2022), la aplicación de técnicas de minería de datos se convierte en un componente importante para analizar grandes conjuntos de información y extraer conocimientos significativos. No obstante, el uso ético y responsable de esta tecnología es esencial, ya que su implementación debe equilibrar la necesidad de seguridad con la protección de la privacidad y los derechos individuales (Buenadicha et al., 2019).

Explorar vastas cantidades de datos desde fuentes diversas lleva a detectar correlaciones, tendencias y comportamientos que podrían indicar la presencia de actividades criminales. En nuestro caso, los algoritmos para el análisis de datos, Fuzzy c-Means (FCM) y análisis de componentes principales (ACP), revelan conexiones entre las variables y los riesgos de ocupación criminal. En el análisis de componentes principales, cada variable podría considerarse como una dimensión diferente. El análisis genera un nuevo conjunto de variables, llamado “componentes principales”. Cada componente es una combinación lineal de las variables originales y todos son ortogonales entre sí, por lo que no hay información redundante1 (James et al., 2021; Raschka y Mirjalili, 2019). En otras palabras, reduce la dimensionalidad de un dato multivariado a dos o tres componentes principales que pueden visualizarse gráficamente con una mínima pérdida de información (James et al., 2021; Jolliffe, 2002; Renchery Christensen, 2012).

Por otra parte, Fuzzy c-Means es una técnica de agrupación del machine learning, en la que un conjunto de datos se agrupa en N grupos y cada muestra del conjunto pertenece a cada grupo hasta cierto punto. Por ejemplo, una muestra que se encuentra cerca del centro de un grupo tendrá un alto grado de “membresía” en ese grupo2.

El agrupamiento por FCM está definido como una técnica cuyo algoritmo realiza un “agrupamiento no pesado” o soft clustering; en otras palabras, cada muestra de datos puede formar parte de cada agrupamiento en un grado de pertenencia parcial, en lugar de seguir la lógica booleana de pertenecer o no pertenece3 (Raschka y Mirjalili, 2019).

Metodología

Para la implementación computacional con Fuzzy c-Means y el análisis de componentes principales, utilizamos el método CRISP-DM (Cross-Industry Standard Process for Data Mining) un enfoque estructurado para llevar a cabo proyectos de ciencia de datos4 (IBM, 2021). El método es flexible y se puede personalizar, está compuesto por seis fases: comprensión del problema, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. Las fases dan forma a los elementos descritos en los siguientes apartados.

En cuanto a las bases de datos, se utilizaron como fuentes de información para la investigación: la Dirección de Investigación Criminal e INTERPOL (DIJIN) y el Sistema de Información Estadístico, Delincuencial, Contravencional y Operativo de la Policía Nacional de Colombia (SIEDCO); el Sistema de Información de Drogas de Colombia (SIDCO); el Instituto Nacional de Medicina Legal; el Observatorio de Tierras; el Instituto de Estudios para el Desarrollo y la Paz (Indepaz); la Unidad para la Atención y Reparación Integral a las Víctimas; la Defensoría del Pueblo; la Dirección de Sustitución de Cultivos de Uso Ilícito; el Ministerio de Defensa Nacional; la E.S.E. Hospital Carisma; la Dirección de Información Departamental-Gobernación de Antioquia; el Departamento Administrativo Nacional de Estadística (DANE) y el Ministerio de Educación Nacional.

En síntesis, los datos provienen de 17 fuentes: 14 bases de datos de entidades públicas (12 de cobertura nacional y dos de cobertura departamental). Por otro lado, las restantes tres fuentes son de centros de pensamiento dedicados al monitoreo del conflicto armado en Colombia. Además, las bases de datos de entidades públicas adoptan el marco legal de la Ley 1712 de 2014, que establece los procedimientos para garantizar el derecho de acceso a la información pública respetando los datos reservados y clasificados.

Selección del territorio y estadísticas descriptivas

El conjunto de datos seleccionados corresponde a los 125 municipios del departamento de Antioquia en Colombia. La elección del departamento está motivada por la cantidad de grupos armados ilegales que tienen presencia histórica y persiste en este territorio; según las autoridades, la Defensoría del Pueblo y centros de pensamiento, están presentes el ELN, las disidencias de las Farc-EP y el Clan del Golfo (Defensoría del Pueblo, 2018; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021). En cuanto a los grupos delictivos organizados (GDO) y grupos de delincuencia común organizados (GDCO), el “Inventario Criminal Unificado” de la Policía Metropolitana de Medellín (capital del departamento), la Fiscalía General y los organismos de inteligencia, identificaron solo en la subregión del Valle de Aburrá5 alrededor de 350 organizaciones delincuenciales (Blattman et al., 2020; Fundación Paz y Reconciliación, 2022; Matta, 2021), algunas con más de 30 años en la criminalidad (Castañeda, 2023).

Los datos recopilados corresponden al periodo 2018-20196 y están relacionados con información de homicidios, extorsión, amenazas, masacres y líderes sociales asesinados, presencia de grupo armado ilegal, desplazamiento forzado, incautaciones de estupefacientes: pasta base de coca (PBC), clorhidrato de cocaína, bazuco, marihuana prensada y heroína, incautaciones de armas de fuego, hectáreas con cultivos de coca, víctimas de violencia intrafamiliar, unidades de las Fuerzas Militares y de Policía, tasa de deserción escolar, instituciones educativas, índice de pobreza multidimensional, tasa de ocupación, tasa de desempleo, tasa de informalidad y tasa de trabajo infantil.

Se prepararon y se adaptaron las bases de datos de manera que se ajusten a los objetivos de la investigación, toda vez que los mismos corresponden a datos secundarios (Grijalva, 2019; Hox y Boeije, 2005). Para ello, realizamos una exploración inicial de los datos para entender su estructura, características y calidad. Luego, una limpieza de los datos para abordar los problemas identificados durante la exploración inicial, como la imputación de valores faltantes o la corrección de errores. En seguida, una estandarización de los datos. Por último, la selección de las variables que finalmente se almacenaron en un formato adecuado.

Se clasificaron las variables en diferentes tipos, teniendo como criterio las características de los datos; es decir, criminalidad, economías ilícitas, seguridad, consumo de sustancias psicoactivas, violencia intrafamiliar, mercado laboral, pobreza multidimensional y educación (véase Tabla 1). Para la implementación con el ACP y FCM, se construye una matriz (csv) con las 54 variables descritas en la Tabla 1, junto con los valores provenientes de las bases de datos recopiladas para cada uno de los municipios.

Tabla 1 Variables seleccionadas para la implementación con ACP y FCM 

Selección de grupos armados ilegales (GAI)

Por una parte, tenemos a los grupos armados organizados “Clan del Golfo” y al Ejército de Liberación Nacional (ELN) y, por otra, al grupo delictivo organizado “Los Pachelly”. Con relación al primero, según la Fundación Paz & Reconciliación (2020), es la estructura armada ilegal más grande del país y tiene presencia en alrededor de 210 municipios, es decir, en el 19 % del territorio nacional. Este grupo sucesor del paramilitarismo ha mantenido el control de las zonas históricas de las Autodefensas Unidas de Colombia (AUC) y en la actualidad hace presencia con hombres armados principalmente en los departamentos de Antioquia, Córdoba y Chocó (la región del Urabá). A su vez, implementan la modalidad de subcontratación de grupos criminales locales, lo cual les ha permitido diversificar su portafolio criminal y extenderse en varios municipios ofreciendo franquicias.

Del mismo modo, el ELN está en varios municipios de las subregiones Norte, Nordeste, Bajo Cauca, Suroeste, Urabá y Occidente de Antioquia (Corporación Jurídica Libertad y Fundación Sumapaz, 2022). Más allá de esos territorios, también están en zonas de frontera como en los departamentos de Arauca, Norte de Santander y Nariño; en áreas de explotación petrolera y alrededor de los principales oleoductos del país; en torno a zonas de explotación mineroenergética, particularmente extracción de oro, como el sur de Bolívar, nordeste de Antioquia y el Chocó; asimismo, en zonas de producción cocalera como en Nariño, Cauca, Chocó, Norte de Santander y el sur de Bolívar (Defensoría del Pueblo, 2018).

El grupo delictivo Los Pachelly es considerado por las autoridades colombianas como una de las estructuras más peligrosas del departamento de Antioquia: tendría alrededor de 220 hombres con armas, ha logrado sobrevivir por más de 30 años cometiendo múltiples delitos, particularmente extorsión, tráfico de estupefacientes y homicidios, y tiene presencia reportada en varios municipios (principalmente en el municipio de Bello). Además, su alcance delincuencial7 y nexos con el Clan del Golfo y el Frente 36 de las disidencias Farc-EP, pone en constante riesgo a la población civil (Fundación Paz & Reconciliación, 2022).

Implementación computacional

Para llevar a cabo esta tarea, la minería de datos utiliza herramientas que permiten la transformación, el análisis y la visualización de datos (Makhabel et al., 2017). En este sentido, para la implementación con el análisis de componentes principales (ACP) y Fuzzy c-Means (FCM), junto con la base de datos construida, se utilizaron las herramientas y bibliotecas proporcionadas por el software R, tales como FactoMineR, factoextra, cluster, fclust, gstat, ppclust, entre otras.

La Figura 1 representa la secuencia de pasos dentro de la implementación para detectar los municipios con un potencial de riesgo de presencia de los grupos ilegales. Primero, crear los “indicadores sintéticos”8. Con la reducción de la dimensionalidad de ACP generar los componentes principales; es decir, las asociaciones en la varianza explicada para cada uno de los planos y las variables que los representan, luego creamos un indicador sintético para cada componente a partir de la distancia al punto de origen (medias generales). Por último, interpretar cada componente en función de sus características. Segundo, crear un “indicador de riesgo” para cada componente utilizando la técnica FCM y generar un semáforo de riesgo (bajo, medio, medio-alto, alto y muy alto). Tercero, realizar un kriging9 para estimar un riesgo hipotético para los municipios de acuerdo con la distancia espacial. Para ejecutar el kriging se requiere haber generado la matriz de riesgo fuzzy para cada indicador, medimos las distancias euclidianas entre los centroides, luego creamos los agrupamientos de acuerdo con los municipios con información, y finalmente se crea una estimación de riesgo para los municipios sin información basados en el agrupamiento.

Figura 1 Flujo de trabajo en la implementación computacional 

Algoritmos para la clusterización6

El “análisis de componentes principales” como herramienta para la exploración de datos no supervisada, considera un conjunto de variables (x1, x2,..., xp ) sobre un grupo de objetos o individuos y con base en ellos se calcula un nuevo conjunto de variables y1, y2,..., yp, estas nuevas variables no están correlacionadas entre sí, y sus varianzas disminuyen gradualmente (Rencher y Christensen, 2012).

Cada yj, donde j = 1,2,..., p, es una combinación lineal del conjunto original x1, x2,..., xp, como se muestra en la ecuación (1):

donde a’j = (a1j, a2j ,..., apj) es un vector de constantes y x el conjunto de variables:

El objetivo es maximizar la varianza, por lo que se aumentan los coeficientes a ij . Además de eso, para mantener la ortogonalidad de la transformación se requiere que el módulo del vector a’ j sea igual a 1, es decir, (2)

Ahora, el “primer componente” se calcula eligiendo a’ 1 de tal manera que y1 obtenga la mayor varianza sujeta a la restricción de que a’ 1 a 1 =1. El “segundo componente principal” se calcula mediante un a’ 2 que hace que y 2 no esté correlacionado con y 1. Se aplica el mismo procedimiento para seleccionar y 3 hasta y p (Agudelo et al., 2016).

Por otra parte, el algoritmo de Fuzzy c-Means se basa en la distancia euclidiana (3):

entonces, al realizar el Fuzzy c-Means se pretende minimizar la función objetivo o costo10 (4):

teniendo en cuenta que (5),

donde,

un conjunto de puntos de datos, conjunto de grupos o clústeres, matriz de partición difusa, distancia euclidiana entre el centro del clúster i y el conjunto de puntos o el punto j-ésimo, grado de borrosidad (fuzziness) o exponente ponderador (m > 1), valores de pertenencia, están entre 0 y 1, centro del clúster del grupo i.

El objetivo consiste en que ese costo sea mínimo; es decir, que los puntos de datos encuentren su centro más cercano. Las condiciones necesarias para encontrar el mínimo con esta función objetivo están dadas por las ecuaciones (7) y (8):

El siguiente pseudocódigo muestra el algoritmo implementado por la técnica de agrupamiento (véase Figura 2).

Figura 2 Algoritmo de la técnica Fuzzy c-Means 

Por último, la técnica kriging permite generar un riesgo hipotético por grupo armado ilegal para cada uno de los municipios, por medio de una interpolación espacial en la que los valores medidos circundantes se ponderan para generar un valor previsto de una ubicación no medida. Las ponderaciones se basan en la distancia entre los puntos medidos, las ubicaciones de predicción y la disposición espacial general entre los puntos (Krivoruchko, 2011). En otras palabras, es una técnica que permite estimar valores desconocidos en lugares específicos, dados los valores disponibles de otros lugares para dar respuesta a qué tanto la medición en un lugar se parece a la de los lugares cercanos (Miller, 2004).

El procedimiento aplicado con el kriging consiste en (a) calcular las distancias euclidianas entre un centroide y cinco vecinos; (b) crear una estimación de riesgo para los municipios sin información basados en el agrupamiento (distancia espacial); (c) distribuir el riesgo muy alto, es decir, entre municipios con una muy alta probabilidad y sus vecinos y, por consiguiente, establecer una dependencia espacial de los datos para cada uno de los municipios.

Resultados

Se dividen en tres partes. La primera, corresponde a los resultados obtenidos con la implementación del ACP (las variables mejor representadas que mayormente aportan a la variable presencia de grupo armado ilegal, y primer semáforo de riesgo con los interceptos). La segunda, a los resultados de Fuzzy c-Means (tablas, mapas y semáforos de riesgo), y la tercera, muestra los respectivos mapas de riesgo hipotético utilizando la técnica de interpolación kriging.

Variables mejor representadas ante la presencia de grupos armados ilegales

A partir del gráfico de sedimentación, seleccionamos los primeros tres componentes principales (en adelante, PC), toda vez que a partir de ese componente el gráfico no presenta pendientes fuertes.

Los resultados del ACP permitieron identificar las variables mejor representadas para los componentes (PC1, PC2 y PC3) en relación con la inclusión de la variable presencia de grupos armados ilegales, junto con el porcentaje de la variable que está recogiendo cada componente (véase Tabla 2).

Tabla 2 Variables mejor representadas por componente principal 

La Tabla 3 presenta las correlaciones entre la variable presencia de grupos armados ilegales con los componentes principales (ejes) que tienen información de tipo social, económico, laboral, educacional y criminal. Es así que las variables mejor representadas en PC1 y PC2 están correlacionadas con la presencia de las organizaciones criminales Clan del Golfo y el ELN, de igual forma, PC1 y PC3 con el grupo delictivo Los Pachelly. Una explicación sería que las variables correlacionadas con el Clan del Golfo y el ELN corresponden a grupos ilegales que tradicional e históricamente han tenido presencia en territorios de característica rural. Caso contrario con el bloque formado por PC1 y PC3, están presentes las variables para una estructura criminal que delinque en territorios de tipología urbana o municipios intermedios.

Tabla 3 Correlación variable presencia de grupos armados ilegales (GAI) con los ejes (PC) 

La manifestación de las variables de características socioeconómicas, algunas de ellas: violencia intrafamiliar contra menores de edad, deserción escolar, pobreza, desempleo y consumo de sustancias psicoactivas, contribuyen a incrementar y, podríamos decir, a configurar las condiciones necesarias para los territorios con posible riesgo de ocupación o presencia de estructuras criminales. Asimismo, a partir de los interceptos de las componentes principales, se logró determinar, por ejemplo con PC1 y PC2, que la presencia en los municipios de los grupos armados ilegales: Clan del Golfo y el ELN, hacen que las variables mejor representadas en PC1: amenazas, eventos de desplazamiento, homicidios, hectáreas de coca, líderes sociales asesinados, reclutamiento ilícito de niños, niñas y adolescentes, incautación de PBC y deserción escolar en primaria se incrementen en 8.32 % y 8.82 %, respectivamente, en los territorios analizados (véase Tabla 4). Igualmente, su presencia hace que PC2: instituciones educativas, técnicas y tecnológicas11; consumo de sustancias psicoactivas y capturas a integrantes de GDCO por secuestro simple o extorsivo, aumente en 71.12 % y 67.63 %, respectivamente. Ahora, cuando la presencia corresponde al grupo ilegal Los Pachelly, los valores de las variables de PC3 aumentan en 34.82 % (véase Tabla 5).

Tabla 4 Semáforo de riesgo incremento variables del PC1 

Tabla 5 Semáforo de riesgo incremento variables del PC3 

Semáforos y mapas de riesgo

Utilizando el resultado del ACP, con las variables mejor representadas en cada componente principal ante la presencia de una organización criminal, y la implementación con la técnica FCM, obtenemos el semáforo de riesgo (bajo, medio, medio-alto, alto, muy alto) para cada una de las estructuras criminales. Conviene especificar que, para estos semáforos, no se incluyeron los municipios de Cáceres, Medellín, Tarazá y Turbo, territorios que presentan riesgos por fuera o por encima de los niveles considerados, producto de una mayor concentración de casos o denuncias para las diferentes variables. Incluirlos “invisibiliza” el riesgo en los otros municipios; es decir, los omitimos en el semáforo, dado que previamente el resultado de contribución individual muestra que son los municipios donde las variables están contribuyendo mayormente y, por consiguiente, son territorios en muy alto riesgo.

En este sentido, los semáforos para cada uno de los grupos armados ilegales contienen cada nivel de riesgo establecido por el número de casos, denuncias, tasas y eventos de las variables que aportan mayormente (fila de encabezado) a la variable presencia de un grupo criminal en los municipios. Tomemos como ejemplo el semáforo de la Tabla 6, los municipios con registros: eventos de desplazamiento forzado mayor o igual que 83.1 y menor que 512.5, es decir, (83.1, 512.5); amenazas (22.4, 143.8); tasa de deserción en primaria (3.2, 4.1); pobreza multidimensional (26.7, 33.2); homicidios (16.5, 36.4), y hectáreas de coca (25.9, 317.2), estarían en un riesgo medio-alto, con una probabilidad del 51.4 % de presencia del Clan del Golfo en sus territorios. De la misma forma para el ELN y Los Pachelly (véanse Tablas 7 y 8).

Tabla 6 Semáforo de riesgo presencia del Clan del Golfo 

Tabla 7 Semáforo de riesgo presencia del ELN 

Tabla 8 Semáforo de riesgo presencia de Los Pachelly 

Por otra parte, la Tabla 9 muestra los pronósticos de riesgo para el Clan del Golfo en cada uno de los municipios. Además, en ese semáforo podemos identificar tipos de riesgo, como un riesgo entre dos riesgos con prevalencia para el municipio de Vegachí (subregión Nordeste); esto es, 10.5 en riesgo alto y 68.9 en riesgo muy alto. Asimismo, para el municipio de Abriaquí (subregión Occidente) exhibe un riesgo entre dos riesgos sin prevalencia, 33.3 en riesgo bajo y 32.3 en riesgo medio. Los pronósticos del semáforo adquieren un gran valor; conocer de manera anticipada los municipios del departamento, con una tendencia clara de mayor riesgo de ocupación criminal, permite priorizar e intervenir estos territorios y mantener bajo monitoreo los de menor riesgo.

Tabla 9 Semáforo de riesgo presencia del Clan del Golfo por municipio 

a Sin la inclusión de Cáceres, Medellín, Tarazá y Turbo.

Otro resultado con la técnica FCM son los mapas de riesgo, y para una mayor comprensión de la distribución del riesgo en el departamento de Antioquia, consideremos el mapa de referencia de las subregiones (véase Figura 3) para tener una panorámica del riesgo en las nueve subregiones y, por consiguiente, en sus municipios.

Figura 3 Mapa de referencia 

En los mapas de riesgo para el Clan del Golfo, observamos en la probabilidad de riesgo medio-alto, la concentración de este en los municipios ubicados en las subregiones Suroeste, Oriente y Valle de Aburrá; igual tendencia es detectada en los municipios de las subregiones Norte, Nordeste y Bajo Cauca con un riesgo alto y muy alto (véase Figura 4); es decir, son territorios con un alto riesgo de posible ocupación criminal que puede extenderse hacia otros territorios del departamento por su proximidad geográfica y por factores sociales, laborales, educacionales y criminales similares a los lugares en alto riesgo. De igual forma, podemos observar que los riesgos más altos están presentes en municipios de la subregión Bajo Cauca, Nordeste y Urabá; esta última es conocida como el territorio donde se localiza mayormente la estructura criminal. Por otra parte, Medellín (capital del departamento) es la ciudad de la subregión del Valle de Aburrá, donde persiste un riesgo muy alto de posible presencia del grupo armado ilegal Clan del Golfo.

Figura 4 Mapas de riesgo presencia del Clan del Golfo 

En cuanto a la presencia del ELN y Los Pachelly, el primero genera un mayor riesgo para los municipios en el Bajo Cauca, Norte, Nordeste y Urabá (véase Figura 5).

Figura 5 Mapas de riesgo presencia del ELN 

El segundo ocasiona un alto riesgo en los territorios que comprenden las subregiones del Valle de Aburrá, Norte, Nordeste y Bajo Cauca (véase Figura 6).

Figura 6 Mapas de riesgo presencia de Los Pachelly 

Al analizar las probabilidades del semáforo de riesgo (véase Tabla 9), extraemos los municipios con mayor riesgo de una posible ocupación criminal por parte de los grupos armados ilegales seleccionados. La Tabla 10 contiene los municipios con mayor riesgo, y el criterio utilizado para incluirlos corresponde a la suma de los porcentajes de riesgo alto y riesgo muy alto que estuviera por arriba del 50 %; ello para señalar los territorios de prioridad para una atención focalizada por las autoridades civiles y las Fuerzas Armadas del Estado. No obstante, es posible con las tablas de riesgo, modificar el criterio o ampliarlo incluyendo otro nivel de riesgo para aumentar el número de municipios a priorizar e intervenir, con el objetivo de considerar territorios que pueden ser estratégicos en la dinámica de expansión criminal de los grupos ilegales.

Tabla 10 Municipios en alto riesgo por la presencia de grupos armados ilegales 

Como se observa en la Tabla 10, el 26 % de los municipios del departamento de Antioquia tendrían un riesgo alto de posible ocupación o presencia criminal del grupo armado organizado Clan del Golfo. Por otra parte, el Ejército de Liberación Nacional (ELN) ocasionaría un riesgo en el 11% de los municipios. Lo mismo ocurre con el grupo delictivo organizado Los Pachelly, el 12 % también estaría en riesgo. Como resultado adicional, los municipios de Briceño, Segovia y Tarazá registran un alto riesgo para las tres estructuras criminales analizadas. Asimismo, los municipios de Cáceres, Caucasia, El Bagre, Medellín, Nechí, Turbo y Zaragoza tienen en común un alto riesgo de posible presencia criminal del ELN y el Clan del Golfo.

Riesgo kriging de los municipios

En cada mapa kriging se observa una dependencia espacial entre los municipios próximos. Para la influencia del riesgo por el Clan del Golfo en la subregión Bajo Cauca, vemos en la Figura 7 un comparativo entre el riesgo muy alto medido y el kriging para esa organización criminal; Cáceres y Tarazá cambian de alrededor de un cien por ciento a 56 % y 32 %, respectivamente. Ahora, si comparamos el mapa de riesgo muy alto y el mapa kriging para Los Pachelly (véanse Figuras 6 y 8), tenemos para el municipio de Tarazá una reducción del riesgo en 63 puntos porcentuales; es decir, tendría un riesgo hipotético del 35 %. En cuanto a sus cinco vecinos, el riesgo en Mutatá pasa de 3 % a 6 %, Cáceres de 24 % a 30 %, Anorí de 44 % a 18 %, Valdivia de 24 % a 26 % e Ituango de 41 % a 23 %. Por tanto, la técnica kriging revela un riesgo hipotético, que hay municipios que no tienen un riesgo tan alto y otros lo tienen, aunque no aparezcan en el mapa. El resultado es coherente y se ajusta con la forma de delinquir de los grupos ilegales. Extienden su presencia y rentas ilícitas hacia los territorios más próximos, como sucede con varios grupos delincuenciales del Valle de Aburrá que tienen como objetivo la subregión Suroeste (NoCopio, 2022; Restrepo, 2020).

Figura 7 Mapa de riesgo kriging del Clan del Golfo 

Figura 8 Mapa de riesgo kriging del ELN y Los Pachelly 

Prototipo del sistema integrado de alerta temprana

Los resultados anteriores pueden ser utilizados con el propósito de dar forma a un sistema integrado de alerta temprana para detectar riesgos de posible presencia de grupos armados ilegales. El siguiente diagrama describe el flujo de cada proceso necesario para alcanzar el principal objetivo, emitir la alerta temprana (véase Figura 9). Además, muestra los detalles generales para cada pieza del sistema, en particular sus productos, semáforos de riesgo, tablas de riesgo y mapas de riesgo, todos generados con agrupaciones de tipo difuso.

Figura 9 Modelo del sistema integrado de alerta temprana 

Ahora bien, el objetivo de una alerta temprana es originar una respuesta proactiva y oportuna; en este sentido, un semáforo de riesgo con una aproximación de cuándo y cómo intervenir es de gran utilidad, porque permite comprender rápidamente el nivel de riesgo asociado con la actividad criminal en una determinada área geográfica, y responder de una manera más focalizada (véase descripción de los niveles de riesgo en la Tabla 11).

Tabla 11 Descripción de los niveles de riesgo en el semáforo 

Discusión

El ACP muestra cómo las variables de amenazas, eventos de desplazamiento forzado, homicidios, líderes sociales asesinados, cultivos de coca, eventos de vinculación de niños, niñas y adolescentes en actividades de grupos ilegales, deserción escolar en primaria, secundaria y media, consumo de sustancias psicoactivas en los jóvenes, víctimas de violencia intrafamiliar contra hombres y mujeres menores de edad, entre otras, persisten y contribuyen en una posible ocupación criminal mediante la presencia de grupos armados ilegales en los territorios.

Al mismo tiempo, el componente cuantitativo de los resultados confirma los hallazgos presentes en la literatura alrededor de la naturaleza compleja de los fenómenos de ocupación, gobernanza criminal y su impacto en las comunidades, investigada en este trabajo y por diferentes fuentes, autores y centros de pensamiento (Blattman et al., 2020, 2022; Charles, 2022; Comisión Interamericana de Derechos Humanos, 2023; Corporación Jurídica Libertad y Fundación Sumapaz, 2022; De Rivero, 2023; Defensoría del Pueblo, 2022; Giraldo et al., 2015; Martínez-Lanz et al., 2021; Observatorio de Derechos Humanos y Conflictividades de Indepaz, 2021; Restrepo, 2020; Torrado et al., 2021; Uribe et al., 2022).

Encontramos que las variables del PC1 son las que mejor representan la presencia en los territorios del ELN, el Clan del Golfo y Los Pachelly. Sin embargo, los otros componentes aportan un segundo nivel de representación que ocasiona una distinción en la presencia de los grupos ilegales, incluyen otras variables que complementan de manera particular, los factores que podrían aumentar la presencia en el territorio de determinados grupos en concordancia con su naturaleza y forma de delinquir en territorios con características rurales o urbanas.

Lo anterior permitió construir un primer semáforo de riesgo utilizando el intercepto de cada componente principal. El intercepto para el Clan del Golfo, promedio de los porcentajes de PC1 para cada municipio sin presencia del grupo ilegal, es igual a 50.61 y al cambiar su estado, tener presencia, ese promedio toma el valor de 54.82, lo que ocasiona un incremento del 8.32 % en las variables que mejor representan el PC1. Ahora, la presencia del ELN aumenta las variables en 8.82 % y, en contraste, Los Pachelly generan una reducción de -0.92 %. Los resultados confirman que las variables del PC1 están más relacionadas con la presencia de grupos armados ilegales, los eventos y las actividades ilícitas que tradicionalmente han tenido lugar en territorios de tipo rural o municipios intermedios. Por otra parte, los grupos ilegales en territorios con características más urbanas, su presencia ocasiona una reducción de las variables para estos municipios. Visto todo lo anterior, la presencia más nociva para los territorios rurales la ocasiona el ELN, seguido por el Clan del Golfo. Por último, la reducción marginal de las variables en el PC1 por parte de Los Pachelly (véase Tabla 4), estaría confirmando la capacidad de esta estructura criminal para vincularse también en las actividades ilícitas propias de los territorios rurales.

Con los resultados de Fuzzy c-Means tenemos un nuevo semáforo, tablas y mapas de riesgo. Detrás de la probabilidad de cada riesgo están las variables que mejor representan la presencia de un grupo armado ilegal. Después de realizar el análisis fuzzy inicial para cada grupo ilegal, se decidió no incluir unos municipios que concentran la mayor cantidad de registros para las variables. En este sentido, Medellín, Cáceres, Tarazá y Turbo tienen un elevado riesgo cuando se analizan sus datos con la presencia del Clan del Golfo y el ELN. Además, el municipio de Tarazá también presenta un riesgo elevado con la presencia de Los Pachelly.

Ahora, el semáforo de riesgo por cada grupo armado ilegal reveló las probabilidades para los niveles de riesgo de ocupación criminal, junto con la cantidad de eventos mínimos y máximos que deben tener las variables de mayor aporte para ocasionarlo. Asimismo, el límite superior de cada nivel es el parámetro a monitorear en los territorios. La información suministrada por el semáforo permite tener una visión completa de cuándo intervenir los municipios y cuáles variables priorizar en concordancia con el nivel de riesgo detectado.

Por otra parte, encontramos diferentes tipos de riesgo; esto es, riesgo único, riesgo entre dos riesgos con prevalencia y riesgo entre dos riesgos sin prevalencia. Una información que muestra la tendencia de los diferentes niveles de riesgo. Por ejemplo, en la tabla de riesgo para el Clan del Golfo, hallamos un riesgo único para el municipio de Caldas (subregión Valle de Aburrá), de 98.8 en riesgo medio de posible presencia en el territorio de este grupo criminal.

Por último, al analizar las probabilidades en las tablas de riesgo, el 26 % de los municipios tendrían un riesgo alto de posible presencia criminal del grupo armado organizado Clan del Golfo. En cuanto al ELN y Los Pachelly, ocasionan un riesgo en el 12 % de los municipios.

Con base en la información de los mapas de riesgo, el aporte individual de las variables analizadas muestra que los riesgos más altos se encuentran en la subregión Bajo Cauca, seguida por las subregiones Valle de Aburrá, Norte, Nordeste y Urabá. Asimismo, a medida que aumenta el riesgo, es posible identificar una agrupación de las probabilidades en cada uno de los riesgos, con una tendencia a concentrarse en las subregiones mencionadas y, por tanto, territorios que requieren constante monitoreo y ser priorizados, sin olvidar las demás subregiones. Sin embargo, esta tendencia depende de la naturaleza delincuencial del grupo armado ilegal y su capacidad para ocupar nuevos territorios.

Del mismo modo, los mapas de riesgo muy alto ajustados con la técnica de interpolación kriging, muestran la dependencia espacial entre los municipios cercanos. Tal como ocurrió con Tarazá y sus cinco vecinos para la presencia de Los Pachelly. Con la técnica, Tarazá tuvo una reducción del riesgo en 63 puntos porcentuales, quedando con un riesgo hipotético del 35 %. Ahora, los municipios vecinos como Mutatá, el riesgo pasó de 3 % a 6 %, Cáceres de 24 % a 30 %, Anorí de 44 % a 18 %, Valdivia de 24 % a 26 % e Ituango de 41 % a 23 %. Por consiguiente, la técnica kriging reveló con un riesgo hipotético una dependencia espacial del riesgo muy alto entre los municipios cercanos.

Estos resultados pueden ser integrados en un sistema de alerta temprana para detectar el riesgo de una posible presencia criminal de grupos armados ilegales. Un sistema que contribuye al campo de la prevención situacional, ya que no solo incluye variables de tipología criminal, sino que también logra integrar en sus análisis, variables sociales, económicas, educacionales y laborales que coexisten con la dinámica criminal de los grupos armados ilegales, suministrando información de gran valor para intervenir el riesgo desde diferentes frentes de acción.

El prototipo del sistema de alerta temprana permite realizar los ajustes necesarios para replicarlo en otros territorios, adicionar o eliminar variables de interés para los municipios, en concordancia con la información disponible. La estructura de la base de datos permite hacer cambios; además, el software utilizado en la programación es libre, multiplataforma y de código abierto, y muchas de las herramientas necesarias para el análisis de los datos ya vienen incorporadas.

En cuanto a las limitaciones encontradas, si bien gran parte de la información utilizada es de acceso público, para los registros de las capturas de integrantes de grupos armados ilegales por diferentes delitos, tuvimos que hacer una solicitud a la DIJIN de la Policía Nacional de Colombia, lo mismo para acceder a la información de consumo de sustancias psicoactivas por grupos de edad y sustancia, se hizo la solicitud en el Hospital Carisma en Medellín (institución especializada en conductas adictivas).

Otra limitación tiene que ver con el acceso a las bases de datos relacionadas con la pobreza multidimensional a nivel municipal, solo están disponibles para el 2018 en el Departamento Administrativo Nacional de Estadística (DANE). Ahora, el departamento de Antioquia es uno de los pocos en el país que recopila esa información, por medio de la Encuesta de Calidad de Vida que lleva a cabo cada dos años. Algo similar se presenta con los datos de mercado laboral de los municipios: acceder a esta información para otros departamentos no sería posible, toda vez que se recopila para las principales ciudades de Colombia; ello obligaría a realizar cambios en la etapa de recopilación de datos, adicionar o eliminar variables en concordancia con el contexto y la disponibilidad de la información, o generar puentes y un trabajo articulado con organismos del tercer sector y la academia para su recolección.

Conclusiones

El análisis realizado muestra que la presencia de grupos armados ilegales en los territorios se erige como una amenaza grave que socava los fundamentos de la seguridad y estabilidad en las comunidades. Un preocupante escenario que va más allá de la mera presencia de actividades delictivas cuando se configura la gobernanza criminal, lo que representa un desafío complejo que plantea riesgos sustanciales tanto para las autoridades como para los habitantes. Además, al explorar esta problemática se revelaron los factores subyacentes, los peligros que enfrentan las poblaciones, los territorios en riesgo a priorizar e intervenir, y la necesidad apremiante de adoptar enfoques cuantitativos para la toma de decisiones.

Asimismo, se identificaron los municipios con el mayor riesgo de presencia criminal ocasionado por el Clan del Golfo, el ELN y Los Pachelly. Cada municipio dispone de un semáforo de riesgo que permite tener una panorámica más amplia y pertinente de lo que está ocurriendo en los territorios. También, los mapas proporcionan una visión espacial de los riesgos, las tendencias y dinámicas similares entre municipios y grupos armados ilegales.

Por otra parte, la propuesta de un prototipo para el sistema integrado de alerta temprana cuenta con un diseño sencillo. También, el sistema dispone de una guía para los indicadores de riesgo (bajo, medio, medio-alto, alto y muy alto), que describe qué características tiene cada riesgo y cómo deberían intervenir las autoridades correspondientes. Un elemento de juicio práctico que puede ser ajustado, según los contextos de los territorios y la experticia del equipo detrás del sistema de alerta temprana.

Finalmente, una extensión lógica del trabajo podría centrarse en la incorporación de tecnologías emergentes como la inteligencia artificial, entre otras, para predecir en tiempo real riesgos y patrones de ocupación criminal por parte de grupos armados ilegales. Esta evolución tecnológica podría optimizar la capacidad del sistema para anticipar y responder a las tácticas cambiantes de los grupos criminales, ofreciendo a las autoridades un sistema más sólido y proactivo.12

Referencias

Agudelo, S., Ochoa, M. y Zuluaga, F. (2016). Principal component analysis for mixed quantitative and qualitative data. Research Group in Mathematical Modelling.https://www.eafit.edu.co/programasacademicos/pregrados/ingenieria-matematica/practicasinvestigativas/Documents/principalcomponent-analysis.pdfLinks ]

Aiman, A., Hanin, H., Ibrahim, Z., Diah, N., Mohd, A. y Hanum, H. (2022). Crime scene prediction using the integration of k-Means clustering and support vector machine. IEEE. 10th Conference on Systems, Process & Control (ICSPC), (pp. 242-246).https://doi.org/10.1109/ICSPC55597.2022.10001768Links ]

Aldana, A. (2019). La tenebrosa radiografía de las oficinas de cobro en Medellín. Fundación Paz & Reconciliación.https://www.pares.com.co/post/la-tenebrosa-radiograf%C3%ADa-de-las-oficinasde-cobro-en-medell%C3%ADnLinks ]

Alvarado, N., Norza, E., Pérez, S., Tobón, S. y Vanegas, M. (2020). Evolución de la seguridad ciudadana en Colombia en tiempos del Covid-19. Banco Interamericano de Desarrollo.https://publications.iadb.org/publications/spanish/document/Evolucionde-la-seguridad-ciudadana-en-Colombia-entiempos-del-COVID-19.pdfLinks ]

Álvarez, E. (2017). El crimen organizado en lo local: ¿un problema subvalorado en Colombia?http://www.ideaspaz.org/publications/posts/1449Links ]

Arango, M., Jaramillo, J. y Jaramillo, L. (2016). Técnicas de clustering para detectar patrones espaciales de criminalidad en jóvenes y adultos en Medellín. Octubre del 2013 a noviembre del 2014. Revista Criminalidad, 58(1), 25-45.https://revistacriminalidad.policia.gov.co:8000/index.php/revcriminalidad/issue/view/13Links ]

Asmann, P. (2018). Desplazamientos masivos en Colombia muestran nueva dinámica de violencia criminal. InSight Crime.https://es.insightcrime.org/noticias/noticias-del-dia/desplazamientos-masivoLinks ]

Ayling, J. (2009). Criminal organizations and resilience. International Journal of Law, Crime and Justice, 37(4), 182-196.https://doi.org/10.1016/j.ijlcj.2009.10.003Links ]

Badillo, R. y Trejos, L. (2022). Entender al Clan del Golfo para entender la violencia posAUC en Colombia: reflexiones sobre la transformación del crimen organizado y sus efectos sobre la paz. En A. Ugalde e I. Perea, Balances y perspectivas del cumplimiento del Acuerdo de Paz en Colombia (2016-2022) (pp. 289-310). Servicio Editorial de la Universidad del País Vasco.https://addi.ehu.es/handle/10810/59609Links ]

Ballestin, R. y Dalby, C. (2022). Military arsenals provide convenient source of weapons for Latin American gangs. InSight Crime.https://insightcrime.org/news/military-arsenals-provide-convenient-sourceweapons-latin-american-gangs/Links ]

Blattman, C., Duncan, G. y Lessing, B. (2020). Gobierno criminal en Medellín: panorama general del fenómeno y evidencia empírica sobre cómo enfrentarlo. Documento de Trabajo, Centro de Investigaciones Económicas y Financieras (CIEF).https://repository.eafit.edu.co/handle/10784/24352Links ]

Blattman, C., Lessing, B., Mesa, J. y Tobón, S. (2022). Measuring organised crime: challenges and solutions for collecting data on armed illicit groups. Briefing Note, Serious Organised Crime & Anti-Corruption Evidence (SOC ACE). [ Links ]

Bock, J. (2015). Firmer footing for a policy of early intervention: Conflict early warning and early response comes of age. Journal of Information Technology & Politics , 12, 103-111.https://doi.org/10.1080/19331681.2014.982265Links ]

Buenadicha, C., Galdon, G., Hermosilla, M., Loewe, D. y Pombo, C. (2019). La gestión ética de los datos. Banco Interamericano de Desarrollo.https://publications.iadb.org/es/la-gestion-etica-de-los-datosLinks ]

Cabrera, E. (2017). Un acercamiento a la criminalidad organizada como un fenómeno de magnitud mundial. Revista Actualidad Criminológica, 6, 1-33.https://blogs.ucjc.edu/criminologia-iter-criminis/wpcontent/uploads/sites/21/2018/03/elvira-cabrera.pdfLinks ]

Carretero, N. y Lezcano, A. (2021). Marbella, sede global del crimen organizado. El País.https://elpais.com/especiales/2021/marbella-sede-global-del-crimenorganizado/Links ]

Castañeda, C. (2023). Los dilemas de las redes criminales de Bello. Ratio Juris, 18(36), 1-34.https://doi.org/10.24142/raju.v18n36a17Links ]

Catanese, S., De Meo, P. y Fiurama, G. (2016). Resilience in criminal networks. Atti della Accademia Peloritana dei Pericolanti, Classe di Scienze Fisiche, Matematiche e Natural, 94(2), 1-19.https://doi.org/10.1478/AAPP.942A1Links ]

Charles, M. (2022). La participación de NNA en el crimen organizado y el conflicto después del acuerdo de paz. Universidad del Rosario. Observatorio Colombiano del Crimen Organizado.https://www.urosario.edu.co/Observatorio-Colombiano-del-crimenorganizado/Documentos-OCCO/#ECHTab1Links ]

CICR (Comité Internacional de la Cruz Roja). (2022). El confinamiento más largo: campaña del CICR en Colombia. Informe.https://www.icrc.org/es/document/colombia-confinamiento-mas-largoartefactos-explosivos-dihLinks ]

CICR (Comité Internacional de la Cruz Roja). (2022a). Colombia: vivir a la sombra de los conflictos armados y retos humanitarios. Informe.https://www.icrc.org/es/document/balance-humanitario-colombia-2022-dihLinks ]

CODHES (Consultoría para los Derechos Humanos y el Desplazamiento). (2022). 2021, el año con mayor número de víctimas de desplazamiento en 5 años. Informe.https://codhes.wordpress.com/2021/12/22/2021-el-ano-con-mayor-numerode-victimas-de-desplazamiento-en-5-anos/Links ]

Colaresi, M., Hegre, H. y Nordkvelle, J. (2016). Early ViEWS: A prototype for a political violence Early-Warning System. American Political Science Association, 1-29.https://www.pcr.uu.se/digitalAssets/653/c_653796-l_1-k_earlyviewsapsa2016.pdfLinks ]

Comisión Interamericana de Derechos Humanos. (2023). Impacto del crimen organizado en mujeres, niñas y adolescentes. OAS. Documentos oficiales; OEA/Ser.L.https://www.oas.org/es/CIDH/jsForm/?File=/es/cidh/prensa/comunicados/2023/073.aspLinks ]

Corporación Jurídica Libertad y Fundación Sumapaz. (2022). La guerra no para en Antioquia: balance de la situación de los derechos humanos, el derecho internacional humanitario y garantías para las personas defensoras de derechos humanos en el año 2021. Corporación Jurídica Libertad y Fundación Sumapaz.https://cjlibertad.org/informe-la-guerrano-para-en-antioquia/Links ]

DANE (Departamento Administrativo Nacional de Estadísticas). (2021). Pobreza multidimensional en Colombia 2020. Boletín técnico.https://www.dane.gov.co/index.php/estadisticas-por-tema/pobreza-ycondiciones-de-vida/pobreza-multidimensional/pobreza-multidimensional-2020Links ]

Das, D. y Nayak, M. (2021). Crime pattern detection using data mining. En S. Pani, S. Singh, L. Garg, R. Pachori y X. Zhang, Intelligent data analytics for terror threat prediction: Architectures, methodologies, techniques, and applications (pp. 221-236). John Wiley & Sons, Ltd.https://doi.org/10.1002/9781119711629.ch11Links ]

De Hoyos, M. (2022). Delincuencia organizada e inteligencia artificial. Estrategias y propuestas normativas en el contexto de la Unión Europea desde la perspectiva procesal. En F. Garrido y V. Faggiani, Respuesta institucional y normativa al crimen organizado: perfiles estratégicos para una lucha eficaz (pp. 283-314). Thomson Reuters Aranzadi. [ Links ]

De los Mozos, R. (2021). Consideraciones acerca de la trata de seres humanos desde la perspectiva internacional y de la Unión Europea. Cuadernos Cantabria Europa (pp. 85-110). Dirección General de Economía y Asuntos Europeos.https://dialnet.unirioja.es/servlet/articulo?codigo=8281955Links ]

De Rivero, J. (2022). Situación de los derechos humanos en Colombia 2021. Oficina del Alto Comisionado y del Secretario General.https://www.hchr.org.co/informes_anuales/Links ]

De Rivero, J. (2023). Situación de los derechos humanos en Colombia 2022. Oficina del Alto Comisionado y del Secretario General.https://www.hchr.org.co/historias_destacadas/informe-anual-del-altocomisionado-de-las-naciones-unidas-para-losderechos-humanos-sobre-colombia/Links ]

Defensoría del Pueblo. (2018). Informe especial: economías ilegales, actores armados y nuevos escenarios de riesgo en el pos-acuerdo.https://publicaciones.defensoria.gov.co/desarrollo1/ABCD/bases/marc/documentos/textos/Informe_Economias_ilegales.pdfLinks ]

Defensoría del Pueblo. (2022). Dinámicas actuales de reclutamiento, uso y utilización de niños, niñas y adolescentes por parte de grupos armados ilegales o delincuencia organizada. Informe.https://repositorio.defensoria.gov.co/server/api/core/bitstreams/d7d1c05f-7cac-4067-bb66-333f53646545/contentLinks ]

Deshmukh, S. y Annappa, B. (2019). Prediction of crime hot spots using spatiotemporal ordinary kriging. En A. N. Krishna, K. C. Srikantaiah y C. Naveena (Eds.), Integrated intelligent computing, communication and security (pp. 683-691). Springer.https://doi.org/10.1007/978-981-10-8797-4_70Links ]

Ditta, E. (2016). Mexico, Colombia groups bring franchising model to Europe: Europol. InSight Crime.https://insightcrime.org/news/brief/mexicocolombia-groups-bring-franchising-model-toeurope-europol/Links ]

Duriez, T. (2019). El desplazamiento forzado intraurbano: una modalidad de movilidad residencial a las coacciones controvertidas. Territorios, 40, 227-244.https://doi.org/10.12804/revistas.urosario.edu.co/territorios/a.6402Links ]

Elezaj, O., Yayilgan, S. y Kalemi, E. (2021). Criminal network community detection in social media forensics. En S. Yildirim, I. Bajwa y F. Sanfilippo, Intelligent technologies and applications (pp. 371-383). Springer International Publishing.https://doi.org/10.1007/978-3-030-71711-7_31Links ]

Europol (Agencia de la Unión Europea para la Cooperación Policial). (2021). European Union serious and organised crime threat assessment (EU SOCTA). Publications Office EU.https://www.europol.europa.eu/publication-events/mainreports/european-union-serious-and-organisedcrime-threat-assessment-socta-2021Links ]

Europol (Agencia de la Unión Europea para la Cooperación Policial). (2021a). The illicit trade of cocaine from Latin America to Europe: From oligopolies to freefor-all? Series Cocaine Insights 1. UNODC.https://www.europol.europa.eu/publications-events/publications/cocaine-insights-1Links ]

Fundación Paz y Reconciliación. (2020). Seguridad en tiempos de pandemia: legados de guerra y crimen organizado en Colombia. Informe. Línea de investigación en conflicto, paz y posconflicto.https://www.odevida.pares.com.co/post/seguridaden-tiempos-de-pandemia-legados-de-guerra-ycrimen-organizado-en-colombiaLinks ]

Fundación Paz y Reconciliación. (2021). Grupos armados posFarc: una nueva espiral de violencia en Colombia. Informe.https://www.pares.com.co/post/gruposarmados-posfarc-gapf-una-nueva-espiral-deviolencia-en-colombiaLinks ]

Fundación Paz y Reconciliación. (2022). Delincuencia organizada en aglomeraciones urbanas. Línea convivencia y seguridad ciudadana.https://www.pares.com.co/post/informe-delincuenciaorganizada-en-%C3%A1reas-metropolitanasLinks ]

Gelvez, D., Nieto, M. P. y Rocha, C. (2022). Prediciendo el crimen en ciudades intermedias: un modelo de “machine learning” en Bucaramanga, Colombia. Revista Latinoamericana de Estudios de Seguridad, (34), 83-98.https://doi.org/10.17141/urvio.34.2022.5395Links ]

Giménez-Salinas, A. y Fernández, S. (2016). Multiple affiliations in criminal organizations: Analysis of a Spanish sample. Crime, Law and Social Change, 65, 47-65.https://doi.org/10.1007/s10611-015-9597-zLinks ]

Giraldo, H., Ocampo, J., Tuta, F., Gallego, M. y López, Y. (2015). ¿Por qué las personas ingresan a la delincuencia organizada? Análisis del fenómeno en Santiago de Cali. Revista Criminalidad, 57(1), 103-119.https://revistacriminalidad.policia.gov.co:8000/index.php/revcriminalidad/issue/view/16Links ]

Gómez, J., Corredor, S., Arias, V. y Mayorga, C. (2020). Antioquia silenciada. El Espectador.https://reportajes.elespectador.com/antioquia-silenciada/index.html#nav-tabLinks ]

González, P., Cardona, J., Oviedo, M. y Urbina, D. (2020). Desafíos y respuestas urgentes al reclutamiento forzado de menores de edad. Informe Fundación Ideas para la Paz.https://www.ideaspaz.org/publications/posts/1907Links ]

Grijalva, A. E. (2019). Los datos secundarios como fuente de información en la investigación criminológica. En R. Barberet, R. Bartolomé y E. Fernández-Molina, Metodología de investigación en criminología (pp. 225-247). Tirant lo Blanch. [ Links ]

Gutiérrez, M., Mendoza, L., Vélez, M., Weintraub, M. y Norza, E. (2022). Caracterizando espacialmente el delito urbano en Tumaco. Centro de Estudios sobre Seguridad y Drogas (CESED), Universidad de los Andes y Dirección de Investigación Criminal e INTERPOL.https://cesed.uniandes.edu.co/caracterizando-el-delito-urbano-en-tumaco/Links ]

Hox, J. J. y Boeije, H. R. (2005). Data collection, primary vs. secondary. En K. Kempf-Leonard, Encyclopedia of Social Measurement (pp. 593-599). Elsevier. [ Links ]

IBM (International Business Machines). (2021). Guía de CRISP-DM de IBM SPSS Modeler. Manual.https://www.ibm.com/docs/es/spss-modeler/saas?topic=SS3RA7_sub/modeler_crispdm_ddita/modeler_crispdm_ddita-gentopic1.htmLinks ]

Indepaz (Instituto de Estudios para el Desarrollo y la Paz). (2020). Los grupos posFarc-EP: un escenario complejo. Observatorio de Derechos Humanos y Conflictividades de Indepaz.https://indepaz.org.co/los-grupos-posfarc-ep-un-escenario-complejo/Links ]

James, G., Witten, D., Hastie, T. y Tibshirani, R. (2021). An introduction to statistical learning with applications in R. Springer. [ Links ]

Jolliffe, I. (2002). Principal component analysis. Springer. [ Links ]

King, T., Aggarwal, N., Taddeo, M. y Floridi, L. (2020). Artificial intelligence crime: An interdisciplinary analysis of foreseeable threats and solutions. Science and Engineering Ethics, 26, 89-120.https://doi.org/10.1007/s11948-018-00081-0Links ]

Krivoruchko, K. (2011). Spatial statistical data analysis for GIS users. Esri. [ Links ]

Lessing, B. (2022). Criminal governance in Latin America in comparative perspective: Introduction to the special edition. Dilemas - Revista de Estudos de Conflito e Controle Social, 4, 11-20.https://doi.org/10.4322/dilemas.v15esp4.52895Links ]

Leuprecht, C., Aulthouse, A. y Walther, O. (2016). The puzzling resilience of transnational organized criminal networks. Police Practice and Research, 17, 376-387.https://doi.org/10.1080/15614263.2016.1168600Links ]

Makhabel, B., Mishra, P., Danneman, N. y Heimann, R. (2017). R :Mining spatial, text, web, and social media data. Packt Publishing Ltd. [ Links ]

Mantilla, J., Cajiao, A. y Tobo, P. (2021). El Clan del Golfo sin “Otoniel”: ¿qué cambia y qué continúa? Fundación Ideas para la Paz.https://www.ideaspaz.org/publications/posts/2066Links ]

Martínez-Lanz, P., Cuevas-Covarrubias, C. y Hernández-Valdez, P. (2021). Principal component analysis of male criminal behavior. Health, 13, 1112-1128.https://doi.org/10.4236/health.2021.1310083Links ]

Matta, N. (2021). Así se juega el ajedrez del crimen organizado en el Valle de Aburrá. El Colombiano.https://www.elcolombiano.com/antioquia/elajedrez-del-crimen-organizado-en-el-aburra-HL15966076Links ]

Mejía, D., Norza, E., Tobón, S. y Vanegas-Arias, M. (2021). Broken windows policing and crime: Evidence from 80 colombian cities. En P. Buonanno, P. Vanin y J. Vargas (Eds.), A modern guide to the economics of crime (pp. 55-87). Edward Elgar Publishing.http://hdl.handle.net/10784/30182Links ]

Mesa Municipal de Participación Efectiva de Víctimas. (2022). Medellín frente al desplazamiento forzado intraurbano: una ciudad de contrastes. Documento JEP.https://www.convivamos.org/web25w/?p=2214Links ]

Miller, H. J. (2004). Tobler’s first law and spatial analysis. Annals of the Association of American Geographers, 94, 284-289.https://doi.org/10.1111/j.1467-8306.2004.09402005.xLinks ]

Morillas, L. (2022). Globalización y delincuencia organizada. Respuestas penales. En F. Garrido y V. Faggiani, Respuesta institucional y normativa al crimen organizado: perfiles estratégicos para una lucha eficaz (pp. 39-77). Thomson Reuters Aranzadi. [ Links ]

Muñoz, J. (2020). Elementos diferenciadores entre organización y grupo criminal. Revista Electrónica de Ciencia Penal y Criminología, 1(22-08), 1-42.http://criminet.ugr.es/recpc/22/recpc22-08.pdfLinks ]

NoCopio. (2022). Jóvenes del suroeste, agobiados por el microtráfico.https://nocopio.com/jovenes-delsuroeste-agobiados-por-el-microtrafico/Links ]

Norza, E. y Peñalosa, M. (2016). Microextorsión en Colombia: caracterizando el delito desde Medellín, Cartagena y Bogotá, 2011-2014. Revista Criminalidad, 58(1), 131-157.https://revistacriminalidad.policia.gov.co:8000/index.php/revcriminalidad/issue/view/13Links ]

Observatorio de Derechos Humanos y Conflictividades de Indepaz. (2021). Los focos del conflicto en Colombia: informe sobre presencia de grupos armados. Indepaz.https://indepaz.org.co/los-focos-del-conflicto-encolombia/Links ]

Pérez, J. (2021). Cuando la violencia sobra y el trabajo falta. Escenarios para jóvenes de sectores populares urbanos en América Latina. Última Década, 55, 33-61.https://dialnet.unirioja.es/descarga/articulo/8622545.pdfLinks ]

Perversi, I., Valenga, F., Fernández, E., Britos, P. y García, R. (2007). Identificación y detección de patrones delictivos basada en minería de datos. IX Workshop de Investigadores en Ciencias de la Computación (pp. 385-389). [ Links ]

Piedrahíta, P. (2020). Local y global: el Estado frente al delito transnacional. Revista Derecho del Estado, 2, 137-160.https://doi.org/10.18601/01229893.n46.06Links ]

Prieto-Curiel, R., Campedelli, G. M. y Hope, A. (2023). Reducing cartel recruitment is the only way to lower violence in Mexico. Science, 381, 1312-1316.https://doi.org/10.1126/science.adh2888Links ]

ProAntioquia. (2018). Estado de la educación en Antioquia. Informe.https://www.proantioquia.org.co/node/26337Links ]

Raschka, S. y Mirjalili, V. (2019). Python machine learning. Packt Publishing Ltd. [ Links ]

Rencher, A. y Christensen, W. (2012). Methods of multivariate analysis. Wiley series in Probability and Mathematical Statistics. [ Links ]

Restrepo, V. (2020). Suroeste, nuevo foco en disputas por microtráfico. El Colombiano.https://www.elcolombiano.com/antioquia/suroestede-antioquia-nuevo-foco-en-disputas-pormicrotrafico-JI13287970Links ]

Revatthy, K. y Satheesh, K. (2016). An attribute weighted fuzzy clustering algorithm for mixed crime data. Indian Journal of Science and Technology, 9, 1-7.https://dx.doi.org/10.17485/ijst/2016/v9i8/87910Links ]

Rød, E. G., Gåsste, T. y Hegre, H. (2023). A review and comparison of conflict early warning systems. International Journal of Forecasting, 40(Issue 1), 96-112.https://doi.org/10.1016/j.ijforecast.2023.01.001Links ]

Rojas, F. (2008). Globalización y violencia en América Latina. Debilidad estatal, inequidad y crimen organizado inhiben el desarrollo humano. Pensamiento Iberoamericano, 1, 3-36.https://dialnet.unirioja.es/ejemplar/213360Links ]

Rojas, F. (2021). Latinoamérica: once escenarios después de la pandemia. Foreign Affairs Latinoamérica, 21, 2-5.https://revistafal.com/numeros-anteriores/fal-21-4/Links ]

Romero, J. J. (2023). Criptomonedas, blanqueo de capitales y crimen organizado: avances y cuestiones pendientes. En F. J. Garrido, V. Faggiani y J. J. Romero, Planificación, estrategias y medios en la lucha contra el crimen organizado y en la recuperación de activos (pp. 247-278). Aranzadi. [ Links ]

Salcedo, E. y Garay, L. (2016). ¿Por qué son tan resistentes las actuales redes criminales? En E. Salcedo, L. Garay y F. Gómez, Macro-criminalidad: complejidad y resiliencia de las redes criminales (pp. 3-20). Publisher: iUniverse, Vortex Foundation Small Wars Journal.https://www.researchgate.net/publication/326465064_Macro-criminalidad_Complejidad_y_Resiliencia_de_las_Redes_CriminalesLinks ]

Sansó-Rubert, D. (2021). La política criminal en la encrucijada. Nuevas perspectivas y desafíos originados por las transformaciones de la criminalidad organizada. En L. Zúñiga y J. Ballesteros, Nuevos desafíos frente a la criminalidad organizada transnacional y el terrorismo (pp. 19-47). Dykinson. [ Links ]

Silva, J., Palacio de la Cruz, S., Hernández, J., García, D., Neira, H., Hernández, H., Romero L. (2019). Early warning system based on data mining to identify crime patterns. En Y. Tan y Y. Shi (Eds.), Data mining and big data (pp. 259-268). Springer Singapore.https://doi.org/10.1007/978-981-32-9563-6_27Links ]

Spiezia, F. (2022). The challenges of the European Union in the fight against organized crime. En F. Garrido y V. Faggiani, Respuesta institucional y normativa al crimen organizado: perfiles estratégicos para una lucha eficaz (pp. 79-102). Thomson Reuters Aranzadi. [ Links ]

Sweijs, T. y Teer, J. (2022). Practices, principles and promises of conflict early warning systems. Informe. The Hague Centre for Strategic Studies.https://hcss.nl/report/practices-principles-and-promises-ofconflict-early-warning-systems/Links ]

Torrado, O., Hernández, A., Calvete, E. y Prada, E. (2021). Factores protectores y de riesgo asociados a las conductas delictivas en adolescentes: una revisión sistemática. Revista Criminalidad, 63(1), 105-122.https://revistacriminalidad.policia.gov.co:8000/index.php/revcriminalidad/issue/view/29Links ]

Transparency International. (2023). IPC 2022 de las Américas: terreno fértil para el crimen organizado y los abusos de derechos humanos.https://www.transparency.org/es/news/cpi-2022-americascorruption-criminal-networks-human-rights-abusesLinks ]

Turkewitz, J. (2022). En lo profundo de Colombia, una nueva generación de combatientes se enfrenta por lo mismo: el control del tráfico de drogas. The New York Times.https://www.nytimes.com/es/2022/04/20/espanol/colombia-grupos-armados.htmlLinks ]

UNODC (United Nations Office on Drugs and Crime). (2023). Global report on trafficking in persons 2022. Report.https://www.unodc.org/documents/dataand-analysis/glotip/2022/GLOTiP_2022_web.pdfLinks ]

Uribe, A., Lessing, B., Schouela, N., Stecher, E. y Block, D. (2022). Criminal governance in Latin America: An initial assessment of its extent and correlates. SSRN.http://dx.doi.org/10.2139/ssrn.4302432Links ]

Usman, U., Suleiman, S., Yar’adua, S. I. y Abduljalil, I. (2021). Spatial analysis on the crimes rate using regression kriging model. European Journal of Advances in Engineering and Technology, 8(10), 64-69.https://doi.org/10.5281/zenodo.10651367Links ]

Valls, J. (2016). Nuevas formas de combatir el crimen en internet y sus riesgos. Revista Electrónica de Ciencia Penal y Criminología, 18-22 , 1-36.http://criminet.ugr.es/recpc/18/recpc18-22.pdfLinks ]

Valls, J. y Gallo, F. (2022). El arte de pescar en aguas profundas: metodología de investigación criminológica basada en Dark Web y Honeypots. Cuadernos de Política Criminal, 138(1), 223-253. [ Links ]

Viano, E. (2017). Cybercrime, organized crime, and societal responses: International approaches. Springer. [ Links ]

Wang, T., Rudin, C., Wagner, D. y Sevieri, R. (2013). Learning to detect patterns of crime. En H. Blockeel, K. Kersting, S. Nijssen y F. Železný (Eds.), Machine learning and knowledge discovery in databases (pp. 515-530). Springer.https://doi.org/10.1007/978-3-642-40994-3_33Links ]

Wirkus, L. y Piereder, J. (2019). Early warning systems for drought and violent conflict-toward potential cross-pollination. En E. Mapedza, D. Tsegai, M. Bruntrup y R. Mcleman (Eds.), Drought challenges (pp. 165-181). Elsevier.https://doi.org/10.1016/B978-0-12-814820-4.00011-0Links ]

Zepeda, R. (2023). Conceptualising criminal wars in Latin America. Third World Quarterly, 44, 776-794.https://doi.org/10.1080/01436597.2022.2153665Links ]

Zúñiga, L. (2021). Derecho penal de la seguridad: ¿seguridad para todos? En L. Zúñiga y J. Ballesteros, Nuevos desafíos frente a la criminalidad organizada transnacional y el terrorismo (pp. 99-126). Dykinson. [ Links ]

Zúñiga, L. (2022). Una propuesta de política criminal integral para cada fenómeno criminal. En V. Gómez, C. Bolea, J.-I. Gallego, J. Hortal, U. Joshi, V. Valiente y G. Ramírez, Un modelo integral de derecho penal: libro homenaje a la profesora Mirentxu Corcoy Bidasolo (pp. 379-390). Agencia Estatal Boletín Oficial del Estado. [ Links ]

1Esto quiere decir que las componentes principales no están correlacionadas.

2El valor de membresía es la probabilidad de que un punto de datos específico pertenezca a grupos con similitudes significativas.

3Contrario a lo que ocurre en el “agrupamiento pesado” o hard clustering donde cada muestra en un conjunto de datos se asigna “exactamente” a un grupo, como lo hace la técnica k-Means.

4Los resultados de la encuesta Data Science Process Alliance realizada en el 2020 a 109 líderes de equipos de ciencia de datos, muestran que el 49 % de los encuestados utilizan con mayor frecuencia CRISP- DM. A esto le siguieron Scrum (18 %), Kanban (12 %), “My own” (12 %) y TDSP (4 %). Además, al comparar con encuestas anteriores, el porcentaje de personas que utilizan el método CRISP-DM no ha cambiado significativamente durante los últimos 20 años. https://www.datascience-pm.com/crisp-dm-still-most-popular/

5Los municipios están agrupados en nueve subregiones: Bajo Cauca, Magdalena Medio, Nordeste, Norte, Occidente, Oriente, Suroeste, Urabá y Valle de Aburrá

6Los dos años seleccionados permiten utilizar la información del mercado laboral y pobreza multidimensional a nivel de municipios del Censo Nacional de Población y Vivienda 2018, y la medida en el 2019 por la Dirección de Información Departamental de Antioquia. Además, las bases de datos para esos años tienen la información completa y no presentan novedades, como ocurre para el 2020 y 2021 por la pandemia del COVID-19 (Alvarado et al., 2020).

7El monitoreo realizado por la Defensoría del Pueblo (Alerta Temprana de Inminencia 059-18) en el Bajo Cauca, ha permitido establecer que el grupo Los Pachelly de Bello se encuentra en esta subregión a través de una estructura que se autodenomina “Nueva Empresa”, que cuenta posiblemente con el apoyo económico y con el suministro de armas de un actor trasnacional; según algunos testimonios recogidos por el Sistema de Alertas Tempranas (SAT), podría tratarse del cartel mexicano de Jalisco “Nueva Generación”. Asimismo, en una operación conjunta entre España y Colombia, desarticulan una red que utilizaba sicarios para prostituir a mujeres y extorsionar a sus familias en sus países de origen. Estas amenazas eran llevadas a cabo en Colombia por el grupo criminal “Los Pachelly”, vinculado al Clan del Golfo, el principal grupo narcotraficante del país. https://elpais.com/sociedad/2023-05-12/una-operacion-entre-espana-y-colombia-desarticula-una-red-que- utilizaba-sicarios-para-extorsionar-y-prostituir-a-mujeres.html

8En ACP las nuevas variables o componentes principales se buscan de manera que estén lo más cerca posible del conjunto de variables originales. Podemos pensar en estas nuevas variables como “variables sintéticas”. https://pca4ds.github.io/

9El kriging es una técnica de interpolación espacial en la que los valores medidos circundantes se ponderan para generar un valor previsto de una ubicación no medida. Las ponderaciones se basan en la distancia entre los puntos medidos, las ubicaciones de predicción y la disposición espacial general entre los puntos (Krivoruchko, 2011).

10Penalización o cobro por alejarse de un centro; para el FCM es una generalización de la distancia euclidiana.

11Aunque solo el 15 % de los estudiantes son atendidos en sedes educativas rurales del departamento de Antioquia, estas sedes representan el 72 % del total, lo que da cuenta de un alto nivel de dispersión en la ruralidad (ProAntioquia, 2018). Si bien las instituciones educativas constituyen un factor de protección de los niños, las niñas y los adolescentes contra el reclutamiento ilícito, en regiones como el Bajo Cauca son precisamente las escuelas y colegios los principales escenarios utilizados por los grupos armados ilegales para cometer este delito (Charles, 2022; DANE, 2021; De Rivero, 2022).

Para citar este artículo / To reference this article / Para citar este artigo: Granados-Garzón, L. (2024). La minería de datos con agrupamiento difuso para el cálculo del riesgo de ocupación criminal por parte de grupos armados ilegales. Revista Criminalidad, 66(2), 137-166. https://doi.org/10.47741/17943108.610

Recibido: 02 de Febrero de 2024; Revisado: 30 de Mayo de 2024; Aprobado: 07 de Junio de 2024

* Autor de correspondencia: Leonardo Granados Garzón, email: ogranados@correo.ugr.es

Nota de conflicto de interés:

No se presentó conflicto de interés entre los autores de la presente investigación académica. Declaramos que no tenemos ninguna relación financiera o personal que pudiera influir en la interpretación y publicación de los resultados obtenidos. Asimismo, aseguramos cumplir con las normas éticas y de integridad científica en todo momento, de acuerdo con las directrices establecidas por la comunidad académica y las dictaminadas por la presente revista.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons