Introducción
Existen diferentes factores que permiten identificar los países que cuentan con mayores niveles de bienestar social, entendido este como el conjunto de condiciones que se miden a través de índices de calidad de vida: el trabajo, los ingresos, el ambiente, la educación, la salud, entre otros índices, que orientan la construcción de sociedades con los más altos estándares sociales, como lo evidencia la Organización para la Cooperación y el Desarrollo Económicos (OECD, 2021). Entre todos estos factores, sobresale la percepción del estado de tranquilidad, protección social y bienestar de cada país, que se asocia con el indicador de seguridad como causa del nivel de vida (OECD, 2021).
La seguridad ha sido objeto de estudio ante los constantes hechos de conflicto y violencia vividos históricamente. A raíz de esto, se ha establecido una relación entre seguridad y desarrollo (Duffield, 2020). Países de América Latina como Guatemala, Honduras, Nicaragua, Colombia y Venezuela han tenido altos índices de desigualdad, homicidios, pobreza, migración y conflicto, que se han justificado por falta de acciones de los Estados y el consecuente desbalance de los aspectos sociales que construyen el bienestar social. La Unión Europea recoge estos factores de bienestar social como un indicativo de desarrollo y seguridad, de forma que se pueda establecer la disminución de actos violentos y los avances en materia de seguridad (Gratius & Rodríguez, 2021).
El concepto de seguridad, según Kahhat (2019), se concibe desde diferentes enfoques dependiendo de sus fines, amenazas, objetos de referencia y medios. En este sentido, cabe comprender la seguridad como la carencia de amenazas; y en relación con los Objetivos de Desarrollo Sostenible, la seguridad implica una lucha contra la desigualdad, los actos delictivos y la violencia, así como el refuerzo de políticas encaminadas a disminuir la inseguridad (Duffield, 2020; Gratius & Rodríguez, 2021).
Los factores de violencia entorpecen el progreso y avance de la seguridad social. Respecto a ellos, se han estudiado y establecido diferentes aspectos (Valencia, 2018; Niño, 2020; Rodríguez et al., 2020). Así, hay factores sociales como el conflicto armado, el desplazamiento que este genera y la sobrepoblación en países desiguales e inequitativos, como puede medirse con el coeficiente de Gini (Datosmacro, 2021), que muestra una alta desigualdad en la mayoría de los países estudiados y un incremento de los índices de inseguridad y delitos cometidos, dada la falta de empleo y la complejidad de conseguir sustento para suplir las necesidades básicas. Asimismo, la escasa educación de calidad, la desigualdad social y la falta de acción del Estado da pie al surgimiento de actos criminales y de violencia (Palacio, 2020).
América Latina es considerada un territorio pacífico, por cuanto no hay conflictos entre naciones, pero paradójicamente lleno de violencia. Un claro ejemplo es Colombia, un país en el que el conflicto armado se ha debilitado, pero ha perdurado hasta hoy en día (Niño, 2020), por lo cual los delitos de violencia tienen una incidencia importante, que difiere en cada región del país. Por eso es importante caracterizar estos delitos para poder tomar acciones en pro de mitigarlos, según el contexto específico en el que ocurran.
Colombia ha vivido un conflicto armado por más de sesenta años cuyas consecuencias y dinámicas de violencia persisten en la actualidad, como se observa en las cifras de la OECD (2021). Así, Colombia obtuvo para 2021 un 43,24% en porcentaje de seguridad tanto rural como urbana, en contraste con Noruega, el país de mayor índice de bienestar, con un porcentaje de 93,08 %. Esto evidencia una gran diferencia, producto de la inestabilidad en seguridad y bienestar para la población colombiana. Esta problemática hace necesarias las investigaciones sobre las causas, el control y el abordaje de los factores de violencia en el país.
En ese sentido, considerando la percepción de la ciudadanía, la Encuesta de Convivencia y Seguridad Ciudadana (ECSC), aplicada por el Departamento Administrativo Nacional de Estadística (DANE, 2021), muestra que la percepción de inseguridad asciende, luego de una bajada en 2020, de 39% a 44%, sobrepasando la tasa de inseguridad de 2019 (39,7 %), mientras que, para el área urbana y rural, la tasa de inseguridad aumentó en un 6,2 % y 0,3 % respectivamente.
Asimismo, el aumento para septiembre de 2022 de algunos delitos violentos, como la extorsión, las amenazas, el secuestro y el terrorismo, en comparación con 2021 (Policía Nacional de Colombia, 2022), reafirman el incremento de la inseguridad percibido por la ciudadanía, y que, en consecuencia, reduce el bienestar social. Esto conlleva nuevos retos para las autoridades encargadas de garantizar la seguridad pública de Colombia -en este caso, la Policía Nacional de Colombia-, que requiere tomar acciones para atender de manera rápida y eficaz las situaciones problemáticas, de modo que disminuya la ocurrencia de delitos en las zonas críticas de Colombia, en aras de la tranquilidad y bienestar de la población.
La Policía Nacional de Colombia ha adelantado operativos para controlar hechos delictivos a través de la instalación de sistemas de vigilancia, establecimiento de cuadrantes, actividades de sensibilización ciudadana y registros de delitos en bases de datos, clasificados por su tipo, para mayor entendimiento y análisis (Ordóñez et al., 2020).
Sin embargo, pese a que estas herramientas reducen los delitos y posibilitan un accionar oportuno, el abordaje pleno y pertinente de esta problemática requiere una mayor aplicabilidad de técnicas inteligentes que converjan en la celeridad y el combate de delitos. Así lo argumenta Tello (2022), al mencionar que dichos mecanismos contribuyen a la evaluación y aplicación de estrategias que inciden en la validez y eficiencia faltante. En consecuencia, esta investigación, basada en inteligencia artificial, junto con el tratamiento de bases de datos, busca estrategias para detectar, clasificar y predecir los delitos, como lo sugieren varios autores (Sukhija et al., 2022; Suruliandi et al., 2019). Investigaciones previas en este tema abarcan variables territoriales o geoespaciales centradas en un lugar, ya sean ciudades o barrios específicos (Ordóñez et al., 2020; Aguirre et al., 2018; Aguilar 6c Contreras, 2018); no obstante, si bien contribuyen a entender el comportamiento delictivo en Colombia, tienen limitaciones debido a que dejan de lado criterios tan relevantes como el análisis multivariado de diferentes tipologías de delitos en diversas zonas de Colombia.
Considerando lo anterior, la investigación ha buscado responder las siguientes preguntas: ¿Cuál es la caracterización de los delitos o factores de violencia en los diferentes departamentos de Colombia? ¿Cuáles son los perfiles departamentales con mayores delitos violentos en Colombia? ¿Cómo pronosticar los perfiles de delitos en Colombia a través de inteligencia artificial? Con esto se busca establecer perfiles de violencia departamentales en los que prevalezcan delitos violentos como las amenazas, delitos sexuales, extorsión, homicidios, secuestros y terrorismo, además de la predicción basada en redes neuronales que posibiliten su pronóstico. Esto derivó en los siguientes objetivos de investigación: 1) caracterizar los delitos o factores de violencia en los diferentes departamentos de Colombia; 2) proponer los conglomerados o perfiles de delitos violentos en Colombia por medio de clustering, y 3) pronosticar los perfiles de delitos en Colombia mediante la inteligencia artificial.
Marco teórico
Factores y delitos violentos en Colombia
Los factores de violencia en Colombia han prevalecido por diversos motivos. Sánchez (2020) explica que se deben principalmente a la inequidad en el acceso a derechos básicos, así como la desigualdad en el ejercicio de la justicia, de ingresos y de acceso a oportunidades. Esto se refleja en la disparidad en calidad de vida, calidad en salud, consumo per cápita y educación en los territorios y en el contexto regional de la población. Por tanto, es importante entender las épocas y situaciones que predisponen los índices de violencia en Colombia. Un punto a tener en consideración son los delitos que implican violencia, entendida como aquellas acciones que implican comportamientos dañinos sobre una persona, que se presentan en delitos como los homicidios, la violencia sexual y los hurtos (Magalhães, 2022).
Por ende, el análisis de delitos por tipología y ubicación espacial y temporal es relevante para desplegar las operaciones policiales necesarias en el momento exacto. De ahí que se tenga conciencia de las áreas de bajo y alto impacto delictivo según su ubicación, patrones y épocas del año (Butt et al., 2021). Por ello, todos los países establecen normas que tipifican estos incidentes con valor judicial. En Colombia, los delitos se establecen en el Código Penal (Ley 599,2000), donde prevalecen las conductas punibles y sus sanciones, con el fin de regular la sociedad y garantizar la acción de la justicia. La Policía Nacional clasifica y registra los eventos delictivos (como homicidios, lesiones, hurtos, piratería, abigeato, terrorismo, delitos sexuales, violencia intrafamiliar y amenazas) que ocurren en el territorio colombiano a través de su base de información de estadísticas delictivas, donde los desagrega en variables como tiempo, modo y lugar, con el objetivo de entender el desarrollo de cada crimen cometido (Policía Nacional de Colombia, 2022). Con esto, para efectos prácticos de la investigación, fue necesario definir los delitos violentos objeto de estudio, de acuerdo con el Código Penal colombiano (Ley 599, 2000).
Así, las amenazas se consideran delitos que atemorizan a personas, instituciones, entidades o familias con el fin de propagar terror o coaccionarlas; los delitos sexuales son actos carnales abusivos y violentos; los delitos de extorsión son un acto de opresión y de obligación a tolerar o pasar por alto hechos, palabras y órdenes con el propósito de recibir beneficios para sí mismo o terceros. Por otra parte, los homicidios son delitos que atenían contra la vida de una persona, ya sea homicidio culposo, preterintencional o por piedad; a su vez, los delitos de secuestro se refieren a actos de privación de la libertad por retener, arrebatar o sustraer a una persona, ya sea secuestro simple o extorsivo. Por último, el terrorismo procesa aquellos actos de conflicto armado en el que estén implicados ataques de violencia hacia la población.
Clustering en el sector de criminología
El análisis de clustering (o agolpamiento) es una técnica multivariante enfocada en formar grupos o conglomerados de datos, con el fin de obtener etiquetas de características diferenciadoras para su comparación, con base en la cercanía o similitud de sus elementos para conocer los patrones estudiados. De acuerdo al concepto de Chang y Chen (2018), la técnica de clústeres, denominada también como análisis de segmentación o de taxonomía, aplica un método estadístico para generar grupos a través de una muestra de datos, señalando el número adecuado de conglomerados para evaluar variables de la mejor forma y establecer aquellos grupos similares que se alejan o son diferentes entre sí. Otros investigadores consideran este método como la partición de variables en subconjuntos para un agrupamiento que permita hallar la conformación organizada y brindar hipótesis en respuesta a las inquietudes surgidas al estudiar o investigar dichas variables (Jami & Gore, 2019).
En este sentido, las técnicas de clustering se han empleado para evaluar diversos temas. De la Hoz-Domínguez et al. (2021) utilizaron el análisis por conglomerados para identificar los grupos de 27 entidades de salud acreditadas en alta calidad, siguiendo los patrones de acreditación y variables de entrada como cuentas por cobrar, inventario, propiedad y equipo, y variables de salida como las ventas de servicios de salud y utilidad neta. Esto arrojó dos principales grupos de instituciones: las acreditadas en proceso de consolidación financiera y otras instituciones acreditadas financieramente sólidas. Fontalvo et al. (2021) también mostraron la importancia del clustering en análisis de diversos contextos. Igualmente, existen estudios de aplicación de clustering en el campo criminalístico: Sukhija et al. (2022) identificaron puntos criminales con clasificadores no supervisados y el algoritmo K-nearest (K-más cercano) en Gurgaon, India, teniendo en cuenta casos delictivos de los últimos cinco años en esta zona; de esta forma se reconocieron los puntos geográficos en función de la captación de delitos, con una precisión del 99 %.
Por su parte, Butt et al. (2021) dispusieron de un análisis de conglomerado jerárquico mediante un algoritmo de agrupamiento HDDSCAN, que filtra datos espaciales para encontrar las características de los grupos sin información a priori sobre el número de clústeres que deben ser encontrados dentro de la región -en este caso, las zonas de mayor población, negocios y movilidad de Nueva York-. Los resultados demuestran la zona con mayor delincuencia, lo que permite empoderar a las autoridades para que desarrollen patrullajes o estrategias basadas en esta información. Otros trabajos usan estas herramientas para investigar más a profundidad a partir de los puntos calientes localizados por clústeres, con el fin de predecir sus ocurrencias en un futuro, en conjunto con análisis bidimensionales, lo que permite una mayor comprensión y actuación sobre los espacios locales según la categoría delictiva y su relación con variables como el tiempo, la ubicación, los ingresos por familia y demás (Hajela et al., 2020).
Por último, en Colombia también se han hecho estudios de análisis por grupos en diferentes ciudades. Tal es el caso expuesto por Aguirre et al. (2018), que demostraron cómo a través de la minería de datos es posible identificar barrios con mayor significancia en hurtos, así como los departamentos donde prevalecieron delitos sexuales entre los años de 2010 y 2016. Además, evidencia que estas técnicas permiten un aprovechamiento del volumen de datos tratados, dado que las técnicas tradicionales resultan ineficientes para ello; aunque sea un método complejo, la información resultante genera nuevo conocimiento para la toma de decisiones.
Redes neuronales y predicción en el sector de delitos en Colombia
Las redes neuronales pertenecen al subgrupo de técnicas empleadas en inteligencia artificial y deep learning (aprendizaje profundo). Se trata de redes neuronales artificiales que imitan el comportamiento basado en datos históricos para predecir o pronosticar ocasiones futuras en las que se repitan y detecten tales conductas, y que adquieren experiencia a través del aprendizaje automático en la entrada de nodos, nodos ocultos y nodos de salida, que permiten arrojar un resultado concreto. Qi et al. (2019) explican que las redes neuronales son un tipo de inteligencia artificial inspeccionada, con etiquetas en las que los datos de entrada predisponen las respuestas de los modelos estudiados.
Esto ha permitido el desarrollo de nuevas investigaciones, como la detección de comportamientos maliciosos en equipos Android mediante la toma de muestra de acciones y su integración por grupos de características por cada comportamiento, para entrenar la red neuronal y finalmente identificar en la vida real aquellos patrones que predicen un enlace malicioso (Chen et al., 2020). Asimismo, otros autores utilizan las redes neuronales para detectar otros fenómenos, como la identificación del bullying mediante el reconocimiento de expresiones o palabras que puedan convertirse en ciberacoso, para así ayudar a la población víctima de esta problemática (Cumba-Armijos et al., 2022).
Asimismo, el uso de las redes neuronales en análisis y predicción delincuencial ha prevalecido en los últimos años, por lo cual se han incrementado los países que lo han aplicado, así como los softwares y artículos publicados para la mejor detección y acción sobre los hechos delictivos (Walteros et al., 2021; Khan &: Wani, 2019). Es así como se ha podido establecer una red neuronal capaz de detectar intrusiones en la red con un algoritmo de red difusa y métodos de identificación lineal, con resultados exactos, para asegurar y proteger la red (Dai; 2020).
Por su parte, George et al. (2019) compilaron una red neuronal de dos clases que predice cuándo una persona habla y se expresa con sinceridad o falsedad a partir de sus gestos faciales. Primero, se entrenó la red con 62 sujetos de pruebas y se almacenó la variabilidad muscular facial para luego probar y generar pronósticos al respecto. Estos antecedentes muestran la practicidad y funcionalidad de estas técnicas innovadoras, que garantizan un tratamiento competente de los datos que se analizan dirigido a la toma de decisiones, por cuanto se pueden pronosticar comportamientos futuros en contextos delictivos.
Metodología
Para el desarrollo de la investigación se asumió un enfoque epistemológico explicativo-cuantitativo. Inicialmente se caracterizó, organizó y tabuló la información empírica asociada a los delitos o factores de violencia en los diferentes departamentos de Colombia en una ventana de observación de 2018 a 2022. Luego se analizaron los diferentes modelos asociados con el clustering, y después se propuso un modelo que permitió establecer los conglomerados o perfiles relacionados con los delitos o factores de violencia para los diferentes departamentos del país. Finalmente, con los conglomerados como variables de entrada, a través de un análisis racional lógico, se estableció una estructura que permitió instaurar una red neuronal de doble capa para predecir dichos perfiles o clústeres de los factores de violencia en Colombia.
Como información primaria, se partió de las estadísticas generadas por la Policía Nacional de Colombia en su base de datos de estadísticas delictivas. Así, se utilizaron registros delictivos de amenazas, delitos sexuales, extorsión, homicidio, secuestro y terrorismo entre 2018 y septiembre de 2022. De esta forma, se consolidó la información de los diferentes delitos violentos para procesarlos, clasificados en los 32 departamentos de Colombia, como se observa en la Tabla 1.
Fuente: Policía Nacional de Colombia (2022)
Con la información consolidada, se procedió a procesar la información mediante el programa de sistematización estadística Minitab 16, con el fin de establecer los grupos característicos de violencia por conglomerado y el dendograma de los perfiles de violencia por departamentos en Colombia para el periodo correspondiente. Seguidamente, con la información del clustering y los conglomerados generados, se utilizó el software estadístico IBM SPSS 27 para proponer una red neuronal de doble capa, mediante la cual se predijo el conjunto de delitos agrupados.
Resultados
Para alcanzar los objetivos de esta investigación, fue necesario considerar y aplicar los dos modelos presentados a continuación, y que se relacionan entre sí: el clustering y las redes neuronales.
Clustering
Tras el análisis con múltiples modelos asociados a las técnicas de cluster, se procedió a estandarizar las variables con el fin de asignar una medida homogénea de similitud para su conglomeración por grupos que se basara en un criterio certero. Con esto se pudieron identificar los modelos que se ajustaban a la información empírica recolectada y consolidada por la Policía Nacional de Colombia para el periodo 2018-2022, con las funciones jerárquicas de distancia euclidiana, para clasificar variables similares entre sí. Además, para el análisis de cluster, se decidió emplear también el enlace de Ward, en el que cada grupo se une al centro del cluster con el que se halle el menor número de errores posibles, es decir, de la diferencia de los cuadrados de sus desviaciones. Así se obtuvieron las diversas estadísticas, que se consolidaron en un dendrograma con los clústeres resultantes. En la Tabla 2 se puede observar el paso de amalgamación y en la Figura 1, el dendograma de los clústeres de delitos por departamento.
Paso | Conglomerados | Nivel de semejanza | Nivel de distancia | Conglomerados incorporados | Nuevo conglomerado | Numero de observaciones en el nuevo conglomerado | |
---|---|---|---|---|---|---|---|
1 | 31 | 99,590 | 0,0367 | 15 | 32 | 15 | 2 |
2 | 30 | 99,368 | 0,0565 | 1 | 15 | 1 | 3 |
3 | 29 | 99,102 | 0,0803 | 1 | 31 | 1 | 4 |
4 | 28 | 98,497 | 0,1344 | 1 | 26 | 1 | 5 |
5 | 27 | 98,142 | 0,1661 | 8 | 23 | 8 | 2 |
6 | 26 | 97,090 | 0,2602 | 7 | 25 | 7 | 2 |
7 | 25 | 97,075 | 0,2615 | 17 | 19 | 17 | 2 |
8 | 24 | 96,956 | 0,2721 | 8 | 28 | 8 | 3 |
9 | 23 | 96,433 | 0,3188 | 5 | 29 | 5 | 2 |
10 | 22 | 96,243 | 0,3358 | 8 | 24 | 8 | 4 |
11 | 21 | 95,523 | 0,4003 | 8 | 9 | 8 | 5 |
12 | 20 | 95,111 | 0,4371 | 5 | 13 | 5 | 3 |
13 | 19 | 94,153 | 0,5227 | 1 | 16 | 1 | 6 |
14 | 18 | 93,810 | 0,5533 | 4 | 27 | 4 | 2 |
15 | 17 | 93,243 | 0,6040 | 7 | 8 | 7 | 7 |
16 | 16 | 92,687 | 0,6537 | 10 | 22 | 10 | 2 |
17 | 15 | 92,266 | 0,6914 | 5 | 6 | 5 | 4 |
18 | 14 | 92,009 | 0,7143 | 17 | 18 | 17 | 3 |
19 | 13 | 91,947 | 0,7199 | 11 | 12 | 11 | 2 |
20 | 12 | 89,657 | 0,9246 | 20 | 21 | 20 | 2 |
21 | 11 | 87,148 | 1,1489 | 11 | 17 | 11 | 5 |
22 | 10 | 85,776 | 1,2715 | 4 | 5 | 4 | 6 |
23 | 9 | 77,550 | 2,0069 | 4 | 11 | 4 | 11 |
24 | 8 | 73,808 | 2,3414 | 1 | 7 | 1 | 13 |
25 | 7 | 73,194 | 2,3963 | 4 | 20 | 4 | 13 |
26 | 6 | 68,001 | 2,8605 | 3 | 10 | 3 | 3 |
27 | 5 | 57,544 | 3,7953 | 2 | 30 | 2 | 2 |
28 | 4 | 35,062 | 5,8051 | 2 | 14 | 2 | 3 |
29 | 3 | 11,718 | 7,8918 | 1 | 4 | 1 | 26 |
30 | 2 | -30,135 | 11,6332 | 2 | 3 | 2 | 6 |
31 | 1 | -207,934 | 27,5273 | 1 | 2 | 1 | 32 |
Fuente: Elaboración propia con Minitab 16.
Así pues, teniendo en cuenta las corridas junto con los niveles de distancia y de semejanza entre variables, se dividieron los departamentos por los grupos característicos más cercanos entre sí, como se observan en el dendograma (Figura 1), que estableció los cuatro conglomerados o clústeres de los diferentes delitos clasificados en las diferentes regiones de Colombia. De este modo se pudieron reconocer los perfiles y sectores con mayor o menor impacto de delitos de violencia en el país.
Luego, mediante el dendograma, se pudieron reconocer cuatro clústeres. El primer clúster hace referencia a los departamentos de Amazonas, Guainía, Vichada, Vaupés, San Andrés, Guaviare, Caldas, Risaralda, Caquetá, Putumayo, Sucre, Quindío y Casanare. En el segundo clúster se encuentran los departamentos de Antioquia, Valle y Cundinamarca. El tercer clúster agrupa los departamentos de Arauca, Cauca y Norte de Santander. Por último, en el cuarto clúster se encuentran los departamentos de Atlántico, Santander, Bolívar, Tolima, Córdoba, Boyacá, Cesar, Chocó, Huila, Magdalena, Guajira, Meta y Nariño. De esta manera se clasificaron los diferentes departamentos de Colombia en los grupos jerárquicos. Además, en la Tabla 3, se evalúa el número de departamentos correspondiente a cada conglomerado, sus distancias respecto al centro y su pertenencia a las características particulares encontradas en los clústeres que aluden a los criterios seleccionados para corresponder a cada grupo.
Clúster | Número de observaciones | Dentro de la suma de cuadrados del conglomerado | Distancia promedio desde el centroide | Distancia máxima desde el centroide |
---|---|---|---|---|
Clúster 1 | 13 | 1,3628 | 0,31678 | 0,50325 |
Clúster 2 | 3 | 23,9197 | 2,75946 | 3,33842 |
Clúster 3 | 3 | 3,7537 | 1,03429 | 1,53623 |
Clúster 4 | 13 | 6,2366 | 0,64984 | 1,17533 |
Fuente: Elaboración propia con Minitab 16
En la Tabla 3 se identifican también los clústeres según su incidencia en hechos delictivos. El clúster con mayor incidencia es el 2, seguido por el clúster 3, luego el clúster 4 y finalmente el cluster de menor incidencia es el 1, a pesar de ser uno de los grupos con mayor número de departamentos. Estos resultados muestran que el clúster 1 contiene el conjunto de departamentos con menores niveles de violencia y ocurrencia de delitos en la ventana de tiempo de evaluación de esta investigación. Por su parte, el clúster 2, aun cuando lo componen solo tres departamentos, reúne el mayor número de delitos de violencia cometidos en Colombia en el periodo evaluado. En consecuencia, en la Tabla 4 se señalan los centroides de los conglomerados asociados con los delitos de amenazas, delitos sexuales, extorsión, homicidio, secuestro y terrorismo.
Variable | Clúster 1 | Clúster 2 | Clúster 3 | Clúster 4 | Centroide principal |
---|---|---|---|---|---|
Amenazas | -0,581995 | 2,35815 | 0,00286 | 0,037146 | -0,0000000 |
Delitos sexuales | -0,497539 | 2,67149 | -0,28801 | -0,052496 | 0,0000000 |
Extorsión | -0,549340 | 2,88433 | 0,08752 | -0,136472 | 0,0000000 |
Homicidio | -0,535917 | 2,82245 | 0,15193 | -0,150476 | 0,0000000 |
Secuestro | -0,664814 | 1,99784 | 1,82964 | -0,218451 | -0,0000000 |
Terrorismo | -0,498491 | 1,31398 | 1,83468 | -0,228123 | 0,0000000 |
Fuente: Elaboración propia con Minitab 16
En la Tabla 4, se definieron los grupos por grado de abordaje de delitos. Al respecto, el clúster 2 confirma que la mayor repercusión de violencia e inseguridad prevaleció por cada tipo de delito. Al mismo tiempo, el clúster 3 señaló niveles altos de los diferentes delitos, a pesar de que los delitos sexuales presentan menores repercusiones sobre estos departamentos. Por otra parte, el clúster 4 mostró niveles negativos para los diferentes delitos, lo cual contrasta con los clústeres 2 y 3. No obstante, en este clúster las amenazas sobresalen sobre los demás delitos, aunque, a diferencia de los otros clústeres, su nivel es muy bajo. En suma, los clústeres 2 y 3 tienden a ser departamentos altamente delictivos, y el menor puntaje delictivo entre todos se evidenció en los departamentos del clúster 1.
En la Figura 1, el dendograma de los cuatro clústeres de violencia por departamento en Colombia tiende a dividirse en dos grandes grupos que aglomeran la mayoría de los departamentos, y que corresponden a los clústeres 1 y 4. Sin embargo, al revisar la Tabla 5, el clúster 2 (Antioquia, Valle y Cundinamarca) muestra un conglomerado que estadísticamente resalta la mayor distancia de centroide, es decir, posee los departamentos con mayor índice de violencia en Colombia. Así mismo, al revisar el cluster 3 (Arauca, Cauca y Norte de Santander), se aprecia un centroide que presenta el segundo valor más alto de los cuatro conglomerados, de lo cual se concluye que es el segundo grupo con mayor impacto en niveles de delitos cometidos en Colombia. En consecuencia, la relación del clúster 2 con los otros tres demostró una cercanía con los departamentos del cluster 3. Ello significa que las distancias entre los grupos 4 y 1 adquieren características similares, que pueden incrementarse o reducirse en un futuro.
Redes neuronales
Con el fin de establecer un modelo para pronosticar los perfiles de violencia, en este apartado se desarrolló el procedimiento para implementar una red neuronal. Para iniciar, se precisaron los nodos de entrada y salida. De este modo, se procedió a establecer una estructura de inteligencia artificial, concebida mediante una red neuronal de doble capa. Para establecerla, se tomaron como punto de partida los cuatro clústeres, señalados en la Tabla 5. A su vez, como variables independientes se procesaron los clústeres identificados en el apartado anterior, además, como covariables se tuvieron en cuenta los diferentes delitos analizados. Finalmente, la estructura del modelo establecido trabajó como capa de entrada un modelo de tangente hiperbólica para ingresar los patrones que se comunican a la red neuronal, mientras que las capas ocultas dieron como resultado la capa de salida, empleando para esta el modelo sigmoide. Como función de error se utilizó la suma de cuadrados.
Enseguida, al ingresar los datos en el programa y procesarlos, se entrenó la red neuronal con los datos de muestra y se completó la corrida de data al 100 % de valores válidos sin exclusión alguna para mayor precisión de respuesta. En consecuencia, los valores de la Tabla 6 generaron la estructura que se muestra en la Figura 2, correspondiente a la red de doble capa en la red neuronal. Allí se evidenció el comportamiento de los delitos con respecto a los clústeres expuestos, con el fin de pronosticar la pertenencia a un determinado conglomerado.
N.° | Porcentaje | ||
---|---|---|---|
Muestra | Entrenamiento | 13 | 40,6% |
Prueba | 15 | 46,9% | |
Reserva | 4 | 12,5% | |
Válidos | 32 | 100,0% | |
Excluidos | 0 | ||
Total | 32 |
Fuente: Elaboración propia con Minitab 16
Por otra parte, en la Tabla 7 se observó una alta capacidad de clasificación del modelo propuesto para la partición de las 32 muestras, para su entrenamiento, prueba y reserva, en razón a los departamentos de Colombia y su respectivo porcentaje pronosticado por cada clúster encontrado. Esto probó una capacidad promediada de clasificación para el universo estudiado del 97,7 %, un resultado bueno para el modelo propuesto.
Fuente: Elaboración propia mediante IBM SPSS 27
Así mismo, en la Tabla 8 se evidencia el nivel de importancia relativa de los diferentes delitos analizados ante la estructura de doble capa relacionada con la red neuronal propuesta. Se observó que el delito de mayor importancia relativa para la generación del comportamiento y los patrones es el secuestro, mientras que el de menor incidencia, relevancia e impacto dentro del modelo es el terrorismo. Esto es analizado desde la información estudiada y los resultados cuantitativos del modelo.
Delitos | Importancia | Importancia normalizada |
---|---|---|
Amenazas | ,128 | 48,5% |
Delitos sexuales | ,230 | 87,0% |
Extorsión | ,207 | 78,2% |
Homicidio | ,115 | 43,4% |
Secuestro | ,264 | 100,0% |
Terrorismo | ,056 | 21,2% |
Fuente: Elaboración propia mediante IBM SPSS 27
Del mismo modo, para mayor comprensión, se explicitan los datos de la Tabla 8 de manera gráfica en la Figura 3, donde se visualizan los delitos desde un alto hasta un bajo nivel de significancia para el modelo de doble capa de red neuronal, de manera que se pudieron pronosticar los clústeres de los delitos en los diferentes departamentos de Colombia con las condiciones de importancia expuestas.
Como hallazgo de esta investigación, se encontró que en los departamentos de Cundinamarca, Antioquía y Valle se generan los mayores niveles de violencia en Colombia. Del mismo modo, el segundo cluster de mayor nivel de violencia es el conformado por los departamentos de Arauca, Cauca y Norte de Santander, aunque muestran una menor implicación de ocurrencia de estos delitos. Como hallazgo asociado a la estructura de red neuronal, se evidenció que la estructura propuesta muestra una capacidad de pronosticar a qué conglomerado podría pertenecer o pasar un departamento a futuro con una probabilidad del 97,7%.
De igual manera, las variables estandarizadas para la red neuronal mostraron que los delitos de mayor importancia para el modelo propuesto en Colombia, en su orden, fueron el secuestro, los delitos sexuales, la extorsión, las amenazas, los homicidios y el terrorismo, como se observa en la Tabla 8 y la Figura 3. En consecuencia, por los altos índices de violencia y los múltiples delitos que se cometen en Colombia, este análisis, que integró el cálculo multivariable y la red neuronal, se constituye en un aporte significativo para la Policía Nacional y demás entidades relacionadas, con el fin de seguir investigando sobre el tema, para optimizar la toma de decisiones relacionadas con la disminución de los delitos analizados en Colombia.
Discusión
Otras investigaciones ya han demostrado la pertinencia de estas técnicas en otros contextos de incidencia pública (Fontalvo et al., 2018), lo que ratifica la importancia y utilidad de los resultados de esta investigación. Otros estudios han aplicado las técnicas de conglomerado en contextos similares. Un ejemplo claro es la investigación de Das et al. (2021), en la que se agruparon clústeres de informes delictivos para un tratamiento eficaz. La adaptabilidad de estos grupos fue posible al emplear un conjunto de redes neuronales, lo que hizo factible la actualización inmediata al ingresar otros informes delictivos con niveles de rendimiento altos, así como en este estudio se priorizó el empleo de datos actualizados.
Además, Deepak et al. (2021) evidencian que este tipo de métodos alcanzan métricas de respuesta precisas en comparación con otras técnicas de evaluación, al clasificar los tipos de delitos mediante procesos de redes neuronales. Por otra parte, estudios han utilizado los modelos de redes neuronales artificiales para predecir los tipos de robos considerando factores ambientales; sin embargo, explican que esto es posible solo si se integran las características y variables relacionadas con ese tipo de delito. Igualmente, resaltan la importancia de incursionar en áreas criminalísticas para proporcionar diversidad a los modelos de redes neuronales (Kwon et al., 2021), tal como se hizo en esta investigación.
En cuanto al método de clustering, la mayoría de investigaciones aplican una cantidad de dos clústeres (Azis et al., 2021). Si bien esto permite focalizar el análisis en contextos con mayores y menores delitos, deja de lado una jerarquización más desagregada de regiones que podrían clasificarse y desglosarse según las cualidades propias de los delitos, de manera que permita a las autoridades comprender a profundidad el comportamiento de cada uno de los grupos e incluso comprender el posible desarrollo de capacidades de violencia diferentes. En este estudio, si bien dos clústeres agruparon la mayoría de departamentos, los otros dos fueron relevantes en materia de cantidad de delitos, lo que permite priorizar las acciones de las entidades encargadas de la seguridad en el país.
Un punto a destacar de los resultados obtenidos en este estudio es la precisión de la red neuronal propuesta para la proyección de los delitos. Por tanto, la calidad y precisión de la información ha sido significativa, ya que permitió entrenar la red neuronal de forma efectiva. En este sentido, dependiendo de la calidad de los datos utilizados, el sistema de red neuronal propuesto será más o menos preciso. En otras investigaciones se ha demostrado que el empleo de redes neuronales permite alcanzar una buena capacidad de predicción. Tal es el caso de Incio et al. (2021), que utilizaron dos algoritmos y obtuvieron como resultado un porcentaje de predicción del 70 % para el primero y de 86 % para el segundo en una red neuronal de doble capa. Por su parte, Bravo et al. (2021) proponen una red neuronal con capacidad de predicción del 97,3 % al entrenar y aumentar el análisis de los datos. En comparación con dichos estudios, esta investigación demostró que la proyección de los delitos de los cuatro clústeres propuestos tiene una capacidad de predicción del 97,7 % sobre la pertenencia de un departamento a uno de los cuatro conglomerados de delitos.
Por último, esta alta capacidad de identificación y pronóstico de la red neuronal propuesta puede permitir que las autoridades encargadas de la seguridad y bienestar social en Colombia comprendan el comportamiento de los delitos por departamentos en estos últimos cuatro años, para predecir a su vez el panorama futuro de Colombia al respecto. De esta forma se pueden identificar los departamentos en que se deben priorizar medidas de seguridad y de preparación de la población residente, así como tomar decisiones y establecer políticas de Estado para reducir dichos factores de violencia.
Conclusión
Como aporte teórico y metodológico, esta investigación articuló los delitos y factores de violencia en Colombia con la aplicación del método de clustering, lo cual permitió identificar los clústeres de violencia en el periodo 2018-2022. Se brinda así un análisis que permitió caracterizar los delitos violentos mediante el enlace de grupos de factores de violencia por departamentos, para finalmente proyectar la pertenencia de este conjunto de delitos a un conglomerado específico, lo que permitió identificar el comportamiento de estos factores de violencia por grupos de departamentos.
Como aporte práctico, las entidades del Estado responsables de la toma de decisiones en seguridad y de prevenir la ocurrencia de los delitos, recibieron los criterios cuantitativos soportados en el cálculo multivariado y las redes neuronales, lo que permite identificar los puntos geográficos críticos de Colombia para establecer políticas públicas que prioricen esos grupos de departamentos con mayores índices de violencia.
De igual manera se recomienda hacer análisis similares de las causas de los factores de violencia a nivel nacional y departamental para contrastar estos resultados, en pro de la resolución de esta problemática y su prevalencia en los próximos años. Asimismo, se sugiere identificar en estudios futuros otros conglomerados y tipologías diferentes a los delitos estudiados acá, con base en otros modelos de aprendizaje automático o machine learning, de modo que se analicen desde otras perspectivas los delitos y su eventual predicción (Shermila et al., 2018). De esta forma, se puede avanzar en el desarrollo de estructuras de predicción con mayor capacidad de precisión.
Esta investigación es de utilidad a nivel regional, nacional e internacional, dado que la metodología y estructura propuesta en esta investigación se puede replicar en diferentes contextos, como barrios, municipios, departamentos y otros países, para clasificar contextos específicos y hacer pronósticos en pro de la toma de decisiones para reducir los diferentes tipos de delitos.