Introducción
Gracias al vertiginoso avance en las nuevas Tecnologías de la Información y la Comunicación (TIC) y al desarrollo de áreas de la ingeniería como las ciencias de la computación, la electrónica, la mecatrónica, entre otras, los dispositivos tecnológicos como laptops, teléfonos y relojes inteligentes, sensores y dispositivos wearables conectados a Internet -implantando lo que hoy se conoce como loT (Internet de las Cosas)-, son cada vez más accesibles a los ciudadanos, instituciones educativas, gobiernos y organizaciones del sector productivo. Se ha posibilitado, de cierta forma, algunas mejoras en la calidad de vida de la sociedad en general, permitiendo, por ejemplo: a) que el ciudadano tenga acceso inmediato a datos que contribuyen con su crecimiento personal e intelectual, b) que las instituciones educativas ofrezcan herramientas pedagógicas innovadoras para la labor de enseñanza-aprendizaje, c) que el gobierno tenga un control más eficiente de los recursos económicos, y que implemente y vigile políticas públicas que generen desarrollo, y d) finalmente, que el sector produc-tivo, brindar servicios y productos que satisfagan las necesidades de los consumidores, además de la evaluación del rendimiento y la productividad de sus trabajadores.
Debido a la enorme cantidad de datos generados por la sociedad hoy en día, conceptos como Big Data, Minería de datos, Analítica de datos y Open Data se abren paso como herramientas que permiten su tratamiento, consulta y análisis. A través de la aplicación de algunos algoritmos de Inteligencia Artificial (IA) y Machine Learning (ML), y gracias a la Datificación, dichas herramientas pueden ayudar a encontrar y comprender patrones de comportamiento en los procesos sociales de una comunidad. Eso permite codificar y convertir en datos cuantificables todas las actividades que son poco susceptibles de medición (Stein et al., 2019).
El objetivo de la presente investigación es identificar casos de aplicaciones del uso de la Datificación y las herramientas de análisis de datos como Big Data, Analítica de datos, Open Data, IA y ML, entre otras, y como estas, afectan las dinámicas en los diversos escenarios sociales especialmente de la población de América Latina, enfatizando en los sectores de Gestión Pública, Industria y Economía, Seguridad y Transporte, y en menor medida en Educación, Salud, Agricultura y Turismo.
El concepto de Datificación, este concepto fue introducido por los autores Mayer-Schoenberger y Cukier en 2013, en su libro acerca de Big Data y la revolución de los datos masivos, como elemento de la minería de datos y su correlación para extraer conocimiento de los datos (Cesarotto, 2018). La Datificación otorga capacidad interpretativa a las herramientas de almacenamiento, al realizar análisis acerca del mundo y de las relaciones sociales, transformándolas en datos on-line cuantificados, permitiendo el monitoreo en tiempo real y el análisis predictivo (Grillo, 2019). La Datificación es un proceso de tres etapas que suceden cuando: 1) una actividad requiere y se vuelve más dependiente de los datos, 2) el uso de los datos comienza a transformar la actividad y 3) la actividad se desarrolla completamente con base en datos, que se convierten en información para la toma de decisiones (ALC-UE, 2015).
La importancia que adquiere la Datificación para el conocimiento, quizás se pueda entender mejor a través de la comparación de la generación y almacenamiento de datos a lo largo de la historia: hasta principios del siglo XX el conocimiento se duplicaba cada siglo; y después de la Segunda Guerra Mundial, cada 25 años. En la actualidad cada 13 meses, y con loT se estima que cada 12 horas (MinTIC, 2019).
Quizás una de las tecnologías de mayor crecimiento (y que más aporta a la Datificación) son los Asistentes Personales Inteligentes, que registran toda actividad del usuario, desde la agenda digital, conversaciones, correos electrónicos, hábitos de compra y alimentación, prácticas de actividad física, geo-posicionamiento y hasta rutinas de sueño que, dotados de IA y algoritmos de Deep Learning adquieren la capacidad de autoaprendizaje, reconociendo hábitos y patrones de los usuarios (Pridmore y Mols, 2020).
Las herramientas de recolección y Datificación son muy variados. Por un lado, tenemos el IoT que hace posible que dispositivos wearables puedan recolectar datos en tiempo real sobre características físicas como el ritmo cardíaco, la temperatura, el peso, la presión y los impulsos cerebrales (González, 2019), y almacenarlos en grandes bases de datos para su posterior análisis, proporcionando atención especial a los pacientes con enfermedades crónicas y de edad avanzada (Quijano et al., 2019). También en las Smart Cities dispositivos IoT generan continuamente grandes volúmenes de datos que ayudan al monitoreo y control de actividades como: estacionamiento, tránsito, transporte, iluminación, seguridad y control ambiental (Joshi, 2019). En el sector educación, el Big Data está ayudando a la mejora en los servicios educativos, en áreas como: acceso a contenidos, reconocimiento de técnicas de enseñanza más efectivas, y caracterización de perfiles (Said-Hung et al., 2019). Así mismo, en la agricultura de América Latina la digitalización de datos está dando origen al concepto de "Agricultura de precisión" que busca una toma de decisiones más precisa con base en el análisis de datos de múltiples fuentes (Vitón et al., 2017).
En la actualidad, las plataformas digitales son medios tecnológicos que originan un nuevo tipo de capital social basada en "datos", que son capturados, procesados, ordenados, analizados y contados, permitiendo el rastreo social y digital de cualquier persona u objeto con fines de comercialización (Couldry y Mejias, 2019). A nivel mundial se estima que existen más de 1.000 millones de páginas web, muchas de ellas con la capacidad capturar variedad de datos de los navegantes. Además, a través de Facebook, Messenger y Whatsapp se envían cerca de 60.000 millones de mensajes a diario, Facebook almacena 4 petabytes de datos cada día, 80 millones de fotos son compartidas diariamente en Instagram, Google procesa 40.000 búsquedas por segundo, y por Twitter se envían 500 millones de mensajes diarios (Peñaloza, 2017).
Por otro lado, el término Big Data hace referencia a la producción rutinaria de datos masivos a través herramientas como plataformas informáticas, terminales automatizadas como sensores y dispositivos de lectura, que son capturados, almacenados y procesados para llevar a cabo la administración de las organizaciones, el análisis del comportamiento de los usuarios, la identificación de patrones de comportamiento y la predicción de situaciones (Gutiérrez, 2018). Para definir el Big Data generalmente se acude al esquema de las 3Vs (Volumen, Velocidad y Variedad), que se convirtió en 5Vs (sumando Veracidad y Valor), y que en la actualidad es 7Vs (con Variabilidad y Visualización) (Mayor et al., 2019). Gracias al auge del Big Data ha surgido el concepto de Data Science (DS), para referirse a las técnicas para el gestión y el análisis de datos masivos en las que se aplica un enfoque estadístico e informático (Hernández, et al., 2017).
Frecuentemente, los conceptos de Big Data, IA y ML se encuentran estrechamente relacionados. Mientras que Big Data hace referencia al almacenaje y procesamiento, por su parte, la IA es un área de las Ciencias de la Computación que se encarga del diseño de sistemas inteligentes, y se refiere a algoritmos que buscan simular las capacidades de inteligencia del cerebro humano (Ocaña et al., 2019). Por su parte, ML es cualquier algoritmo informático que aprende a realizar una tarea directamente a partir de ejemplos, sin que un ser humano proporcione instrucciones o reglas explícitas sobre cómo hacerlo (Majaj y Pelli, 2018).
Metodología
La investigación se realizó utilizando una metodología descriptiva. La población objetivo está representada principalmente por los países de América Latina, aunque se incluyen algunos casos de Estados Unidos y España. Básicamente el estudio se dividió en cuatro fases: 1) Revisión bibliográfica en fuentes primarias como Sciencedirect y Redalyc, páginas gubernamentales, organizaciones de renombre nacional e internacional y artículos de periódicos reconocidos, en una ventana de observación entre los años 2015 y 2019, donde se evidencien casos prácticos de la aplicación de la Datificación y las tecnologías de análisis de datos en la población objetivo, 2) Construcción del marco teórico, 3) Discusión de las aplicaciones más notorias de la Datificación y tecnologías asociadas, y 4) Conclusiones finales.
Resultados
En cuanto a los resultados, se puede señalar que estos se aprecian en diferentes niveles de madurez, es decir; algunos se encuentran aún en procesos incipientes incluyendo su teorización, mientras que otros en niveles de madurez incluso en el territorio de la innovación. Para favorecer la interpretación de los resultados la Figura 1 resume los niveles de madurez tecnológica.
Por otra parte, antes de reseñar cada uno de las áreas de conocimiento, la Tabla 2 resume los resultados obtenidos por tipología de producto.
Tipo | Science Direct | Redalyc | Scopus | Scielo |
---|---|---|---|---|
Artículo | 578 | 281 | 620 | 760 |
Libro/Capítulo | 98 | 102 | ||
Documento de conferencia | 15 | 3 | 2 |
En cuanto a los resultados por países, la Tabla 3 resume los resultados.
La incorporación de nuevas tecnologías para la gestión y el análisis de grandes volúmenes de datos provenientes del IoT, de drones y de datos satelitales aplicados a la agricultura, dio inicio a lo que se denomina Smart Farming (Agricultura inteligente o de precisión), que permite, por ejemplo, el ahorro de agua al establecer los tiempos de riego más acordes conforme con el progreso de las siembras, lo que se traduce en mayores ganancias y disminución de costos de producción (Detsch, 2018). En América Latina y El Caribe, un estudio de 2017 identificó 130 emprendimientos de innovación que usan tecnologías como Big Data, IoT, ML y biotecnología, enfocadas al sector de la agricultura. Entre ellos más del 60 % fueron creados en los últimos cinco años, en su mayoría en Argentina, Brasil, Chile y Colombia (Fontagro, 2018). Por otra parte, se espera que esta proliferación de datos masivos sirva como alimento para nuevos desarrollos científicos y de innovación que, apoyados en tecnologías como Big Data y Blockchain, contribuyan a un desarrollo más eficaz y sostenible (CERAI - Centro de Estudios Rurales y de Agricultura Internacional, 2019), y que influyan en toda la cadena de suministro impulsando procesos predictivos y el rediseño de las actividades comerciales entre los diferentes actores involucrados (Wolfert et al., 2017). En relación con este aspecto, en Colombia, Hernández (2016) desarrolló un modelo para la gestión y el análisis de datos ambientales con el uso de Big Data e IA que apoyará la toma de decisiones al permitir el tratamiento y almacenaje de datos meteorológicos e hidrometeorológicos generados por estaciones de monitoreo ambiental, para luego aplicar Deep Learning en la predicción del comportamiento de variables como precipitación, temperatura, humedad y presión.
Como ejemplos de Smart Farming y analítica de datos se puede mencionar la Plataforma de CGIAR (Grupo Consultivo sobre Investigación Agrícola Internacional) para Big Data en la Agricultura, manejada por el CIAT (Centro Internacional de Agricultura Tropical) en Colombia, y que es adoptada por varios países, no solo latinoamericanos, sino también asiáticos como India y Singapur. Por medio de esta herramienta se logró analizar las políticas en Brasil para la agricultura familiar a través de la creación de una base de datos única, alimentada de datos públicos disponibles en sitios web, que recopiló información de implementación de doce políticas relativas a la agricultura familiar en 5.570 municipios (Le Coq et al., 2019). Asimismo, un grupo de investigadores del CIAT y el CGIAR ha trabajado con organismos estatales, asociaciones nacionales de productores y agencias climatológicas en Colombia y Honduras para asesorar a cerca de 300.000 agricultores de los dos países, en el uso de procesos de modelación, pronóstico del clima, Big Data e IA, trabajo que ayudó en 2014 a evitar una catástrofe económica en la que aproximadamente 170 productores arroceros colombianos evitaron pérdidas por US$3.6 millones tras acatar la recomendación de no sembrar en la primera de las dos temporadas de siembra del año (CIAT, 2017).
En Colombia, la plataforma tecnológica Farmapp está ayudando al sector Agro. Farmapp implementa Big Data, IoT y herramientas de geolocalización y tecnología satelital, para monitorear cultivos en busca de plagas, realizar pronósticos a causa del impacto de cambio del clima, analizar la eficiencia de los plaguicidas y las condiciones del suelo para realizar una siembra más adecuada (Asociación Nacional de Industriales, 2017). En Uruguay, la plataforma de agricultura digital Okaratech integra imágenes satelitales, muestras de suelos, estaciones meteorológicas, manejo productivo y datos de sensores de la maquinaria agrícola, para aplicar algoritmos de ML e IA que los interpretan y contextualizan para brindar una mejor toma de decisiones (Larronda, 2018). Finalmente, en Argentina, un proyecto de la Asociación Argentina de Consorcios Regionales de Experimentación Agrícola (AACREA), está permitiendo realizar un mapeo del suelo al obtener datos sobre componentes químicos, humedad, entre otros, mediante sensores, y analizarlos con Big Data para mejorar la producción de alimentos y biotecnología (Malvicino y Yoguel, 2016).
En el sector de la educación algunas plataformas informáticas están recolectando a gran escala datos sobre las actividades de enseñanza-aprendizaje, de las cuales no se tenían antecedentes, aplicando técnicas de Minería de Datos e IA para mejorar la calidad educativa por medio del análisis de datos (Raffaghelli, 2020). De esa forma se ha dado lugar a una nueva disciplina denominada Learning Analytics (LA), cuyos objetivos fundamentales son la reflexión y la predicción sobre los datos masivos (estructurados y no-estructurados), a través del procesamiento social con instrumentos analíticos como ML o análisis estadístico clásico (Rojas-Castro, 2017).
En este escenario la LA y el análisis de datos han ganado tal relevancia que está en trámite la creación de la carrera de Ingeniería y Ciencia de Datos, así como la especialidad en Ciencia de Datos, en la Universidad Nacional Autónoma de México, las cuales se espera que a corto y mediano plazo fortalezcan estas disciplinas en el país, mejorando la calidad de la enseñanza, aprendizaje y evaluación educativa (Sánchez et al., 2019).
Varias son las investigaciones que aplican LA y Big Data como herramientas para fortalecer los procesos de enseñanza-aprendizaje. Por ejemplo, en la Universidad Nacional de Colombia, sede Manizales, un trabajo de grado de maestría plantea el desarrollo de un modelo de descubrimiento de patrones mediante minería de datos y LA, que se alimentó de datos educativos y de las interacciones de los estudiantes con las plataformas virtuales de aprendizaje, con el objetivo de mejorar el proceso de enseñanza-aprendizaje haciéndolo adaptativo a las particularidades de cada estudiante (Giraldo-Ocampo, 2017). Igualmente, a través del Plan CEIBAL, en Uruguay se puso a disposición de los ciudadanos (mediante su documento de identidad) una biblioteca digital con 7.000 títulos disponibles para descargar gran cantidad de cursos virtuales para la formación de docentes, videos y en vivos de redes sociales. Además, se da una integración de video-conferencias al LMS CREA y la incorporación de plataformas para el aprendizaje, que mediante la recolección de datos y preferencias se van adaptando al progreso de cada estudiante (Taborda, 2020). En Bolivia, una investigación usó DS para entender la motivación de los estudiantes universitarios en cuanto al aprendizaje de la programación de computadoras, de tal forma que este proceso sea adaptable al estudiante y se pueda replicar en otras áreas (Mendoza-Jurado, 2018). Finalmente, en Brasil, la Universidad Abierta de Brasil y la Universidad Estatal de Ceará (UAB - UECE), desarrollaron un modelo predictivo que analiza la interacción entre tutores y estudiantes, logrando identificar once acciones desarrolladas por los tutores, de las cuales siete aumentaban la probabilidad de aprobación de los estudiantes y cuatro que debían ser evitadas pues la reducía (Oliveira et al., 2019).
Por otro lado, el análisis de datos estudiantiles también podría servir para combatir la deserción académica y aumentar los estándares de calidad en la enseñanza. Así sucede en Colombia, donde un proyecto de investigación de la Universidad Distrital Francisco José de Caldas propone un modelo de análisis de datos masivos resultantes de los procesos académicos y los relaciona con datos históricos y personales para combatir la deserción académica (Rodríguez et al., 2019). Asimismo, usando técnicas de LA y empleando los datos abiertos suministrados por el gobierno, en Chile se generó un modelo predictivo de aprendizaje automático que relaciona factores del sistema educativo, el acceso a la oferta, los estándares mínimos de aprendizaje y 31 atributos de los estudiantes, tales como datos personales, ubicación de residencia, vulnerabilidad del colegio, convivencia, participación, autoestima y motivación, para prevenir fenómenos de alto impacto social como son la deserción y el abandono escolar (Rodríguez et al., 2016). Por medio de Big Data, el Ministerio de Educación de Ecuador, como órgano regulador encargado de la recopilación masiva de datos, logró realizar análisis exploratorios y predictivos, enfocados en el alcance de altos estándares de calidad y mejora en la toma de decisiones en cuanto a la infraestructura de las instituciones educativas (Tejada et al., 2018).
En el campo de la investigación se destacan los proyectos Mendeley Data y DataSearch de la editorial Elsevier para gestionar un gran volumen de datos (Alonso, 2019), así como el banco de artículos de la editorial Pearson Education: "Learning Curve Data Bank", que combina sesenta bases de datos globales en un mismo lugar. Ambas permiten a investigadores encontrar correlación con variables sociales y económicas y son ejemplos de que, al ser correctamente analizados, los datos generados en los procesos de aprendizaje pueden representar, de cierta forma, mejoras en la calidad de vida de la sociedad (Lleixà et al., 2018).
En el sector del turismo las herramientas de análisis de datos como Big Data, unidas a la implementación de algoritmos de analítica de datos e IA, están marcando una nueva senda en la promoción y divulgación de centros turísticos en Latinoamérica. En México, un estudio exploratorio que aplicó Big Data bajo una modalidad de análisis de sentimientos de las opiniones de los turistas en los blogs turísticos TripAdvisor y VirtualTourist sobre cuatro factores (atractivos, hospedaje, restaurantes y transporte) en dos destinos turísticos mexicanos, permitió identificar evaluaciones positivas, negativas y neutrales sobre cada uno de los establecimientos y servicios analizados (Amaya et al., 2017). Una investigación similar se dio en Argentina, donde una tesis de la Universidad Nacional del Sur (Departamento de Geografía y Turismo) utilizó minería de datos, junto con reglas de asociación y clasificación, para analizar las percepciones que tienen los turistas internacionales sobre los destinos turísticos del país, con base en los datos generados a través de la red social Instagram. Lo anterior se realizó con el objetivo de mejorar la toma de decisiones estratégicas que contribuyeran a potenciar la imagen de marca argentina y el posicionamiento turístico a nivel internacional (De Lucca, 2017). En Perú, un modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico permite hacer un análisis más profundo de las características y comportamientos de los consumidores o de clientes potenciales (Mérida et al., 2017). En el contexto colombiano, un estudio utilizó las ciencias de datos aplicadas a los sistemas de información geográfica para permitir analizar y visualizar diferentes variables relevantes para el ecoturismo, con el fin de identificar deficiencias y oportunidades y mejorar la toma de toma decisiones en el sector turístico (Barrera et al., 2020).
De igual modo, varios países latinos están adoptando políticas de estado tendientes a la explotación de datos masivos de sus visitantes. En México, el proyecto "Big Data y Turismo", llevado a cabo entre la cartera de Turismo y BBVA Data Analytics, permitió analizar el comportamiento de los turistas nacionales y extranjeros procesando doce distintos análisis estadísticos que comprenden a los 111 Pueblos Mágicos y a los principales corredores turísticos del país (Peña y Benítez, 2016). En Colombia, el Plan Sectorial de Turismo 2018-2022 del Ministerio de Comercio, Industria y Turismo estableció que para el sector turismo es prioridad estar a la vanguardia de nuevas tecnologías que identifiquen preferencias y patrones de comportamiento del consumidor, para mejorar las estrategias de mercadeo y la toma de decisiones por medio de análisis de datos, Big Data, IA y ML (Ministerio de Comercio, Industria y Turismo, 2018). En Argentina se puso en marcha el Sistema de Inteligencia Turística (SIT), una herramienta que utiliza técnicas de Big data y se alimenta de 820 millones de registros provenientes de distintas fuentes de información como la Secretaría de Turismo de la Nación, Amadeus, Telefónica de Argentina y Aeropuertos Argentina 2000 para mejorar la toma de decisiones del sector turismo (Turismo Buenos Aires, 2019). Finalmente, en Uruguay, la División Turismo incorporó Big Data como herramienta para el análisis y gestión de los principales mercados emisores, preferencias y comportamiento de los turistas, a fin de adaptar y personalizar la experiencia de los visitantes (Intendencia de Montevideo, 2019).
Gestión Publica
Las nuevas tecnologías de almacenamiento y análisis de datos están cambiando la gobernanza de los países; pese a los grandes beneficios que ofrecen al brindar mecanismos más eficaces para prestar servicios a sus ciudadanos, aún no son estrategias de planes de gobierno para muchos países en vías de desarrollo. Por ejemplo, en Perú la tecnología de los macrodatos no es de plena actualidad para la administración pública, aunque seguramente este tema cobre valor, ya que el país está demostrando grandes avances tecnológicos, además lleva a cabo planes para digitalizar su administración a partir de la llegada de la Nueva Gestión Pública (Unión Internacional de Telecomunicaciones, 2018).
En este sentido, de acuerdo con un reciente estudio, de veintitrés países latinoamericanos encuestados el 75 % argumentaron haber implementado estrategias digitales orientadas al manejo de políticas gubernamentales, por ejemplo, la creación de la política de Open Data en el caso de Uruguay Digital, la implementación en México de la Agenda Digital (Mariño, 2018) y la participación del Instituto Nacional de Estadística y Geografía de México (INEGI) con la aplicación de la estrategia de datos abiertos como resultado de la inclusión del país a la OCDE (Manske et al., 2016). En Brasil, el uso de Big Data en el proyecto Serenata do Amor permitió que el Observatorio de Gastos Públicos examinara información de contratos públicos e identificara ilegalidades en algunos de ellos, aun cuando se trata de una plataforma en desarrollo (Rodrigues y Vinicius, 2018). En Colombia, la Contraloría de Bogotá utilizó Big Data para realizar un proceso de auditoría en el que encontró hallazgos fiscales por aproximadamente US$72.000 (OLACEFS, 2018). Por otro lado, el MinTIC ha impulsado el uso del Big Data con el Departamento Nacional de Planeación para ejecutar una actualización de las variaciones del PIB nacional; también ha detectado fraudes en las políticas del Sistema de Identificación y Clasificación de Potenciales Beneficiarios para programas sociales (SISBEN) rastreando 653.000 casos de inconsistencias en el sistema en 2015 (Gomis-Balestreri, 2017).
La adopción de estrategias de datos abiertos ha venido siendo impulsada en la región gracias a la creación de la Alianza del Pacífico (AP), integrada por Chile, Colombia, México y Perú, donde uno de los principios del cuarto pilar "Gobierno Digital" es la adopción de Open Data como herramienta para fomentar políticas públicas basadas en evidencia, incentivar la participación ciudadana, acercar a las instituciones del Estado y estimular el crecimiento económico (Coordinación de Estrategia Digital Nacional, Gobierno de México, 2017). Como resultado de este tratado, los poderes judiciales de Chile y Uruguay comenzaron a publicar las sentencias, la información presupuestaria y las estadísticas. De igual forma, Argentina es otro país que impulsa el Open Data como un esfuerzo por mejorar la transparencia al aumentar la disponibilidad de la información en formatos reutilizables y accesibles (Tapia, 2018).
Industria y Economía
El Big Data y la analítica de datos son herramientas que ayudan a las organizaciones en el proceso de toma de decisiones mejorando la segmentación, la comunicación y la fidelización de los clientes, lo cual es vital como ventaja competitiva en un mercado cada vez más globalizado. La digitalización del sector industrial está estimulando el mercado de centros de datos en América Latina. Se espera que este crezca en un 6 % para el período 2019-2025, para que factores como el desarrollo de centros de datos ecológicos, la agricultura inteligente y el e-Commerce sean los de mayor uso de análisis de Big Data y aplicaciones de IoT. En ese proceso Chile se ha destacado como uno de los países de mayor crecimiento en la puesta en marcha de centros de datos en los últimos años, debido al funcionamiento del cable submarino que aumentó la demanda de servicios basados en la nube, en IoT y en el análisis de Big Data (Arizton Advisory and Intelligence, 2020).
Según un estudio reciente, el mercado latinoamericano de Big Data and Analytics (BDA) alcanzó ingresos por valor de US$2.992,5 millones en 2017. Se espera que genere US$8.593,5 millones para 2023. En la actualidad, Brasil lidera el ranking con el 46,7 % de las ventas totales, lo siguen México (26,7 %), Colombia (7,9 %), Chile (6,9 %), Argentina (5,6 %) y Perú (2,4 %) (Frost y Sullivan, 2018).
En este contexto, la Comisión Económica para América Latina y el Caribe (CEPAL) está liderando el proyecto "Big Data: Grandes datos para la economía digital en América Latina y el Caribe", que pretende mejorar las capacidades para la medición de la economía digital y el diseño de políticas basadas en evidencia, a través de la analítica de grandes datos. Además, busca analizar la economía digital de Internet en Brasil, Chile, Colombia y México, a partir del tratamiento de datos web y oficiales con Big Data (CEPAL, 2017). Estudios similares de la misma entidad han permitido analizar macrodatos de indicadores económicos. Por ejemplo, en Nicaragua y Brasil se encontró que existe una relación entre la cantidad de vendedores, el tamaño del país y la cantidad de transacciones por vendedor. Así se evidenció que es más probable un monopolio económico cuando la cantidad de vendedores, el tamaño del país y la cantidad de transacciones es pequeña, lo que demuestra la importancia de apoyar nuevas oportunidades económicas (CEPAL, 2020).
Como ejemplos del uso de BDA orientado al sector comercial está el proyecto desarrollado por BBVA Data & Analytics, que ha analizado más de 413 millones de transacciones bancarias con tarjeta en las ciudades de Madrid, Barcelona y Ciudad de México, dando como resultado nuevos mapas interactivos que identifican las zonas más turísticas, residenciales o con más compradores jóvenes (BBVA, 2018). Por otra parte, con ayuda de Big Data, en Colombia se pueden realizar análisis del consumo (Voz-Datos) que se generan al llamar por su teléfono móvil o por el consumo de internet móvil con el fin de generar estrategias de mercadeo en tiempo real, de acuerdo con las preferencias de los clientes (Soche, 2016).
Otro ejemplo nacional deja ver cómo el Ministerio de Hacienda de Colombia y el DNP desarrollaron una metodología, a partir de datos de Google Trends, para analizar estadísticamente los términos de búsqueda con el objetivo de predecir y obtener tendencias económicas de ciertos sectores más rápido que a través de la estadística tradicional (Karisma, 2016).
Uno de los sectores que más beneficios obtiene al implementar técnicas de recolección y análisis de datos es la salud, debido a que aquellas herramientas contribuyen a la reducción de costos de investigación médica, sirven para encontrar predisposiciones y patrones sintomáticos en diversas enfermedades. Eso resulta en un mejor diagnóstico y tratamiento, e impulsa a la investigación de nuevos medicamentos. Así sucedió con la compañía Berg, que usó IA para descubrir el medicamento BPM 31510 destinado a combatir el cáncer (Guillén, 2017).
Así, el Big Data puede ayudar a descubrir el peligro de una pandemia al identificar en tiempo real tendencias en buscadores de Internet como Google Trends o sistemas de datos (Monleón-Getino, 2015). Un claro ejemplo de esta metodología ocurrió en Colombia, donde una investigación desarrollada entre la Fundación ISI y las Naciones Unidas describe que puede asociarse el contagio de zika entre 2014 y 2016 a través del rastreo de la posición geográfica de las personas al usar su teléfono móvil (Perrotta, 2018).
Igualmente, compartir datos clínicos por medio de plataformas seguras puede mejorar la atención de pacientes y servir como una especie de medicina más preventiva, puesto que el monitoreo y análisis predictivo ayudan a descubrir las patologías de manera anticipada (OECD, 2018). Tal es el caso de Costa Rica, que implementó el Expediente Digital Único en Salud, a través del cual se espera tener el historial clínico de alrededor de veinte millones de personas aseguradas al sistema de Seguridad Social del Estado. Eso permite analizar cerca de cinco mil variables como diagnósticos, medicamentos, imágenes médicas, internamientos y operaciones (Estrada, 2017). En Colombia, el departamento de Cundinamarca implementó la Historia Clínica Electrónica Unificada (HCEU), un proyecto de transformación tecnológica, que busca optimizar e integrar los diferentes recursos de información de los servicios de salud en el departamento al unificar la historia clínica en los 35 Hospitales de la Red Pública Departamental, facilitando la toma de decisiones medicas basadas en evidencia (Gobernación de Cundinamarca, 2018).
Un enfoque similar se presentó en Chile, donde el Centro de Imágenes Biomédicas de la Pontificia Universidad Católica de Chile desarrolló técnicas de radiología cuantitativa con macrodatos, al convertir la información de imágenes radiológicas en métricas precisas y reproducibles que permiten encontrar biomarcadores que descubran de forma temprana situaciones de riesgo para la salud (Andía, Arrieta y Sing, 2019).
Finalmente, en Brasil está en proceso la creación de una estrategia nacional con alianza de la Red Universitaria de Telemedicina (RUTE) sobre IoT y macrodatos como apoyo al sector de investigación y de e-Salud (Unión Internacional de Telecomunicaciones, 2018).
Seguridad y transporte
El crimen ha sido históricamente uno de los mayores flagelos en América Latina, pero la comprensión del porqué y del lugar donde se comenten estos crímenes aún es un tema en desarrollo. En algunos casos, los gobiernos han mejorado su investigación criminal con ayuda de herramientas de análisis de datos que examinan diversidad de variables para identificar áreas donde el crimen tiene mayor porcentaje de reincidencia (BID, 2017).
En América Latina, Montevideo utiliza una plataforma para predecir delitos de alto impacto en la ciudadanía, como robos callejeros y extorsión. En Chile, el Centro de Análisis y Modelado de Seguridad (CEAMOS) desarrolló un software similar al utilizado por la policía de Estados Unidos, pero adaptado particularmente a los patrones criminales de América Latina (Gurney, 2015). Del mismo modo ocurre en Salvador, Guatemala y Honduras, donde las autoridades están procesando mayor cantidad de datos para analizar acontecimientos relacionados con el delito, con el objetivo de prevenir y ajustar las políticas de seguridad y justicia (Magoga, 2018). Igual pasa en Bogotá, donde un proyecto diseñado por la Oficina de Análisis de Información de la Secretaría de Seguridad, Convivencia y Justicia, la Universidad Nacional y la empresa Quantil, ha desarrollado un modelo de predicción que usa Big Data para el análisis de datos oficiales e imágenes de cámaras de seguridad de la ciudad (Barreto, 2019). En Brasil una organización desarrolló un sistema predictivo utilizado por más de 5.000 conductores que analiza los datos de crímenes cometidos e identifica zonas críticas de delincuencia (Leahy, 2018).
En cuanto al transporte, la Ciudad de Rosario, en Argentina, estudió la movilidad de los ciclistas utilizando dispositivos de georreferenciación y análisis de datos, e identificó puntos de accidentes sin ciclovías, pero con alta presencia de ciclistas. Estos resultados ayudaron a tomar decisiones para mejorar la infraestructura pública. En Fortaleza (Brasil), el proyecto "Fortaleza Inteligente" utiliza información del GPS de los buses de transporte público para analizar el comportamiento del sistema y evitar retrasos y sobrecupo (Rodríguez et al., 2017). Por su parte, en México la plataforma Mapatón, un proyecto del gobierno de la Ciudad de México realizado en alianza con otros organismos, generó una base de datos de las 1500 rutas de autobuses de la ciudad por medio de algoritmos que procesaron los macrodatos con el objetivo de brindar un servicio más eficiente (DNP, 2017).
Riesgos
Si bien es cierto que los procesos de Datificación y la utilización de técnicas de recolección y análisis de datos tienen enormes beneficios, para algunos resulta alarmante desconocer el destino y el uso de toda esa información recopilada. Para evitar ese temor varios países de la región han ajustado sus leyes. En el caso de Colombia, el documento CONPES 3920, sobre la Política Nacional de Explotación de Datos, establece la necesidad de anonimizar los datos recolectados por cualquier entidad e informar quién puede disponer totalmente de la información (CONPES 3920, 2018). En Chile existen varias leyes y normativas que regulan el uso de datos clínicos y se ha determinado que toda información de procedimientos y tratamientos médicos debe ser considerada como "dato sensible", por lo cual solo pueden ser utilizados con el consentimiento de los pacientes (Zepeda, 2019). La ley de Brasil agregó el Reglamento de Protección de Datos Personales de la Unión Europea estableciendo que los datos genéticos o biométricos son datos sensibles, y que la legislación es aplicable a empresas tanto nacionales como extranjeras que realicen recolección de datos en el territorio brasileño, además deben solicitar consentimiento al ciudadano para el tratamiento de sus datos y ofrecerle herramientas para acceder, corregir o eliminar toda su información (Bosque y Villan, 2018). En cuanto a la protección de datos, es importante mencionar que hace falta promover una cultura de seguridad que incluya a grupos heterogéneos de la población, por ejemplo para el caso de Colombia se han observado antecedes interesantes sobre prácticas de seguridad informática a nivel universitario y policial (Estrada et al., 2019 y Estrada et al., 2021).
A pesar de que existen leyes contra el mal tratamiento y uso de los datos, estas aún son deficientes y tienen vacíos legales que organizaciones privadas aprovechan para su beneficio y el de sus clientes. Por ejemplo, los sistemas de puntaje crediticio, como Datacrédito en Colombia, Inforcorp en Perú o Dicom en Chile, que hasta hace un tiempo solo registraban el comportamiento crediticio pasado de los consumidores y, de acuerdo con este, calificaban al usuario, en la actualidad aplican algoritmos para predecir la probabilidad de incumplimiento crediticio y toman decisiones de forma autónoma, sin que el usuario tenga posibilidades de argumento (Urueña, 2019). También en el campo político se han presentado situaciones de manipulación del electorado con base en tendencias de redes sociales. Es el caso de CA, una empresa dedicada al tratamiento de datos que son vendidos a empresas y políticos para modificar el comportamiento de las audiencias. De acuerdo con algunas investigaciones, CA ha estado involucrada en más de cien campañas políticas en todo el mundo; a nivel de América Latina, al parecer esto ha sucedido específicamente en Colombia, Argentina, Brasil y México. En estos tres últimos países se abrieron investigaciones por presunta manipulación de datos personales de usuarios de redes sociales (García, 2018).
Otros sectores Importantes
En otros sectores de la sociedad también existe evidencia de procesos de Datificación, sin embargo, se omite reseñar en detalle dichas áreas por el alcance del presente trabajo. La tabla 4 resumen la cantidad de referentes por sector.
Sector | Trabajos relacionados |
---|---|
Educación | (Raffaghelli, 2020), (Rojas-Castro, 2017), (Sánchez et al., 2019), (Giraldo-Ocampo, 2017), (Taborda, 2020), (Mendoza-Jurado, 2018), (Rodríguez et al., 2019), (Tejada, et al., 2018), (Lleixà et al., 2018) |
Salud | (Open Mind, 2017), (Perrotta, 2018), (Monleón-Getino, 2015), (OECD, 2018), (Estrada, 2017), (Gob Cundinamarca, 2018), (Andía et al., 2019), (ITU, 2018). |
Agricultura | (Detsch, 2018), (CERAI, 2019), (Fontagro, 2018), (Wolfert, et al., 2017), (Hernández-Leal 2016), (Le Coq, et al., 2019), (CIAT, 2017), (ANDI, 2017), (Larronda, 2018), (Malvicino y Yoguel, 2016). |
Turismo | (Amaya et al., 2017), (De Lucca, 2017), (Barrera et al., 2020), (Peña y Benítez, 2016), (MinCit, 2018), (Turismo Buenos Aires, 2019), (Intendencia de Montevideo, 2019). |
Discusión
Si bien es cierto los procesos de Datificación y la utilización de técnicas de recolección y análisis de datos tienen enormes beneficios, y están contemplados como pilares fundamentales de la Agenda 2030 para el desarrollo sostenible de la Organización de las Naciones Unidas, al considerar que son herramientas que permiten encontrar factores de desigualdad en la sociedad y mejorar la calidad de vida de las personas (Lasso-Cardona, 2018), para algunos resulta alarmante, al desconocer qué destino y utilización tiene toda esa información, para lo cual varios países de la región han ajustado sus leyes. En el caso de Colombia, el documento CONPES 3920 sobre la Política Nacional de Explotación de Datos, establece la necesidad de anonimizar los datos recolectados por cualquier entidad, e informar quien puede disponer totalmente de la información (CONPES 3920, 2018). Por su parte, la Corte Constitucional argumento que el tratamiento de datos sensibles sin autorización del titular debe adaptarse según los criterios de habeas data, en relación al almacenamiento, propósito, gestión y divulgación (Castañeda et al, 2016). En Chile, existen varias leyes y normativas que regulan el uso de datos clínicos, determinado que toda información de procedimientos y tratamientos médicos, es considerada como "dato sensible", por lo cual solo pueden ser utilizados con el consentimiento de los pacientes (Zepeda, 2019). La ley de Brasil agregó el Reglamento de Protección de Datos Personales de la Unión Europea estableciendo que los datos genéticos o biométricos son datos sensibles, y que la legislación es aplicable a empresas tanto nacionales como extranjeras que realicen recolección de datos en el territorio brasileño, además de solicitar consentimiento al ciudadano para el tratamiento de sus datos, y ofrecerle herramientas para acceder, corregir o eliminar toda su información (Bosque y Villan, 2018). En cuanto a la protección de datos, es importante mencionar que hace falta promover una cultura de seguridad que incluya a grupos heterogéneos de la población, por ejemplo para el caso de Colombia se han observado antecedes interesantes sobre prácticas de seguridad informática a nivel universitario y policial (Estrada-Esponda et al., 2019, 2021).
A pesar de existir leyes contra el mal tratamiento y uso de los datos, estas aún son deficientes y tienen vacíos legales, que organizaciones privadas aprovechan para su beneficio y el de sus clientes. Por ejemplo, los sistemas de puntaje crediticio, como Datacrédito en Colombia, Inforcorp en Perú, o Dicom en Chile, que hasta hace un tiempo solo registraban el comportamiento crediticio pasado de los consumidores, y de acuerdo a este, calificaban el usuario. En la actualidad estos sistemas aplican algoritmos para predecir la probabilidad de incumplimiento crediticio y toman decisiones de forma autónoma, sin que el usuario tenga posibilidades de argumento (Urueña, 2019). También en el campo político se han presentado situaciones de manipulación del electorado con base en tendencias de redes sociales. Es el caso de CA, una empresa dedicada al tratamiento de datos que son vendidos a empresas y políticos para modificar el comportamiento de audiencias. De acuerdo a investigaciones, CA ha estado involucrada en más de cien campañas políticas en el mundo, y en América Latina específicamente en Colombia, Argentina, Brasil y México. En estos tres últimos países se abrieron investigaciones por presunta manipulación de datos personales de usuarios de redes sociales (García, 2018). En el campo de la seguridad, varias investigaciones mencionan los riesgos que existen en los sistemas informáticos que son alimentados por organismos de control y vigilancia, los cuales tratan de predecir acontecimientos criminales, y en los cuales se ha comprobado un sesgo algorítmico al calificar con mayor puntaje de peligrosidad delitos cometidos por un sector de la población, caracterizada por su color de piel, antecedentes judiciales propios, de familiares, o círculo cercano, y estrato social (Lasso-Cardona, 2021).
Conclusiones
La investigación logró evidenciar que el auge de la Datificación y el uso de herramientas tecnológicas de análisis de datos como Big Data, IA y ML, están transformando a las comunidades de los países de la región, lo que deriva en nuevas entidades digitales que tienden a mejorar su calidad de vida en los aspectos más notorios de la sociedad. Como se demostró, los sectores de educación, agricultura y salud son los más beneficiados; no hay que dejar de lado a la economía y la seguridad, pero en estos se observa todavía cierto rezago, bien sea por las carencias en el presupuesto de cada país o por la falta de voluntad en las políticas institucionales, que limitan la adopción de nuevas tecnologías, lo cual desencadena, de cierta forma, en un atraso que genera más pobreza económica y social, a las clases más necesitadas y apartadas.
Asimismo, si la tecnología y los datos solo favorecen a unos pocos, eso debilita todo el sistema social. Así sucede en gran parte de los sectores de investigación y producción agrícola, en el que -gracias a los grandes recursos que posee- el sector privado puede estar motivado a monopolizar el sector, dejando de lado a los medianos y pequeños cultivadores.
Cabe reseñar que aunque los gobiernos e instituciones privadas han acatado las reglamentaciones y leyes de cada país, aún falta mucho por normalizar en cuestiones de protección y tratamiento de datos privados, sobre todo en el campo tecnológico donde es casi inexistente la promulgación de algún tipo de acuerdo, norma o ley que regule el alcance de técnicas como Big Data, IA y ML, y en tecnologías IoT, entre los cuales los usuarios desconocen el alcance real y la capacidad de captura de datos de este tipo de dispositivos. Eso dificulta reconocer cuál es la línea que delimita lo privado de lo general en beneficio del bien común, como ocurre con el uso de cámaras de vigilancia, GPS, drones, identificación biométrica y de audio y artefactos inteligentes con la capacidad de recopilar y reconocer individualmente a los usuarios, porque su uso comúnmente es justificado bajo la premisa de brindar comodidad, control y seguridad.
Finalmente, se espera que esta investigación sirva como referente de estudio y análisis en cursos de educación media y superior, y como punto de partida para futuras investigaciones que profundicen en áreas específicas o de interés, y que contrasten a la región con el resto del mundo.