Introducción
Si bien la analítica de datos posibilita acometer estudios desde diferentes disciplinas, el acervo documental disponible en las bases de datos especializadas demuestra que las áreas de Bioquímica, Ingeniería y Farmacología son las más recurrentes en el uso y aplicación de la analítica, por su parte, en la literatura disponible se pueden encontrar estudios soportados en la analítica de datos particularmente en temas asociados al sector público, tales como: efectos socioeconómicos potenciales del derivados del COVID-19 (Nasir et al., 2021), estudios de migraciones (Bircan & Korkmaz, 2021), análisis espacial para la localización de puntos de atención médicos (Wan et al., 2021), diseño de eco-ciudades y ciudades inteligentes (Bibri, 2021; Sun & Tang, 2021), entre otros; demostrando la existencia de un interés creciente, en el uso de los datos más allá de las disciplinas tradicionales y por supuesto, se elucidan las ventajas de usar los grandes conjuntos de datos y la analítica como apoyo en la toma de decisiones en el sector público; no obstante, en la literatura se percibe algo de escepticismo, debido a las limitaciones a nivel de infraestructura y en mayor parte a la falta de más científicos de datos (Guijo et al., 2021). Ciertamente, dicho escepticismo guarda relación con la poca disponibilidad de nuevos profesionales y científicos de datos un profesional con capacidades analíticas que lo ubican hoy, con un rol relevante en la llamada sociedad digital.
Marco Teórico
Hacia una Comprensión de los Datos, Analítica e Información
Un dato se concibe como una representación simbólica, numérica, algorítmica y de otras tipologías, de un atributo o variable, que puede ser de orden cuantitativa o cualitativa. Los datos describen hechos empíricos, sucesos aislados o entidades (Egas, 2015), es de anotar que, los datos aislados pueden no contener información relevante. Por su parte, cuando se habla de un conjunto de datos, se refiere al agrupamiento de datos en grandes volúmenes, conocidos también como Big Data, de acuerdo con (Mayer-Schonberger & Cukier, 2013) quien señala que el Big Data alude a un conjunto de datos en grandes dimensiones, estos datos provienen a su vez de diversas fuentes, las cuales, debido a la informatización de la sociedad, crecen a grandes volúmenes. En esta misma corriente, (Bollatti, 2013) afirma que el Big Data también se refiere al tratamiento y análisis de enormes repositorios de datos, en la mayoría de las ocasiones, desestructurados.
Por su parte, la analítica de datos se puede entender como un proceso de extracción o inspección, limpieza o transformación y carga de datos, con la finalidad de obtener información útil que sirva de apoyo en la toma de decisiones. En concordancia con (Judd & McClelland, 1989) quienes señalan que los datos se coleccionan y se analizan para probar conjeturas, invalidez de teorías y para la resolución de preguntas. El análisis de datos comprende múltiples enfoques y técnicas donde se pueden perseguir fines diferentes, los cuales pueden ir desde el seguimiento de procesos del negocio, la analítica de datos orientada a problemáticas urbanas o en el ámbito industrial, gracias al posicionamiento de concepto de «cuarta revolución industrial», donde la analítica se constituye en una respuesta a la demanda de servicios, en el marco de la digitalización de las sociedades, como manifestaban (Tubella & Vilaseca, 2005), al referir que ante la aparición y consolidación de nuevos tipos de tecnologías, se establecen las bases sustanciales para los cambios.
Ahora bien, la información al ser focalizada, limpiada o categorizada ofrece un mensaje útil abierto a la interpretación del receptor.
Es preciso aclarar que, sobre la información existen diversos enfoques de estudio, como por ejemplo el enfoque desde la teoría de la información, que considera la información como una medida de complejidad para un conjunto de datos; otro enfoque proviene de la línea de la comunicación social, donde corresponde a un conjunto de mensajes con fines organizativos. En este caso, el ultimo enfoque se ajusta a las pretensiones de este estudio, en tanto, propone un mensaje con fines organizativos, donde los datos, una vez procesados constituyen un mensaje de interés, donde desde el punto de vista organizacional es un insumo útil para la toma de decisiones en el sector público.
Analítica de Datos Orientada al Sector Público
Hablar de analítica de datos orientada al sector público, implica considerar una temática donde la producción se distribuye principalmente en las líneas de: datos abiertos (open data), gobernanza (governance), Big Data, seguridad (security), ciudades inteligentes (smart city), entre otras. Así entonces, al rastrear la producción académica en SCOPUS, durante los últimos seis años, se tiene que el Big Data corresponde al escenario de mayor concurrencia de estudios, algo que concuerda con lo expresado en (Hochtl et al., 2016) quienes manifiestan que el Big Data a pesar de ser un tema de relevancia para la ciencia política, al rastrear los estudios sobre la interacción tecnológica y el cambio político en la era del Big Data, se concluye que sigue siendo un tema desatendido. Siguiendo esta misma línea (Pencheva et al., 2018) argumentan que las investigaciones sobre el rol de Big Data y análisis avanzado en el sector público aún son incipientes. El segundo escenario de mayor concurrencia corresponde al de análisis de datos (data analytics) un tema fundamental y conectado con el Big Data, según (Abai et al., 2015) quien refiere que la capacidad de analítica en el manejo de Big Data es innegable.
Hablar de Big Data desde enfoque del sector público, significa emprender nuevos desafíos, supuestos a la complejidad de un universo de datos desestructurados en el que surgen problemáticas que van desde la seguridad, riesgos y privacidad de la información hasta la infraestructura tecnológica y habilidades humanas requeridas para el trabajo en la analítica. En relación con la infraestructura y las habilidades humanas requeridas, conviene manifestar que se trata de uno de los cuestionamientos de mayor frecuencia, como lo expone (Aggarwal, 2015), quien considera que la tecnología, debido a su rápido progreso, es la generadora de grandes cantidades de datos; donde existe un desafío claro, y es, precisamente el hecho de determinar cómo monitorear y dar sentido a estos datos. En esta misma línea, otro aspecto importante en estos cuestionamientos recae sobre la experiencia en unidades de analítica y aplicaciones de analítica de datos, la cual corresponde mayoritariamente al sector privado, mientras que, en el caso del sector público, apenas recientemente se ha comenzado a obtener información a partir de los datos masivos, en una búsqueda inagotable por un respaldo en la toma de decisiones.
Ciertamente, el uso de Big Data en el sector público, se centra en la búsqueda de servir a los ciudadanos y superar desafíos nacionales, es decir, aprovechar las oportunidades y afrontar los problemas públicos más complejos, sin dejar de lado la transparencia y la responsabilidad; de acuerdo a lo expuesto en (Matheus & Janssen, 2015) quienes en la misma línea, proponen como una de las principales razones para abrir los datos por parte de los gobiernos, es la de generar confianza soportada en la transparencia, como lo exponen (Kumar et al., 2019) al proporcionar un trabajo en el que señalan la importancia del uso del Big Data en la toma de decisiones del sector público en temas de salud pública. En esta misma corriente (Lee et al., 2019) dan relevancia al uso de los datos de ciudadanos para la consolidación de políticas públicas.
En consecuencia, se evidencia la importancia del uso de los datos y la analítica, donde autores como (Lopez et al., 2016) destacan la forma de pensar en Big Data y datos abiertos y se confirma una tendencia en los últimos años. De ahí que, como resultado, cada vez más son los aspectos de la vida cotidiana (Amoore, 2014; Rob Kitchin, 2014; Offenhuber & Ratti, 2014) en esta misma corriente plantean que se capturan y almacenan los datos conformando un universo del Big Data, para posteriormente normalizar los mismos, a través de infraestructuras impulsadas de analítica, compartidas y divulgadas. En el reporte de IBM Global Business Services (2011), se manifiesta que debido a la complejidad cada vez mayor, es importante tomar decisiones más inteligentes, colaborativas y basadas en hechos. Es entonces, una oportunidad de acelerar los resultados deseados adoptando la analítica como una competencia principal en la gestión pública.
Materiales y Métodos
Desde el punto de vista del planteamiento metodológico, se precisa que la presente investigación, se suscribe a un estudio de tipo cualitativo con un enfoque descriptivo, del cual (Sampieri et al., 2010) señalan que: «Los estudios descriptivos buscan especificar las propiedades, las características y los perfiles de personas, grupos, comunidades, procesos, objetos o cualquier otro fenómeno que se someta a un análisis (P. 80)». Lo anterior, posibilitando un proceso hermenéutico-analítico, proceso propuesto como método, por autores como (Gómez et al., 2015), quienes manifiestan que dicha metodología es esencial en la comprensión de determinadas teorías donde la finalidad es buscar claridad conceptual de nociones pertenecientes a diversas disciplinas. En este sentido, la ruta metodológica ha seguido tres momentos: (1) rastreo y focalización (2) análisis y profundización (3) modelación de esquema, discusión y conclusiones.
Las unidades de análisis para el momento uno, fueron todos aquellos documentos académicos sobre el tema, encontrados en las bases de datos SCOPUS y WEB OF SCIENCE. Como criterios de búsqueda, se incluyeron los siguientes descriptores: «analítica de datos», «analítica de datos y sector público», «gestión de la información», «data analytics», «data analytics and government».
Finalmente se propone un esquema de analítica de datos, compuesto por dimensiones (Big Data, gestión de datos, gestión de la información y toma de decisiones) como se puede observar en la Figura N°1, con la finalidad de plantear un flujo teórico de los datos, constituyéndose como una propuesta que, busca servir de insumo para fortalecer la toma decisiones del sector público.
Resultados
Con la finalidad de realizar una aproximación teórica orientada a fortalecer la toma de decisiones del sector público, se propone el siguiente esquema de flujo de datos (Figura N°1) en su concepción se determinan las áreas de prioridad, consolidando un flujo compuesto por cuatro dimensiones:
Big Data
Corresponde al primer eje del esquema, en este se localiza el universo de datos, subyace un proceso de flujo de datos que comienza con un proceso de recopilación en el cual se considera el origen de los datos, favoreciendo el contraste con los objetivos desde una mirada institucional. Dicho contraste, se lleva a cabo mediante un proceso de filtrado que finalmente se refleja en la primera etapa de focalización de datos: Extracción.
Gestión de datos
El segundo eje corresponde a un proceso de gestión de datos en el cual se recibe un flujo de datos focalizados y categorizados, que luego pasan a reposar a una base de datos de acceso restringido. En este eje, se considera como capacidad instalada de analítica: la infraestructura tecnológica y el talento humano (profesionales de datos) y corresponde en conjunto con la segunda etapa: transformación.
Gestión de la información
Se considera el eslabón principal del esquema, en este se hace uso de los conjuntos de datos disponibles en la base de datos, en un proceso de inteligencia de negocio (BI), proceso que se orienta fundamentalmente a la generación de reportes e indicadores como actividad esencial, no obstante, en la dinámica que proporciona la analítica es necesario considerar como sub-proceso, el análisis y monitoreo de la información; actividad de alta relevación en la clasificación de la información generada como confidencial o como sujeta de ser divulgada. Corresponde en conjunto con la tercera etapa: carga.
Toma de decisiones
Teniendo en cuenta que, hoy en día hay la gran cantidad de información disponible es la causa de una mayor complejidad en el proceso de análisis de datos, es necesario generar un tipo de estandarización, de tal forma que se prioricen la información más relevante y eliminando la información irrelevante. Este último eje propone un uso bidireccional, que favorezca la liberación de conjuntos de datos (divulgación) y su respectivo aprovechamiento ya sea para fine investigativos o informativos por parte de la ciudadanía, academia e institucionalidad. Así las cosas, el control de la información ya no es una característica opcional, si no fundamental a la hora de plantear el contexto y establecer la importancia de los datos. Es aquí donde la arquitectura de la información se vuelve un pilar en los objetivos ligados a los resultados.
Discusión
Uno de los principales obstáculos a la hora de procesar datos masivos, es la poca estandarización de estos y la perdida de trazabilidad de estos, se denominan entonces datos heredados, y provienen de fuentes que no han sido actualizadas o no siguen la directriz de categorización de los datos. Esto puede generar un desligamiento a la hora de articular toda la información, tal y como lo expresa (Mentzer & Washington, 2015) quien señala que, a pesar de los avances en las aplicaciones, el sector público sigue rezagado en términos de análisis debido en gran parte a que la información está bloqueada en formatos de datos heredados. Sumado a ello, aseguran (Puron-Cid et al., 2012; Purón-Cid & Gil-García, 2013) que la llegada de nuevos avances tecnológicos y grandes conjuntos de datos no siempre están acompañados por condiciones favorables para una adopción exitosa.
Otra consideración, corresponde a la concepción sobre los datos, para autores como (Boyd & Crawford, 2012) y (Meneses, 2018) los datos no son neutrales, sino que expresan las intenciones de quienes los diseñan, según esta lógica, la información puede ser manipulada, en tanto los datos expresan una intencionalidad de diseño. Es entonces, una postura contraria al objetivo de la analítica de datos, pues el procesamiento de datos conserva una estructura neutral, y solo cuando se procesan y se agrupan los datos estos se convierten en información útil. Se afirma entonces, como refiere (Mills, 2003) que a partir de los grandes datos presenciamos un momento en el cual se abren posibilidades para el entendimiento sociológico del dato, ya que se logran ampliar las posibilidades de observación, experimentación, abriendo la puerta a una nueva practicidad.
Finalmente, es menester mencionar que estamos en un entorno cada vez más digital, lo que conlleva a concebir los datos como un insumo clave para los estudios de ciudad, como lo expresa (Kitchin et al., 2017) al señalar que existe una larga historia de gobiernos, empresas, ciencia y ciudadanos que producen y utilizan datos para monitorear, sacar provecho y darle sentido al mundo urbano.
En este sentido, el llamado que se realiza con esta investigación subyace en la posibilidad de generar alternativas para la aplicación efectiva de la analítica de datos, como contraposición a los análisis estáticos de los fenómenos urbanos, esta característica puede desarrollarse gracias a la disposición de grandes cantidades de datos, que según autores como (Batty, 2016; Kitchin, 2014b, 2014a) se configuran como un torrente amplio y profundo de datos oportunos, variados y relacionales, los cuales si son acompañados de otros tipos de datos de origen gubernamental, pueden nutrir el proceso de toma de decisiones (Bates, 2012)
Conclusiones
Hacer uso de Big Data en el sector público, se ha constituido como una tendencia, destacando principalmente las posibilidades que ofrece para la participación ciudadana en asuntos públicos más que en el sector gubernamental. En este sentido, si el propósito es la implementación de la analítica de datos, los gobiernos deben implementar unos centros de integración de datos estructurados y no estructurados con la finalidad de garantizar la disponibilidad y acceso a los datos por parte de las dependencias analíticas, soportadas con infraestructura tecnológica y personal especializados en datos.
El uso de datos en el sector público obedece en primera instancia a la búsqueda de mecanismos con los cuales hacer frente a los principales desafíos, desafíos, que contemplan crisis económicas recurrentes, gobiernos inestables, falta de gobernabilidad, instituciones débiles y desconfianza de los ciudadanos en sector público. Estos desafíos, están obligando a los gobiernos a implementar medidas adecuadas para la toma de decisiones. No obstante, el gran inconveniente se centra en la gestión de los datos, donde se busque que sean relevantes, estructurados y precisos.
Cabe señalar que incorporar la analítica de datos en los métodos de gestión en búsqueda del desarrollo de talento analítico, creara un entorno que fomente la integración y la experimentación para la resolución de problemas, es por ello que los gobiernos que operan proyectos de Big data necesitan tomar enfoques específicos donde el éxito dependerá de la capacidad para integrar y analizar la información, desarrollar sistemas de soporte y respaldar la toma de decisiones a través del análisis de los datos.
Muchos datos del sector público tienen una naturaleza global y se pueden usar para la solución y prevención de problemas mundiales; esta perspectiva no es nueva, y puede confirmarse con iniciativas como los Objetivos del Milenio -ODS- cuyo alcance es de carácter mundial. Dicho esto, los gobiernos y desde el sector público en general, se hace necesario e imprescindible compartir datos. El Big Data, la divulgación y los datos abiertos, se constituyen como una gran oportunidad para la resolución de problemáticas sociales, en este aspecto, el reporte del IBM Global Business Services (2011) señala que resolver problemáticas sociales va más allá de la revolución de los datos.