Introducción
La Agenda 2030 para el desarrollo sostenible aprobada en 2015 por la Organización de las Naciones Unidas - en adelante, ONU-, aborda 17 objetivos principales y 169 metas definidas, como un macro plan que busca, a través de una alianza mundial y el compromiso de los diferentes Estados miembros, garantizar el desarrollo equitativo y armonizado con el medio ambiente, enfocado principalmente en superar las diferentes brechas sociales, económicas y ambientales, las cuales tienden a ser aún más pronunciadas en América Latina y el Caribe (CEPAL 2018).
El seguimiento de los Objetivos de Desarrollo Sostenible -en adelante, ODS- y sus metas propuestas se hace efectivo a través de la definición de un marco global de 241 indicadores, cuya medición y cálculo permite realizar diagnósticos y validar avances cuantificables en los diferentes contextos del desarrollo sostenible. Para lograr lo anterior, los lineamientos para el cálculo de indicadores son definidos por organismos custodios acorde a sus competencias, descritos en metadatos que presentan las metodologías y fórmulas a emplear, con el fin de lograr una medición estandarizada y comparable entre países. Ahora bien, no todos los indicadores planteados presentan el mismo grado de desarrollo metodológico y disponibilidad de datos, por lo que el Grupo Interagencial y de Expertos sobre Indicadores ODS (IAEG-SDGS, por sus siglas en inglés) ha establecido una clasificación por nivel o tier1 (ONU 2021), con el fin de impulsar el cálculo masivo y reporte de los indicadores con metodologías definidas, y promover la participación multinacional para lograr la consolidación de procesos en aquellos indicadores con menor desarrollo.
En el contexto actual de los ODS, para lograr la aplicación plena de la Agenda 2030, se hace necesario invertir en datos para garantizar el cálculo de indicadores, ya que "la mayoría de los países no recopilan datos con regularidad para más de la mitad de los indicadores mundiales" (ONU 2019, 3). En este sentido, la Comisión Económica para América Latina y el Caribe (CEPAL), ha definido una serie de prioridades para lograr la implementación y seguimiento de la Agenda Global, entre las cuales se destacan: potenciar los análisis a través del avance en las innovaciones tecnológicas; acceso e implementación de la sociedad de la información; integración de los ODS en los planes de desarrollo; creación de arquitecturas nacionales y fortalecimiento de capacidades; importancia de las oficinas nacionales de estadística -en adelante, ONE- en la recolección, procesamiento, desagregación, diseminación y análisis de datos y estadísticas (CEPAL 2018). De esta forma, los sistemas estadísticos nacionales se convierten en una de las áreas estratégicas para lograr acciones conducentes al desarrollo sostenible, involucrando el uso y aplicación de nuevas fuentes de datos y tecnologías, junto a la integración de datos geoespacia-les en la producción de estadística (UN-GGIM: Europa 2019a). Esto ha permitido que las ONE capacitadas, para producir información, integren datos provenientes de fuentes alternativas y no tradicionales, como las imágenes satelitales, redes sociales, telefonía móvil, entre otros (Adams y Judd 2018).
El Comité de las Naciones Unidades sobre la Gestión Global de Información Geoespacial (UN-GGIM, por sus siglas en inglés) ha caracterizado un marco de trabajo, que destaca como fuentes nacionales de información para el seguimiento y reporte de los ODS a las Observaciones de la Tierra -en adelante EO, por sus siglas en inglés-, las infraestructuras de datos espaciales, los sistemas nacionales de estadísticas, y otras fuentes, incluido el Big Data (ESA 2018). Uno de los principales beneficios del uso de las EO en las ONE, radica en la posibilidad de derivar indicadores ODS que, de otra manera, serían técnica y financieramente difíciles de calcular, ya que se podría reducir la frecuencia de las encuestas y, por ende, sus costos asociados, proporcionando, adicionalmente, desagregación y granularidad a los indicadores (UN-GGIM: Europa 2019a), sumado a la posibilidad de monitorear los cambios durante el tiempo, para la oportuna toma de decisiones (Digital Globe s. f.). De esta forma, los datos estadísticos y geoespaciales son una de las fuentes de datos más prominentes para el monitoreo de indicadores ODS, siendo el objetivo 11 uno de los ejemplos de mayor efectividad en el uso y análisis de información geoespacial (Avtar et ál. 2019), donde las EO son una de las fuentes más relevantes para proveer datos de media y alta resolución requeridos en el cálculo de los indicadores asociados (Andries et ál. 2019), gracias a sus características más relevantes, entre las cuales se destacan: acceso libre y abierto; escala y cobertura; consistencia y comparabilidad; continuidad temporal; complementariedad con métodos estadísticos tradicionales; diversidad de mediciones (ESA 2018).
El ODS 11 es uno de los objetivos con mayor seguimiento en tiempos recientes, ya que con sus diez metas definidas busca lograr que las ciudades y asentamientos humanos sean inclusivos, seguros, resilientes y sostenibles, en un mundo donde la urbanización no es simplemente un fenómeno demográfico (ONU 2018), ya que la acelerada la expansión urbana y sus complejidades acarrean una serie de cuestiones ya conocidas, tales como: los asentamientos marginales, el acceso al transporte público, la disposición de residuos, contaminación del aire; y en otras que están tomando relevancia actual, como el acceso inclusivo y equitativo a espacios abiertos de uso público (ONU 2019). De esta forma, el monitoreo de avances en indicadores ODS asociados a contextos urbanos requiere de acceso y sistemas de datos desglosados especialmente abiertos y referenciados espacialmente, por el rol crucial que tienen las ciudades de cara a un futuro enmarcado en el desarrollo sostenible (Kanuri et ál. s. f.). Ahora bien, la obtención de datos desagregados es costosa y requiere de capacidades adicionales, por lo que es indispensable conjugar esfuerzos entre los distintos niveles de gobierno, para trabajar en formas modernas de análisis y recolección de datos (ONU-Hábitat s. f.).
De acuerdo con lo anterior, ante el compromiso de Colombia para la implementación y monitoreo de la Agenda 2030, donde el Departamento Administrativo Nacional de Estadística -en adelante, DANE- participa activamente en el IAEG-SDGS (UNFPA, DANE, y FAO 2021), este trabajo se encamina a resaltar el uso de técnicas enmarcadas en el aprendizaje de máquinas, para el cálculo de los indicadores ODS 11.3.1, relación entre la tasa de consumo del suelo y la tasa de crecimiento de la población, y 11.7.1, proporción media de la superficie edificada de las ciudades que se dedica a espacios abiertos para uso público de todos, en un marco de procesos enfocados en la integración de la información estadística y geoespacial, a partir de los datos proporcionados por el DANE, en conjunción al acceso y procesamiento de imágenes de satélite. Otro aspecto relevante que se deriva de la realización de estos cálculos es lograr que Colombia escale posiciones en el índice ODS para América Latina y el Caribe, que para 2019 posicionaba al país en el puesto noveno del ranking regional (CODS 2020).
Estado del arte
El desarrollo sostenible es, actualmente, un término que se emplea de manera recurrente en diseño de políticas públicas, la planificación del territorio y, en general, con toda aquella relación dada entre el contexto socioeconómico y ambiental. En realidad, esta concepción se sustenta en la posibilidad de llegar al desarrollo sin comprometer los recursos, tanto presentes, como los de las próximas generaciones, entendiendo que la sostenibilidad es un fenómeno multidimensional en términos sociales, económicos y ambientales (Lorenzo 2020).
En el contexto global, ante los desafíos que se han presentado en los países para el monitoreo y avance de los ODS, las entidades productoras de información, especialmente las ONE, han visto la necesidad de emplear nuevas fuentes de información con mayores niveles de desagregación y dimensionalidad, así como grandes conjuntos de datos como el Big Data, con el fin de fortalecer los sistemas de medición de datos, y de esta forma lograr nuevas soluciones, no solo para el cálculo y monitoreo de indicadores ODS (Li 2021)., sino para la propia producción estadística (Vaca y Vega 2019). Por esta razón, en la actualidad se plantea el concepto de infraestructura para el desarrollo sostenible, derivado de los recientes avances tecnológicos, el cual contempla categorías asociadas a la inteligencia artificial (AI, por sus siglas en inglés), junto a la integración con técnicas de Machine Learning y Deep Learning, sumado a las tecnologías de las EO, como los sensores remotos, LIDAR (Light Detection and Ranging) y vehículos aéreos no tripulados (drones) (Song y Wu 2021).
Aunque los dos indicadores abordados en este artículo están catalogados como tier ii, con su consecuente nivel de desagregación y disponibilidad de datos, ha permitido definir lineamientos metodológicos para el cálculo de sus diferentes indicadores. Tanto el ODS 11.3.1 como el 11.7.1 son indicadores que pueden ser soportados por Big Data y datos geoespaciales (Halderen et ál. 2021).
Para el cálculo del indicador ODS 11.3.1 se adopta una métrica espacial como una de sus principales unidades de análisis, la tasa en que el suelo es consumido para crecimiento urbano (GUO 2020) y para ello, un conjunto de datos que sirve como línea base para su cálculo es la capa de asentamientos globales humanos -en adelante GHSL, por sus siglas en inglés- y sus componentes asociados a las áreas construidas, población residente y tipologías de asentamientos (Melchiorri et ál. 2019). Asimismo, el análisis geoespacial combinando datos de población y coberturas del suelo derivan en métricas relevantes para el desarrollo metodológico del indicador (UN-GGIM: Europa 2019b). De esta forma, el empleo de imágenes satelitales como Landsat-8, Sentinel-2 y MODIS, permite monitorear el crecimiento urbano y modelar la expansión de las ciudades, en conjunto al uso de técnicas Machine Learning para la detección de áreas construidas por medio de métodos de clasificación supervisada como las Máquinas de Soporte Vectorial (SVM, por sus siglas en inglés), Random Forest y árboles de decisión (O'Connor et ál. 2020), con las que se busca categorizar grandes números de observaciones, tales como, píxeles de las imágenes (Holloway, Mengersen, y Helmstedt 2018).
En el caso del indicador ODS 11.7.1, aunque se presentan limitaciones para disponer imágenes ópticas en la resolución espacial requerida para delinear los espacios abiertos, es posible emplear fuentes de datos globales como GHSL y CORINE Land Cover, que destaquen la huella urbana, en conjunto con datos de luces nocturnas y servicios comerciales de imágenes de alta resolución, como Copernicus (O'Connor et ál. 2020), que sumados a datos nacionales provenientes de catastros y coberturas de mayor desagregación territorial, garantizan la consistencia y estabilidad temporal necesarias para realizar mediciones a través del tiempo (UN-GGIM: Europa 2019b).
Justamente, se destacan algunos trabajos enfocados en los indicadores objeto de este estudio. Por ejemplo, para evaluar el indicador ODS 11.3.1 en cuatro ciudades de Sudáfrica se usaron imágenes satelitales Landsat 5 y SPOT 2&5, en adición a datos censales recolectados en 1996, 2001 y 2011, con la aplicación de técnicas de análisis de imágenes orientadas a objetos, y así obtener el consumo de suelo per cápita y el cambio urbano total para cada ciudad, derivando en la creación de una línea base para el seguimiento de este indicador (Mudau et ál. 2020). De otro lado, en China continental se emplearon datos de EO, cobertura y uso del suelo, luces nocturnas y censos, con el fin de extraer el porcentaje de área construida, que junto a la estimación de población, permitió obtener la heterogeneidad espacial y tendencia de la expansión urbana a nivel ciudad y nacional, desde 1990 hasta 2010, encontrando que más del 95 % de las ciudades experimentaron crecimientos en sus áreas construidas, con un valor del indicador que se incrementó de 1,69 en el periodo 1990-2000 a 1,78 en el periodo 2000-2010 (Wang et ál. 2020). El cálculo del indicador ODS 11.3.1 también ha sido llevado a cabo por países europeos como Suecia, Noruega y Portugal, los cuales emplearon fuentes de datos nacionales, GHSL, grillas de aglomeraciones urbanas, y coberturas nacionales de uso del suelo (Dysterud y Engelien 2019), mientras que en la ciudad de Bari, Italia, se emplearon mapas dasimétricos a partir del uso del Mapa de Asentamientos Europeos de 2012, y la clasificación de imágenes Sentinel-2 de los años 2019 y 2020 (Aquilino et ál. 2021).
En el caso del ODS 11.7.1, para el monitoreo y modelado de accesibilidad a áreas verdes urbanas a través de datos de observaciones de la Tierra en cuatro ciudades europeas, se emplearon observaciones satelitales Sentinel-2 y de alta resolución derivadas de Copernicus, junto con información auxiliar de fuente catastral, para realizar procesos de clasificación supervisada de imágenes utilizando índices espectrales y máscaras de nubosidad en la plataforma Google Earth Engine (GEE), y así modelar y mapear la accesibilidad física de la población a su espacio verde público más cercano, en diferentes rangos de tiempo (Giuliani et ál. 2021). Otras fuentes empleadas por países europeos como Suecia, Noruega y Estonia son las coberturas de aglomeraciones urbanas, atlas, GHSL e información de vías (Dysterud y Engelien 2019). De otro lado, métodos más robustos para identificar y mapear los espacios verdes abiertos se emplearon en Monterrey, México, a través de tecnologías Deep Learning para la detección geométrica de patrones en imágenes de satélite (Huerta et ál. 2021).
Los casos anteriores demuestran que el uso de EO tiene el potencial para lograr el monitoreo oficial de los indicadores ODS (Wang et ál. 2020) y la facultad de complementar y mejorar los procesos estadísticos tradicionales, sumado a su alcance en el reporte de estos indicadores (Giuliani et ál. 2021).
Metodología
Desde los contextos investigativos y geográfico, este estudio cuantitativo tiene alcance correlacional (Hernández, Fernández y Baptista 2015), ya que se desarrollan procesos Machine Learning con árboles de predicción en técnicas espaciales referidas a la percepción remota (Bozzano et ál. 2016), con el fin de obtener clasificaciones sobre imágenes satelitales, fundamentales para el cálculo de los indicadores ODS 11.3.1 y 11.7.1.
Ahora bien, el organismo custodio para el desarrollo y cálculo de los indicadores mencionados, ONU-Hábitat ha elaborado metadatos asociados a cada uno de ellos, donde se describen, de forma general, el flujo de procesos y pasos a seguir y fórmulas a emplear. A continuación, se mencionan dichos pasos para cada indicador:
1. Indicador ODS 11.3.1 (ONU-Hábitat 2020a):
1.1. Decisión del periodo/años de análisis;
1.2. Delimitación del área urbana o ciudad de actuará como alcance geográfico del análisis;
1.3. Análisis espacial y cálculo de la tasa de consumo del suelo;
1.4. Análisis espacial y cálculo de la tasa de crecimiento de la población;
1.5. Cálculo de la razón de la tasa de consumo del suelo respecto a la tasa de crecimiento de la población.;
2. Indicador ODS 11.7.1 (ONU-Hábitat 2020b):
2.1. Análisis espacial para delimitar el área urbana o de ciudad que actuará como alcance geográfico para el cálculo del indicador;
2.2. Análisis espacial para identificar espacios públicos abiertos, y cálculo del área total ocupada por los estos espacios;
2.3. Estimación del área total asignada a vías;
2.4. Estimación de la proporción de los grupos de población de interés con acceso a espacios abiertos públicos.
Área de estudio
La Comisión de Estadísticas de la ONU, en su sesión número 51, ha recomendado a los países emplear el método del grado de urbanización -en adelante DEGURBA, por sus siglas en inglés-, que permite delinear ciudades, áreas urbanas y rurales, para realizar comparaciones estadísticas internacionales (EU et ál. 2020), y puede ser usada para recopilar estadísticas acorde a los grados de urbanización definidos en un nivel principal, así (European Union-FAO-UN-Habitat-OECD-World Bank 2020): centro urbano o ciudad (área densamente poblada), aglomeración urbana o poblado (área de densidad intermedia) y área rural (baja densidad y población detallada).
A partir de la metodología DEGURBA se definió un universo de 68 ciudades en Colombia, de las cuales 63 contaban con insumos idóneos (imágenes ópticas sin alta nubosidad) para realizar el cálculo del indicador ODS 11.3.1, en el periodo 2015-2020. A su vez, ya que el indicador 11.7.1 requiere contar con insumos adicionales para determinar espacios abiertos de uso público, los cuales no están disponibles para todas las ciudades, se optó por aplicar el enfoque de una muestra nacional de ciudades del Observatorio Global Urbano -en adelante Guo, por sus siglas en inglés-, a partir de criterios definidos, como el número de ciudades y tamaño de la población, con el fin de usar una muestra estadísticamente representativa de los asentamientos urbanos del país, y así realizar la estimación nacional del indicador (Ndugwa 2018). De acuerdo con lo anterior, se definió una muestra representativa de nueve ciudades para realizar el cálculo del indicador 11.7.1, año 2018, correspondiente a los datos disponibles del Censo Nacional y Población y Vivienda -en adelante, CNPV- de 2018. La Tabla 1 lista las ciudades empleadas para cada uno de los indicadores.
La Figura 1 presenta el mapa de contexto de la distribución de las ciudades definidas para el calculo de los dos indicadores ODS, objeto de este estudio.
Datos
La Tabla 2 y la Tabla 3 describen los insumos y los datos empleados para el cálculo de los indicadores.
Procesos
El flujo de procesos geoespaciales definido para el cálculo de los indicadores ODS 11.3.1 y 11.7.1 está plenamente soportado por técnicas analíticas espaciales, procesamiento de imágenes y algoritmos de Machine Learning, como se describe en la Figura 2.
Clasificación supervisada
De acuerdo con los lineamientos de los metadatos definidos para los indicadores ODS 11.3.1 y 11.7.1, se procedió a realizar el proceso de clasificación supervisada de las imágenes satelitales de media y alta resolución, en las siguientes categorías: áreas construidas, aquellas ocupadas por construcciones y superficies artificiales (ONU-Hábitat 2020a); áreas no construidas y agua.
Dos de las principales recomendaciones para la clasificación de imágenes conciernen a la creación de mosaicos y selección del algoritmo adecuado (Aguilar y Kuffer 2020; Giuliani et ál. 2021). De esta manera, a través de la plataforma de procesamiento en la nube, Google Earth Engine (GEE), fueron seleccionadas las imágenes satelitales de acceso libre, teniendo como criterios principales de selección los siguientes: (i) porcentaje de nubosidad por debajo del 40 %, a partir del metadato de la imagen, indicada por la concentración estimada que se encuentra presente en el total de la imagen; (ii) intervalo de fechas, dependiendo de las vigencias requeridas para el cálculo del indicador; y (iii) selección por localización y corte al límite de las ciudades del área de estudio.
Las imágenes satelitales seleccionadas de las dos misiones poseen corrección geométrica y calibración radio-métrica, con valores de píxel en reflectancia de superficie (TOA3, por sus siglas en inglés), ya que esto asegura la obtención de mejores resultados en procesamientos con las imágenes, más aún con la diferencia de temporalidad de los insumos para el caso del indicador ODS 11.3.1; en los años 2015 y 2020 los resultados pueden ser comparables entre si (Nonni et ál. 2018).
Adicionalmente, se aplicó una máscara de nubosidad a cada imagen de la colección, de acuerdo con la banda de calidad de cada una de las misiones,4 donde se identifica la presencia de nubes y tipos particulares de estas, como cirrus (Traganos et ál. 2018) asociadas a algún bit. Esta acción disminuye la probabilidad de nubes en el mosaico utilizado para las distintas clasificaciones.
Como el propósito consistió en realizar la clasificación a partir de una sola imagen, se empleó una reducción de la colección de las imágenes para cada una de las misiones, generando un mosaico de medianas, que consiste en seleccionar el valor de la mediana de cada píxel, generando una imagen homogénea en el espacio y tiempo, con menor probabilidad de afectaciones por presencia de nubes y fuentes de contaminación, lo cual es una condición adecuada para la identificación de zonas construidas (Flood 2013).
Debido a las diferencias encontradas en la resolución espacial en las bandas espectrales RGB y NIR de las imágenes Landsat 8 con las bandas SWlR-1, SWlR-2 y Red Edge de las imágenes Sentinel-2, es necesario realizar sobre el mosaico de medianas el proceso pansharpening, que consiste en la fusión de imágenes con el fin mejorar la resolución espacial de las bandas, sin perder la resolución espectral que poseen (Li et ál. 2018). El algoritmo aplicado corresponde al filtro de paso alto (HPF, por sus siglas en inglés) (Chen 2019) a las bandas espectrales térmicas para obtener una resolución espacial final de 10 m en todas las bandas, y de esta forma realizar con mayor precisión la delimitación del área construida.
Para obtener una clasificación final mejorada, tanto en el mosaico de medianas como en la imagen de mejor resolución espacial extrapolada y re-muestreada, se calcularon los índices espectrales de la Tabla 4.
El algoritmo que se utiliza para la clasificación supervisada basada en píxeles es Random Forest, siendo uno de los más usados y con mejores resultados dentro de las técnicas de Machine Learning, obteniendo la mejor exactitud temática para la detección de zonas urbanas (Belgiu y Drăgu 2016; Tavares et ál. 2019; C. Li, Cai, y Du 2021; Shafizadeh-Moghadam et ál. 2021). Respecto a los parámetros del algoritmo, el resultado de la clasificación difiere solo si varía la muestra de entrenamiento, o esta es realizada en otra imagen (Ramírez et ál. 2020).
La clasificación se realizó a partir de los polígonos de entrenamiento trazados manualmente en los que se hizo distinción entre zonas construidas, verdes y cuerpos de agua. La muestra es dividida entre el 70 % de los polígonos de entrenamiento y el restante 30 % para validación (Millard y Richardson 2015). Para decidir si la clasificación es adecuada, se utilizaron los indicadores de exactitud temática más representativos, a saber: porcentaje de clasificación del mapa, calidad del productor, calidad del usuario y kappa, derivados de la matriz de confusión generada a partir de la información de entrenamiento y validación (Foody 2002; Liu, Frazier y Kumar 2007).
Con base en las imágenes clasificadas, se procede a realizar la evaluación para determinar el nivel de clasificación de las áreas construidas, a partir de las definiciones establecidas por la metodología DEGÜRBA (European Union-FAO-UN-Habitat-OECD-World Bank 2020):
Definir un círculo de 1 km2 alrededor de cada píxel clasificado como construido, y calcular la proporción de píxeles en el círculo que también se clasifican como construidos.
Si el 50 % o más de los píxeles en el kernel son construidos, el píxel se clasifica como urbano.
Si entre el 25 % y menos del 50 % de los píxeles en el kernel son construidos, el píxel se clasifica como suburbano.
Si menos del 25 % de los píxeles en el kernel son construidos, el píxel se clasifica como Rural.
Cálculo del indicador ods 11.3.1, periodo 2015-2020
Con el resultado de la clasificación del área construida para cada ciudad, se procedió a realizar un ajuste a la clasificación, ya que se tiene una clasificación de todos los píxeles urbanos, y para realizar el cálculo del indicador se debe tener la delimitación por ciudad, por lo cual se realizó el corte con la cobertura de cabeceras municipales del MGN. Así mismo, se hizo el ajuste por la diferencia de resolución entre sensores (Landsat 8, 30 metros para 2015 y Sentinel-2, 10 metros para 2020), mediante Sistemas de Información Geográfica, generando los polígonos con el área construida a nivel ciudad, lo que permitió la comparabilidad visual entre las dos vigencias. Finalmente, se generaron los polígonos de consumo del suelo urbano entre los dos años.
Con el área del consumo de suelo para cada ciudad, se procede al cálculo de la correspondiente tasa que, junto a la calculada a partir de las proyecciones para determinar el crecimiento de población, derivan en el cálculo del indicador. A continuación, se presentan las fórmulas establecidas para realizar los cálculos mencionados:
Ecuación 1. Tasa de consumo del suelo (TCS).
Donde:
Urb t+n : Área construida en el año final (2020)
Urb t : Área construida en el año (2015)
y: Número de años entre los dos momentos de medición (cinco)
Ecuación 2. Tasa de crecimiento de población (TCP).
Donde:
Pop t : Población de la cabecera municipal en el año final (2020)
Popt+n: Población de la cabecera municipal en el año inicial (2015)
y: Número de años entre los dos momentos de medición (cinco)
Ecuación 3. Relación entre la tasa de consumo del suelo y la tasa de crecimiento de población.
Cálculo del indicador ods 11.7.1 año 2018
Con el área urbana determinada por la clasificación de imágenes Sentinel-2 para 2018, se realizó la determinación de los espacios abiertos empleando técnicas de información geoespacial, tomando como base la información catastral disponible, el MGN y la toponimia. De los espacios públicos detectados, es necesario realizar un chequeo manual exhaustivo del resultado consolidado, a través de un mapa base actualizado o una imagen de muy alta resolución espacial de archivo. Esta actividad es necesaria ya que se pueden encontrar diferencias en forma y tamaño de estos espacios con la información catastral reportada como uso público, y por la temporalidad de la toponimia respecto a la fecha de toma de la imagen satelital clasificada (Giuliani et ál. 2021).
Como complemento a los espacios públicos detectados con la información oficial disponible, se utilizó la información de acceso abierto proveniente de la fuente Open StreetMap (OSM), el cual es un insumo masivo útil con información confiable (Aguilar y Kuffer 2020; Giuliani et ál. 2021). No obstante, se realizó una verificación visual antes de su integración, y así construir un repositorio de espacios públicos más robusto para cada una de las ciudades analizadas.
Dentro del cálculo del indicador es indispensable determinar el área destinada a las calles, para lo cual se utilizaron los insumos base disponibles (manzanas censales y límites de cabeceras municipales) y la extensión urbana resultante del proceso de clasificación de imágenes. Se procedió a realizar una operación espacial de recorte, tomando el límite de cada cabecera, aplicando posteriormente la operación espacial de borrado, partiendo los cubrimientos resultantes con la cobertura de manzanas censales. El resultado obtenido es una malla, tipo polígono, de las vías de cada ciudad. Posteriormente, se realizó una revisión y depuración de estos cubrimientos, con el fin de detectar posibles inconsistencias, que afecten el cálculo del indicador, definido en la siguiente fórmula:
Ecuación 4. Proporción del área construida de la ciudad que es destinada a espacios abiertos de uso público.
Dado que el indicador se debe desagregar por grupos de poblacionales de interés, a partir de las siguientes temáticas: sexo, edad y personas con condición de discapacidad, para realizar las estimaciones de población con acceso a espacios públicos abiertos, se adoptó el enfoque basado en el uso de datos de alta resolución provenientes de las ONE junto a la definición de áreas de servicio (ONU-Hábitat 2018). Por consiguiente, en cada una de las ciudades de la muestra se utilizaron las unidades censales (viviendas) georreferenciadas del CNPV 2018, en donde se logró identificar la participación de mujeres, menores de quince años y personas con discapacidad, cuya ubicación se superpuso con las áreas de servicio definidas para los espacios públicos, determinadas a una distancia de cuatrocientos metros caminando. La generación de estas áreas se realizó a través de procesos derivados del análisis de redes que ofrece la plataforma ArcGlS Pro. De esta manera, se estableció el indicador desagregado por medio del porcentaje de personas, pertenecientes a los tres grupos de población interés, que se encuentran dentro del área de accesibilidad a los espacios abiertos definidos, aplicando la Ecuación 5.
Ecuación 5. Indicador desagregado por grupos poblacionales de interés.
Resultados
La sección de resultados se encuentra compuesta por los siguientes apartados: (i) procesamiento de imágenes satelitales, haciendo énfasis en los resultados obtenidos para las ciudades de Cali y Medellín; (ii) resultados relevantes del cálculo de indicadores ODS 11.3.1 y 11.7.1.
Procesamiento de imágenes
El primer producto corresponde al mosaico de composición de medianas para cada uno de los años de estudio (2015 y 2020 para el indicador ODS 11.3.1; 2018 para el indicador ODS 11.7.1), con el cual fue realizada cada una de las clasificaciones. La Figura 3 y la Figura 4 muestran los mosaicos generados para Cali y Medellín, respectivamente.
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Los mosaicos se encuentran libres de nubosidad y radiométricamente son conformes, es decir, no se encuentran valores atípicos, situación que es característica general de una composición de medianas.
A partir de las muestras de entrenamiento recolectadas para cada una de las tres clases de interés, y luego de seleccionar aquella clasificación con mejores resultados tanto visuales como en los resultados de los indicadores de exactitud temática (Tabla 5) fueron escogidas las clasificaciones que se presentan en la Figura 5 para Cali y la Figura 6 para Medellín.
Datos: índices de evaluación temática resultado de la clasificación de las imágenes de satélite Landsat (2015) y Sentinel-2 (2018 y 2020).
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Los indicadores de exactitud temática obtenidos para las 63 ciudades definidas reflejan precisiones generales que oscilan 0,951 y 1, con índices Kappa entre 0,908 y 1 para cada uno de los años. Estos valores cercanos y superiores a 0,9, ratifican que los productos generados son adecuados5. En la Tabla 5 se observan los índices para las ciudades de Cali y Medellín.
A partir de las clasificaciones obtenidas, se aplica la metodología DEBURGA con el fin de identificar cuáles de estos píxeles se pueden clasificar como área construida, y así delimitar el consumo de suelo urbano. El resultado para las ciudades de Cali y Medellín se observa en la Figura 7 y en la Figura 8, respectivamente, enmascarando las demás coberturas.
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Landsat 8 (2015) y Sentinel-2 (2018 y 2020).
Cabe recalcar que las áreas urbanas fueron obtenidas en función de la resolución espacial propia de las imágenes satelitales empleadas para cada vigencia. Es decir, las áreas urbanas del año 2015 se encuentran a una resolución espacial de treinta metros de las imágenes Landsat, y las del año 2018 y 2020 a una resolución de diez metros de las imágenes Sentinel-2.
Cálculo de los indicadores ODS 11.3.1 y 11.7.1
Indicador ODS 11.3.1 periodo 2015-2020
Después de obtener la clasificación de las áreas urbanas y la realización del ajuste a la clasificación debido a la diferencia en la resolución espacial de las imágenes de satélite, se pueden evidenciar las zonas y sus cambios sustanciales en el consumo del suelo entre 2015 y 2020, como se evidencia, a manera de ejemplo, en la ampliación realizada, a través de la plataforma Google Earth, en la ciudad de Cali (Figura 9).
Con los datos numéricos del área de consumo de suelo en las dos temporalidades y los datos de población proyectada en cabeceras municipales, se calculan las tasas de crecimiento de la población consumo del suelo.
De manera general, los incrementos del consumo de suelo urbano se encuentran localizados en las zonas periféricas de las ciudades de estudio, donde las mayores tasas se manifiestan en ciudades intermedias y pequeñas. Las dos ciudades con mayor tasa de consumo del suelo urbano son Madrid y Zipaquirá en el departamento de Cundinamarca, indicativo de sus procesos actuales de urbanización a partir de la alta demanda de espacios de vivienda derivada de la población de Bogotá D.C. A manera de ejemplo gráfico, como se ha hecho en las secciones anteriores de este artículo, se presentan los mapas que destacan las zonas de consumo del suelo urbano en las ciudades de Cali (Figura 10) y Medellín (Figura 11). De otro lado, las mayores tasas de crecimiento de la población se presentan en Sabaneta (Antioquia) y Cajicá (Cundinamarca), municipios cercanos a grandes ciudades como Medellín y Bogotá.
Los valores obtenidos para el indicador en las 63 ciudades reflejan que doce ciudades tienen un valor mayor a uno; 49 ciudades, un valor inferior a uno (positivo); y dos ciudades indicador con valor negativo. De acuerdo con la interpretación de resultados propuesta en el metadato del indicador (ONU-Hábitat 2020a), valores superiores a uno implican un posible uso ineficiente del suelo, caso contrario a los valores por debajo de uno, que representan efectos de estabilización, donde valores próximos a cero reflejarían procesos de densificación. En este caso, se destacan los valores altos significativos del indicador para las ciudades de: Barrancabermeja (5,41); Pereira (3,28); y Cartago (2,64). El valor negativo del indicador que se manifiesta en las ciudades de Buga y Pasto obedece a las tasas de crecimiento de población negativas entre los años 2015 y 2020. El valor derivado del indicador a nivel nacional es 0,503.
La Tabla 6 presenta, a manera de ejemplo y en concordancia con los anteriores, los valores de las tasas y el indicador para las ciudades de Cali y Medellín. En el anexo 1 se dispone la tabla completa de los resultados para las 63 ciudades definidas y a nivel nacional.
Indicador ods 11.7.1 año 2018
Tomando como base el área urbana estimada para el año 2018, se hizo una validación en cada una de las ciudades de la muestra, a partir de las unidades prediales del catastro y la toponimia del MGN, con el fin de determinar los espacios públicos abiertos. A su vez, con el fin de complementar la información, se integró a la información anterior los espacios públicos derivados de Open Street Map, y de esta forma obtener una cobertura completa para cada ciudad. El uso de esta fuente cartográfica colaborativa fue sumamente valioso, ya que diversos espacios públicos no podían ser determinados a través de la clasificación por el tamaño del píxel o por la ausencia nombres geográficos actualizados, en especial en las zonas de urbanizaciones nuevas.
Cabe anotar que para el cálculo de este indicador, el espacio público abierto está compuesto por las zonas verdes y el área destinada a vías, la cual también fue estimada en cada ciudad. Adicionalmente, para la desagregación del indicador por los grupos de población de interés, se generaron las áreas de servicio requeridas para calcular la población con acceso a los espacios abiertos de uso público. La Figura 12 presenta los mapas correspondientes a dichos espacios (zonas verdes y área destinada a vías), así como las áreas de servicio definidas para la ciudad de Cali; la Figura 13, para la ciudad de Medellín.
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Sentinel-2 (2018) y técnicas SIG.
Datos: procesos geoespaciales elaborados a partir de imágenes satelitales Sentinel-2 (2018) y técnicas SIG.
Con los valores definidos de área urbana y del área de espacios abiertos de uso público, se realizó el cálculo del indicador global, aplicando la Ecuación 4. La Tabla 7 presenta los resultados obtenidos para las nueve ciudades de la muestra definida.
De los resultados del indicador se destaca que las ciudades de Pereira, Cali y Medellín poseen los porcentajes más altos de área construida destinada a espacios abiertos de uso público, superiores al 40 %, caso contrario a ciudades de la muestra ubicadas en la región Caribe, Turbaco, Barranquilla y Cartagena, con porcentajes inferiores al 30 %. El valor estimado del indicador a nivel nacional es igual a 33,2 %.
La desagregación del indicador se efectúa determinando la proporción de los grupos de población de interés con acceso a los espacios públicos abiertos a través de la superposición de la información censal georreferenciada en las áreas de servicio. De esta manera se obtuvo el total de población para cada uno de los grupos poblacionales de interés, contenida en las áreas de servicio, para así aplicar la Ecuación 5, obteniendo el indicador desagregado como se observa en la Tabla 8.
De acuerdo con la Tabla 9, las ciudades con mayor porcentaje de población perteneciente a los grupos de interés, con acceso a espacios abiertos de uso público, son Bogotá D.C. y Pereira, con valores superiores al 90 %. Caso contrario se presenta la ciudad de Cartagena con valores próximos al 60 %. Se destaca, adicionalmente, que las personas del grupo poblacional de personas con limitaciones presentan mayores porcentajes de acceso respecto a los otros dos grupos poblacionales. Ahora bien, los valores estimados del indicador desagregado para el nivel nacional son los siguientes: mujeres, 80,0 %; menores de 14 años, 77,8 %; personas con limitaciones, 84,8 %.
Conclusiones y discusión
Con este trabajo, se presenta la propuesta metodológica desarrollada para el cálculo de los indicadores ODS 11.31 y 11.7.1 en Colombia, soportado por la integración de información estadística y geoespacial, sumado de procesamiento de imágenes satelitales en la nube, aprovechando las potencialidades de los métodos de clasificación enmarcadas en Machine Learning.
En cuanto a la definición de ciudades y la clasificación de las áreas urbanas, la metodología recomendada del grado de urbanización DEGURBA, es adecuada y óptima para la medición de indicadores asociados al ODS 11, enfocado en las ciudades.
Respecto al uso y procesamiento de imágenes satelitales, como información geoespacial clave y fuente masiva de datos para el monitoreo del desarrollo sostenible, actualmente se cuenta con una gran variedad de imágenes de acceso libre, lo que permite realizar clasificaciones en distintas fechas, aventajando el empleo de otras fuentes como son GHSL, disponibles para años específicos y con una resolución espacial menos detallada, respecto a las imágenes Sentinel-2 o Landsat-8 (Melchiorri et ál. 2019).
El procesamiento de imágenes en la nube garantiza, además del acceso, realizar procesos más rápidos, con automatización de tareas, desde la búsqueda de las imágenes disponibles hasta obtener la clasificación final de las áreas y/o coberturas que se requieran. Esto evita requerir equipos de cómputo de gran capacidad de cómputo junto a licencias de software especializado en el procesamiento de imágenes. Justamente, una de las ventajas principales en este ambiente es el desarrollo de algoritmos o scripts que pueden ser replicables en otras zonas o adaptables para otros estudios similares, gracias a la aplicación de técnicas de clasificación o predicción sobre grandes volúmenes de datos, derivadas del Machine Learning, como los árboles de decisión aleatorios o Random Forest.
En cuanto a la información estadística, la importancia de levantar, diseminar y disponer datos georreferencia-dos y desagregados por parte de las ONE, en este caso el DANE, se convierten en insumos fundamentales para el monitoreo de indicadores con énfasis sociodemográfico. Es así que los datos empleados en Colombia para el cálculo de los indicadores incluyó fuentes estadísticas convencionales como las proyecciones de población para determinar la tasa de crecimiento de la población en el indicador ODS 11.3.1, y las unidades censales georreferenciadas para determinar la desagregación por grupos poblacionales en el indicador ODS 11.71, las cuales son consideradas datos de alta resolución, en comparación a otras fuentes de datos, como las grillas de población o la información agregada a niveles superiores.
Los resultados obtenidos en el indicador ODS 11.3.1 destacan casos especiales en ciudades con un alto consumo del suelo urbano entre 2015 y 2020, y dos ciudades con tasas de crecimiento poblacional negativas. No obstante, el valor derivado nacional indica un comportamiento estable de acuerdo la interpretación del indicador. Respecto al indicador ODS 11.7.1, se destacan los valores inferiores en las ciudades de la muestra pertenecientes a la Región Caribe, los cuales se pueden inferir, en términos de morfología urbana, por el entramado vial predominantemente irregular de las ciudades de Cartagena y Turbaco, sumado a la fundación histórica de estos asentamientos, así como en vocación portuaria e industrial del distrito de Barranquilla. De otro lado, Medellín, Cali y Pereira son ciudades en donde más del 40 % de su superficie edificada está destinada a espacios abiertos de uso público, porcentaje superior al valor estimado nacional, correspondiente al 33 %.
El desarrollo metodológico expuesto en este artículo sigue los lineamientos generales del organismo custodio de los dos indicadores, ONU-Hábitat, realizando procesos de clasificación de imágenes satelitales y análisis de información geoespacial. No obstante, es probable que la identificación obtenida de espacios abiertos de uso público podría diferir respecto a un inventario detallado de este tipo de espacios, ya que los resultados finales del indicador en cada ciudad están condicionados a los insumos empleados. En este sentido, para trabajos futuros se sería recomendable disponer y utilizar o información oficial o registros administrativos de espacio público, y continuar explotando fuentes alternativas de información, como las plataformas de mapeo colectivo, entre ellas, OSM, la cual ha sido empleada en otros trabajos (Aguilar y Kuffer 2020; Giuliani et ál. 2021) y que por su actualización constante garantiza no solo el cálculo del indicador sino su actualización en el tiempo, sumado a que es información de acceso libre.
Mientras que la actualización en la medición del indicador ODS 11.3.1 puede estar garantizada gracias a la disponibilidad de imágenes satelitales en diferentes vigencias y a las fuentes de datos de población, como las proyecciones censales o iniciativas globales tales como WorldPop y Facebook, el cálculo actualizado del indicador ODS 11.7.1 estaría afectado por la desactualización de la información catastral en algunas ciudades, creando una brecha de información con las ciudades que si mantienen procesos catastrales continuos. Con el fin de solucionar lo anterior, sumado a garantizar una estructura de información que permita la interoperabilidad con otras fuentes, se espera que el desarrollo del catastro multipropósito en Colombia procure mecanismos para disponer de información predial actualizada, de gran utilidad para el cálculo del indicador.
La aplicación de técnicas de análisis espacial en SIG permite explorar diversas posibilidades en estudios de accesibilidad urbana, ya sea a través de áreas de servicio o la definición de métricas de acceso a los espacios abiertos de uso público. Cabe destacar que el cálculo desagregado del indicador ODS 11.7.1 por grupos poblaciones, a la fecha no se ha documentado en publicaciones y artículos relacionados, ya que el enfoque se ha plasmado sustancialmente en la determinación de los espacios abiertos.
Los indicadores calculados no solo tienen como fin cumplir con el seguimiento a la Agenda Global del Desarrollo Sostenible, sino que se afirman como resultados idóneos y necesarios para alcaldes y gobiernos municipales, ya que la desagregación espacial y focalización de estos indicadores serían un soporte para la toma de decisiones informada, en pro de llegar a la planificación y ordenamiento de ciudades sostenibles. En este sentido, se insta a los mandatarios y gabinetes a emplear estos recursos, con el fin de plantear políticas, programas y proyectos que busquen la inclusión y acceso de los diferentes grupos poblacionales a los espacios públicos y su aprovechamiento, así como el desarrollo de estrategias para lograr un equilibrio sostenible y sustentable entre el crecimiento de la población y los procesos de urbanización.