Introducción
En el neotrópico, los ecosistemas de alta montaña (páramo y bosque altoandino) apoyan la regulación climática transformando el CO2 en O2 (Torres et al., 2012); razón que determina la necesidad de su conservación. Estos ecosistemas recientes (Holoceno), presentan un interés por las comunidades locales para la realización de actividades como la agricultura itinerante, el pastoreo, la quema, las plantaciones exóticas (Pinuspatula y Eucalyptus globulus) y la tala con rigor; estas actividades provocan alteraciones en la estructura ecológica de las comunidades vegetales (Cleef, 2008). Vale la pena mencionar que cerca del 99% de los páramos del planeta están ubicados en la Cordillera de los Andes (Garavito-Rincón, 2015).
Esta investigación se centra en dos páramos ubicados en la Cordillera Oriental de Colombia, específicamente, los páramos de Merchán y Telecom en el municipio de Saboyá (Complejo de Páramos Iguaque - Merchán, Boyacá), con el propósito de evaluar métodos de clasificación supervisada e identificar cuál de éstos permite una mejor discriminación de la distribución espacial del páramo.
Estos métodos de clasificación que hasta ahora no se habían implementado en el área de interés, sin embargo, se cuentan con aportes para otras localidades en el mundo, como reseñan Manna et al. (2013), quienes evaluaron cambios de bosque de mangle en la isla Jharkhali (Sundarbans, India) entre el 2004 y 2010 con datos satelitales multitemporales y de vegetación a partir del Índice de Vegetación de Diferencia Transformada (TDVI por sus siglas en inglés). Este último determinó un resultado favorable con aumento de la cubierta vegetal gracias a los esfuerzos de conservación. En Egipto (Al-Kharj), Aly et al. (2016), con imágenes Landsat, determinaron un aumento de la cobertura vegetal (CV), en ecosistemas áridos (107,4% entre 1987 y 2000) y disminución de la misma (27,5% entre el 2000 y 2013), producto del deterioro y salinización del suelo y el agua.
En México, De León-Mata et al. (2014) estudiaron la composición de la cobertura vegetal entre los años 2008 y 2011 para el área prioritaria para la conservación de pastizales conocida como Cuchillas de la Zarca, estimaron una degradación lenta (-661 ha anuales de chaparral y -795,6 ha de bosques de encino - pino) debido a la existencia de grandes parches. En Sinaloa (México), Sanhouse-García et al. (2017) entre 1990 - 2000 identificaron una tasa de cambio durante ese periodo de 52% en la superficie total inicial y de 41% entre 2000 - 2014 por causa de la ocupación del territorio por el hombre. En Brasil (Paulo Assis Ribeiro, Colorado), dos Santos et al. (2015) determinaron entre 1991 - 2010, transiciones de bosque en pasto en un 70%. En Chile, Sepúlveda-Varas et al. (2019) estudiaron el cambio de cobertura y uso del suelo entre 1994 y 2007 con el índice de Kappa, concluyeron mayor presión de uso en las categorías cultivos, praderas naturales y plantaciones forestales.
En Colombia, Muñoz-Guerrero et al. (2009) evaluaron la dinámica de cambio entre 1989 y 2008 en la microcuenca Las Minas (Pasto, Nariño), con imágenes Landsat10TM e IKONOS; los resultados permiten discriminar la reducción del bosque secundario (58,51 ha) con una tasa de deforestación de 3,08 ha/año, un aumento de áreas destinadas para la siembra (141,64 ha) por presiones de deforestación y un aumento de actividad bovina y pecuaria.
Por su parte, en algunos páramos de Colombia Arellano y Rangel (2008), identificaron áreas en la Serranía de Perijá y el Parque Nacional Natural Los Nevados (PNN) con favorable estado de conservación y conectividad.
Actualmente, los entes gubernamentales y la autoridad ambiental en el páramo de Merchán y Telecom no cuentan con instrumentos suficientes de planificación, vigilancia y control que permitan determinar los impactos naturales de la actividad humana en la zona. Por otra parte, la investigación biótica relacionada en las áreas del Complejo de Páramos Iguaque -Merchán es incipiente, y se requiere información sobre la dinámica espaciotemporal del páramo, el bosque altoandino y la influencia de la matriz agrícola sobre estos (Cortés-Duque y Sarmiento-Pinzón, 2013; Velasco-Linares et al., 2015).
Por lo anterior, el presente estudio da respuesta a las siguientes interrogantes: ¿Qué método de clasificación supervisada permite estimar de forma confiable la dinámica de cambio de las coberturas vegetales presentes en el páramo de Merchán y Telecom? ¿Tienen algunos de estos métodos la capacidad para discriminar los rasgos geológicos que ejercen algún tipo de influencia sobre los páramos?
Marco teórico
Teledetección
Los estudios de dinámicas espaciales y temporales se apoyan en la geografía cuantitativa bajo un sistema lógico matemático y deductivo (Padrón, 2007). La investigación se enfoca en el estudio del territorio (González, 2011), como representación del espacio sometido a una transformación continua, como resultado de la acción social del hombre (Llanos-Hernández, 2010).
El cambio se identifica con herramientas de teledetección que de acuerdo con Chuvieco (1995) y Di Somma et al. (2010) poseen las siguientes ventajas:
Permite adquirir información de la superficie terrestre a partir de sensores instalados en plataformas espaciales y la energía electromagnética.
Las imágenes de satélite permiten abordar análisis multitemporales, entendidos como cambios espaciales debido a presiones agrícolas y pecuarias, que acarrean modificaciones físicas (aumento o disminución de cobertura de estudio) y geográficas (aumento o disminución área de cada clase), en un periodo de tiempo.
Proporciona una visión de la evolución del territorio y ofrece instrumentos para una correcta lectura de los orígenes del paisaje actual y sus posibles desarrollos futuros.
Algoritmos de clasificación supervisada
Existen herramientas predictivas que clasifican datos basados en algoritmos que describen patrones. Estos algoritmos de clasificación supervisada tienen aplicaciones medioambientales, sociales, políticas, entre otras (Riquelme et al., 2006).
Uno de ellos, es el algoritmo Máquinas de Soporte Vectorial (SVM, por sus siglas en inglés), método muy utilizado debido al amplio rango de datos que permite procesar; además, identifica con exactitud las coberturas del suelo y permite visualizar la separación entre estas (Cervantes-Canales, 2009; Murillo-Castañeda, 2018; Parra, 2017).
Un segundo método son las Redes Neuronales Artificiales (ANN, por sus siglas en inglés), que utilizan muestras establecidas (entradas de entrenamiento) cuya cantidad y calidad de datos son indispensables para la red neuronal (Moya-Fuero, 2012). Las ANN, permiten determinar patrones que en varios casos se escapan de la observación humana (Becerra-Serial et al., 2009). El método clasifica imágenes satelitales de forma automática por medio de muestras o puntos de control, dados por interpretación visual (Jaramillo y Antunes, 2018; Lanzarini, 2004).
El tercer método, el cual ha sido muy aceptado por la capacidad de integrar datos de diversas fuentes y calidad de los resultados, es Bosques Aleatorios (RF, por sus siglas en inglés) (Sánchez-Pellicer et al., 2017). Este algoritmo es un clasificador de conjunto que produce múltiples árboles de decisión, conformado por un subconjunto de muestras al azar y variables de entrenamiento; una de sus ventajas es su alta precisión en la clasificación (Belgiu y Drágut, 2016). En este último método, distintos árboles analizan distintas porciones de los datos; de esta manera hace que cada árbol se entrene de distintas muestras de datos para un mismo problema. Así, al combinar los resultados, unos errores serán compensados con otros, y se obtendrá un mejor resultado (Paredes-Inilupu, 2020).
Un cuarto método es Árboles de Decisión (DT, por sus siglas en inglés), tiene la bondad de que permite interpretar fácilmente las decisiones tomadas por el modelo, revela formas complejas de la estructura de datos que no se pueden detectar con métodos convencionales de regresión. A partir de una base de datos, crea diagramas de construcciones lógicas, técnica explicativa y descomposicional basada en procesos de división secuencial, iterativa y descendiente. La manera de obtener árboles de decisión binarios, es decir que cada nodo se divide en exactamente dos ramas, es por medio de la técnica CART (Classification And Regression Trees) diseñado por Breiman et al. (1984) (según Friedl y Brodley, 1997). Este modelo es considerado una herramienta que complementa técnicas estadísticas como la regresión múltiple, análisis de varianza, regresión logística, modelos loglineales (De'Ath y Fabricáis, 2000).
Finalmente, un quinto método corresponde a la clasificación de Bayes (BC, por sus siglas en inglés), conocido por su simplicidad y rapidez computacional. Permite predecir la probabilidad de diferentes resultados con base al Teorema BC (Gonzáles y Rodríguez, 2006).
En síntesis, estos algoritmos de clasificación supervisada permiten medir el cambio de uso del suelo, direccionado a la interpretación de la pérdida o ganancia de cobertura vegetal, que se puede ver reflejado en la fragmentación de bosques, pérdida de biodiversidad, disminución de la conectividad ecológica, o, por el contrario, la recuperación a través de la sucesión y la resiliencia ecosistémica (Lozada, 2007).
Marco geológico
La zona de estudio se encuentra en la Cordillera Oriental de Colombia, específicamente en los límites entre los departamentos de Santander y Boyacá, esta corresponde a los páramos de Merchán y Telecom.
El área de interés se caracteriza por un sistema de anticlinales y sinclinales que pertenecen al llamado Sinclinorio de Chiquinquirá (Fuquen y Osorno, 2005), un bloque estructural que se encuentra delimitado al oriente por la Falla Pedro Gómez y al occidente por la Falla Carupa, pero que en el sector considerado con esta investigación es llamada Falla Peña Blanca (Figura 1), la cual ha sido reconocida en la plancha 170 (Fuquen y Osorno, 2005). En el sector sur de la zona de estudio, yace la Falla Garavito, una estructura que ha sido interpretada a partir de las fotografías aéreas de la zona. El área comprendida en la presente investigación presenta más plegamientos asociados a los procesos compresivos que edificaron la Cordillera Oriental de Colombia, que fallamientos. A lo largo de este bloque, las estructuras son asimétricas, y estrechas con ejes que poseen una dirección entre N30E a N40E. Los principales rasgos estructurales lo constituyen las fallas Carupa, Arboledas, El Roble, Peña Blanca, Garavito, y el sinclinal de Aposentos - Chiquinquirá (ver Figura 1).
La Falla de Carupa es considerada una falla de cabalgamiento con vergencia al occidente que afecta los estratos de las formaciones de edad Cenomaniano-Turoniano: Churuvita (predominantemente areniscas), Simijaca (unidad lutítica-limosa, en cuya base se encuentras delgadas capas de caliza) y Frontera (secuencia de limolitas silíceas). La Falla de Peña Blanca cartografiada por Ulloa y Rodríguez (1978) es considerada como una falla dextral con salto inverso con una dirección de N40-45°E, su trazo es rectilíneo y se infiere que el plano de esta falla es sub-vertical inclinado al NW con vergencia al SE. La falla deforma las rocas de la Formación Conejo de edad Coniciano-Santoniano, constituida principalmente por arcillolitas negras a grisáceas, con delgados niveles de areniscas y calizas, su prolongación hacia el sur es considerada la continuación de la Falla de Carupa y está cubierta por depósitos cuaternarios en casi toda su extensión y su traza queda cubierta por depósitos lagunares al noreste de Susa (Fuquen y Osorno, 2005).
La Falla Arboledas reconocida por Terraza (2004), tiene carácter sinestral extendiéndose con dirección N50°W, debido a su trazo rectilíneo se ha inferido (Fuquen y Osorno, 2005) que el plano de falla podría inclinarse subverticalmente al NE, sin embargo, no se descarta algún tipo de desplazamiento inverso local a lo largo de su extensión. Terraza (2004) estima un desplazamiento de 1 a 2 km de la falla, su expresión geomorfológica es de un escarpe prominente que se extiende hasta la Falla de Peña Blanca.
La Falla El Roble es considerada como una falla inversa convergencia al SE (Terraza, 2004) la cual controla el curso medio y alto de la quebrada El Roble. La dirección del plano de falla es al noreste con buzamiento hacia el noroeste. Posiblemente la estructura se haya generado por deslizamiento flexural entre rocas competentes e incompetentes durante el plegamiento que dio origen al sinclinal de Aposentos - Chiquinquirá tomando como superficie de despegue los niveles arcillosos por debajo de la Formación Churuvita.
A lo largo de la zona, existen otras estructuras como el sinclinal de Aposentos - Chiquinquirá, el cual fue definido por Ulloa y Rodríguez (1978) como sinclinal de Chiquinquirá - San José de Pare. Esta estructura de tipo simétrico ocupa toda la zona de estudio, y está delimitada por las rocas de la Formación Tablazo (conformada por una intercalación de lutitas, calizas y areniscas cuarzosas de edad Aptiano Superior a Albiano Inferior) en sus flancos y por rocas de la Formación Plaeners (arcillas grises oscuro a amarillas de edad Campaniano superior) en su núcleo. Según Fuquen y Osorno (2005) el eje de este sinclinal tiene una dirección general N35°E y se extiende desde el suroeste de Carupa conectando con otras estructuras. Hacia los flancos del sinclinal de Aposentos -Chiquinquirá se desarrollaron varios pliegues que son interpretados por Terraza (2004) como el resultado de la acomodación por deslizamiento flexural entre capas de distinta resistencia mecánica, resultando en el plegamiento de la Formación Churuvita y las unidades supra e infrayacentes, con superficies de charnela que presentan diferente orientación.
El páramo de Merchán se extiende entre ellos anticlinales de Río Piedras y Jesús María (Figura 1), y está limitado por un contraste litológico. En contraste, el páramo de Telecom es parte del flanco oriental del Anticlinal de Tinjacá - Oiba (Figura 1).
El páramo de Telecom se encuentra sobre el bloque colgante generado por la Falla de Garavito. Por medio de la cartografía y cálculos realizados para el presente estudio, se observa que estos páramos juntos con otros más pequeños de Santander comprenden un área de 16.212 ha con alturas entre 3.150 y 3.850 msnm (Figura 2). En este complejo se distribuyen ecosistemas de páramo, subpáramo y bosques altoandinos (Morales-Rivas et al., 2007). En la zona de estudio se originan los principales tributarios del río Suárez para este sector de la Cordillera Oriental (Figura 2).
Metodología
Basados en los métodos descritos en la segunda sección, se realizó una secuencia de pre y posprocesamiento a imágenes de satélite del sensor Landsat 8, apoyado en software ERDAS para ortorrectificación, QGIS para algunas herramientas de preprocesamiento como recorte, combinación de bandas, algunos complementos de código abierto y libre acceso como Algoritmo de Semiclasificación Automática (SCP, por sus siglas en inglés) creado por Luca Congedo (Bravo-Morales, 2020) y RStudio, para hacer las clasificaciones supervisadas a según los cinco métodos basados en Machine Learning.
Es importante mencionar, que esta investigación se realizó durante la emergencia sanitaria generada por la pandemia de COVID-19, por lo cual no fue posible tener acceso presencial a la zona de estudio, por esta razón la asignación de los puntos de control como insumos para todos los métodos de clasificación, se hizo con algunos puntos en campo tomados previamente a la emergencia sanitaria, imágenes satelitales de alta resolución espacial (geo portales) y Pansharpening en procesamiento de la imagen Landsat 8 bajo el SCP (para el año 2018 se aplicaron los dos últimos criterios); la resolución de 30 x 30 m se redujo a 15 x 15 m, de esta forma se permite una mayor visualización y mejor conocimiento de la zona de interés. De igual forma se tomó Landsat 8 por su resolución espacial y año 2018, debido a que años posteriores se presentaban dificultades de visualización de coberturas por la alta presencia de nubosidad.
Obtención de las imágenes satelitales de la zona de estudio
Se utilizaron imágenes satelitales del sensor Landsat 8, con una resolución espacial de 30 m y Path/row 08/56. Estas imágenes fueron obtenidas del visor Glovis del Servicio Geológico de los Estados Unidos (USGS), que contaron con nubosidad <15% y cubrieron la extensión de la zona de estudio para el trimestre enero - marzo de 2018, algunas características de resolución son reflejadas en la Tabla 1 (Chuvieco, 2002).
Preprocesamiento de imágenes satelitales
Combinación de bandas. Se realizó la combinación R:4, G:3, B:2 según especificaciones técnicas del sensor Landsat 8 con el fin de obtener una mejor visualización y diferencias de coberturas.
Recorte de la imagen a partir del polígono de referencia. Luego de la ortorrectificación se realizó recorte de cada imagen correspondiente al área de estudio de los páramos Merchán y Telecom (sistema de coordenadas WGS 84 UTM Zone 18N, código 32618), por medio del SCP de QGIS, durante el preprocesamiento se hicieron recortes de bandas, agregando el shapefile en primer caso para el páramo de Telecom y posteriormente páramo de Merchán.
Mejoramiento espacial
Para mejorar la resolución y la visualización de la zona de estudio se aplicó la herramienta SCP en QGIS y poder visualizar a mejor detalle la zona de estudio.
Categorización temática de imágenes
Para determinar las coberturas de las zonas de páramo se tomaron puntos de control, es decir, coordenadas de interés las cuales fueron la base para que a través de métodos de Machine Learning (SVM, RF, entre otros) se generara una clasificación temática en cada una de las imágenes multiespectrales.
La clasificación digital de las imágenes Landsat 8, se realizó a través de una clasificación supervisada (lenguaje de programación R) de la siguiente manera:
Creación y delimitación de áreas de entrenamiento: donde se efectuó la definición digital de las categorías, es decir, se define la cantidad total de distintas cubiertas definidas según el IDEAM (2010).
Asignación: consistió en la categorización de los pixeles de la imagen, de esta manera se asignaron los pixeles específicos para cada tipo de cobertura.
Para que la clasificación sea satisfactoria por medio del lenguaje de programación R, la imagen satelital (preprocesada), debe presentarse de forma rectangular para evitar errores al correr los paquetes y librerías previamente instaladas.
Calibración de un modelo de clasificación supervisada
Se efectuó a través del lenguaje de programación R, este incorporó una serie de herramientas estadísticas robustas (regresión logística, análisis discriminante) y de inteligencia artificial (SVM, DT, BC) las cuales tienen la capacidad de realizar tareas propias de clasificación. Para realizar estas últimas se empleó un subconjunto de datos de prueba (entrenamiento) los cuales fueron usados para comprobar el comportamiento del modelo estimado.
Dentro del lenguaje de programación R, se utilizó el paquete nnet redes neuronales con capa oculta, trabajando con dos hiperplanos: uno es el número de neuronas en la capa oculta (size) y otro que controla la regulación durante el entrenamiento de la red (decay), arrojando una clasificación supervisada.
Para dicha clasificación, se debe hacer lo siguiente:
Instalación de algunos paquetes como sp, ráster, RStoolbox, ggplot2, reshape, rpart.plot, snow, rpart, sf, nnet
Se activan las librerías de los anteriores paquetes, además de usar suppressMessages para evaluar las variables en un solo contexto, omitiendo mensajes de diagnóstico "simple"
Los valores seleccionados de la imagen satelital junto con el shapefile de los páramos se incorporan en el paquete nnet de R con los siguientes ítems:
Size: Número de unidades en la capa oculta (50)
Data: Marco de datos en este caso se tomó una muestra de 200 puntos de control, donde el 50% es tomado para ser validado por medio de la función simple en R
Rang: Pesos iniciales, se tomó de 0,1
Decay: Parámetro de caída de peso, se debe tomar un valor muy pequeño en este caso 40.0005
Maxit: Máximo número de iteraciones: 200
La Figura 3 resume la metodología utilizada en la presente investigación en forma de diagrama de flujo.
Resultados
La Figura 4 resume las distribuciones espaciales de los páramos Merchán y Telecom mediante los métodos de clasificación supervisada.
Discriminar visualmente cuál de los métodos de clasificación es más efectivo resulta una tarea compleja, por esta razón se calculó para cada uno de ellos el índice Kappa (Tabla 2), el cual se define como: K = (Po - Pe) / (1 - Pe). Siendo: Po = Número de aciertos/Número total de clases, Po = (A1 + B2 + C3) / M, Pe = Cálculo generado desde la matriz de confusión, Pe = (EP1 x EU1) + (EP2 x EU2) + (EP3 x EU3) (Llactayo et al., 2014).
Con el propósito de discriminar la confiabilidad de cada uno de los métodos, se construyen entonces matrices de confusión (CM, por sus siglas en inglés), ya que este ha sido uno de los métodos más utilizados para validar estos tipos de modelos (Willington et al., 2013). Así, para cada uno de los modelos se proporcionaron las matrices de confusión obtenidas.
Las Tablas 3 a la 12 resumen los resultados obtenidos al aplicar los cinco métodos de clasificación supervisada.
Las Tablas 5 y 6 resumen los resultados obtenidos al aplicar método RF.
Las Tablas 7 y 8 resumen los resultados obtenidos al aplicar el método DT.
En las Tablas 9 y 10 se presentan la CM del método de Bayes, así como las determinaciones de áreas y porcentaje de cada cobertura para los páramos Merchán y Telecom.
Análogamente que, en los casos anteriores, en las Tablas 11 y 12 se presentan la CM del método de redes neuronales artificiales, así como las determinaciones de áreas y porcentaje de cada cobertura para los páramos Merchán y Telecom.
Con el propósito de facilitar la discusión en la Tabla 13 se presenta un resumen de todos los métodos empleados para cada uno de los páramos estudiados.
Discusión
El índice Kappa indica la confiabilidad y precisión general de la clasificación temática, de esta manera permite evaluar la concordancia de métodos cuyo resultado es categórico, con dos o más clases. Este índice representa la proporción de acuerdos observados respecto del máximo acuerdo posible más allá del azar (Borras et al., 2017). Según la clasificación establecida para el índice Kappa presentada en Llactayo et al. (2014), y con los resultados obtenidos de este índice en el presente estudio, se puede considerar que los cinco métodos de clasificación supervisada se encuentran en una concordancia casi perfecta (0,81 - 1) para calificar la exactitud obtenida.
El método que obtuvo mayor precisión en la clasificación supervisada para la imagen de Landsat 8 (2018) fue RF con un valor del 92,53% (Tabla 2). Los resultados afirman la precisión en la clasificación, pues este algoritmo permite resultados de calidad ya que genera múltiples árboles de decisión donde hay un subconjunto de muestras al azar y variables de entrenamiento (Belgiu y Drágut,, 2016); de igual forma como mencionan Sánchez-Pellicer et al. (2017), RF es uno de los algoritmos más usados en la actualidad para la teledetección, esto por su capacidad de integrar datos de diversas fuentes.
La investigación realizada por Fragoso-Campón y Quirós (2019), titulada Sentinel Toolbox Application (SNAP) aplicada a la clasificación supervisada de imágenes PNOA, en la cual la clasificación mediante el algoritmo RF alcanzó una exactitud global del 86%, ayudando a validar al software SNAP como herramienta de trabajo, no sólo de imágenes satelitales, sino también de imágenes aéreas y de alta resolución. De igual forma el valor de precisión y confiabilidad para RF (92,53%) obtenido en el presente estudio, tiene un valor cercano a una clasificación de cobertura terrestre realizada en un geo ecosistema montañoso ecuatoriano, realizado por Ayala-Izurieta et al. (2017), en el cual se clasificó la cobertura vegetal de las áreas montañosas dentro de un área de estudio de 1016 km2, a una resolución espacial de 30 m, utilizando un método clasificador para RF que arrojó un mapa de cobertura terrestre con una precisión general del 95%.
El algoritmo de RF ha sido utilizado en diferentes estudios, entre los cuales se encuentra el de Espejo (2016), donde se concluyó que, para los objetos de deforestación generados a partir de los objetos de Bosque y No Bosque clasificados por el método de RF y SVM se presentan valores más altos en la similaridad temática (Theme), borde (Edge) y posición (Position).
En las CM, se observa que, para el método RF (Tabla 5), la cobertura vegetal Mosaico de Pastos y cultivos presentó un menor grado de precisión dado que obtuvo 7774 puntos correctos de 8215 puntos, de igual manera, Herbazal denso obtuvo 944 puntos de 1260; estos datos permiten verificar la exactitud temática respecto a la clasificación establecida con los datos de referencia del terreno. Es importante resaltar que los valores bajos con respecto a las otras coberturas se deben a la poca área ocupada en la zona, es decir la cobertura de mayor área es la que presenta el mayor número de puntos de control. Con esto es posible inferir que la clase con mayor precisión y agrupación espectral fue nubes, ya que, obtuvo un valor de 421 puntos correctos de 427, seguida de Tejido Urbano Discontinuo y Bosque Denso Alto de Tierra Firme.
Con base en la clasificación supervisada por el método de RF, en la Tabla 6, se puede observar que la mayor área de cobertura corresponde a Mosaico de Pastos y Cultivos (MdPyC), con 26,131 km2 en el páramo de Merchán y 11,297 km2 en el páramo de Telecom. La segunda cobertura vegetal mejor distribuida es el Bosque Denso Alto de Tierra Firme (BDAdTF), en un mayor porcentaje de área en el páramo de Telecom con un valor del 43,62% respecto al área total del páramo.
El segundo método más preciso en la clasificación supervisada para los páramos de Merchán y Telecom, fue ANN el cual obtuvo un índice Kappa de 91,51% (Tabla 2). La CM (Tabla 11), muestra que las coberturas de Bosque Denso Alto de Tierra Firme y Mosaico de Pastos y Cultivos fueron las menos precisas, dado que presentan la mayor diferencia entre puntos de control y los puntos correctos; la clase de nubes obtuvo un 100% de precisión tomando totalmente los puntos correctos.
Los valores de área para las clases de coberturas por ANN, son cercanos a las áreas presentadas por RF. En el caso del Herbazal Denso en el páramo de Merchán, por ejemplo, con RF se obtuvo un área de 2,757 km2 (Tabla 6) y con ANN un valor de 3,060 km2 (Tabla 12), esto se debe a que los dos métodos fueron los más altos en la precisión de la clasificación según el índice Kappa. Sin embargo, algunos valores de coberturas entre estos dos algoritmos presentan una mínima diferencia, por ejemplo: BDAdTF y MdPyC en el páramo de Telecom muestran porcentajes de área, respectivamente, de 45,66% y 47,44% con ANN (Tabla 12), y 43,62% y 49,41% con RF (Tabla 6).
El siguiente método más preciso en la clasificación, según el índice Kappa, fue SVM con un valor del 91,32%. Este algoritmo presenta una buena precisión de clasificación ya que, según Murillo-Castañeda, 2018, SVM tiene una alta resolución al momento de identificar coberturas presentes en el suelo, pues aparte de lograr disociación entre cada una de ellas, también separa los elementos a clasificar. Dentro de la CM (Tabla 3) se observa que la cobertura que presentó mayor asignación de puntos fue Mosaico de Pastos y Cultivos, sin embargo, obtuvo el menor grado de precisión ya que presentó una diferencia de 601 puntos respecto a los puntos totales de control; esta clase está seguida de Herbazal Denso (998 puntos correctos) y Bosque Denso Alto de Tierra Firme (3197).
Entre los algoritmos de SVM y BC, se observa que existe una diferencia significativa entre los valores de las áreas de coberturas. En la Tabla 10 del método BC, se observa que el porcentaje de área para Herbazal Denso en el páramo de Telecom es 16,59%, mientras en SVM presentan un valor de 6,79% para esta cobertura (Tabla 4). Lo mismo ocurre con MdPyC del páramo de Merchán, el cual alcanzó un valor de 67,57% de área con el método BC y de 76,42% de área con el método SVM. Con ello es posible observar la relación que existe con el índice Kappa, en el cual el método BC obtuvo un valor de 86,38%, uno de los valores de confiabilidad más bajos en comparación con los otros cuatro métodos evaluados.
El índice Kappa para los métodos BC y DT, fueron 86,38% y 80,07% respectivamente (Tabla 2). Estos valores, reflejan una buena precisión general de la clasificación, sin embargo, como se menciona anteriormente, fueron los valores más bajos en comparación con los demás métodos. Es de resaltar que el índice Kappa, como menciona Llactayo et al. (2014), es una medida de la diferencia entre la exactitud lograda en la clasificación con un software y la exactitud de lograr una clasificación correcta con una clasificación visual (en campo o con imágenes de alta resolución).
Las coberturas de Tejido Urbano Discontinuo (TUD) y Nubes, en los cinco métodos, presentaron áreas muy bajas en comparación con las demás. Por ejemplo, con el método de DT, en el páramo de Merchán se obtuvo un área de 0,0748 km2 para TUD y 0,0082 km2 de TUD en el páramo de Telecom. Sin embargo, es importante resaltar que para la imagen Landsat 8 tomada de estudio y/o referencia, el páramo de Telecom no presentaba ningún grado de nubosidad, contrario al de Merchán, de ahí el mínimo porcentaje de área; donde si hay presencia se debe a errores de precisión del algoritmo.
Respecto a la cobertura de Bosque Denso Alto de Tierra Firme, se observa que existe un mayor porcentaje de área 43,62% (método RF) en el páramo de Telecom, con lo cual se puede deducir que en el páramo de Merchán se ha presentado mayor intervención agrícola y pecuaria; el mayor valor de cobertura presente en este páramo es Mosaico de Pastos y Cultivos con un porcentaje de área de 77,68% respecto al área total del páramo.
Los valores obtenidos de las CM para los cinco métodos utilizados, muestran que las clases de Tejido Urbano Discontinuo y Nubes presentaron la mejor precisión en todos los algoritmos. Los pocos puntos presentados para Tejido Urbano Discontinuo se deben a un grado de error por el posible desacierto de la respuesta espectral de las nubes, dado que se puede presentar una confusión de los pixeles de este tipo de clase, clasificándolas como tejido urbano discontinuo; así mismo, en la zona de estudio del páramo de Telecom existe una base militar que interviene con la captura de los puntos de control.
De igual forma se observa dentro de los resultados obtenidos en las CM, que estas presentan una cantidad considerable de puntos de control lo cual se debe a que para la clasificación supervisada se tomó un polígono de tipo rectangular que abarco el área del páramo de Merchán junto con el de Telecom, ya que el lenguaje de programación R no considera polígonos irregulares como el límite perimetral de los páramos de estudio; por esta razón al establecerse los puntos de control dentro del polígono se visualizan varios de ellos.
Debido a que el contorno o límite de los páramos pareciera estar limitado en el caso del páramo de Merchán por el contacto entre las formaciones Cretácicas y Cuaternarias, y en el caso del páramo de Telecom por el eje del sinclinal, para cada uno de los métodos se realizaron 6 medidas de la distancia entre el borde del páramo dado por cada método y esos rasgos geológicos. Los resultados son resumidos en la Figura 5. Se observa que desde un punto de vista geológico la distancia promedio predicha entre el borde del páramo y el eje del sinclinal es muy similar para los distintos métodos, y si se considera la desviación estándar prácticamente no hay diferencia entre ellos. En contraste, cuando se determina la distancia entre el borde del páramo y el límite de las formaciones cretácicas para el páramo de Merchán, los algoritmos SVM, RF, ANN y DT arrojan resultados similares en términos de la distancia promedio y la desviación estándar. Mientras que el método BC tiende a subestimar la distancia promedio. Para el páramo de Telecom, la distancia promedio entre el límite del páramo y el contacto con formaciones cuaternarias es muy similar para cada uno de los métodos, siendo el algoritmo de RF, el que presenta la menor dispersión.
Al realizar una correcta clasificación supervisada de coberturas vegetales, fue posible obtener datos reales del terreno que se pueden considerar insumos precisos y confiables para la determinación y análisis de métricas del paisaje, ayudando a establecer y analizar la configuración, diversidad y forma del paisaje, en este caso para los páramos de Merchán y Telecom en el municipio de Saboyá-Boyacá. Estos estudios son importantes para la gestión de la estructura ecológica principal, entendiéndose esta según el PND 2010-2014 (IDEAM, 2011), como el conjunto de ecosistemas estratégicos que garantizan la integridad de la biodiversidad y la provisión de servicios ecosistémicos con el fin de satisfacer las necesidades básicas de la población. Estos páramos brindan diferentes servicios ecosistémicos, entre los cuales encontramos los de aprovisionamiento y regulación hídrica; motivo por el cual su cuidado y conservación es fundamental dentro del Plan de Ordenamiento Territorial para el desarrollo sostenible en el Municipio de Saboyá.
Importancia de la geología en la extensión de los páramos
En los resultados obtenidos (Tabla 13), independientemente del método utilizado, se observa una tendencia de disminución del área de la cobertura del páramo de Merchán, en comparación con el de Telecom, diversos factores asociados a la geología pudieran justificar la diferencia entre ambos páramos, el primero de ellos: la litología, al producirse los procesos de erosión por efecto del agua, se crean los suelos que servirán de soporte a los herbazales densos, el páramo de Merchán tiene una densidad de drenajes mucho mayor que el de Telecom, esto hace que rápidamente la roca se erosione y genere distintos tipos de suelos. En el páramo de Telecom existe una importante acumulación de sedimentos no consolidados de edad cuaternaria, las cuales limitan la extensión del páramo hacia el sector oriental (Figura 1). Segundo: en el páramo de Merchán se observa un sistema local de plegamientos, un sinclinal y un anticlinal son indicativos de que la zona está sufriendo un proceso importante de compresión, la cual pudiera causar un aumento en la rugosidad del terreno. Ambos páramos están separados por un sistema de fallas de tipo inverso, donde el páramo de Telecom cabalga sobre la Serranía de Merchán, este proceso podría generar basculamientos de bloques que inciden en la pendiente del terreno y por lo tanto los métodos usados pudieran ser sensibles a estos fenómenos de incremento de la pendiente a lo largo del tiempo.
Conclusiones
Con base en los resultados obtenidos en las matrices de confusión y el índice Kappa, es posible confirmar que el método con mayor precisión en confiabilidad para la clasificación supervisada es RF con un valor del 92,53% del índice Kappa, durante la aplicación de este método se observó que identificaba con mayor facilidad el contacto entre rocas cretácicas y cuaternarias. Este algoritmo, permite representar de forma clara y precisa las características del terreno, pues por medio de un proceso de múltiples árboles de decisión, logra obtener resultados de alta precisión y calidad.
Por medio de esta investigación, se buscó evaluar la eficacia y precisión de los métodos de Machine Learning para los procesos de clasificación supervisada, con los resultados obtenidos se pudo observar que los cinco métodos son efectivos para la identificación de coberturas; para zonas de estudio como páramos se sugiere en principio utilizar los dos métodos que por naturaleza de su algoritmos obtuvieron los mejores índices de confiabilidad y precisión, siendo estos RF seguido de ANN.
El índice Kappa es una medida estadística que permite ver la exactitud y precisión de los algoritmos o métodos de clasificación, con lo cual se puede elegir el método que mejor representa la realidad de terreno, por esta razón se sugiere la inclusión del índice en futuras investigaciones.
Por medio de la clasificación supervisada para los páramos Merchán y Telecom en Saboyá en el Complejo de Páramos Iguaque - Merchán, Boyacá, realizada con Landsat 8 (2018), se observa, en los cinco métodos, que la cobertura de mayor presencia es Mosaico de Pastos y Cultivos; esto demuestra que en la zona de páramo han existido cambios en el tipo y uso de suelo, con presencia de actividades de tipo agrícola o pecuario que afectan el cambio de cobertura reciente del páramo y la conectividad ecológica, biodiversidad y prestación de servicios ecosistémicos.
Los diferentes algoritmos de teledetección son una herramienta útil para establecer los tipos de coberturas vegetales en un terreno y los cambios que se han presentado en estas a lo largo del tiempo. Implementar estos métodos en análisis multitemporales en zonas de importancia ecológica como los páramos, permite identificar los impactos y problemáticas ambientales que se han generado allí, ayudando así a establecer estrategias y medidas de gestión ambiental para los recursos naturales.
Esta investigación es un insumo importante para la continuidad de estudios de métricas del paisaje y análisis multitemporales para los páramos de Merchán y Telecom en el municipio de Saboyá-Boyacá. El grado de exactitud de los métodos evaluados en este estudio, permite que los posibles análisis postclasiicación tengan una mayor confiabilidad y certeza, de esta manera servirán como base para la gestión ambiental del territorio y ordenamiento territorial.