Introducción
La infraestructura vial constituye un factor de gran influencia en el progreso de una región [1], el mal estado de las vías disminuye la calidad del servicio, aumenta los costos de transporte y afecta la seguridad vial. El punto de inicio para determinar la necesidad de intervención en los pavimentos es la evaluación de su condición [2], [3]. Esta evaluación se puede realizar de forma manual, para lo cual se requiere personal técnico calificado, el proceso es lento y propenso a subjetividad. También es posible utilizar equipos automáticos para recopilar datos del estado del pavimento y luego aplicar técnicas de procesamiento de datos para detectar las fallas y clasificarlas; estos sistemas, además de ser confiables, no destructivos y seguros para la manipulación humana, hacen posible la inspección de tramos viales amplios y reducen el tiempo requerido para la evaluación.
A pesar de que se encuentran muchas investigaciones en reconocimiento y clasificación automática de fallas en pavimentos, con resultados significativos, aun existe la posibilidad de encontrar opciones que puedan mejorar el rendimiento de estos sistemas. Este artículo pretende determinar la tendencia en este tipo de sistemas. En esta revisión se han considerado dos etapas fundamentales: la adquisición de datos y el procesamiento de los mismos. La adquisición de datos hace referencia a los instrumentos que se utilizan para la recopilación de la información tomada sobre la superficie del pavimento, y el procesamiento de datos comprende las técnicas utilizadas para operar los datos adquiridos y determinar la condición de la superficie.
El artículo está organizado de la siguiente manera. En la sección 1 se presentan los sistemas utilizados para adquirir los datos de la superficie del pavimento, examinados en cuatro grupos: sistemas láser, cámaras digitales, sistemas comerciales y otros métodos. En la sección 2 se exponen las técnicas de procesamiento de datos utilizadas para la detección de fallas, revisadas en dos grupos: detección de fallas basada en técnicas de visión por computador y detección de fallas basada en técnicas de aprendizaje automático. En la sección 3, se proporcionan discusiones detalladas y finalmente las conclusiones.
Sistemas de adquisición de datos
Para la evaluación vial se utilizan diversos equipos en la recopilación de los datos. La Tabla 1 registra los dispositivos utilizados en las investigaciones consultadas. Separamos estos dispositivos en cuatro grupos, como se muestra en la Figura 1: sistemas láser, cámaras digitales, sistemas comerciales y otros métodos.
Sistema de adquisición | Autor(es) | |
---|---|---|
Sistemas láser | Triangulación | [5] [6] [7] [8] |
Tiempo de vuelo | [9] | |
Luz estructurada | [10] [11] [12] [13] | |
Cámaras digitales | Cámaras de escaneo Lineal | [15] [16] [17] [18] [19] |
Cámaras de escaneo por área | [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] | |
Multiespectrales | [37] [38] [39] [40] | |
Video | [41] [42] [43] [44] | |
Otros | Sensor RGB-D (Red Green Blue - Deep) | [48] |
Sensor ultrasónico | [45] | |
Sensor de profundidad | [46] | |
Acelerómetro | [47] |
Fuente: elaboración propia.
Sistemas láser
Los sistemas láser son adecuados para la detección de fallas debido a su capacidad de obtener información de profundidad y, por ser poco vulnerables a las condiciones de iluminación, proporcionan una alta precisión, pero representan un recurso costoso.
Las técnicas de captación de perfiles 3D basados en los sistemas laser más habituales en evaluación de pavimentos son: tiempo de vuelo, triangulación, diferencia de fase y luz estructurada [4].
Triangulación
Investigaciones como [5] - [8] adquieren datos de la superficie de la vía mediante un escáner que usa el principio de triangulación. En este escáner el brillo del láser se examina mediante una cámara fotográfica para determinar su posición. El punto del objeto en que brilla el láser incidirá en diversos sitios del campo visual de la cámara dependiendo de la distancia [4].
Tiempo de vuelo
En [10] manejan dos escáneres láser Riegl VQ-450 basados en la tecnología de tiempo de vuelo y cuatro cámaras digitales de alta resolución para detectar tapas de alcantarilla. El escáner láser de tiempo de vuelo cronometra el tiempo que tarda un pulso de luz en recorrer la distancia al objeto y volver [4].
Luz estructurada
La técnica de luz estructurada utiliza la proyección de un patrón de luz en el objeto y analiza la deformación del patrón para determinar la posición de cada punto. La captura se realiza con una o varias cámaras fotográficas. Existen diversos métodos de luz estructurada, dentro de los cuales existen tres principales: proyección de un punto láser, proyección de una línea láser y proyección de un patrón de franjas [4]. Los valores de elevación se deducen teniendo en cuenta la deformación de la línea láser que se proyecta sobre la superficie del pavimento [10] - [13].
Cámaras digitales
Utilizar cámaras digitales en detección de fallas es muy habitual. Tienen varias ventajas, como precios razonables (dependiendo de la resolución), facilidad de uso y accesibilidad.
Cámaras de escaneo lineal
En las cámaras de escaneo lineal el sensor está compuesto por una sola fila de píxeles. Las imágenes se construyen a partir de la secuencia de filas capturadas a medida que el objeto fotografiado va pasando por el campo de visión de la cámara. Estos sistemas requieren un alto grado de precisión, por lo cual la alineación y el sincronismo son críticos. Este tipo de cámara permite obtener imágenes a alta velocidad, pero el aumento de velocidad requiere una iluminación que proporcione una imagen clara con poco tiempo de exposición [14]. [15] - [19] usan cámaras de escaneo lineal para adquirir los datos del pavimento. Para mejorar las condiciones de iluminación, [16] y [19] utilizan módulos de iluminación láser; en [15], se eliminan las sombras reconstruyendo la imagen a partir de imágenes complementarias capturadas con dos cámaras.
Cámaras de escaneo por área
En estas cámaras, el sensor está formado por una matriz de píxeles, de manera que una imagen bidimensional correspondiente a un área puede ser generada en un solo ciclo de exposición. La velocidad de lectura de las cámaras de escaneo por área es menor que la de las cámaras lineales [14], lo que reduce la tasa de captación de datos. También requieren una extensión en el montaje para que su campo de visión no sea obstruido y proporcionar una iluminación uniforme del área de escaneo. Numerosas investigaciones han utilizado imágenes de pavimentos capturadas con este tipo de cámara. Para este trabajo se agruparon como: bases de datos, modelos 3D y VANT (vehículo aéreo no tripulado), que se describen a continuación.
Bases de datos: algunos investigadores no entregan detalles sobre los dispositivos de adquisición, utilizan imágenes 2D almacenadas en bases de datos y se enfocan en elaborados algoritmos de procesamiento [20] - [30].
Modelos 3D: en la etapa de adquisición también se incorporan los sistemas que obtienen modelos en 3D partiendo de imágenes en dos dimensiones. [31] utiliza una técnica fotogramétrica llamada SFM (structure from motion). [32] utiliza cámaras de visión estéreo para obtener un mapeo espacial. Los sistemas de visión estéreo presentan limitaciones asociadas con el emparejamiento de píxeles y las áreas de objetos parcialmente obstruidos, lo cual genera un efecto negativo en la precisión del mapeo.
Vehículos aéreos no tripulados: el uso de imágenes capturadas desde VANT también ha despertado interés en varios investigadores [33] - [36]. Las ventajas de los sistemas VANT son su bajo costo, velocidad, maniobrabilidad y seguridad en la recolección de imágenes; sin embargo, se debe tener precaución debido a que a cierta altura de vuelo la resolución espacial de las imágenes puede limitar la capacidad de detectar fallas individuales. No obstante, las imágenes aéreas se pueden usar para evaluar el estado general de las superficies de pavimento de una manera rápida, rentable y segura.
Imágenes multiespectrales
A diferencia de las imágenes digitales habituales que generalmente tienen uno o tres canales que proporcionan características espectrales limitadas, las imágenes multiespectrales tienen una amplia cobertura de longitud de onda que proporciona características espectrales detalladas. Con la incorporación de sensores capaces de capturar este tipo de imágenes, se ha propiciado el desarrollo en investigaciones que utilizan la relación entre los datos espectrales y el estado de la superficie del pavimento. [37] utiliza imágenes multiespectrales para detectar fisuras y baches; las imágenes son capturadas con una matriz de múltiples cámaras micro-MCA (por su sigla en inglés, Multispectral Camera Array). Diseñada por Tetracam, esta matriz de cámaras captura 12 bandas que abarcan longitudes de onda entre 450 nm-1000 nm. [38] utiliza un conjunto de imágenes multiespectrales obtenidas del centro de análisis de datos de la tierra (EDAC, por su sigla en inglés Earth Data Analysis Center); estas fotografías aéreas fueron recopiladas con el sistema Zeiss/Intergraph DMC (del inglés, Digital Mapping Camera) y están compuestas por 3 bandas espectrales que abarcan longitudes de onda entre 0.4 um-0.7 um. [39] utiliza imágenes multiespectrales obtenidas con el sensor Mivis (del inglés, Multispectral Infrared and Visible Imaging Spectrometer) utilizando 10 bandas que abarcan longitudes de onda entre 8.2 um-12.7 um. [40] utiliza imágenes hiperespectrales adquiridas con el sensor Compact Airborne Spectrographic Imager, CASI-1500 estas imágenes contienen hasta 24 bandas espectrales que abarcan longitudes de onda entre 380.1 nm-1033.1 nm.
Las imágenes multiespectrales proporcionan información sobre las propiedades de la superficie que permiten estimar la condición de la vía; sin embargo, se requiere más investigación para el desarrollo de herramientas que ayuden a sobreponerse a dificultades relacionadas con las variaciones en la reflectividad, causadas por las sombras de la rugosidad de la superficie y la alta circulación en las vías.
Cámara de video
Otros investigadores utilizan datos tomados desde video para detectar fallas [41] - [44]. Una desventaja en el uso de video es que la resolución de las imágenes está asociada a la velocidad del vehículo desde el cual se está tomando la señal. La adquisición debe realizarse usando una buena sincronización para garantizar la confiabilidad del sistema. La principal ventaja es la sencillez en la adquisición.
Otros métodos
Otros autores proponen sistemas variados para indicar fallas en la vía. [45] discute un método para identificar baches y ondulaciones que usa sensores ultrasónicos. [46] propone un sistema que detecta pequeñas irregularidades en la vía usando sensores de profundidad. En [47], el sistema se basa en la recolección de datos de un acelerómetro y de un GPS. [48] utiliza un sistema que usa un sensor RGB-D, Microsoft Kinect. La principal limitación de estos sistemas es el rango del ancho del sensor y la profundidad de las fallas que puede detectar.
Sistemas comerciales
Compañías internacionales han equipado vehículos para capturar datos de la superficie del pavimento con el fin de ofrecer servicios que van desde la recopilación de datos de campo hasta la interpretación y análisis de los mismos. ARAN (Automatic Road Analyzer), de Fugro [49], es un vehículo equipado con un sistema de recolección de datos y software de procesamiento; su diseño es modular y se puede configurar a la necesidad del cliente. DHDV (Digital Highway Data Vehicle), de WayLink [50], es un vehículo que integra varios subsistemas de captura de datos, posicionamiento y análisis de fallas en las vías. Leica Geosystems ofrece una plataforma de captura llamada Pegasus [51]; este sistema captura datos de nubes de puntos e imágenes y algunos datos de sensores adicionales. Su aplicación principal es de mapeo en infraestructura, aunque el fabricante deja abierta la posibilidad de su uso en detección de fallas. REAL (del inglés, Road Excellent Automatic Logging), de Pasco [52], es un vehículo que cuenta con un sistema de registro automático de vías. El MFV (Multi-Functional Vehicle), de Dynatest [53], también cuenta con varios módulos de adquisición de datos acoplados. Fiona [54] es un vehículo para toma de datos en carreteras desarrollado por RaurosGroup, que permite grabación de imágenes y toma de datos geométricos. La principal ventaja del uso de estos equipos es la recolección rápida y confiable de la información. Pero la fabricación y el soporte son costosos. Además, los datos obtenidos son de gran tamaño y la decisión automática del tipo de falla es una tarea cuantiosa que requiere de herramientas potentes y software especializado.
Procesamientos de datos
Las investigaciones iniciales en detección de fallas visibles mediante análisis automático se enfocaron en técnicas de visión por computador fundamentadas en distintas disciplinas como la geometría, la estadística, la física, entre otras. Los enfoques modernos combinan técnicas de procesamiento de imágenes y aprendizaje automático dando resultados satisfactorios bajo condiciones delimitadas. La Tabla 2 registra el tipo de procesamiento realizado en los trabajos consultados. Separamos estas técnicas en dos grupos, como se muestra en la Figura 2: detección de fallas basada en técnicas de visión por computador y detección de fallas basada en técnicas de aprendizaje automático.
Técnicas de procesamiento | Autor(es) | |
---|---|---|
Detección de fallas basada en técnicas de visión por computador | Técnicas de descomposición | [10] [14] [56] [57] [58] [59] |
Enfoque basado en semillas | [17] [18] [19] | |
Métodos de umbral | [11] [39] [42] [60] | |
Otros métodos | [6] [7] [33] [34] [38] [40] [44] | |
Detección de fallas basada en técnicas de aprendizaje automático | Máquinas de soporte vectorial | [21] [23] [25] [26] [35] [37] [43] [62] |
Árboles de decisión | [9] [22] [24] [25] [30] [37] | |
Redes neuronales | [8] [25] [26] [29] [36] [37] | |
Aprendizaje profundo | [20] [27] [28] [63] [64] |
Fuente: elaboración propia.
Detección de fallas basado en técnicas de visión por computador
La visión por computador es una rama de la inteligencia computacional que busca la deducción automática de la estructura del mundo real a partir de la comprensión de la información de una o varias imágenes [55]. Las investigaciones consultadas se han separado en cuatro grupos: análisis mediante descomposición, algoritmos de crecimientos de semillas, aplicación de umbral y otros métodos. Como otros métodos se incluyen los algoritmos de detección de bordes, el análisis usando la emisividad del pavimento, el análisis de contornos, entre otros.
Técnicas de descomposición
El análisis mediante la transformación de la señal en componentes más representativos siempre ha estado presente en la ingeniería. La idea ha evolucionado con el tiempo y las investigaciones más recientes nos llevan a una variedad de transformaciones como la transformada Wavelet o la transformada Hough, entre otras, que constituyen una herramienta matemática que simplifica los cálculos y puede usarse para abordar el problema de detección de fallas en pavimentos, como se observa en [10], [12], [56] - [59].
Enfoque basado en semillas
Algunos investigadores han abordado el enfoque basado en semillas [17] - [19]. Estos métodos comparten dos pasos comunes: se extraen los puntos que probablemente pertenezcan a una falla (puntos semilla) y se unen los caminos entre semillas mediante técnicas de crecimiento. La simplicidad del enfoque basado en semillas es su principal ventaja; pero los resultados de la detección dependen de la elección de las semillas, siendo esto una desventaja, ya que el ruido en la imagen puede hacer que las semillas queden mal inicializadas.
Métodos de umbral
Los métodos de umbral consisten en fijar unos límites para separar los rasgos de interés; estos métodos generalmente son sensibles al ruido, aunque se han propuesto alternativas que intentan mejorar su desempeño, en [11], [39], [42] y [60]. El problema en estos métodos es encontrar el valor del umbral que separe los rasgos de interés. En términos generales su simplicidad es una ventaja, pero pueden ser sensibles al ruido y son altamente dependientes de la iluminación. Estos métodos son adecuados cuando hay una clara diferencia entre los rasgos que se desean separar.
Otros métodos
Varias alternativas de procesamiento se han planteado en esta sección. El uso de la respuesta espectral [38] [40] como herramienta de análisis tiene la desventaja de que aun no se han obtenido resultados satisfactorios en la detección de fallas específicas; sin embargo, es útil para obtener índices globales de la condición de la vía. Otras alternativas, como el uso de operadores para detección de bordes [33] - [34] y [44], presentan desventajas al ser sensibles al ruido y a determinadas orientaciones dependiendo del operador, pero su ventaja es la simplicidad. Los contornos activos [7] pueden realizar una buena separación de las fallas, tienen la ventaja de ser robustos frente al ruido y a la existencia de bordes falsos, pero su desventaja es la necesidad de inicializar con una cercanía al objeto y englobándolo, además de presentar conflictos con las concavidades. El uso de un sistema Fuzzy [6] tiene la ventaja de permitir relacionar entradas y salidas sin conocer el modelo matemático que rige su funcionamiento; por lo mismo, el análisis de cualquier propiedad del sistema es complejo.
Aprendizaje automático
El aprendizaje automático (machine learning) es otra rama de la inteligencia computacional. Consiste en crear programas capaces de generalizar la relación entre entradas y salidas para automáticamente mejorar sus algoritmos [61]. En los últimos años, con el desarrollo del aprendizaje automático, se introdujeron en el campo de detección automática de fallas en el pavimento algoritmos como máquinas de soporte vectorial (SVM, del inglés, Support Vector Machines), árboles de decisión, redes neuronales y aprendizaje profundo, constituyendo una alternativa confiable.
Máquinas de soporte vectorial
Las SVM son un método de clasificación donde la idea principal es construir hiperplanos como superficies de decisión, de tal manera que el margen de separación entre los ejemplos positivos y negativos se maximice [65]. Algunas publicaciones, como [19], [21], [23], [25], [43], [35] y [62], muestran que las SVM arrojan resultados satisfactorios en la detección de fallas en pavimentos.
Dentro de las fortalezas de las SVM tenemos que su modelamiento no necesita la totalidad de puntos disponibles del conjunto de entrenamiento para hallar la separación entre clases, lo cual representa una ventaja frente a otros métodos que utilizan un porcentaje alto de las muestras del conjunto de entrenamiento. Mientras la mayoría de los métodos de aprendizaje se centran en minimizar los errores generados a partir de los ejemplos de entrenamiento, las SVM se centran en la minimización del denominado riesgo estructural, el cual ha mostrado un mejor desempeño, ya que minimiza un límite superior en lugar de minimizar el error sobre los datos de entrenamiento. Así mismo, la capacidad de generalización y el proceso de entrenamiento de la máquina no dependen necesariamente del número de atributos, lo que permite un buen comportamiento en problemas de alta dimensionalidad. Otros aspectos favorables son: tienden a ser menos propensas a problemas de sobrentrenamiento, la complejidad está caracterizada por el número de vectores de soporte en lugar de la dimensionalidad del espacio transformado, el error es independiente de la dimensionalidad, la solución es global y no hay óptimo local como en las redes neuronales. En sentido opuesto, como debilidades se puede mencionar que se necesita una buena función kernel, es decir, se necesitan metodologías eficientes para estimar los parámetros de la SVM. De igual forma, aunque las SVM usan funciones de decisión directa, el problema de las multiclase no es sencillo porque se tienen muchas formulaciones.
Árboles de decisión
Los árboles de decisión son una técnica de clasificación que utiliza aprendizaje inductivo. Se trata de un método para aproximar funciones de valores discretos, capaz de expresar hipótesis disyuntivas a partir de un conjunto de datos de entrenamiento [66]. Los resultados publicados en [9], [19], [24], [30] y [37] muestran que los árboles de decisión pueden ser útiles en la detección de fallas.
Los árboles de decisión tienen la ventaja de realizar de forma implícita un proceso de selección de las variables más significativas. Una vez construido el árbol, aquellos atributos que no intervienen en ninguna condición pueden descartarse, reduciéndose el tamaño del espacio de características. Otra ventaja es que pueden tratar con atributos continuos o discretos, permiten tratar relaciones no lineales entre características y clases, las muestras de aprendizaje de una misma clase no tienen que ser homogéneas entre sí, son tolerantes al ruido y a atributos no significativos. Entre las desventajas se puede mencionar que no son tan precisos como otros métodos, no detectan correlaciones, tratan de dividir el dominio de los atributos en regiones rectangulares, pueden tener problemas de sobreaprendizaje, además son dependientes de las muestras que se les suministran para el aprendizaje.
Redes neuronales
Una red neuronal (RN) es un sistema de procesamiento de información basado en un conjunto estructurado de elementos de procesamiento interconectados. La habilidad de procesamiento de la red está relacionada con los pesos de las conexiones entre los elementos; estos se obtienen a través de un proceso de adaptación a un conjunto de muestras de entrenamiento [67]. Investigaciones como [8], [26], [29] y [36] revelan la potencialidad de las redes neuronales en la solución del problema de detección de fallas en pavimentos.
A favor de las redes neuronales cabe mencionar que son robustas, ya que pueden responder de manera aceptable, aun si fallan algunos elementos de procesamiento. También son flexibles, puesto que pueden manejar variaciones no importantes en la información de entrada como señales con ruido, distorsionadas o incompletas. Otro punto a favor es que para utilizar RN no es necesario conocer los detalles matemáticos, solo se requiere estar familiarizado con los datos de trabajo. Dentro de los aspectos desfavorables generales tenemos que el tiempo de entrenamiento puede ser elevado, el aprendizaje para grandes tareas puede resultar complejo, demandan la definición de varios parámetros antes de aplicar la metodología, pueden tener problemas de sobreaprendizaje y para adicionar nuevo conocimiento es necesario cambiar las interacciones entre muchas unidades de procesamiento.
Aprendizaje profundo
Mientras que los métodos de inteligencia computacional tradicionales requieren que las características de la imagen estén especificadas manualmente, el aprendizaje profundo proporciona una solución nueva y prometedora que tiene la ventaja de realizar la extracción de características y los procesos de clasificación de manera integrada y totalmente automatizada. Esto ha despertado el interés de los investigadores en emplear estas arquitecturas en la detección de fallas en el pavimento. Publicaciones como [20], [27] - [28] y [63] - [64] muestran resultados con buenos índices de desempeño.
El principal problema del uso de una arquitectura profunda es conseguir una buena representación de la entrada; además, si una solución se representa con una arquitectura muy grande podrían necesitarse muchos ejemplos para el entrenamiento, pero una profundidad insuficiente puede ser perjudicial para el aprendizaje. Se consideran ventajas su posibilidad de ser aplicado a funciones con representaciones abstractas de información y su prometedora capacidad de aprendizaje automático.
Discusión
En la etapa de adquisición de datos se han probado varios dispositivos, que han demostrado su utilidad en la evaluación de pavimentos. Todos ofrecen confiabilidad y eficiencia bajo ciertas condiciones. Los sistemas comerciales, [50] - [54], usan una combinación de cámaras digitales apoyada por varios sensores, lo que los hace más robustos y al mismo tiempo costosos. Las imágenes digitales 2D se utilizan con frecuencia, como se observa en [15] - [30] y [34] - [36]; sin embargo, los métodos 2D no pueden detectar algunos tipos de falla debido a la falta de información de profundidad y pueden tener dificultad para discriminar áreas oscuras, como sombras e iluminación deficiente. Para hacer frente a estas desventajas, se propusieron sistemas que obtienen modelos 3D partiendo de imágenes 2D, [31] - [33], y también se incorporan los sistemas de escaneo láser que pueden recopilar perfiles 3D para construir superficies de pavimento [5] - [6], [9] - [13]. Como una alternativa a los métodos de evaluación con sensores montados en vehículos terrestres, algunos investigadores han propuesto la captura de datos utilizando VANT [31], [33] - [36]. Los VANT presentan ventajas como su bajo costo, velocidad, seguridad, además no interfieren con el tránsito y tienen la posibilidad de vuelo en modo autónomo o dirigido; presentan inconvenientes debido a las obstrucciones por objetos presentes sobre la superficie en el momento de la recolección de datos; también tienen una limitación en la resolución, debido a la distancia de muestreo en tierra, lo que en términos generales limita la capacidad de detección. Los sensores multiespectrales también ofrecen una alternativa en la etapa de adquisición de datos. Es posible determinar la tasa global de fallas en las vías a través de la respuesta espectral [37] - [40], pero se requiere más investigación para el desarrollo de herramientas que permitan la detección y cuantificación de las fallas individuales; de las investigaciones consultadas, solo [37] evalúa fallas individuales a partir de imágenes multiespectrales; estos desarrollos podrían usarse como complemento a la inspección de campo o para la evaluación general de la gestión de las agencias que administran las vías.
En la etapa de procesamiento de datos, se han probado varias técnicas. Cada técnica ofrece ventajas y también presenta desventajas. El enfoque basado en semillas es simple, pero los resultados dependen de una buena elección de las semillas y esta elección puede ser afectada por el ruido; los métodos del umbral también son simples, pero sensibles al ruido y altamente dependientes de picos; los operadores para detección de bordes son simples, pero sensibles al ruido y a determinadas orientaciones dependiendo del operador; los contornos activos son robustos frente al ruido y a la existencia de bordes falsos, pero requieren ser inicializados con una cercanía al objeto y englobándolo, además de presentar conflictos con las concavidades; los sistemas Fuzzy permiten relacionar entradas y salidas sin conocer el modelo matemático que rige su funcionamiento, pero el análisis de cualquier propiedad del sistema es complejo; las SVM manejan bien el problema de la alta dimensionalidad, pero necesitan una buena función kernel; los árboles son tolerantes al ruido y a atributos no significativos, pero no detectan correlaciones; las RN son robustas y flexibles, pero el tiempo de entrenamiento puede ser elevado, y el aprendizaje profundo tiene la posibilidad de ser empleado en aplicaciones donde se requieren representaciones abstractas de información, pero es laborioso obtener una buena representación de la entrada.
En la Tabla 3, la primera columna corresponde a un intervalo de tiempo en años, la segunda y la tercera columna relacionan el porcentaje de uso de técnicas de visión por computador con el aprendizaje automático en estos intervalos. Se observa que en los primeros años el problema de detección de fallas se abordó utilizando técnicas de visión por computador, pero en los últimos años las técnicas de aprendizaje automático se convirtieron en las más utilizadas. Esto se debe a tres factores que impulsaron el aprendizaje automático: los avances en hardware con el desarrollo de GPU rápidas y masivamente paralelas, la disponibilidad de grandes conjuntos de datos que no podrían haberse recolectado sin internet y de los que no se disponía con anterioridad, y el planteamiento de algoritmos avanzados. Cuando estas mejoras comenzaron a permitir modelos de entrenamiento más profundos, el interés de los investigadores se volcó hacia el aprendizaje automático. Cabe resaltar que las técnicas de visión por computador aun son utilizadas en este tipo de sistemas, pero no como eje central, sino integradas como etapas de preprocesamiento.
Intervalo de Tiempo | Técnicas de procesamiento | |
Visión por computador | Aprendizaje automático | |
1999 - 2008 | 17% | 0% |
2009 - 2014 | 22% | 7% |
2015 - 2019 | 12% | 41% |
Fuente: elaboración propia.
La Tabla 4 registra la información de rendimiento de los sistemas revisados. La primera columna indica la técnica de procesamiento usada en la investigación, la segunda corresponde a la referencia citada, la tercera nos indica el número de imágenes usadas para el análisis y la cuarta corresponde al criterio de evaluación. Una comparación general en términos de desempeño sería improcedente, dado que no todos los autores utilizan los mismos criterios de evaluación; además, la cantidad de imágenes de prueba es diferente y existen variaciones en el tipo de falla o fallas detectadas. De la información de la Tabla 4, podemos notar que en los desarrollos fundamentados en técnicas de visión por computador los criterios de evaluación utilizados por los autores son muy variados. Utilizan medidas como: la raíz del error cuadrático medio RMSE (por su sigla en inglés, Root Mean Square Error), la correlación, la puntuación Hausdorff, diferencias estadísticas, porcentajes de error, porcentajes de acierto, la tasa de precisión de la clasificación CAR (por su sigla en inglés, Classification Accuracy Rate) y la medida de evaluación de desempeño F1. En los desarrollos fundamentados en aprendizaje automático, además de usar un número mayor de imágenes en las pruebas, el criterio de evaluación es más uniforme, pues se utilizan dos medidas: la tasa de precisión de la clasificación CAR y el puntaje F1. La tasa de precisión de la clasificación CAR cuantifica la relación entre el número de datos correctamente clasificados y el número total de datos, la puntuación F1 cuantifica la relación entre la precisión y la detección.
Técnica de procesamiento | Autor(es) | Número de imágenes usadas en el análisis | Criterio de evaluación |
---|---|---|---|
Técnicas de descomposición | [59] | -- | -- |
[58] | -- | -- | |
[57] | 9 | CAR = 33% | |
[58] | -- | -- | |
[10] | 48 |
Detección acertada fisuras transversales =96.58% Detección acertada fisuras longitudinales=93.74% |
|
[12] | -- | Puntuación Hausdorff = 94.25 | |
Enfoque basado en semillas | [18] | 100 |
Correlación = 0.91 en FL Correlación =0.96 en FT |
[17] | 5 | F1-score= 0.88 | |
[19] | 7250 | RMSE = 0.019 | |
Métodos de umbral | [60] | 10 | CAR = 89.7% |
[39] | -- | Detección acertada = 90%. | |
[42] | 70 | CAR = 86% | |
[11] | 220 | CAR = 94.55% y 89.03% | |
155 | Tasa de error de reconocimiento 5.45% y 10,97%. | ||
Otros métodos | [6] | -- | -- |
[40] | 4 | Porcentaje promedio en el error de 55.5% | |
[33] | -- | -- | |
[38] | -- | Correlación = 0.95 | |
[34] | -- | Diferencia estadística de 0.05 | |
[7] | -- | -- | |
[44] | 500 | CAR = 80% | |
Máquinas de soporte vectorial | [62] | 80 | Reconoce correctamente todas las imágenes de prueba |
[35] | 4253 | CAR = 95.51 %. | |
[21] | 120 | CAR = 95.7% | |
[43] | 200 | CAR = 87.3% | |
[23] | 500 | CAR = 93.04% | |
[25] | 1500 |
CAR = 91.91% para svm car = 92.62% para una svm de mínimos cuadrados |
|
[37] | 1760 | CAR = 98.78% | |
[26] | 200 | CAR = 88.75% | |
Árboles de decisión | [30] | 1830 |
CAR = 97.9% para baches CAR = 96.4% para fisuras |
[9] | -- |
CAR = 95.5% F1-score = 0.957 |
|
[22] | 118 | -- | |
[24] | 2000 | CAR = 90% | |
[25] | 1500 | car =76.84% | |
[37] | 1760 | CAR = 98.83% | |
Redes neuronales | [29] | 324 | CAR = 99.07% |
[8] | -- | -- | |
[36] | 80 | CAR = 82.5% | |
[25] | 1500 |
CAR = 84.79% para una red neuronal de propagación hacia atrás CAR = 74.81% para una red neuronal de base radial |
|
[26] | 200 | CAR = 85.25% | |
[37] | 1760 | CAR = 96.46% | |
Aprendizaje profundo | [63] | 500 |
CAR = 86 % F1-score = 0.8965 |
[64] | 500 |
CAR = 86 % F1-score = 0.8965 |
|
[20] | 400 | CAR = 92.08% | |
[27] | 9053 | CAR = 75% | |
[28] | 1006 | F1-score = 0.87 |
Fuente: elaboración propia.
En la Tabla 5, los artículos revisados se clasifican en 5 grupos según la tasa de precisión CAR y en 3 grupos de acuerdo al puntaje F1. La mayoría de las investigaciones alcanzan tasas de precisión por encima del 80% y un puntaje F1 mayor a 0.8. Aunque la tasa de precisión CAR es una medida muy usada como criterio de evaluación, según lo manifestado en [64] no es una buena medida de rendimiento cuando se trata de datos no equilibrados como los que nos ocupan en esta revisión, ya que la medida favorece a la clase dominante, en este caso los registros que no presentan fallas y que no son el foco principal en la evaluación de pavimentos. La puntuación F1 se considera una medida de rendimiento más apropiada, ya que combina la tasa de detección y la tasa de falsas alarmas, dos características valiosas para evaluar la aplicabilidad de un detector del mundo real.
Criterio de evaluación | Autor(es) | |
---|---|---|
CAR | Menor a 80% | [27] [57] |
80% - 85% | [36] [44] | |
85% - 90% | [26] [43] [42] [60] [63] | |
90% - 95% | [11] [21] [20] [23] [24] [25] [35] | |
Mayor a 95% | [9] [29] [30] [37] | |
F1 | Menos de 0.8 | -- |
0.8 - 0.9 | [17] [63] [28] | |
Mayor de 0.9 | [9] |
Fuente: elaboración propia.
Entre las entidades que realizan evaluación de pavimentos no existe un sistema universal de identificación de fallas superficiales. La clasificación de los tipos de fallas se realiza por contrastación con manuales desarrollados por diferentes instituciones. La metodología Vizir (del francés, Visión Inspection de Zones et Itinéraires Á Risque) y la norma de la American Society of Testing Materials, ASTM6433, son dos de los más referenciados. La metodología Vizir especifica 24 tipos de deterioro, teniendo en cuenta dos tipos de degradación, y la norma ASTM6433 especifica 19 tipos. La Tabla 6 registra el tipo de falla detectada y el porcentaje de detección. Se puede observar que la mayor parte de las investigaciones se han enfocado en detección de fisuras, mientras que otras fallas apenas se mencionan; esto hace que la base de conocimiento en técnicas de detección de fisuras sea más completa y madura. De igual forma, se evidencia la necesidad de desarrollar investigaciones para detectar otros tipos de deterioro. Las metodologías Vizir y ASTM, además de clasificar y describir los tipos de daños, también especifican tres niveles de severidad y ofrecen la recomendación para el cálculo de un índice de condición del pavimento. La Tabla 7 relaciona otras características de las investigaciones presentadas en esta revisión: la primera fila indica cuáles de las investigaciones calculan indicadores de la condición de la vía, la segunda cuáles evalúan niveles de severidad por falla y la tercera fila indica si el desarrollo se ajusta a alguna norma o manual de clasificación de fallas. Como se puede observar, solo el 4% de las investigaciones calcula indicadores de la condición de la vía, el 4% calcula niveles de severidad en las fallas y el 4% se ajusta a una norma o manual, lo que hace evidente la necesidad de ampliar la investigación en este sentido.
Falla | Porcentaje de investigaciones consultadas | Autor(es) |
---|---|---|
Fisuras | 77% | [5] [6] [7] [8] [10] [11] [12] [15] [16] [17] [18] [19] [20] [22] [23] [24] [25] [27] [28] [29] [30] [34] [35] [36] [37] [40] [41] [44] [48] [58] [57] [58] [59] [60] [63] |
Baches | 22% | [12] [21] [26] [30] [37] [40] [42] [45] [48] [62] |
Parches | 6% | [40] [43] [48] |
Ondulaciones | 4% | [45] [46] |
Surcos | 4% | [12] [34] |
Estimación de la condición global | 4% | [38] [39] |
Marcas viales | 4% | [12] [27] |
Tapas de alcantarilla | 2% | [9] |
Fuente: elaboración propia.
Característica | Porcentaje de investigaciones consultadas | Autor(es) | |
---|---|---|---|
Indicadores de la condición de la vía | Sí | 4% | [39] [40] |
No | 96% | [6] [7] [8] [9] [10] [11] [12] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [34] [35] [36] [37] [41] [42] [43] [44] [56] [57] [58] [59] [60] [62] [63] [64] | |
Niveles de severidad | Sí | 4% | [6] [59] |
No | 96% | [7] [8] [9] [10] [11] [12] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [34] [35] [36] [37] [38] [39] [40] [42] [43] [44] [56] [57] [58] [60] [62] [63] [64] | |
Ajustado a norma o manual | Sí | 4% | [27] [64] |
No | 96% | [6] [7] [8] [9] [10] [11] [12] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [28] [29] [30] [34] [35] [36] [37] [38] [39] [40] [42] [43] [44] [56] [57] [58] [59] [60] [62] [63] |
Fuente: elaboración propia.
Generalmente se estudian las fisuras porque surgen en una etapa temprana y son el origen de los distintos tipos de deterioro de un pavimento. A partir de ello se gradúa el nivel de severidad, diferenciada en tres niveles para cada daño: bajo, medio y alto. Estos permiten caracterizar el grado de avance en el deterioro del pavimento. Suelen estar asociados también a distintos requerimientos de conservación, variables según los casos, que van desde no hacer nada hasta la completa reposición del pavimento. Con ello se confeccionan las normas, manuales, catálogos, etc.
Conclusiones
Este documento proporciona un análisis del progreso y la investigación en sistemas automáticos utilizados para la detección de fallas superficiales en pavimentos. Sobre la base de una revisión de los métodos, tecnologías y desempeño, se hacen las siguientes observaciones. (i) Para la adquisición de datos se han probado varios dispositivos (sistemas láser, cámaras de escaneo de línea, cámaras de escaneo de área, cámaras de video, sensores multiespectrales, etc.). Todos ofrecen confiabilidad bajo condiciones delimitadas, se evidencia una tendencia al uso de cámaras digitales, aunque es recomendable complementar estos datos para obtener información de profundidad y de esta manera ampliar la clasificación, incluyendo fallas que requieren esta información. (ii) Para procesar los datos y determinar la condición de la superficie, inicialmente se utilizaron técnicas de visión por computador (descomposición, semillas, umbral, detección de bordes, etc.). las investigaciones de los últimos años se han enfocado en los sistemas que utilizan aprendizaje automático (SVM, árboles de decisión, redes neuronales, etc.) y las más recientes implementan específicamente el aprendizaje profundo; no obstante, las técnicas de visión por computador no fueron descartadas completamente, se han integrado en las investigaciones recientes debido a su potencial de proporcionar información valiosa que puede complementar los métodos de aprendizaje automático. (iii) La mayoría de las investigaciones alcanzan tasas de precisión por encima del 80%, aunque es necesario aclarar que varias investigaciones utilizan medidas de desempeño diferentes. (iv) La detección de fallas se ha centrado en las fisuras y los baches, dejando clara la necesidad de investigación adicional en métodos que puedan detectar diferentes clases de fallas. A partir del análisis de las fisuras y la experiencia de los ingenieros viales, se detectan tempranamente las tipologías de fallas superficiales, sin necesidad de llegar a un estado de deterioro elevado y sin requerir reconstrucción total del pavimento necesitando equipos especiales.
Del análisis de los diferentes métodos, utilizados en la detección de fallas superficiales en pavimentos, se concluye que para la adquisición de los datos lo más conveniente es usar un sistema multisensorial que complemente las imágenes digitales con datos de profundidad. En cuanto al procesamiento de los datos, claramente el aprendizaje profundo es la técnica más prometedora, al ser un área en desarrollo que ofrece resultados satisfactorios.