Services on Demand
Journal
Article
Indicators
- Cited by SciELO
- Access statistics
Related links
- Cited by Google
- Similars in SciELO
- Similars in Google
Share
Revista EIA
Print version ISSN 1794-1237On-line version ISSN 2463-0950
Rev.EIA.Esc.Ing.Antioq no.17 Envigado Jan./June 2012
APLICACIÓN DE REDES NEURONALES EN LA CLASIFICACIÓN DE ARCILLAS
APPLICATION OF NEURAL NETWORKS IN CLASSIFICATION OF CLAYS
APLICAÇÃO DE REDES NEURONAIS NA CLASSIFICAÇÃO DE ARGILAS
Jairo Gómez1, Jaime Sánchez2, Aquiles Ocampo3, José William Restrepo4
1 Ingeniero Químico, Universidad Nacional de Colombia; Magíster en Ingeniería Industrial, Universidad de Antioquia; Especialista en Gerencia de Empresas de Ingeniería y Profesor Asistente e investigador del grupo GPC, Escuela de Ingeniería de Antioquia. Medellín, Colombia. pfjagom@eia.edu.co.
2 Ingeniero Industrial, Universidad de Antioquia. Profesor Asistente e investigador del grupo GPC, Escuela de Ingeniería de Antioquia. Medellín, Colombia. pfjasan@eia.edu.co.
3 Ingeniero Químico, Universidad de Antioquia; Magíster y Doctor en Ingeniería Química, University of Kentucky. Profesor Titular e investigador del grupo GPC, Escuela de Ingeniería de Antioquia. Medellín, Colombia. investigar@eia.edu.co.
4 Ingeniero Metalúrgico, Universidad de Antioquia; Doctor en Ciencia de los Materiales, Universidad de Barcelona. Profesor Asistente e investigador del grupo MAPA, Escuela de Ingeniería de Antioquia. Medellín, Colombia. pfjorest@eia.edu.co.
Artículo recibido 21-XII-2011. Aprobado 14-VI-2012
Discusión abierta hasta diciembre de 2012
RESUMEN
Las arcillas son la materia prima fundamental en la fabricación de productos para el sector constructor tales como baldosas, enchapes, pavimentos y ladrillos. Las pequeñas y medianas industrias ladrilleras por lo general utilizan arcillas de diverso origen mineralógico, clasificadas para formular sus mezclas con base en la experiencia del equipo de personas responsables de la producción; la incertidumbre asociada con este método causa que una parte de sus productos se rechacen después de fabricados, porque sus propiedades no cumplen las especificaciones técnicas. En este artículo se presenta una metodología basada en redes neuronales que permite clasificar, con base en sus propiedades, las arcillas que se van a usar para componer las pastas, con el propósito de disminuir la cantidad de producto rechazado. Se emplearon diversas topologías de red para la clasificación, lo cual permitió encontrar una capaz de predecir las muestras de entrenamiento y prueba con 97,79 % y 94,12 % de precisión, respectivamente.
PALABRAS CLAVE: red neuronal; productividad en cerámicos; problema de clasificación; arcillas.
ABSTRACT
Clays are the main raw material in the manufacture of products for the construction sector, such as tile, veneer, flooring and bricks. Small and medium enterprises generally use brick clays of different mineralogical origin, classified in order to formulate their mixtures according to the production team experience; the uncertainty associated with this method causes that a portion of their manufactured products are rejected, because their properties do not meet the technical specifications. This paper presents a methodology based on neural networks for classification of clays, based on the clay properties to be used to make the pasta, with the aim of reducing the number of rejected products. It used different network topologies for classification, and chose the one which have been found capable to predict the training and testing samples with an accuracy of 97.79 % and 94.12 %, respectively.
KEY WORDS: neural network; ceramics productivity; classification problem; clays.
RESUMO
As argilas são a matéria prima fundamental na fabricação de produtos para o setor construtor tais como baldosas, revestimentos, pavimentos e tijolos. As pequenas e médias indústrias de tijolos geralmente utilizam argilas de diversa origem mineralógica, classificadas para formular suas misturas com base na experiência da equipe de pessoas responsáveis pela produção; a incerteza associada com este método causa que uma parte de seus produtos se rejeite depois de fabricados, porque suas propriedades não cumprem as especificações técnicas. Em este artigo apresenta-se uma metodologia baseada em redes neuronais que permite classificar, com base em suas propriedades, as argilas que se vão usar para compor as massas, com o propósito de diminuir a quantidade de produto rejeitado. Empregaram-se diversas topologias de rede para a classificação, o qual permitiu encontrar uma capaz de predizer as mostras de treinamento e prova com 97,79 % e 94,12 % de precisão, respectivamente.
PALAVRAS-CÓDIGO: rede neuronal; produtividade em cerâmicos; problema de classificação; argilas.
1. INTRODUCCIÓN
Las arcillas son materiales naturales compuestos por agregados de silicatos de aluminio hidratados (Al2O3 · 2SiO2 · H2O), procedentes de la meteorización de rocas feldespáticas por procesos geológicos complejos resultantes de las interacciones entre la presión, la temperatura y la humedad. Comúnmente, las arcillas resultan ser una mezcla de diferentes variedades mineralógicas, entre las que se destacan los aluminosilicatos como caolinita, además de cuarzo, feldespato, esmectita, mica y algunos óxidos metálicos ante todo de hierro, magnesio y calcio.
Desde la antigüedad las arcillas han sido empleadas en la fabricación de productos cerámicos tales como ladrillos, tejas, pavimentos, baldosas, porcelanas y utensilios sanitarios, cuya homogeneidad depende de las características de las arcillas utilizadas. Aunque la composición química de las arcillas puede ser similar, su composición mineralógica es muy variada y, por lo tanto, lo son su plasticidad, su comportamiento reológico del cual dependen su facilidad para moldearlas y su comportamiento estructural resultante de los procesos térmicos posteriores a que se someterán durante el secado y la cocción (Cultrone et al., 2004).
El comportamiento reológico de la arcilla, es decir, su flujo viscoplástico bajo acción de esfuerzo mecánico es función de la composición mineralógica y tiene relación con la cohesión entre las partículas y su granulometría (Chan, 2011). Una medida de la cohesión de las arcillas se basa en la resistencia al corte para determinado contenido de humedad, según el método de Atterberg, de acuerdo con la norma técnica ASTM D 4318-00, la cual implica la determinación de los límites líquido y plástico -también conocido como ensayo de Casagrande-. La granulometría de las arcillas se determina siguiendo las normas ASTM D1140-00 para los finos y ASTM D422-63 para grava y arena.
Otras variables importantes para los propósitos de este trabajo y que afectan el comportamiento térmico incluyen el contenido de limos, arenas y material orgánico, que se determina con ayuda del triángulo de Winkler en la clasificación tradicional de suelos, no usada en la formulación de pastas de arcilla para la producción de cerámicos.
En consecuencia, para establecer una clasificación de arcillas usadas en la producción de cerámicos, con base en su reología y comportamiento térmico, de tal manera que se pueda prever su aptitud para obtener unas características determinadas en el producto final, es necesario desarrollar un modelo de clasificación que incluya en forma simultánea todas las variables independientes e identificadas como influyentes.
En este artículo se presenta un modelo predictivo basado en redes neuronales, que constituye una herramienta para que la pequeña y mediana industria ladrillera puedan formular mezclas aptas para la producción de ladrillos, con la calidad exigida por la respectiva norma técnica, a partir de cantidades variables de arcillas de diverso origen y composición mineralógica.
2. METODOLOGÍA
Con el fin de obtener una clasificación de arcillas de diferente procedencia y propiedades mediante algoritmos de redes neuronales, se siguieron las etapas que se describen a continuación.
Etapa 1. Se recolectó una muestra de arcillas compuesta por especímenes procedentes de diversos yacimientos ubicados en diferentes partes del territorio colombiano.
Etapa 2. En un laboratorio de una empresa ladrillera se midió, sobre la muestra de arcillas disponible, el conjunto de variables consideradas como independientes e influyentes.
Etapa 3. Con métodos tradicionales para la selección de arcillas usables en las mezclas, se clasificó en grupos la muestra de arcillas recolectada.
Etapa 4. Con base en los grupos identificados en la etapa 3, se desarrolló un modelo de redes neuronales capaz de sustituir la experiencia como herramienta para la selección de las arcillas para emplear en una mezcla destinada a la producción de cerámicos en la industria ladrillera.
3. MODELO DE REDES NEURONALES ARTIFICIALES
Una red neuronal es un sistema que imita el cerebro humano en la transformación de entradas en una o más salidas con un conjunto de neuronas. Para encontrar el modelo más eficiente en este estudio se utilizaron las redes multinivel siempre hacia adelante (MLFN) y las redes neuronales probabilísticas (PNN). De modo específico, una función tangente hiperbólica se usa como función de activación en las neuronas de la capa oculta para la red MLFN. La neurona de salida emplea la identidad como función de activación, la cual simplemente devuelve la suma ponderada de sus entradas. Las redes PNN fueron propuestas primero por Specht (1991) y aproximan cualquier función arbitraria entre los vectores de entrada y salida con el trazo de la función estimada de manera directa desde los datos de entrenamiento (Specht, 1991; Cigizoglu, 2005).
El entrenamiento de la red busca identificar el valor del conjunto de pesos o sinapsis que, minimizando el error de predicción, logra reproducir las salidas incluidas en el conjunto de datos de entrenamiento.
La figura 1 muestra la topología MLFN adoptada, que consiste en tres capas: la de entrada, oculta y capa de salida, y la topología PNN que consiste en cuatro capas: la de entrada, la de patrón (una neurona por caso de entrenamiento), la de suma (una neurona por categoría) y la de salida. Debido a que una sola capa oculta es suficiente para la mayoría de problemas (Hegazy, Fazio y Moselhi, 1994; Palisade, 2010), la topología MLFN se configuró con una sola capa oculta comenzando con dos a seis neuronas para generar el menor error y evitar el exceso de entrenamiento.
Varias técnicas heurísticas se han desarrollado para acelerar la convergencia computacional del entrenamiento. Para reducir el riesgo de encontrar el mínimo local en lugar del mínimo global, en la herramienta usada (Palisade, 2010), la red MLFN utiliza el algoritmo de gradiente descendente conjugado (Bishop, 1995, Palisade, 2010) y el método de recocido simulado (Masters, 1995; Palisade, 2010). La función tangente hiperbólica fue utilizada como la función de activación en las neuronas de la capa oculta; las neuronas de la capa de salida usan la función identidad, la cual simplemente devuelve la suma ponderada de las entradas. Cuando se utilizan las redes PNN, no es necesario investigar la estructura de la red ni ejecutar un procedimiento de entrenamiento interactivo, requeridos por el método de propagación hacia atrás. La configuración de la red siempre tiene dos capas ocultas de neuronas.
En ambas topologías MLFN o PNN las variables de entrada identificadas (que se describen más adelante) se emplearon para desarrollar el modelo de clasificación con la ayuda de NeuralTools, un complemento de redes neuronales para Microsoft Excel (Palisade, 2010). A continuación se describe el panorama general de este proceso.
- Preparación de los datos. Definir el conjunto de datos que se usan en NeuralTools con la función de Administrador de Conjunto de Datos.
- Entrenamiento. Se genera una red neuronal a partir de un conjunto de datos compuesto por casos con valores (categorías) de salida conocidos.
- Prueba. Un subconjunto de datos históricos se reserva para las pruebas para ver qué tan bien se desempeña la red en la predicción de los valores conocidos. El conjunto de datos de prueba no se usa para el entrenamiento de la red.
- Predicción. Una vez entrenadas y probadas, las redes pueden ser empleadas para predecir salidas de datos de casos nuevos. La topología seleccionada y el procedimiento de entrenamiento y prueba de la red se han generado y realizado a partir de los algoritmos mencionados con un proceso iterativo e intensivo en tiempo. NeuralTools soporta configuraciones MLFN y PNN para dar las mejores predicciones posibles. Una vez se desarrolla la mejor red, el usuario puede utilizarla rápidamente para predecir.
4. CLASIFICACIÓN DE ARCILLAS CON REDES NEURONALES ARTIFICIALES
Las redes neuronales artificiales se han usado ampliamente en problemas de clasificación, es decir, en problemas en los que se trata de determinar el tipo de categoría a la que pertenece un elemento desconocido. En el presente trabajo se utiliza dicha técnica para la clasificación de arcillas de acuerdo con su plasticidad (alta, media, débil y suelo descartable) a partir de mediciones físicas.
Para el estudio se recolectaron un total de 170 muestras de arcillas provenientes de diferentes yacimientos de todo el país. Cada muestra se analizó físicamente y se determinaron 11 variables, a saber: límite líquido, límite plástico, porcentaje de grava, porcentaje de arena, porcentaje de finos, humedad de moldeo, contracción en seco, contracción en quema, contracción total, pérdidas por calcinación y porcentaje de absorción.
Las propiedades térmicas fueron determinadas sometiendo el material a tratamientos térmicos; para ello se moldearon probetas de unos 200 g cada una, replicadas tres veces para cada uno de los ensayos. La presión de moldeo aplicada, que se mantuvo constante, fue controlada mediante un torquímetro. La humedad de moldeo se determinó secando en una estufa de laboratorio a una temperatura 110° C ± 5º C durante 24 horas. El proceso de cocción se llevó a cabo mediante un calentamiento lento hasta una temperatura de 950 ºC, la cual se mantuvo por una hora y luego se realizó un enfriamiento lento hasta la temperatura ambiente. Por comparación con la muestra original, se determinaron la contracción en seco, la contracción en quema, la contracción total y las pérdidas por calcinación. Finalmente el porcentaje de absorción de agua se determinó conforme a la norma técnica colombiana NTC 4205.
En la clasificación de las 170 muestras, de acuerdo con sus propiedades físicas, resultaron 81 en alta plasticidad, 60 en media plasticidad, 21 en débil plasticidad y 8 en suelo descartable. En la tabla 1 se muestra una lista parcial de los datos.
NeuralTools facilita la selección de una configuración de red al ofrecer una búsqueda de mejor red, opción en la cual NeuralTools entrena y prueba todas las configuraciones de red marcadas. Para el estudio se incluyeron las redes PNN y las redes MLFN con cuentas de nodos de dos a seis en la capa oculta, así se logró disponer de seis modelos de los cuales NeuralTools selecciona el mejor. La selección del mejor modelo se efectuó basándose en los datos de prueba. Los resultados de la búsqueda de mejor red se muestran en la tabla 2. Se puede observar que la tasa promedio de clasificación correcta fue del 94,12 % con los modelos MLFN (5 nodos), MLFN (4 nodos) y MLFN (3 nodos); una tasa promedio de clasificación correcta del 88,24 % con el modelo MLFN (6 nodos), mientras que una tasa promedio de clasificación correcta del 85,29 % para el modelo PNN. En la tabla 2, también se resalta en negrilla el mejor modelo de clasificación seleccionado por NeuralTools. La selección se basa en una mejora por debajo de la tercera cifra significativa en el porcentaje de clasificación correcta.
La tabla 3 reporta la información y exactitud predictiva de la mejor red neuronal encontrada la cual corresponde al modelo MLFN (5 nodos).
Como puede observarse, el modelo predijo la muestra de entrenamiento con el 97,79 % de precisión y la muestra de prueba con un 94,12 % de precisión después de 1.000.000 de ensayos (pruebas) realizados por NeuralTools. También se observa, en la tabla 3, que el modelo predice la alta plasticidad y la débil plasticidad con un 100 % de precisión, tanto en la muestra de entrenamiento como en la muestra de prueba, la media plasticidad con un 97,83 % de precisión en la muestra de entrenamiento y un 85,71 % de precisión en la muestra de prueba, mientras que el suelo descartable lo predijo con un 71,43 % de precisión en la muestra de entrenamiento y un 100 % de precisión en la de prueba.
A pesar del desempeño satisfactorio alcanzado en ese estudio, con el modelo de clasificación MLFN (5 nodos), con frecuencia estos modelos son criticados en la medida que se consideran cajas negras que no permiten a los tomadores de decisiones hacer inferencias acerca de la manera en que las variables de entrada afectan a los resultados de los modelos, inconveniente que puede solucionarse llevando a cabo un análisis de sensibilidad. En este estudio el análisis de sensibilidad fue ejecutado mediante la opción de Impacto variable en el software NeuralTools. El propósito del análisis de impacto de la variable es medir la sensibilidad de las predicciones de la red al cambio de las variables independientes. Este análisis se realiza solo en los datos de entrenamiento. La figura 2 muestra que la variable de entrada más importante para el modelo MLFN (5 nodos) es el límite plástico seguido por el límite líquido. Cuanto menor sea el valor porcentual de una variable, menos efecto tendrá la variable sobre las predicciones. Los resultados de los análisis pueden ayudar a seleccionar un nuevo conjunto de variables independientes que hagan predicciones más exactas. Por ejemplo, una variable con un valor de impacto bajo se puede sustituir por alguna otra variable nueva.
5. CONCLUSIONES
El modelo desarrollado permite clasificar una nueva muestra de arcilla en el grupo al que pertenece con una confianza aproximada del 95 %.
Los grupos que el modelo utiliza son los definidos por los expertos; en este sentido el modelo se convierte en un puente que disminuye la incertidumbre en la decisión de asignar el grupo, sin alterar el conocimiento previo disponible.
La menor confianza obtenida se relaciona con las muestras rechazadas, quizá por un bajo número de casos en ese estado, lo cual se mejoraría al ampliar la muestra de entrenamiento.
El estudio de sensibilidad muestra que las variables que definen mejor la clasificación son los límites plástico y líquido.
AGRADECIMIENTOS
Los autores expresan sus agradecimientos a Colciencias, a la empresa Ladrillera El Ajizal S. A. y a la Escuela de Ingeniería de Antioquia (EIA) por la cofinanciación del proyecto "Modelo para establecer parámetros de proceso en la producción de ladrillo rojo".
REFERENCIAS
Bishop, Christopher M. Neural networks for pattern recognition. Oxford: Oxford University Press, 1995. [ Links ]
Chan, Chee-Ming. (2011). "Effect of natural fibres inclusion in clay bricks: Physico-mechanical properties". International Journal of Civil and Environmental Engineering, vol. 3, No. 1, pp. 51-57. [ Links ]
Cigizoglu, H. K. (2005). "Generalized regression neural network in monthly flow forecasting". Civil Engineering and Environmental Systems, vol. 22, No. 2, pp. 71-81. [ Links ]
Cultrone, Giuseppe; Sebastián, Eduardo; Elert, Kerstin; De la Torre, María José; Cazalla, Olga and Rodriguez-Navarro, Carlos (2004). "Influence of mineralogy and firing temperature on the porosity of bricks". Journal of the European Ceramic Society, vol. 24, No. 3 (March), pp. 547-564. [ Links ]
Hegazy, T.; Fazio, P. and Moselhi, O. (1994). "Developing practical neural network applications using backpropagation". Microcomputers in Civil Engineering, vol. 9, No. 2 (March), pp. 145-159. [ Links ]
Masters, Timothy. Advanced algorithms for neural networks. New York: John Wiley and Sons, 1995. [ Links ]
Palisade. "Guía para el uso de NeuralTools: Programa auxiliar de redes neuronales para Microsoft® Excel Versión 5.7". Ithaca, NY: Palisade Corporation, 2010. 110 p. [ Links ]
Specht, D. (1991). "A general regression neural network". IEEE Transactions on Neural Networks, vol. 2, No. 6 (November), pp. 568-576. [ Links ]