1. INTRODUCCIÓN
En el ron fresco, como en la mayoría de las bebidas alcohólicas destiladas, el aroma recuerda a la materia prima utilizada. Este varía cuando se deja en reposo en recipientes de roble por un tiempo determinado; es decir, durante el proceso de permanencia de los aguardientes en barriles de roble y al cual se le conoce comúnmente como “enveje cimiento” o tiempo de añejamiento [1]. Este proceso se ve afectado por gran cantidad de factores que, a medida que pasa el tiempo, le otorgan al producto una mayor calidad, consiguiéndose un mejor balance entre el sabor a madera y el impacto etanólico [2].
Durante el proceso de añejamiento del ron se producen pérdidas del producto. El añejamiento del ron no cambia ni transforma la bebida, sino que desarrolla y sublima sus cualidades latentes [1]. Es por lo que, en el contexto de excelencia en que compiten estas bebidas, surge el interés por estudiar la merma en el volumen de ron durante su añejamiento en relación con las condiciones ambientales existentes en la solera.
En el mundo el valor medio de pérdidas anuales que se considera para toneles de 180 litros es de 10% del volumen almacenado. Sin embargo, la literatura señala para los países del Caribe 13% de pérdidas anuales [3]. En un trabajo realizado en las soleras de la ronera de Cárdenas, en los años 1985-1986, se corroboró una pérdida de 10,5% anual. No se han encontrado reportes recientes del valor de estas pérdidas en Cuba. En Jamaica se reporta un 6% de pérdidas [4].
Martí et al. [5] analizaron el comportamiento de pará metros ambientales en las naves de añejamiento en la ronera central “Agustín Rodríguez Mena”, concluyendo que la temperatura dentro del barril se comporta uniformemente, debido a las propiedades térmicas de la madera de roble, que actúa como aislante moderado, lo que permite amortiguar las diferencias térmicas durante el día. Igualmente, no encontraron diferencias significativas en la temperatura y la humedad relativa tomadas en diferentes puntos de la nave.
Se han realizado estudios quimiométricos en los rones en Cuba, pero han estado dirigidos a poder identificar la autenticidad de los rones por comercializar [6].
Durante el proceso productivo se determinan numerosos parámetros, que pueden variar de una ronera a otra, que se registran sistemáticamente. Toda esta memoria almacenada constituye una valiosa fuente de información que puede ser útil en la comprensión del presente y en la predicción del futuro. Los modelos predictivos obtenidos por técnicas de minería de datos constituyen una alternativa a los modelos matemáticos y a la vez una herramienta para el análisis de la información almacenada [7] de los procesos de añejamiento de rones.
Por consiguiente, dado que se estima que hay altos porcentajes de mermas en volumen de las bases en solera y no están esclarecidos los factores que influyen en estas pérdidas, se realiza el trabajo con el objetivo de proponer un modelo de regresión que logre predecir las mermas en función de las variables medidas más influyentes en el añejamiento del ron Añejo.
2. METODOLOGÍA
2.1 Determinación de mermas entoneles de añejamiento de ron
El presente estudio se realizó entre los años 2018 y 2019 en las bodegas de ron Añejo, ubicadas en el Centro de Referencia de Alcoholes y Bebidas (CERALBE), pertenecientes al ICIDCA, bajo las condiciones normales de producción de temperatura y humedad ambiental, utilizando los datos históricos del periodo de tiempo entre octubre de 2014 y diciembre de 2015.
Para la determinación de las variables se contó con un dispositivo de medición de temperatura y humedad relativa ambiente marca HOBO, modelo H08-003-02 con registrador de datos en una solera. Estas variables físicas se midieron ininterrumpidamente durante 13 meses.
Los toneles se hallan almacenados en la ronera en cinco ramblas que poseen una distribución vertical de cinco niveles cada una; en ellas se observa la identificación numérica de cada tonel. Se escogieron tres puntos de la solera (centro y extremos) y se midieron los toneles del primer, tercer y quinto nivel, para evaluar las pérdidas en relación con su posición y su altura. Se escogieron 45 toneles, los cuales tienen almacenados diferentes bases de ron.
El dispositivo de medición se instaló sobre las duelas de uno de los barriles del nivel más elevado de la rambla, en las cercanías del tapón utilizado para el llenado o vaciado de la barrica y del techo de la solera.
Los toneles contienen cinco productos con diferentes concentraciones de etanol (formulaciones) que se encuentran distribuidos aleatoriamente en la solera. Los productos se identifican como: BVi, BVa, A, Ag, VV [8].
Esta distribución y selección de toneles y variedad de pro ductos para añejar da lugar a cinco variables cualitativas: pro ducto, rambla, fecha, posición horizontal y posición vertical.
2.2 Análisis de las variables cualitativas
El software Waikato Environment for Knowledge Analy sis (Weka 3.8.0), creado por la Universidad de Waikato, Ha milton, Nueva Zelanda presenta en su interfaz de trabajo aplicaciones muy atractivas para el campo del análisis de procesos, entre las que se pueden citar: exploración, experimentación, ambiente de flujo de trabajo y banco de trabajo [9]. Dentro de la plataforma de exploración se puede acceder a las técnicas de preprocesamiento de datos, clasificación, agrupamiento, selección de atributos, visualización de los resultados y asociación.
Esta última técnica ofrece el conjunto de “mejores re glas encontradas” de acuerdo con el nivel de confianza establecido de 0,6 entre las cinco variables cualitativas de entrada y la de salida en cuestión (mermas). Se implementó el algoritmo Apriori debido a que constituye una opción para extraer reglas de asociación entre clases y es adaptable para explicar hasta segundas referencias. La variable merma inicialmente presentaba carácter numérico y para lograr que el software la reconociera como al resto de las variables cualitativas se transformó y categorizó, de manera que una vez calculada su media, se estableció que las mediciones que superaran ese valor no cumplían y las menores a este eran admisibles.
2.3 Análisis de las variables cuantitativas
Las variables cuantitativas estudiadas fueron: volumen, grado alcohólico, temperatura, humedad y tiempo de añejamiento.
Las variables cuantitativas que regulan un proceso de producción determinado, medidas de manera continua durante un tiempo, pueden presentar incertidumbre des de el propio momento de la medición, lo cual unido al error intrínseco de los instrumentos de medición y a la propia distribución espacial que sigan, introducen ruido o lo que se conoce comúnmente como puntos discrepantes. Estos últimos pueden afectar la confianza en los resultados del proceso de modelado y conlleva la necesidad de realizar un análisis estadístico previo, del que se pueda arribar a información relevante referida a: la media, desviación estándar, coeficiente de variación, mínimo, máximo, rango, sesgo y kurtosis de los datos.
Se utilizó el software Statgraphics Centurion XVll.2 para el análisis estadístico de datos cuantitativos obteniendo los estadígrafos anteriormente mencionados de manera in dependiente, tanto para cada variable de operación como para las mermas [10].
2.3.1 Limpieza de datos
Para la identificación preliminar de puntos discrepantes se utilizó la coincidencia de dos criterios: análisis de las variables cuantitativas con un coeficiente de variación > 10% y el análisis del gráfico de cajas y bigotes para los subconjuntos correspondientes a cada mes numérico.
2.3.2 Pruebas estadísticas de KMO y de esfericidad de Bartlett
El software Statgraphics Centurion XVll.2 se utilizó para realizar las pruebas estadísticas de KMO (Kaiser-Meyer-Ol kin) y la prueba de esfericidad de Barlett. La prueba de KMO indica el grado en que cada variable de un conjunto se pre dice sin error por las restantes variables. Se sugiere un valor de aceptación de 0,5 o más para que se aconseje realizar el análisis de factores. Valores entre 0,5 y 0,7 son regulares y entre 0,7 y 0,8 son buenos. La prueba de esfericidad de Bartlett se aplica para encontrar la presencia de correlaciones entre las variables. Para el análisis de los factores hace falta que haya relaciones entre las variables. portanto, se requiere un p<0,05 para que exista significación [11].
2.3.3 Modelo de regresión
El software Statgraphics Centurion XVll.2 permite estudiar las posibilidades de explicar el proceso a través de un modelo de regresión entre la variable dependiente: mermas y las variables independientes que sigan una distribución normal. Si estas variables no presentan dicho comportamiento deben ser sometidas a un procesamiento previo para normalizarlas.
El ajuste del modelo de regresión permitió seleccionar cuáles son las variables que mayor variabilidad del proceso explican y se deben incluir en el modelo, atendiendo a los valores de error cuadrático medio (ECM), error estándar de los estimados (EEE), coeficiente de determinación (R2) y la prueba de Durbin-Watson.
3. RESULTADOS
3.1 Determinación de ruido, limpieza y selección de los datos que se utilizarán
Se trabajó con un conjunto inicial de datos de 900 instancias y diez variables, de ellas cinco cualitativas: producto, rambla, fecha y posiciones horizontal y vertical; mientras que las restantes: tiempo de añejamiento, volumen, temperatura, humedad y grado alcohólico inicial tienen carácter cuantitativo, como se declaró en el acápite Metodología. La matriz inicial de datos se redujo a 546 valores, ya que presentaba mediciones incompletas con respecto a tres toneles (19, 21 y 159) y al período de tiempo que comprende de febrero a septiembre de 2014.
3.2 Reglas obtenidas del procesamiento de las variables cualitativas
El empleo de la técnica de asociación utilizando el software Weka 3.8 arrojó la siguiente lista de resultados en que se re portan las reglas que relacionan las variables de operación con la variable de salida, mermas y que se presentan en la Tabla I.
3.3 Resultados del análisis estadístico de las variables cuantitativas
En la Tabla II se muestran los estadígrafos resultantes del análisis descriptivo de las cinco variables de operación, así como de la variable de salida.
3.3.1 Gráfico de cajas y bigotes
De estas variables independientes estudiadas, solo el tiempo de añejamiento presenta valores fuera de los bigotes del gráfico de cajas y bigotes, como se aprecia en la Fig. 1. Por no presentar comportamientos anómalos no se presentan los gráficos de las restantes variables.
3.3.2 Pruebas estadísticas KMO y esfericidad de Bartlett
La prueba estadística KMO arrojó un valor de 0,5219 que, aunque está muy cercana al límite inferior que se recomienda para la aplicación del análisis de componentes principales cumple con la premisa de ser mayor de 0,5. Esta es un indicio de la cantidad de varianza común que está presente en la tabla de valores y la necesidad de extraer factores del conjunto de variables.
La prueba de esfericidad detectó un valor - P de 0,0 inferior a 0,05 y portanto existe correlación significativa al menos entre algunas variables. De aquí que se recomiende aplicar el análisis de componentes principales para eliminar estas correlaciones y facilitar la interpretación de los resultados [12], [13].
3.3.3 Modelo de regresión
Para encontrar un modelo de regresión que permitiera relacionar las mermas con algunas de las variables que se miden en el proceso se requirió realizar un tratamiento previo de las variables originales, ya que, como se discutirá posteriormente, presentaban alejamiento de la distribución normal. Se agruparon las mediciones correspondientes a cada mes estudiado (trece entotal) y se determinó la media de dichas variables, de manera que se contaba con trece instancias para cada una. Además, se decidió incorporar al análisis la variable mes numérico. Posteriormente se comprobó que este subgrupo de muestras, representativo del conjunto original, sí presenta un comportamiento normal, como se muestra en los estadígrafos de la Tabla III, ya que los estadígrafos sesgo y kurtosis se encuentran en el intervalo (-2; 2) [14], [15].
El mejor modelo obtenido se muestra en la Ecuación (1); contiene tres variables: mes numérico, volumen y tiempo de añejamiento y presenta valores de error cuadrático medio (ECM), error estándar de los estimados (EEE) y coeficiente de determinación (R2) de 0,194; 0,339 y 95,88%, respectiva mente. La prueba estadística de Durbin-Watson (DW) de resi duales, con un valor de 1,97, cercano del valor esperado 2, se usa para determinar si existe alguna correlación significativa basada en el orden en que aparecen estos datos en la data.
Mermas=1,27762* Mes numérico - 0,17843* volumen+9,75862*Tiempo de añejamiento (1)
4. DISCUSIÓN
De acuerdo con los resultados de la Tabla I, la interpretación de las reglas reportadas por el software Weka 3.8 permite concluir que las muestras con un valor de mermas mayor a su media están relacionadas con el producto BVi, el cual se encontraba en la rambla uno predominantemente, ubicada en el final de la solera, muy cerca de la pared que limita el lugar con el exterior. En dicha pared irradia el sol de manera ininterrumpida durante el horario de la mañana y presenta un vidrio que permite el paso de los rayos solares en mayor medida que el resto de las paredes circundantes. Esto provoca un calentamiento de esta área y el aumento de la temperatura en los toneles más cercanos, favoreciendo la evaporación del producto.
De la técnica aplicada se deduce que las muestras de BVi ubicadas en la rambla dos, en su mayoría, presentan valores de mermas admisibles. Este comportamiento se corresponde con su ubicación, situada en el centro de la bodega de añejamiento, alejada de la periferia y protegida entre las ramblas uno y tres, por lo que no se ve afectada de manera directa por las variables ambientales y donde existe un mayor flujo de aire.
El análisis además evidencia el elevado número de mues tras, correspondientes al mes octubre, que presentan valores de mermas mayores a la media; debido al aumento brusco que experimentó la variable temperatura.
Las muestras ubicadas en las posiciones: vertical derecha y centro se encuentran exactamente debajo de la escalera que comunica con el piso superior; donde se realiza el tra tamiento con viruta. Durante este procedimiento la energía calorífica cedida es alta, lo cual provoca el lógico aumento de la temperatura en esa zona, mayor evaporación y mermas. Se aprecia que el número de muestras con valores superiores a la media en cada una es similar, al estar afectada toda la zona por el efecto de calentamiento en el piso superior.
Del análisis de la Tabla II, en la que se presenta el análisis descriptivo de cada variable cuantitativa independiente se puede plantear que, en términos estadísticos, cuatro de las variables cuantitativas independientes, exceptuando el volumen, presentan coeficientes de variación superiores a 10%.
Las mermas y el tiempo de añejamiento presentan al tos coeficientes de variación en relación con el resto. Para la primera variable esta variación ha motivado la realización del trabajo por la necesidad de conocer los principales factores que condicionan el cambio. El tiempo de añejamiento debe su variabilidad a que existentoneles en la base de datos muy jóvenes, de menos de un año de añejamiento y otros de casi siete años, lo que representa un espectro amplio de condiciones.
Las variables ambientales temperatura y humedad relativa presentan valores similares de este estadígrafo y superiores a 10%, indicando la no existencia de control sobre estos factores durante el proceso de añejamiento y portanto la posible necesidad de regulación. Estos valores son superiores a los reportados por Martí et al. [5].
Los estadígrafos sesgo y kurtosis, en su mayoría, presentan valores distantes del intervalo -2; 2, lo cual muestra un alejamiento del comportamiento normal para todas las variables, que puede invalidar cualquier prueba estadística en relación con la desviación estándar. Esto limitó el uso de herramientas para pronosticar valores de variables de da tos en bruto.
Al observar el diagrama de cajas y bigotes de la Fig. 1 se aprecia que los puntos que se encuentran fuera de los bigotes corresponden a las mediciones 40, 41, 42, 43, 44, 45, 46, 47 y 48 de los primeros nueve meses de estudio. Es tos constituyen los menores valores de la variable analiza da y están directamente relacionados con el volumen. En estos casos se presentan los mayores valores de volúmenes registrados, pertenecientes a toneles que se encontraban prácticamente llenos cuando comenzó la investigación y, por lo tanto, los menos añejados.
De la Tabla III se concluye que las normalizaciones realizadas a las variables transforman estas en conjuntos de da tos con distribuciones normales. El modelo obtenido tiene una buena calidad de ajuste de acuerdo con los parámetros ECM, R2 y a la prueba de Durbin-Watson, la que con su valor cercano a 2 indica que no hay correlación significativa basada en el orden en que aparecen los datos.
Las variables temperatura, humedad y grado alcohólico noresultaron estadísticamente significativas para la predicción de las mermas luego de ajustar el modelo de regresión. Como se aprecia a mayor tiempo de añejamiento mayores serán las mermas, hecho que viene dado por la mayor evaporación a que se somete el producto en los barriles con el cursar de los meses, resultados encontrados por otros autores [2]. Además, en el caso de que el barril disminuya su nivel de líquido, o sea el volumen, y la tapa se seque, se forman grietas por las cuales se facilita la pérdida de vapores y el sistema se comporta más como un sistema abierto en ciertos instantes del día. Con estas fisuras, es mucho más fácil este mecanismo de salida de vapores que el proceso de difusión a través de la madera, el cual es mucho más lento, propiciándose un aumento en las mermas. También el modelo manifiesta que con el trascurso de la investigación (el avance en meses) disminuyen las mermas en proceso, lo cual puede estar condicionado por el eleva do aumento de la temperatura que se manifestó en el mes de octubre, al comienzo de las mediciones, conllevando un aumento excesivo de las mermas en un principio.
En la Fig. 2 se muestra el gráfico que relaciona datos observados vs predichos para la variable mermas.
5. CONCLUSIONES
El análisis de las variables cualitativas arrojó que los mayores valores de mermas se encuentran en los toneles ubicados cerca de las paredes que limitan con el exterior, ya que el incremento de temperatura en la zona en que la radiación solar es mayor, favorecerá la evaporación del producto.
Las variables ambientales temperatura y humedad re lativa tienen altos coeficientes de variación, lo que se corresponde con el hecho de que en la solera no se controlan estos parámetros durante el proceso de añejamiento.
Se obtuvo un modelo de regresión lineal múltiple que logra predecir las mermas en función de las variables: mes numérico, volumen y tiempo de añejamiento con valores de error cuadrático medio de 0,194 y coeficiente de determinación de 95,88 %. La nave de añejamiento contiene toneles con tiempos de añejamiento muy diferentes, de ahí que se aprecie la alta influencia de esta variable en el modelo predictivo de las mermas. Durante todo el año no existe estabilidad en las condiciones ambientales presentes en la solera, las variables temperatura y humedad varían constantemente y están condicionadas por el mes en cuestión, lo cual explica la necesidad de identificar numérica y secuencialmente cada uno de los meses de investigación, para así definir cuáles son más propicios para desencadenar elevados volúmenes de mermas.
Se evidenció que son de utilidad las herramientas de análisis de procesos para extraer información útil de los datos almacenados durante años en la planta y modelar el proceso de añejamiento de ron.