Scielo RSS <![CDATA[Revista Facultad de Ingeniería]]> http://www.scielo.org.co/rss.php?pid=0121-112920230004&lang=en vol. 32 num. 66 lang. en <![CDATA[SciELO Logo]]> http://www.scielo.org.co/img/en/fbpelogp.gif http://www.scielo.org.co <![CDATA[Decision Tree Algorithm Moderately Coupled to PostgreSQL DBMS]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292023000400001&lng=en&nrm=iso&tlng=en Abstract Using machine learning for data management is an extraordinary opportunity to move towards a leadership model based on information, which drives the organization towards success in each initiative. However, when incorporating these technologies, a company presents problems associated with the economic and administrative costs generated in this process since these are usually quite high, limiting their implementation in MSMEs. This paper proposes to integrate supervised machine learning techniques into PostgreSQL DBMS in a moderately coupled architecture to provide it with the capabilities of discovering knowledge in databases. Classification and regression algorithms were coupled by developing extensions using one of the procedural languages supported by PostgreSQL. Initially, the C4.5 decision tree classification algorithm was implemented using the PL/pgSQL procedural language. The main advantage of this strategy is that it considers the scalability, administration, and data manipulation of the DBMS. Since PostgreSQL is an open-source manager, organizations such as MSMEs will have a free tool that allows them to perform predictive analysis in order to improve their decision-making processes by anticipating future consumer behavior and making rational decisions based on their findings.<hr/>Resumen El uso de Aprendizaje Automático para la gestión de datos es una oportunidad extraordinaria para avanzar hacia un modelo de liderazgo basado en la información, que impulse a la organización hacia el éxito en cada una de sus iniciativas. Sin embargo, una empresa, en el momento de incorporar estas tecnologías presenta problemáticas asociadas con los costos económicos y administrativos generados en este proceso, ya que estos suelen ser bastante elevados, que limita principalmente a las MiPymes, su implementación. En este artículo se presenta la propuesta de integrar al SGBD PostgreSQL, técnicas supervisadas de aprendizaje automático, en una arquitectura medianamente acoplada, con el fin de dotar a este gestor con las capacidades de descubrir conocimiento en las bases de datos. Se acoplarán algoritmos de clasificación y regresión mediante el desarrollo de extensiones utilizando uno de los lenguajes procedurales soportados por PostgreSQL. Inicialmente, se implementará el algoritmo de clasificación por árboles de decisión C4.5 usando el lenguaje procedural PL/pgSQL. La principal ventaja de esta estrategia es que se tiene en cuenta la escalabilidad, administración y manipulación de datos del SGBD. Al ser PostgreSQL un gestor de código abierto, organizaciones tales como MiPymes, contarán con una herramienta libre que les permita realizar análisis predictivo con el fin mejorar sus procesos de toma de decisiones al poder anticiparse a los futuros comportamientos del consumidor y tomar decisiones racionales basadas en sus hallazgos.<hr/>Resumo A utilização de Machine Learning para gestão de dados é uma oportunidade extraordinária para avançar para um modelo de liderança baseado em informação, que impulsiona a organização para o sucesso em cada uma das suas iniciativas. No entanto, uma empresa, ao incorporar estas tecnologias, apresenta problemas associados aos custos económicos e administrativos gerados neste processo, uma vez que estes são normalmente bastante elevados, o que limita principalmente a sua implementação às MPME. Este artigo apresenta a proposta de integrar técnicas de aprendizado de máquina supervisionado ao SGBD PostgreSQL em uma arquitetura moderadamente acoplada, a fim de dotar este gestor de capacidades de descoberta de conhecimento em bancos de dados. Algoritmos de classificação e regressão serão acoplados através do desenvolvimento de extensões utilizando uma das linguagens procedurais suportadas pelo PostgreSQL. Inicialmente, o algoritmo de classificação de árvore de decisão C4.5 será implementado utilizando a linguagem processual PL/pgSQL. A principal vantagem desta estratégia é que a escalabilidade, administração e manipulação de dados do SGBD são levadas em consideração. Dado que o PostgreSQL é um gestor de código aberto, organizações como a MiPymes terão uma ferramenta gratuita que lhes permite realizar análises preditivas para melhorar os seus processos de tomada de decisão, sendo capazes de antecipar comportamentos futuros dos consumidores e tomar decisões racionais com base nas suas descobertas. <![CDATA[SentiFuzzy: A Twitter Sentiment Classifier Based on Fuzzy Logic]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292023000400002&lng=en&nrm=iso&tlng=en Abstract In the sentiment classification process, the quality of the polarity varies depending on the characteristics or attributes possessed by the classifier and those of the tweet being analyzed; therefore, a sentiment classifier achieves its highest quality in scenarios in which its characteristics are similar to the characteristics of the tweet. This article presents SentiFuzzy, an algorithm that, based on the characterization of attributes of five sentiment classifiers recognized in the literature, implemented a series of inference rules and fuzzy sets, which allowed to define mathematical weights for each classifier; thus, to know which classifier should be selected according to the nature of the analyzed tweet. Additionally, these weights were optimized by the Hill-Climbing optimization algorithm, which yielded, in some scenarios, a higher polarity accuracy than that reported in the state of the art and, in other cases, a competitive polarity accuracy compared to the polarity reported by the compared classifiers.<hr/>Resumen En el proceso de clasificación de sentimientos, la calidad de la polaridad varía en relación con las características o atributos que posee el clasificador y las del tuit que se analiza, por lo tanto, un clasificador de sentimiento logra su mayor calidad cuando se encuentra en escenarios en que sus características son similares a las características del tuit. En este artículo se presenta SentiFuzzy, un algoritmo que, a partir de la caracterización de atributos de cinco clasificadores de sentimientos reconocidos en la literatura, implementó una serie de reglas de inferencia y conjuntos difusos que permitió definir pesos matemáticos para cada clasificador y de esta manera saber qué clasificador debe ser seleccionado según la naturaleza del tuit analizado. Adicionalmente, dichos pesos se optimizaron a través del algoritmo Hill Climbing, lo que permitió obtener para algunos escenarios una exactitud de polaridad más alta que la reportada en el estado del arte y, en otros casos, una exactitud de polaridad competitiva frente a la polaridad reportada por los clasificadores comparados.<hr/>Resumo No processo de classificação de sentimento, a qualidade da polaridade varia em relação às características ou atributos que o classificador possui e os do tweet que está sendo analisado, portanto, um classificador de sentimento atinge sua maior qualidade quando é encontrado em cenários em que suas características são semelhantes às características do tweet. Este artigo apresenta o SentiFuzzy, um algoritmo que, baseado na caracterização de atributos de cinco classificadores de sentimento reconhecidos na literatura, implementou uma série de regras de inferência e conjuntos fuzzy que permitiram definir pesos matemáticos para cada classificador e desta forma saber qual classificador deveria ser selecionado de acordo com a natureza do tweet analisado. Adicionalmente, estes pesos foram otimizados através do algoritmo Hill Climbing, o que permitiu obter para alguns cenários uma precisão de polaridade superior à reportada no estado da técnica e, noutros casos, uma precisão de polaridade competitiva face à polaridade reportada pelo comparador. classificadores. <![CDATA[ONTOGuide: A Domain Ontology for the Retrieval and Publication of Online Educational Resources]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292023000400003&lng=en&nrm=iso&tlng=en Abstract In today's digital landscape, the exponential growth of information on the web has led to challenges in its organization and management. Often, resources published on the web lack proper structure or appropriate descriptions, thus making it difficult to establish connections with similar resources-a critical issue when searching for educational materials. In such searches, the need for clear, reliable, and immediately available information takes precedence. There are strategies to tackle this problem, the use of ontologies stands out as a compelling solution because they offer a well-defined, lucid, and precise structure within specific domains. Consequently, this study focuses on crafting a domain-specific ontology that furnishes the required knowledge for publishing and retrieving educational resources from the web. We follow the methodology outlined in "Ontology Development 101: A Guide to Creating Your First Ontology" to design it. The outcome is a domain ontology applicable from two distinct perspectives: an academic standpoint, catering to those who seek to understand the underlying concepts, properties, and relationships involved in resource publication and retrieval; and an industrial one, serving as a support tool for companies or institutions aiming to navigate the process of publishing and retrieving resources to improve the management of their knowledge bases.<hr/>Resumen Hoy en día la información en la web crece de forma exponencial, creando inconvenientes en su organización y gestión debidos generalmente a que los recursos publicados en la web no poseen la estructura adecuada o no están descritos de forma apropiada, lo que impide su relación con otros recursos de su mismo tipo. Esto es crítico cuándo se hacen búsquedas relacionadas con recursos educativos, donde a veces prima la urgencia y sobre todo que contengan información clara y confiable para que el usuario que lanza la búsqueda pueda utilizarlos. El uso de ontologías proporciona una estructura bien definida, clara y precisa sobre un determinado dominio. Por tanto, este estudio se centró en la definición de una ontología de dominio específico que proporcione el conocimiento requerido para publicar y recuperar recursos educativos en la web. Para su construcción se siguieron los pasos propuestos en Ontology Development 101: A Guide to Creating Your First Ontology. La ontología de dominio construida puede ser aplicada en dos perspectivas: una académica, para quienes deseen conocer los conceptos, propiedades y relaciones para la publicación y recuperación de recursos; y una industrial, para quienes desean utilizar la ontología como herramienta de apoyo que los guíe paso a paso para publicar y/o recuperar recursos y así mejorar la gestión de sus bases de conocimiento.<hr/>Resumo Hoje em dia, a informação na web cresce exponencialmente, criando problemas na sua organização e gestão, geralmente devido ao facto dos recursos publicados na web não terem a estrutura adequada ou não serem descritos de forma adequada, o que impede a sua relação com outros recursos. do mesmo tipo. Isto é fundamental na procura de recursos educativos, onde por vezes prevalece a urgência e, sobretudo, contêm informação clara e fiável para que o utilizador que inicia a pesquisa os possa utilizar. O uso de ontologias fornece uma estrutura bem definida, clara e precisa sobre um determinado domínio. Portanto, este estudo focou na definição de uma ontologia de domínio específico que forneça o conhecimento necessário para publicar e recuperar recursos educacionais na web. Para sua construção foram seguidos os passos propostos em Desenvolvimento de Ontologia 101: Um Guia para Criar Sua Primeira Ontologia. A ontologia de domínio construída pode ser aplicada em duas perspectivas: uma acadêmica, para quem deseja conhecer os conceitos, propriedades e relações para publicação e recuperação de recursos; e uma industrial, para quem deseja utilizar a ontologia como ferramenta de apoio que os orienta passo a passo para publicar e/ou recuperar recursos e assim melhorar a gestão de suas bases de conhecimento. <![CDATA[Discovering the Spread Patterns of SARS-CoV-2 in Metropolitan Areas]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292023000400004&lng=en&nrm=iso&tlng=en Abstract The spread of COVID-19 has been extensively studied, but the intricate dynamics of its transmission in interdependent and segregated urban areas, constrained by mobility restrictions, have not been completely understood yet. The pandemic's dynamic-adaptive nature implies that virus spread is influenced by diverse factors operating disparately in urban areas with distinct roles. This study investigates the dynamic spread patterns of COVID-19 in the Santiago Metropolitan Area (SMA), Chile, leveraging explanatory variables related to urban mobility, socio-spatial characteristics, segregation, and sanitary measures. Using publicly available mobility data, we used two indices-the Internal Mobility Index (capturing individual trips within a city’s commune), and the External Mobility Index (indicating trips crossing commune borders). These indices were derived from geolocation data recorded by the cellular telephone antenna network of the Telefónica company by tracking successive antenna transitions during trips. The analysis encompasses a three-stage pandemic pattern, corresponding to periods before, during, and after an initial lockdown in the pandemic's first year. Elastic-Net-Penalty regression models, skillful in both feature selection and managing highly correlated predictors while maintaining the interpretability of the models, are used. These models employ a combination of L1 (ridge) and L2 (lasso) regularized log-likelihood optimization. The ridge penalty functions by contracting the coefficients of correlated predictors, pulling them closer to each other. In contrast, the lasso method tends to choose one predictor and exclude the others. The analysis with these models unveils influences of various explanatory variable subsets throughout the pandemic. Importantly, the study provides evidence justifying the suboptimal outcomes of the dynamic quarantine imposed by authorities. Mobility restrictions were implemented without considering the intricate contextual factors, thus impacting vulnerable areas of the city adversely.<hr/>Resumen La propagación del COVID-19 ha sido extensamente estudiada, pero las dinámicas intrincadas de su transmisión en áreas urbanas interdependientes y segregadas, limitadas por restricciones de movilidad, aún no se comprenden completamente. La naturaleza dinámica y adaptativa de la pandemia implica que la propagación del virus está influenciada por diversos factores que operan de manera dispar en áreas urbanas con roles distintos. Este estudio investiga los patrones dinámicos de propagación de COVID-19 en el Área Metropolitana de Santiago (AMS), Chile, utilizando variables explicativas relacionadas con la movilidad urbana, características socioespaciales, segregación y medidas sanitarias. Utilizando datos de movilidad públicos, se emplearon dos índices: el Índice de Movilidad Interna (que captura viajes individuales dentro de una comuna de la ciudad) y el Índice de Movilidad Externa (que indica viajes que cruzan las fronteras de la comuna). Estos índices se derivaron de datos de geolocalización registrados por la red de antenas de telefonía celular de la empresa Telefónica, que rastrea transiciones sucesivas de antenas durante los viajes. El análisis abarca un patrón pandémico de tres etapas correspondientes a los períodos antes, durante y después de un confinamiento inicial en el primer año de la pandemia. Se utilizaron modelos de regresión con penalización Elastic-Net, que permiten seleccionar características y gestionar predictores altamente correlacionados, manteniendo al mismo tiempo la interpretabilidad de los modelos. Estos emplean una combinación de regularización L1 (Ridge) y L2 (Lasso) en la optimización de la verosimilitud. La penalización Ridge contrae los coeficientes de predictores correlacionados entre sí, mientras que la penalización Lasso tiende a seleccionar un subconjunto de coeficientes, asociados a predictores específicos, y descartar los demás. El análisis revela influencias distintas de varios subconjuntos de variables explicativas a lo largo de la pandemia. Es importante destacar que el estudio proporciona evidencia que justifica los resultados subóptimos de la cuarentena dinámica impuesta por las autoridades. Las restricciones de movilidad se implementaron sin tener en cuenta adecuadamente los factores contextuales intrincados, afectando negativamente a áreas vulnerables de la ciudad.<hr/>Resumo A propagação da COVID-19 tem sido extensivamente estudada, mas a intrincada dinâmica da sua transmissão em áreas urbanas interdependentes e segregadas, limitadas por restrições de mobilidade, ainda não é totalmente compreendida. A natureza dinâmica e adaptativa da pandemia significa que a propagação do vírus é influenciada por vários factores que operam de forma díspar nas áreas urbanas com funções diferentes. Este estudo investiga os padrões dinâmicos de propagação da COVID-19 na Área Metropolitana de Santiago (AMS), Chile, utilizando variáveis ​​explicativas relacionadas à mobilidade urbana, características socioespaciais, segregação e medidas sanitárias. Utilizando dados de mobilidade pública, foram utilizados dois índices: o Índice de Mobilidade Interna (que capta as viagens individuais dentro de uma comuna) e o Índice de Mobilidade Externa (que indica as viagens que atravessam as fronteiras da comuna). Esses índices foram derivados de dados de geolocalização registrados pela rede de antenas de telefonia celular da empresa Telefónica, que rastreia transições sucessivas de antenas durante as viagens. A análise abrange um padrão de pandemia em três fases, correspondendo aos períodos antes, durante e depois de um confinamento inicial no primeiro ano da pandemia. Foram utilizados modelos de regressão de penalidade Elastic-Net, que permitem selecionar características e gerenciar preditores altamente correlacionados, mantendo a interpretabilidade dos modelos. Eles empregam uma combinação de regularização L1 (Ridge) e L2 (Lasso) na otimização de probabilidade. A penalidade Ridge colapsa os coeficientes dos preditores correlacionados entre si, enquanto a penalidade Lasso tende a selecionar um subconjunto de coeficientes, associados a preditores específicos, e descartar os demais. A análise revela influências distintas de vários subconjuntos de variáveis ​​explicativas ao longo da pandemia. É importante ressaltar que o estudo fornece evidências que justificam os resultados abaixo do ideal da quarentena dinâmica imposta pelas autoridades. As restrições à mobilidade foram implementadas sem a devida consideração de factores contextuais intrincados, afectando negativamente as áreas vulneráveis ​​da cidade. <![CDATA[Auditive Navigation System for Visually Impaired Individuals in Indoor Spaces Using Augmented Reality]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292023000400005&lng=en&nrm=iso&tlng=en Abstract Visual impairment affects individuals with complete or partial loss of vision. Visually impaired students in Colombian educational institutions face challenges when navigating indoors due to the lack of braille signage. This paper presents the development, implementation, and testing of an augmented reality (AR)-based mobile app that uses rMQR codes to play acoustic descriptions of locations. The application enhances the independence and mobility of visually impaired students in academic spaces. The process involved designing a navigation system, developing software using Unity and Vuforia, and evaluating the application's functionality, accuracy, stability, and performance. A group of thirty-six (36) students validated the software, and their feedback was gathered through a questionnaire using a 5-Likert scale. The results showed that the app had an accessible interface, provided useful information about spaces, and improved autonomy and safety. The app demonstrated fast and accurate code scanning, and its effectiveness in promoting independence, meeting expectations, and not interfering with mobility was validated. The findings emphasize the potential of AR-based applications in supporting visually impaired individuals and fostering social inclusion.<hr/>Resumen La discapacidad visual afecta a personas con pérdida completa o parcial de la visión. Los estudiantes con discapacidad visual en instituciones educativas de Colombia enfrentan desafíos para navegar en interiores debido a la falta de señalización en braille. Este artículo presenta el desarrollo, implementación y prueba de una aplicación móvil basada en realidad aumentada (RA) que utiliza códigos rMQR para reproducir descripciones acústicas de ubicaciones. La aplicación mejora la independencia y movilidad de los estudiantes con discapacidad visual en espacios académicos. La metodología incluyó el diseño de un sistema de navegación, el desarrollo de software utilizando Unity y Vuforia, y la evaluación de la funcionalidad, precisión, estabilidad y rendimiento de la aplicación. Un grupo de treinta y seis (36) estudiantes validaron el software, y se recopilaron sus comentarios a través de un cuestionario utilizando una escala de Likert de 5 puntos. Los resultados mostraron que la aplicación tenía una interfaz accesible, proporcionaba información útil sobre los espacios, mejoraba la autonomía y la seguridad. La aplicación demostró un escaneo rápido y preciso de los códigos. Validamos la efectividad de la aplicación para promover la independencia, cumplir con las expectativas y no interferir con la movilidad. Los hallazgos resaltan el potencial de las aplicaciones basadas en realidad aumentada en el apoyo a personas con discapacidad visual y fomentar la inclusión social.<hr/>Resumo A deficiência visual afeta pessoas com perda total ou parcial da visão. Os alunos com deficiência visual em instituições de ensino na Colômbia enfrentam desafios ao navegar em ambientes fechados devido à falta de sinalização em braille. Este artigo apresenta o desenvolvimento, implementação e teste de um aplicativo móvel baseado em realidade aumentada (AR) que utiliza códigos rMQR para reproduzir descrições acústicas de locais. O aplicativo melhora a independência e mobilidade de alunos com deficiência visual em espaços acadêmicos. A metodologia incluiu o projeto de um sistema de navegação, o desenvolvimento de software utilizando Unity e Vuforia, e a avaliação da funcionalidade, precisão, estabilidade e desempenho da aplicação. Um grupo de trinta e seis (36) alunos validou o software e seu feedback foi coletado por meio de questionário em escala Likert de 5 pontos. Os resultados mostraram que a aplicação tinha uma interface acessível, proporcionava informações úteis sobre os espaços, melhorava a autonomia e a segurança. O aplicativo demonstrou digitalização rápida e precisa de códigos. Validamos a eficácia do aplicativo em promover a independência, atender às expectativas e não interferir na mobilidade. As descobertas destacam o potencial das aplicações baseadas em realidade aumentada no apoio a pessoas com deficiência visual e na promoção da inclusão social.