Servicios Personalizados
Revista
Articulo
Indicadores
Citado por SciELO
Accesos
Links relacionados
Citado por Google
Similares en SciELO
Similares en Google
Compartir
Ingeniería y competitividad
versión impresa ISSN 0123-3033versión On-line ISSN 2027-8284
Resumen
ACEVEDO-CASTIBLANCO, Jorge-Alexander; SUAREZ-BARON, Marco-Javier y GONZALEZ-SANABRIA, Juan-Sebastian. Categorización e integración de columnas de opinión contenido en páginas web aplicando técnicas de Procesamiento de Lenguaje Natural. Ing. compet. [online]. 2023, vol.25, n.3, e-22313220. Epub 30-Dic-2023. ISSN 0123-3033. https://doi.org/10.25100/iyc.v25i3.13220.
Se presenta la aplicación de técnicas de Procesamiento de Lenguaje Natural para el análisis de textos, describiendo el proceso realizado desde la extracción de datos hasta la identificación y detección de opiniones de manera automática. Los textos analizados fueron columnas de opinión que reflejan los criterios de las personas sobre temas de actualidad. Lo anterior con el fin de proporcionar una manera ágil de identificar los temas de interés en la comunidad para proporcionar a los interesados de forma resumida lo que se expresa sobre estos temas. Para tal fin, se implementó un algoritmo que permite extraer información de manera precisa y limpia desde páginas web y posteriormente otro algoritmo que se encarga de efectuar la categorización automática de la información extraída, generando un resumen preciso de los principales temas en cada escrito.
Palabras clave : Clasificación de texto; Columnas de opinión; Procesamiento de Lenguaje Natural; Web Scrapping.