SciELO - Scientific Electronic Library Online

 
vol.47 issue2Listening in education author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Lenguaje

Print version ISSN 0120-3479

Abstract

TAMAYO, Antonio; LONDONO, Julián Arias; BURGOS, Diego  and  QUIROZ, Gabriel. Análisis de sentimientos en artículos de prensa en español usando predicados como características. Leng. [online]. 2019, vol.47, n.2, pp.235-267. ISSN 0120-3479.  https://doi.org/10.25100/lenguaje.v47i2.7937.

La predicción automática del modo de proceder de los agentes involucrados en las tendencias sociales o económicas es un desafío preponderante en la actualidad. Sin embargo, es una tarea difícil debido al hecho de que la postura u opinión a menudo se extiende a través de documentos extensos y complejos, como los artículos de noticias. El presente trabajo evalúa los predicados de oraciones como características para determinar automáticamente la postura del escritor en los artículos de noticias. Capturamos la semántica y la postura del texto codificando características como el atributo de oraciones copulativas, el predicado de oraciones transitivas, sintagmas adjetivales y la sección del artículo. Bajo el supuesto de que estas características son lo suficientemente informativas para modelar la semántica del texto, cada secuencia de palabras se desambigua y se le asigna un valor de sentimiento con reglas de ponderación. Se realizaron diferentes experimentos empleando SentiWordNet y ML-Senticon para determinar la opinión de las palabras. Los vectores de características se construyen automáticamente para completar una base de datos que se prueba mediante el uso de dos algoritmos de aprendizaje automático. Se logró una eficiencia del 69 % utilizando una SVM con kernel gaussiano junto con una estrategia de selección de características. Esta puntuación superó la línea de base de la técnica de "bag of words" en un 12 %. Estos resultados son prometedores si tenemos en cuenta que el análisis de sentimientos se hace en documentos muy complejos en español.

Keywords : análisis de sentimientos; características lingüísticas; artículos de noticias; sociopolítica; máquinas de vectores de soporte; Naïve Bayes; reducción de dimensión.

        · abstract in English | French     · text in English     · English ( pdf )