Clasificación multiclase y visualización de quejas de organismos oficiales en twitter

Hernández-Pajares, Beatriz; Pérez-Marín, Diana; Frías-Martínez, Vanessa

doi:10.22430/22565337.1454

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

TecnoLógicas

Print version ISSN 0123-7799On-line version ISSN 2256-5337

Abstract

HERNANDEZ-PAJARES, Beatriz; PEREZ-MARIN, Diana and FRIAS-MARTINEZ, Vanessa. Clasificación multiclase y visualización de quejas de organismos oficiales en twitter. TecnoL. [online]. 2020, vol.23, n.47, pp.107-118. ISSN 0123-7799. https://doi.org/10.22430/22565337.1454.

Las redes sociales acumulan gran cantidad de información. Las actuales técnicas de Procesamiento de Lenguaje Natural permiten su procesamiento automático y las técnicas de Minería de Datos permiten extraer datos útiles a partir de la información recopilada y procesada. Sin embargo, de la revisión del estado del arte, se observa que la mayoría de los métodos de clasificación de los datos identificados y extraídos de redes sociales son biclase. Esto no es suficiente para algunas áreas de clasificación, en las que hay más de dos clases a considerar. En este artículo, se aporta un estudio comparativo de los métodos svm y Random Forests, para la identificación automática de n-clases en microblogging de redes sociales. Los datos recopilados automáticamente para el estudio están conformados por 190 000 tweets de cuatro organismos oficiales: Metro, Protección Civil, Policía, y Gobierno de México. De los resultados obtenidos, se recomienda el uso de Random Forests, ya que se consigue una precisión media del 81.46 % y una cobertura media del 59.88 %, con nueve tipos de quejas identificadas automáticamente.

Keywords : Minería de texto; clasificación multiclase; redes sociales; Twitter.

· abstract in English · text in Spanish · Spanish (

pdf )