Servicios Personalizados
Revista
Articulo
Indicadores
- Citado por SciELO
- Accesos
Links relacionados
- Citado por Google
- Similares en SciELO
- Similares en Google
Compartir
Cuadernos de Lingüística Hispánica
versión impresa ISSN 0121-053Xversión On-line ISSN 2346-1829
Resumen
PENA-TORRES, Jefferson A.; BUCHELI, Víctor y GUTIERREZ DE PINEREZ REYES, Raúl E.. Traducción automática de un conjunto de entrenamiento para extracción semántica de relaciones. Cuad. linguist. hisp. [online]. 2022, n.39, pp.1-. Epub 03-Mar-2023. ISSN 0121-053X. https://doi.org/10.19053/0121053x.n39.2022.13436.
La traducción automática (TA) se utiliza para obtener corpus anotados a partir de corpus provenientes del idioma inglés, los cuales pueden ser aplicables a diferentes tareas de procesamiento de lenguaje natural (PLN). Teniendo en cuenta que existen más recursos o conjuntos de datos para entrenamiento de modelos de PLN en idioma inglés, en este trabajo se explora la aplicación de la TA para automatizar tareas de PLN en el idioma español. De esta forma, en el artículo se describe un conjunto de datos para la extracción de relaciones genéricas (reACE) y la construcción de un modelo extracción semántica de relaciones en español (ER), basado en el conjunto de muestras traducidas del idioma inglés al español. Los resultados muestran que para la tarea de TA es necesario implementar un proceso de preedición del corpus en inglés, con el fin de evitar errores de traducción, posedición y mantener las anotaciones del corpus original. Los modelos ER en español alcanzan medidas de precisión, exhaustividad y valor-F comparables con las obtenidas por el modelo en el lenguaje de inglés, lo que sugiere que la traducción automática es una herramienta útil para realizar tareas de PLN en el idioma español.
Palabras clave : lingüística informática; traducción automática; lingüística de corpus; extracción de relaciones.