Traductor automático español-quechua, basado en el procesamiento del lenguaje natural
Abstract
En este trabajo, se presenta un traductor automático entre los idiomas español y quechua por medio del Procesamiento de Lenguaje Natural. Para su desarrollo, se decidió utilizar el modelo de Traducción Automática basada en redes Neuronales NMT, implementando dos corpus paralelos de cada idioma con 1,919 frases alineadas en el algoritmo Transformer, para su respectivo proceso de entrenamiento y aprendizaje de las redes neuronales, usando las herramientas básicas para el procesamiento de lenguaje natural, como es un tokenizador, codificador, normalizador y decodificador. Estas herramientas las implementamos guiándonos de la metodología de Proceso Cíclico expuesta en el marco teórico. Los resultados obtenidos no son del todo óptimos pero son aceptables tomando en cuenta el escaso corpus bilingüe con el que se cuenta. En conclusión, el uso de una lengua aglutinada como es el quechua en un sistema NMT, debe ser más estudiada para generar mejores resultados, pero abre la puerta para que nuevos idiomas puedan ser traducidos, sobre todo si son semejantes como el quechua, aimara o el guaraní.