Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/24931
Title: Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.
Authors: Calva Galeas, Carlos Enrique
Director: Aguiar Pontes, Josafá de Jesús
Keywords: HABLA INGLESA
LENGUA HISPANA
TRANSFORMER
DETECCIÓN DE ERRORES
Issue Date: 5-Oct-2023
Publisher: Quito : EPN, 2023.
Citation: Calva Galeas, C.E.(2023).Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.72 páginas. Quito : EPN.
Abstract: This study focuses on evaluating word-level reading errors in audio recordings of the Spanish language (NHK newscasts for Spanish) using the Transformer-based model: Whisper Large-V2. The evaluation results demonstrated the model's capacity to accurately predict most errors. Additionally, two experiments were conducted: the first involved an attempt to train a Transformer-based model using the Whisper-Small model through the transfer learning technique to predict phonetic-level pronunciation for the English language. The second experiment entailed assessing phoneme-level pronunciation errors using the "wav2vec2-xlsr-53-espeak-cv-ft" model for English, spoken by individuals whose native language is Spanish. Unfortunately, both experiments yielded unsatisfactory outcomes.
Description: Este trabajo trata acerca de la evaluación de errores lectura a nivel de palabras en grabaciones de audio del idioma español (Noticieros NHK en el idioma español) utilizando el modelo basado en Transformer: Whisper-Large-V2. Los resultados de la evaluación demostraron que el modelo puede predecir la mayoría de los errores correctamente. Adicionalmente se realizaron dos experimentos: el primero fue un intento de entrenar un modelo basado en Transformer usando el modelo Whisper-Small a través de la técnica del transfer learning para predecir la pronunciación a nivel fonético para el idioma inglés y el segundo experimento fue la evaluación de los errores de pronunciación a nivel de fonemas utilizando el wav2vec2-xlsr-53-espeak-cv-ft para el idioma inglés hablado por personas cuya lengua materna es el español. Los dos experimentos no tuvieron resultados satisfactorios.
URI: http://bibdigital.epn.edu.ec/handle/15000/24931
Type: Trabajo de Integración Curricular
Appears in Collections:TIC - Ingeniería en Ciencias de la Computación

Files in This Item:
File Description SizeFormat 
CD 13623.pdf1,3 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.