Please use this identifier to cite or link to this item:
http://bibdigital.epn.edu.ec/handle/15000/24931
Title: | Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras. |
Authors: | Calva Galeas, Carlos Enrique |
Director: | Aguiar Pontes, Josafá de Jesús |
Keywords: | HABLA INGLESA LENGUA HISPANA TRANSFORMER DETECCIÓN DE ERRORES |
Issue Date: | 5-Oct-2023 |
Publisher: | Quito : EPN, 2023. |
Citation: | Calva Galeas, C.E.(2023).Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.72 páginas. Quito : EPN. |
Abstract: | This study focuses on evaluating word-level reading errors in audio recordings of the Spanish language (NHK newscasts for Spanish) using the Transformer-based model: Whisper Large-V2. The evaluation results demonstrated the model's capacity to accurately predict most errors. Additionally, two experiments were conducted: the first involved an attempt to train a Transformer-based model using the Whisper-Small model through the transfer learning technique to predict phonetic-level pronunciation for the English language. The second experiment entailed assessing phoneme-level pronunciation errors using the "wav2vec2-xlsr-53-espeak-cv-ft" model for English, spoken by individuals whose native language is Spanish. Unfortunately, both experiments yielded unsatisfactory outcomes. |
Description: | Este trabajo trata acerca de la evaluación de errores lectura a nivel de palabras en grabaciones de audio del idioma español (Noticieros NHK en el idioma español) utilizando el modelo basado en Transformer: Whisper-Large-V2. Los resultados de la evaluación demostraron que el modelo puede predecir la mayoría de los errores correctamente. Adicionalmente se realizaron dos experimentos: el primero fue un intento de entrenar un modelo basado en Transformer usando el modelo Whisper-Small a través de la técnica del transfer learning para predecir la pronunciación a nivel fonético para el idioma inglés y el segundo experimento fue la evaluación de los errores de pronunciación a nivel de fonemas utilizando el wav2vec2-xlsr-53-espeak-cv-ft para el idioma inglés hablado por personas cuya lengua materna es el español. Los dos experimentos no tuvieron resultados satisfactorios. |
URI: | http://bibdigital.epn.edu.ec/handle/15000/24931 |
Type: | Trabajo de Integración Curricular |
Appears in Collections: | TIC - Ingeniería en Ciencias de la Computación |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
CD 13623.pdf | 1,3 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.