Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.

Calva Galeas, Carlos Enrique

Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/24931

Título:	Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.
Autor:	Calva Galeas, Carlos Enrique
Director:	Aguiar Pontes, Josafá de Jesús
Palabras clave:	HABLA INGLESA LENGUA HISPANA TRANSFORMER DETECCIÓN DE ERRORES
Fecha de publicación:	5-oct-2023
Editorial:	Quito : EPN, 2023.
Citación:	Calva Galeas, C.E.(2023).Procesamiento acústico de la voz aplicado al reconocimiento de fonemas similares en el habla inglesa comparados con sus homólogos en lengua hispánica : Evaluación de modelos basados en Transformer para la detección de errores de lectura a nivel de palabras.72 páginas. Quito : EPN.
Resumen:	This study focuses on evaluating word-level reading errors in audio recordings of the Spanish language (NHK newscasts for Spanish) using the Transformer-based model: Whisper Large-V2. The evaluation results demonstrated the model's capacity to accurately predict most errors. Additionally, two experiments were conducted: the first involved an attempt to train a Transformer-based model using the Whisper-Small model through the transfer learning technique to predict phonetic-level pronunciation for the English language. The second experiment entailed assessing phoneme-level pronunciation errors using the "wav2vec2-xlsr-53-espeak-cv-ft" model for English, spoken by individuals whose native language is Spanish. Unfortunately, both experiments yielded unsatisfactory outcomes.
Descripción:	Este trabajo trata acerca de la evaluación de errores lectura a nivel de palabras en grabaciones de audio del idioma español (Noticieros NHK en el idioma español) utilizando el modelo basado en Transformer: Whisper-Large-V2. Los resultados de la evaluación demostraron que el modelo puede predecir la mayoría de los errores correctamente. Adicionalmente se realizaron dos experimentos: el primero fue un intento de entrenar un modelo basado en Transformer usando el modelo Whisper-Small a través de la técnica del transfer learning para predecir la pronunciación a nivel fonético para el idioma inglés y el segundo experimento fue la evaluación de los errores de pronunciación a nivel de fonemas utilizando el wav2vec2-xlsr-53-espeak-cv-ft para el idioma inglés hablado por personas cuya lengua materna es el español. Los dos experimentos no tuvieron resultados satisfactorios.
URI:	http://bibdigital.epn.edu.ec/handle/15000/24931
Tipo:	Trabajo de Integración Curricular
Aparece en las colecciones:	TIC - Ingeniería en Ciencias de la Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
CD 13623.pdf		1,3 MB	Adobe PDF	Visualizar/Abrir

Muestra el registro Dublin Core completo del ítem

BIBDIGITAL