Elaboración, evaluación y optimización de modelos ocultos de Markov pare la transliteración de palabras del inglés a katakana.

Morales Banda, Juan José

Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/23453

Título:	Elaboración, evaluación y optimización de modelos ocultos de Markov pare la transliteración de palabras del inglés a katakana.
Autor:	Morales Banda, Juan José
Palabras clave:	TRANSLITERACIÓN DECODIFICADOR VITERBI SISTEMA DE INFORMACIÓN INFORMÁTICA Y DESARROLLO KATAKANA
Fecha de publicación:	nov-2022
Editorial:	Quito : EPN, 2022.
Citación:	Morales Banda, J.J.(2022).Elaboración, evaluación y optimización de modelos ocultos de Markov pare la transliteración de palabras del inglés a katakana. 65 páginas. Quito : EPN.
Resumen:	The present integrative project proposes the use of Markov Ooultos Models (HMM) to perform the Transliteration of words from English into the katakana syllabary of Japanese writing. Bliss Transliteration will be the most likely sequence of katakana characters, given a sequence of observations of phonetic syllables from English. These phonetic syllables have been obtained using the English words of the EDICT2 dictionary within Festival's Grapheme-to-Phoneme (G2P) conversions. Additionally, the PERL programming language and the use of regular expressions will allow ERA programming. Before elaborating the IIMM it is necessary to have one alignment between phonetic syllables with their respective katakana sequences, the MGIZA tool is responsible for making this alignment After that, the generation of the probabilities of initiation, transition and emission, belonging to the HMM, is made of probabilistic way by means of counts based on the aforementioned alignment. These probabilities are what allow us to find the katakana character string my probable per means of Viterbi's algorithm. Through this process, HMMs can be evaluated and optimized for acceptable transliterations. Due to restrictions, the results obtained are partially compared with other existing tools that also perform transliteration from English to katakana. This gives an idea of how satisfactory they were, in order to evaluate the effectiveness of the approach of HMMs based on phonetic syllables.
Descripción:	El presente proyecto integrador propone la utilización de Modelos Ooultos de Markov (HMM) papa realizar la transliteración de palabras provenientes del inglés hacia el silabario katakana de escritura japonés. Dicha transliteración será la secuencia de caracteres katakana más probable, dada una secuencia de observaciones de silabas fonéticas del inglés. Estas silabas fonéticas han sido obtenidas utilizando las palabras en inglés del diccionario EDICT2 dentro de las conversiones Grapheme-to-Phoneme (G2P) de Festival. Adicionalmente, el lenguaje de progranación PERL y el uso de expresiones regulares permitirán la programación de los ERA. Antes de elaborar los IIMM es necesario poseer uno alineación entre lag sílabas fonéticas con sus respectivas secuencias katakana, la herramienta MGIZA es la encargada de realizar dicha alineación. Tras ello, la generación de las probabilidades de inicio, transición y emisión, pertenecientes a los HMM, se realiza de manera probabilística por medio de conteos en función de la alineación antes mencionada. Estas probabilidades son las que permiten encontrar la cadena de caracteres katakana mis probable per medio del algoritmo de Viterbi. A través de este proceso, se podrán evaluar y optimizar los HMM para obtener transliteraciones aceptables. Debido a restricciones, los resultados obtenidos se comparan parcialmente con otras herramientas ya existentes que también realicen la transliteración del inglés al katakana. Esto otorga una idea de cuán satisfactorios fueron, para asi evaluar la eficacia dad enfoque de los HMM basados en silabas fonéticas.
URI:	http://bibdigital.epn.edu.ec/handle/15000/23453
Tipo:	bachelorThesis
Aparece en las colecciones:	Tesis Sistemas Informáticos y de Computación (ISIS)

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
CD 12869.pdf		1,5 MB	Adobe PDF	Visualizar/Abrir

Muestra el registro Dublin Core completo del ítem

BIBDIGITAL