Desarrollo y aplicación de un modelo computacional para el procesamiento de lenguaje natural : detección de errores ortográficos en textos obtenidos por reconocimiento de caracteres ópticos (OCR) mediante Representaciones de Codificador Bidireccional de Transformers (BERT).

Chilán Rivera, Michael Leonardo

Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/25350

Full metadata record

DC Field	Value	Language
dc.contributor.author	Chilán Rivera, Michael Leonardo	-
dc.date.accessioned	2024-04-08T17:09:06Z	-
dc.date.available	2024-04-08T17:09:06Z	-
dc.date.issued	2024-04-08	-
dc.identifier.citation	Chilán Rivera, M.L.(2024).Desarrollo y aplicación de un modelo computacional para el procesamiento de lenguaje natural : detección de errores ortográficos en textos obtenidos por reconocimiento de caracteres ópticos (OCR) mediante Representaciones de Codificador Bidireccional de Transformers (BERT).78 páginas. Quito : EPN, 2024.	es_ES
dc.identifier.other	T-IS/1832/ CD 14032	-
dc.identifier.uri	http://bibdigital.epn.edu.ec/handle/15000/25350	-
dc.description	El presente trabajo está enfocado en el procesamiento de lenguaje natural (NLP), abordando las tareas de procesamiento y alineación de un corpus paralelo identificando las etiquetas que son requeridas para aplicarlas en el desarrollo del modelo supervisado para la Detección de errores ortográficos obtenidos mediante una herramienta OCR. Para cumplir con este enfoque, se aplica la técnica del Ajuste Fino para aprovechar el codificador de un modelo previamente entrenado de arquitectura Transformer, conocido como Codificador Bidireccional de Transformers BERT. De esta manera se utiliza el modelo para procesar la información y contextualizar los datos que recibe, formando una arquitectura específica para el decodificador que está conformado con las capas requeridas para la estructuración de la capa clasificadora, la cual tiene como objetivo asignar las clases según corresponda a las palabras, clases que están catalogadas como correctas e incorrectas.	es_ES
dc.description.abstract	This work focuses on natural language processing (NLP) tasks, specifically addressing the processing and alignment of a parallel corpus by identifying the necessary tags for applications in the development of a supervised model for detecting spelling errors obtained through an OCT tool. To achieve this goal, the Fine-Tuning technique is applied to leverage the encoder of a pre-trained Transformer architecture model, known as Bidirectional Encoder of Transformers (BERT). In this manner, the model is utilized to process information and contextualize the received data, forming a specific architecture for the decoder. The decoder is constructed with the required layers to structure the classification layer, which aims to assign classes accordingly to words, categorizing then as either correct or incorrect.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Quito : EPN, 2024.	es_ES
dc.rights	openAccess	es_ES
dc.subject	CIENCIAS DE LA COMPUTACIÓN	es_ES
dc.subject	MODELO COMPUTACIONAL	es_ES
dc.subject	RECONOCIMIENTO DE CARACTERES ÓPTICOS	es_ES
dc.subject	DETECCIÓN DE ERRORES ORTOGRÁFICOS	es_ES
dc.title	Desarrollo y aplicación de un modelo computacional para el procesamiento de lenguaje natural : detección de errores ortográficos en textos obtenidos por reconocimiento de caracteres ópticos (OCR) mediante Representaciones de Codificador Bidireccional de Transformers (BERT).	es_ES
dc.type	Trabajo de Integración Curricular	es_ES
Appears in Collections:	TIC - Ingeniería en Ciencias de la Computación

Files in This Item:

File	Description	Size	Format
CD 14032.pdf		2,54 MB	Adobe PDF	View/Open

Show simple item record

BIBDIGITAL