Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/21463
Título: Desarrollo de un algoritmo para clasificar de forma automática las regiones de texto, figura y tabla de las páginas de artículos científicos digitales, mediante técnicas de Visión Artificial
Autor: Santos Morocho, Erick Bolívar
Palabras clave: REDES NEURONALES
VISIÓN COMPUTACIONAL
DESARROLLO (SOFTWARE)
Fecha de publicación: 5-mar-2021
Editorial: Quito, 2021.
Citación: Santos Morocho, E. B. (2021). Desarrollo de un algoritmo para clasificar de forma automática las regiones de texto, figura y tabla de las páginas de artículos científicos digitales, mediante técnicas de Visión Artificial. 121 hojas. Quito : EPN.
Resumen: Document Layout Analysis is a previous step to Document Understanding, which consists of identifying and recognizing the logical and physical structure of digitized documents to extract their components and transform them into structured information that can be used later in decision-making. In this sense, a universal algorithm that fits all document designs has not yet been developed, therefore a novel approach is presented to identify regions in scientific articles using Deep Learning and Computer Vision. This approach is a supervised machine learning system with Convolutional Neural Networks to label regions of interest of the pages of a scientific article in the categories of text, table, and figure through the spectrograms from the horizontal and vertical intensity histograms of the regions. Later the system identifies lines of equations in text regions using the Bag of Visual Words technique with Zernike moments. Finally, the algorithms were trained and validated with the K-Fold Cross-Validation technique with a database of document pages previously segmented into regions of interest and evaluated in terms of accuracy and precision. In addition, the ROC (Receiver Operating Characteristic) curve analysis and the AUC (Area Under the ROC Curve) metric are presented to quantify the performance of the trained algorithms.
Descripción: El análisis de diseño de documentos (Document Layout Analysis) es un paso previo al procesamiento de los sistemas de interpretación de documentos (Document Understanding), el cual consiste en reconocer la estructura lógica y física de documentos digitalizados para extraer su contenido y transformarlo en información estructurada. En este sentido, todavía no se ha desarrollado un algoritmo universal que se ajuste a todos los diseños de documentos, por lo que en este trabajo se presenta un enfoque novedoso para identificar regiones de texto, tabla y figura en artículos científicos empleando aprendizaje automático supervisado con redes neuronales convolucionales, el cual considera los espectrogramas provenientes de los histogramas de intensidad horizontal y vertical de las regiones para el proceso de clasificación. Posteriormente este sistema identifica ecuaciones en regiones de texto usando la técnica Bolsa de palabras visuales con momentos de Zernike. Finalmente, los algoritmos fueron entrenados y validados con la técnica de validación cruzada de K iteraciones en una base de datos de páginas de documentos previamente segmentados en regiones de interés y evaluados en términos de exactitud y precisión, así como también con el análisis de curva ROC (Receiver Operating Characteristic) y la métrica AUC (Area Under the ROC Curve).
URI: http://bibdigital.epn.edu.ec/handle/15000/21463
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Electrónica y Telecomunicaciones (ET)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 10952.pdf2,98 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.