Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25819
Título: Prototipo de descripción de figuras geométricas para no videntes : realizar un pdf inclusivo, donde conste la descripción de figuras obtenidas de un archivo latex usando un LLM.
Autor: León Galéas, Carlos Jostin
Director: Zambrano Vizuete, Ana María
Palabras clave: PROGRAMACIÓN LÓGICA
DISEÑO ASISTIDO POR ORDENADOR
PDF ETIQUETADO
INTELIGENCIA ARTIFICIAL
ACCESIBILIDAD DIGITAL
HERRAMIENTA CON IA
USUARIO NO VIDENTE
TEXT TO SPEECH
Fecha de publicación: 1-oct-2024
Editorial: Quito : EPN, 2024.
Citación: León Galeas, C.J.(2024).Prototipo de descripción de figuras geométricas para no videntes : realizar un pdf inclusivo, donde conste la descripción de figuras obtenidas de un archivo latex usando un LLM.45 páginas. Quito : EPN, 2024.
Resumen: This study details the development of a web application designed to create inclusive PDFs, aimed at enhancing the accessibility of figures in SVG and TikZ formats for individuals with visual impairments. The initiative addresses the critical need for providing detailed textual descriptions alongside images in scientific, educational, and technical documents, thereby facilitating access to visually represented information. The application employs a Large Language Model (LLM) to analyze and describe complex figures, integrating these descriptions as alternative text tags within the original LaTeX code. This process is automated, ensuring accuracy and consistency in the descriptions provided. Additionally, technologies such as the Web Speech API and gTTS are implemented to offer an auditory experience, allowing users to receive audio feedback while navigating the application. The web application also supports keyboard navigation and offers variable reading speeds to accommodate user preferences. The use of the Flask framework and the Kanban methodology in project development ensured agile and efficient management, facilitating the implementation and testing phases of the system. The results indicate that the application is effective in producing accessible documents, significantly enhancing digital inclusion for individuals with visual impairments. This tool promotes greater equity in access to information, contributing to the broader goal of a more inclusive society. The integration of IA and speech technologies underscores the potential for innovative solutions in addressing accessibility challenges in digital content.
Descripción: El presente trabajo aborda el desarrollo de una aplicación web que genera archivos PDF inclusivos, específicamente diseñados para mejorar la accesibilidad de figuras en formatos SVG y TikZ para personas con discapacidad visual. La iniciativa surge de la necesidad de proporcionar descripciones textuales detalladas que acompañen a las imágenes en documentos científicos, educativos y técnicos, facilitando así el acceso a la información visualmente representada. La aplicación utiliza un modelo de lenguaje grande (LLM) para analizar y describir figuras complejas, integrando estas descripciones como etiquetas de texto alternativo en el código LaTeX original. Este proceso se realiza automáticamente, asegurando precisión y consistencia en las descripciones. Además, se implementan tecnologías como Web Speech API y gTTS para proporcionar una experiencia auditiva, permitiendo a los usuarios recibir retroalimentación sonora mientras navegan por la aplicación. La aplicación web también soporta navegación por teclado y ofrece diferentes velocidades de lectura para adaptarse a las preferencias de los usuarios. El uso del framework Flask y la metodología Kanban en el desarrollo del proyecto aseguraron una gestión ágil y eficiente, facilitando la implementación y pruebas del sistema desarrollado. Los resultados demuestran que la aplicación es efectiva en la creación de documentos accesibles, mejorando significativamente la inclusión digital de personas con discapacidad visual. Esta herramienta promueve una mayor equidad en el acceso a la información, contribuyendo al avance hacia una sociedad más inclusiva. La integración de IA y tecnologías del habla subraya el potencial de las soluciones innovadoras para abordar los problemas de accesibilidad de los contenidos digitales.
URI: http://bibdigital.epn.edu.ec/handle/15000/25819
Tipo: Trabajo de Integración Curricular
Aparece en las colecciones:TIC - Tecnología de la Información (FIEE)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 14470.pdf1,05 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.