Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/24766
Título: Construcción de un dataset de eventos de conducción utilizando modelos de generación de datos sintéticos mediante Generative Adversarial Networks (GAN).
Autor: Tamayo Urgilés, Diego Armando
Director: Álvarez Hernández, Myriam Beatriz
Palabras clave: GENERACIÓN DE DATOS SINTÉTICOS
REDES GENERATIVAS ADVERSARIAS
DATOS DE EVENTOS DE CONDUCCIÓN
SÍNTESIS DE SERIES TEMPORALES
NIVEL DE RIESGO DE ACCIDENTES DE TRÁNSITO
Fecha de publicación: ago-2023
Editorial: Quito : EPN, 2023.
Citación: Tamayo Urgilés, D.A. (2023). Construcción de un dataset de eventos de conducción utilizando modelos de generación de datos sintéticos mediante Generative Adversarial Networks. 53 páginas. Quito : EPN.
Resumen: The development of solutions to reduce traffic accidents in vehicles requires a lot of experimentation and, therefore, a large amount of data. However, due to data confidentiality issues, few free datasets are available in this area, so it is necessary to build datasets that contain several attributes and can be of general use in this field. Given this reality, this project uses the TimeGAN framework for synthetic data generation. TimeGAN is configured in this thesis work with four recurrent neural networks, which obtain a spatial and temporal distribution that seeks to approximate the real data. The synthetic data generated can replace or complement the real data in different scenarios, with the advantage that the synthetic data can be shared without the risk of exposing confidential information of persons or entities associated with these data. The synthetic data will serve to complete the information of an initial dataset built with driving data obtained from heterogeneous sources. In order to evaluate the results of synthetic data generation, qualitative and quantitative methods will be used to establish the usefulness of the data. The synthetic data dataset constructed will then be used in processes of classification of driving events that present a higher risk of causing traffic accidents.
Descripción: El desarrollo de soluciones que disminuyan los accidentes de tránsito en vehículos requiere de mucha experimentación y, por tanto, gran cantidad de datos. Sin embargo, por temas de confidencialidad de los datos, pocos datasets gratuitos se encuentran disponibles en esta área, por lo que se requiere construir datasets que contengan varios atributos y puedan ser de utilidad general dentro de este campo. Ante esta realidad, en este proyecto se utiliza el framework TimeGAN para la generación de datos sintéticos. TimeGAN se configura en este trabajo de tesis con cuatro redes neuronales recurrentes, las cuales obtienen una distribución espacial y temporal que busca aproximarse a la que tienen los datos reales. Los datos sintéticos generados pueden reemplazar o complementar a los datos reales en distintos escenarios, con la ventaja de que los datos sintéticos pueden ser compartidos sin riesgo de que se pueda exponer información confidencial de las personas o entidades asociadas a estos datos. Los datos sintéticos servirán para completar la información de un dataset inicial construido con datos de conducción obtenidos de fuentes heterogéneas. A fin de evaluar los resultados en la generación de datos sintéticos, se utilizarán métodos cualitativos y cuantitativos que permitan establecer la utilidad de los mismos. El dataset de datos sintéticos construido luego se utilizará en procesos de clasificación de eventos de conducción que presenten mayor riesgo de provocar accidentes de tránsito.
URI: http://bibdigital.epn.edu.ec/handle/15000/24766
Tipo: masterThesis
Aparece en las colecciones:Tesis Maestría en Ciencias de la Computación y Comercio Electrónico (FIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 13483.pdf11,63 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.