Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/23488
Title: Modelos estadísticos para la detección de patrones en medio ambiente y economía :
Other Titles: Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning.
Authors: Amagua Sandobalin, Gabriel Sebastián
Keywords: MATEMÁTICA
MEDIOS SOCIALES
ESTADÍSTICA
MEDIO AMBIENTE
SISTEMA ECONÓMICO
Issue Date: Dec-2022
Publisher: Quito : EPN, 2022.
Citation: Amagua Sandobalin, G.S.(2022).Modelos estadísticos para la detección de patrones en medio ambiente y economía : Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning. 72 páginas. Quito : EPN.
Abstract: On average each year the information available on the network is duplicated and sources such as blogs, social networks, and web pages generate huge amounts of information that can be accessed through Web-Scraping techniques. In recent years, various methodologies have been proposed for measuring uncertainty based on news counts related to a set of keywords. The present work closely follows these methodologies. I use Topics modeling due to the variety of opinions and the amount of data obtained, which are probabilistic models. These models are based on two assumptions: 1) There are several different groups or text sources in an extensive collection of documents. 2) Texts from different sources tend to use different vocabulary. In particular, the Latent Dirichlet Allocation (LDA) algorithm addresses this work. From the problem of choosing the optimal number of topics to classifying the different documents related to uncertainty in different topics. Finally, the uncertainty to be broken down into its possible causes.
Description: En promedio cada año la información disponible en la red se duplica, y como tal, blogs, redes sociales, páginas web, resultan en fuentes de grandes cantidades de información a las cuales se puede acceder por medio de técnicas de Web-Scraping. En los últimos años se han propuesto diversas metodologías para la medición de la incertidumbre a partir del conteo de noticias relacionadas con un conjunto de palabras clave, el presente trabajo sigue de cerca dichas metodologías. Debido a la variedad de opiniones y la cantidad de datos que se pueden obtener, se hace uso del modelado de tópicos que son modelos probabilísticos, que se basan en dos suposiciones: 1) En una gran colección de documentos existen varios grupos o fuentes de texto diferentes, 2) Los textos de diferentes fuentes tienden a usar un vocabulario diferente. En particular se hará uso del algoritmo de Asignación Latente de Dirichlet (LDA), abordando desde la problemática de escoger el número óptimo de tópicos hasta finalmente clasificar los diferentes documentos relacionados con incertidumbre, en diferentes tópicos que permitan descomponer a la Incertidumbre en sus posibles causas.
URI: http://bibdigital.epn.edu.ec/handle/15000/23488
Type: bachelorThesis
Appears in Collections:TIC - Matemática

Files in This Item:
File Description SizeFormat 
CD 12889.pdf1,52 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.