Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://bibdigital.epn.edu.ec/handle/15000/23488
Titel: Modelos estadísticos para la detección de patrones en medio ambiente y economía :
Sonstige Titel: Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning.
Autor(en): Amagua Sandobalin, Gabriel Sebastián
Stichwörter: MATEMÁTICA
MEDIOS SOCIALES
ESTADÍSTICA
MEDIO AMBIENTE
SISTEMA ECONÓMICO
Erscheinungsdatum: Dez-2022
Herausgeber: Quito : EPN, 2022.
Zitierform: Amagua Sandobalin, G.S.(2022).Modelos estadísticos para la detección de patrones en medio ambiente y economía : Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning. 72 páginas. Quito : EPN.
Zusammenfassung: On average each year the information available on the network is duplicated and sources such as blogs, social networks, and web pages generate huge amounts of information that can be accessed through Web-Scraping techniques. In recent years, various methodologies have been proposed for measuring uncertainty based on news counts related to a set of keywords. The present work closely follows these methodologies. I use Topics modeling due to the variety of opinions and the amount of data obtained, which are probabilistic models. These models are based on two assumptions: 1) There are several different groups or text sources in an extensive collection of documents. 2) Texts from different sources tend to use different vocabulary. In particular, the Latent Dirichlet Allocation (LDA) algorithm addresses this work. From the problem of choosing the optimal number of topics to classifying the different documents related to uncertainty in different topics. Finally, the uncertainty to be broken down into its possible causes.
Beschreibung: En promedio cada año la información disponible en la red se duplica, y como tal, blogs, redes sociales, páginas web, resultan en fuentes de grandes cantidades de información a las cuales se puede acceder por medio de técnicas de Web-Scraping. En los últimos años se han propuesto diversas metodologías para la medición de la incertidumbre a partir del conteo de noticias relacionadas con un conjunto de palabras clave, el presente trabajo sigue de cerca dichas metodologías. Debido a la variedad de opiniones y la cantidad de datos que se pueden obtener, se hace uso del modelado de tópicos que son modelos probabilísticos, que se basan en dos suposiciones: 1) En una gran colección de documentos existen varios grupos o fuentes de texto diferentes, 2) Los textos de diferentes fuentes tienden a usar un vocabulario diferente. En particular se hará uso del algoritmo de Asignación Latente de Dirichlet (LDA), abordando desde la problemática de escoger el número óptimo de tópicos hasta finalmente clasificar los diferentes documentos relacionados con incertidumbre, en diferentes tópicos que permitan descomponer a la Incertidumbre en sus posibles causas.
URI: http://bibdigital.epn.edu.ec/handle/15000/23488
Art: bachelorThesis
Enthalten in den Sammlungen:TIC - Matemática

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
CD 12889.pdf1,52 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.