Por favor, use este identificador para citar o enlazar este ítem:
http://bibdigital.epn.edu.ec/handle/15000/23488
Título: | Modelos estadísticos para la detección de patrones en medio ambiente y economía : |
Otros títulos: | Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning. |
Autor: | Amagua Sandobalin, Gabriel Sebastián |
Palabras clave: | MATEMÁTICA MEDIOS SOCIALES ESTADÍSTICA MEDIO AMBIENTE SISTEMA ECONÓMICO |
Fecha de publicación: | dic-2022 |
Editorial: | Quito : EPN, 2022. |
Citación: | Amagua Sandobalin, G.S.(2022).Modelos estadísticos para la detección de patrones en medio ambiente y economía : Medición de incertidumbre política económica del Ecuador a partir del uso de técnicas de machine learning. 72 páginas. Quito : EPN. |
Resumen: | On average each year the information available on the network is duplicated and sources such as blogs, social networks, and web pages generate huge amounts of information that can be accessed through Web-Scraping techniques. In recent years, various methodologies have been proposed for measuring uncertainty based on news counts related to a set of keywords. The present work closely follows these methodologies. I use Topics modeling due to the variety of opinions and the amount of data obtained, which are probabilistic models. These models are based on two assumptions: 1) There are several different groups or text sources in an extensive collection of documents. 2) Texts from different sources tend to use different vocabulary. In particular, the Latent Dirichlet Allocation (LDA) algorithm addresses this work. From the problem of choosing the optimal number of topics to classifying the different documents related to uncertainty in different topics. Finally, the uncertainty to be broken down into its possible causes. |
Descripción: | En promedio cada año la información disponible en la red se duplica, y como tal, blogs, redes sociales, páginas web, resultan en fuentes de grandes cantidades de información a las cuales se puede acceder por medio de técnicas de Web-Scraping. En los últimos años se han propuesto diversas metodologías para la medición de la incertidumbre a partir del conteo de noticias relacionadas con un conjunto de palabras clave, el presente trabajo sigue de cerca dichas metodologías. Debido a la variedad de opiniones y la cantidad de datos que se pueden obtener, se hace uso del modelado de tópicos que son modelos probabilísticos, que se basan en dos suposiciones: 1) En una gran colección de documentos existen varios grupos o fuentes de texto diferentes, 2) Los textos de diferentes fuentes tienden a usar un vocabulario diferente. En particular se hará uso del algoritmo de Asignación Latente de Dirichlet (LDA), abordando desde la problemática de escoger el número óptimo de tópicos hasta finalmente clasificar los diferentes documentos relacionados con incertidumbre, en diferentes tópicos que permitan descomponer a la Incertidumbre en sus posibles causas. |
URI: | http://bibdigital.epn.edu.ec/handle/15000/23488 |
Tipo: | bachelorThesis |
Aparece en las colecciones: | TIC - Matemática |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
CD 12889.pdf | 1,52 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.