Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/19873
Title: Análisis de intereses turísticos utilizando redes sociales en un entorno de big data
Authors: Quishpe Solis, Stalyn Ricardo
Keywords: ANÁLISIS DE DATOS
BIG DATA
REDES SOCIALES
Issue Date: 27-Nov-2018
Publisher: Quito, 2018.
Citation: Quishpe Solis, S. R. (2018). Análisis de intereses turísticos utilizando redes sociales en un entorno de big data. 70 hojas. Quito : EPN.
Abstract: Twitter, the popular microblogging, has more than 320 million users registered nowadays. A big challenge in this project was to use the information collected in Paris, London and New York, to perform a data analysis. The data that was analyzed are: tastes, preferences and opinions about tourist places in the cities mentioned above. Another challenge is to verify this information is accurate for example: coordinates of the tourist places or tweets that mention a tourist place. Since many user’s don´t agree to provide all their personal information in twitter. The applied methodology in this project was “big data harvesting”. The first step of the methodology in question involved giving a correct format to the data. The second step, I collected 16,064,840 tweets from the most populated cities from 20 may to 12 august on 2018. In the third and fourth step, the detection and classification of feelings were performed respectively. The analyzed tweets were classified as: positive and negative. This classification was made with libraries based on NLP (natural language processing). As a final step, the data was analyzed, with the aim of providing information to people or institutions through a web service of the best tourist places in the cities mentioned above. The results obtained represented the recommendations of other users who shared their experiences on twitter, when visiting a tourist place.
Description: Twitter es una plataforma enfocada en el microblogging. Un gran reto en este proyecto fue usar información recolectada en París, Londres y New York, para analizar los datos, y obtener los mejores lugares turísticos de dichas ciudades. Los datos analizados fueron: gustos, preferencias y opiniones acerca de lugares turísticos. Otro reto fue obtener datos relevantes que contengan coordenadas de los lugares turísticos visitados o tuits que los mencionen. Ya que muchos usuarios no están de acuerdo en proporcionar toda su información personal en twitter. La metodología aplicada fue “big data harvesting”. En primer lugar, se dio un correcto formato a los datos. El segundo paso fue la recolección de datos. Con este fin desde la red social twitter se recolectaron 16, 064,840 de tuits en tres ciudades desde el 20 de mayo del 2018 hasta el 12 de agosto de 2018. En el tercer y cuarto paso se realizó la detección y clasificación de sentimientos respectivamente. Los tuits analizados se clasificaron en: positivos y negativos. Esta clasificación se la realizó con librerías basadas en PLN (procesamiento de lenguaje natural). Como paso final se analizó los datos, con el objetivo de entregar a personas o instituciones mediante un servicio web, la información de los mejores lugares turísticos de las ciudades antes mencionadas. Los resultados obtenidos representaron las recomendaciones de otros usuarios que compartieron sus experiencias en twitter, al momento de visitar algún lugar turístico.
URI: http://bibdigital.epn.edu.ec/handle/15000/19873
Appears in Collections:Tesis Sistemas Informáticos y de Computación (ISIS)

Files in This Item:
File Description SizeFormat 
CD-9286.pdf3,44 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.