Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25218
Título: Fraud detection by analyzing human behavior apply machine learning techniques.
Autor: Sánchez Aguayo, Marco Polo
Director: Urquiza Aguiar, Luis Felipe
Palabras clave: INFORMÁTICA
FRAUDE
CIBERSEGURIDAD
APRENDIZAJE AUTOMÁTICO
MODELADO DE TÓPICOS
COMPORTAMIENTO HUMANO
Fecha de publicación: oct-2023
Editorial: Quito : EPN, 2023.
Citación: Sánchez Aguayo, M.P. (2023). Fraud detection by analyzing human behavior apply machine learning techniques. 230 páginas. Quito : EPN.
Resumen: Currently, we are witnessing a sudden increase in fraud cases around the world, which makes it necessary to adopt proactive strategies to detect indications or suspicions before the crime materializes. Fortunately, the continuous development of computer technologies provides favorable opportunities to combat and mitigate this problem. Text mining and topic modeling are practical tools that, together with theories focused on analyzing this phenomenon, can help identify fraud-related issues and discover fraudulent activities to make accurate decisions. Since tangible information on fraud is limited, several synthetic datasets with phrases based on the fraud triangle theory were generated, which was used to develop the proposed model. To recognize patterns in documents, unsupervised topic modeling techniques were applied, followed by a semi-supervised approach that outperformed unsupervised models and provided superior interpretability; This allowed for establishing a relationship between the resulting topics and the vertices of the fraud triangle and obtaining high probabilities that a document belongs to a specific topic. These probabilities were used to train classification algorithms and predict behavior suspected of fraud, with promising results. Evaluating the model’s applicability to all the generated datasets allowed us to determine that the model was generalizable and, therefore, useful for fraud detection.
Descripción: En la actualidad, estamos presenciando un aumento repentino en los casos de fraude en todo el mundo, lo que hace necesario adoptar estrategias proactivas para detectar indicios o sospechas antes de que se materialice el delito. Afortunadamente, el desarrollo continuo de tecnologías informáticas brinda oportunidades favorables para combatir y mitigar este problema. La minería de textos y el modelado de tópicos son herramientas eficaces que, junto con las teorías enfocadas en el análisis de este fenómeno, pueden ayudar a identificar temas relacionados con el fraude y descubrir actividades fraudulentas para tomar decisiones precisas. Dado que la información tangible sobre el fraude es limitada, se generaron varios conjuntos de datos sintéticos con frases basadas en la teoría del triángulo de fraude, que se utilizó para desarrollar el modelo propuesto. Para reconocer patrones en los documentos, se aplicaron técnicas de modelado de tópicos no supervisadas, seguidas de un enfoque semisupervisado que superó a los modelos no supervisados y proporcionó una interpretabilidad superior. Esto permitió establecer una relación entre los temas resultantes y los vértices del triángulo de fraude, y obtener altas probabilidades de que un documento pertenezca a un tema específico. Estas probabilidades se utilizaron para entrenar algoritmos de clasificación y predecir comportamientos sospechosos de fraude, con resultados prometedores. La evaluación de la aplicabilidad del modelo a todos los conjuntos de datos generados permitió determinar que el modelo era generalizable y, por lo tanto, útil para la detección de fraudes.
URI: http://bibdigital.epn.edu.ec/handle/15000/25218
Tipo: doctoralThesis
Aparece en las colecciones:Tesis Doctorado en Informática (FIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 13876.pdf30,23 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.