Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25551
Título: Selección de variables a través de máquinas de soporte vectorial dispersas : un enfoque de optimización binivel.
Autor: González Vallejo, Carlos Luis
Director: Merino Rosero, Pedro Martín
Palabras clave: MATEMÁTICAS
OPTIMIZACIÓN BINIVEL
SELECCIÓN DE VARIABLES
APRENDIZAJE AUTOMÁTICO
MÁQUINAS DE SOPORTE VECTORIAL
HIPERPARÁMETROS
Fecha de publicación: ene-2024
Editorial: Quito : EPN, 2024.
Citación: González Vallejo, C.L. (2024). Selección de variables a través de máquinas de soporte vectorial dispersas : un enfoque de optimización binivel. 107 páginas. Quito : EPN.
Resumen: In this thesis, we address the problem of feature selection through Support Vector Machines with mixed regularization (L2 and L1), called (L2L1−SVM). We present a bilevel approach, where the upper and lower-level objective functions are Mean Square Error (MSE) and (L2L1−SVM) respectively. Furthermore, we use smoothed local approximations of the hinge-loss function and L1 norm, with the purpose of getting a smooth objective function in the lower-level problem and applying algorithms that have been widely studied and improved. This bilevel approach allows selecting the most important features for the binary classification problem and at the same time, optimizing the sparse regularization hyperparameter L1, keeping the regularization hyperparameter L2 fixed. We formulate three variants of the bilevel optimization problem, considering the sparse regularization hyperparameter L1 as a scalar, vector, and grouped vector. To characterize the solution of all formulations of the bilevel optimization problem, we use the Karush-Kunh-Tucker conditions. Based on this characterization, we propose an efficient algorithm called BiSVM L-BFGS to find the numerical solution of the different formulations of the bilevel optimization problem. Experimental results demonstrate the effectiveness of the proposed approach, highlighting improvements in model interpretability and the identification of relevant features.
Descripción: En esta tesis, abordamos el problema de selección de variables a través de Maquinas de Soporte Vectorial con regularización mixta (L2 y L1), denominado (L2L1−SVM). Presentamos un enfoque binivel, donde las funciones objetivo del nivel superior e inferior son el Error Cuadrático Medio (MSE) y (L2L1−SVM) respectivamente. Además, usamos aproximaciones locales suavizadas de las funciones hinge-loss y norma L1, con el propósito de tener una función objetivo suave en el problema de nivel inferior y aplicar algoritmos que han sido ampliamente estudiados y mejorados. Este enfoque binivel permite seleccionar las variables más importantes para el problema de clasificación binaria; y a la vez optimizar el hiperparámetro de regularización dispersa L1, manteniendo fijo el hiperparámetro de regularización L2. Formulamos tres variantes del problema de optimización binivel, considerando el hiperparámetro de regularización dispersa L1 como escalar, vectorial y vectorial agrupado. Para caracterizar la solución de todas las formulaciones del problema de optimización binivel, usamos las condiciones Karush-Kunh-Tucker. Con base a esta caracterización, proponemos un algoritmo eficiente llamado BiSVM L-BFGS para encontrar la solución numérica de las diferentes formulaciones del problema de optimización binivel. Los resultados experimentales demuestran la efectividad del enfoque propuesto, destacando mejoras en la interpretabilidad del modelo y la identificación de variables relevantes.
URI: http://bibdigital.epn.edu.ec/handle/15000/25551
Tipo: Trabajo de Integración Curricular
Aparece en las colecciones:Tesis Maestría en Optimización Matemática (FC)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 14048.pdf10,56 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.