Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen:
http://bibdigital.epn.edu.ec/handle/15000/25551
Titel: | Selección de variables a través de máquinas de soporte vectorial dispersas : un enfoque de optimización binivel. |
Autor(en): | González Vallejo, Carlos Luis |
Regisseur: | Merino Rosero, Pedro Martín |
Stichwörter: | MATEMÁTICAS OPTIMIZACIÓN BINIVEL SELECCIÓN DE VARIABLES APRENDIZAJE AUTOMÁTICO MÁQUINAS DE SOPORTE VECTORIAL HIPERPARÁMETROS |
Erscheinungsdatum: | Jan-2024 |
Herausgeber: | Quito : EPN, 2024. |
Zitierform: | González Vallejo, C.L. (2024). Selección de variables a través de máquinas de soporte vectorial dispersas : un enfoque de optimización binivel. 107 páginas. Quito : EPN. |
Zusammenfassung: | In this thesis, we address the problem of feature selection through Support Vector Machines with mixed regularization (L2 and L1), called (L2L1−SVM). We present a bilevel approach, where the upper and lower-level objective functions are Mean Square Error (MSE) and (L2L1−SVM) respectively. Furthermore, we use smoothed local approximations of the hinge-loss function and L1 norm, with the purpose of getting a smooth objective function in the lower-level problem and applying algorithms that have been widely studied and improved. This bilevel approach allows selecting the most important features for the binary classification problem and at the same time, optimizing the sparse regularization hyperparameter L1, keeping the regularization hyperparameter L2 fixed. We formulate three variants of the bilevel optimization problem, considering the sparse regularization hyperparameter L1 as a scalar, vector, and grouped vector. To characterize the solution of all formulations of the bilevel optimization problem, we use the Karush-Kunh-Tucker conditions. Based on this characterization, we propose an efficient algorithm called BiSVM L-BFGS to find the numerical solution of the different formulations of the bilevel optimization problem. Experimental results demonstrate the effectiveness of the proposed approach, highlighting improvements in model interpretability and the identification of relevant features. |
Beschreibung: | En esta tesis, abordamos el problema de selección de variables a través de Maquinas de Soporte Vectorial con regularización mixta (L2 y L1), denominado (L2L1−SVM). Presentamos un enfoque binivel, donde las funciones objetivo del nivel superior e inferior son el Error Cuadrático Medio (MSE) y (L2L1−SVM) respectivamente. Además, usamos aproximaciones locales suavizadas de las funciones hinge-loss y norma L1, con el propósito de tener una función objetivo suave en el problema de nivel inferior y aplicar algoritmos que han sido ampliamente estudiados y mejorados. Este enfoque binivel permite seleccionar las variables más importantes para el problema de clasificación binaria; y a la vez optimizar el hiperparámetro de regularización dispersa L1, manteniendo fijo el hiperparámetro de regularización L2. Formulamos tres variantes del problema de optimización binivel, considerando el hiperparámetro de regularización dispersa L1 como escalar, vectorial y vectorial agrupado. Para caracterizar la solución de todas las formulaciones del problema de optimización binivel, usamos las condiciones Karush-Kunh-Tucker. Con base a esta caracterización, proponemos un algoritmo eficiente llamado BiSVM L-BFGS para encontrar la solución numérica de las diferentes formulaciones del problema de optimización binivel. Los resultados experimentales demuestran la efectividad del enfoque propuesto, destacando mejoras en la interpretabilidad del modelo y la identificación de variables relevantes. |
URI: | http://bibdigital.epn.edu.ec/handle/15000/25551 |
Art: | Trabajo de Integración Curricular |
Enthalten in den Sammlungen: | Tesis Maestría en Optimización Matemática (FC) |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
CD 14048.pdf | 10,56 MB | Adobe PDF | Öffnen/Anzeigen |
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.