Skip to main content

2022 | OriginalPaper | Buchkapitel

An Analysis of Different Variable Selection Methods in the Context of a Banking Institution

verfasst von : Jaime Velázquez Juárez, Ana Elisa Lage Ramírez

Erschienen in: Industrial Engineering and Operations Management

Verlag: Springer International Publishing

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

Variable selection has become important in some research areas such as data science and analytics, in which datasets with hundreds or even thousands of variables are what is available for model development. Among the objectives of variable selection, also called feature selection, is to improve the predictive capacity of input variables, as well as to provide faster and cost-effective predictors. A greater number of variables theoretically allow more information to be stored, but in practice this rarely happens due to the greater possibility of noise and redundancy in real-world data. Similarly, working with large data sets implies greater computational capacity and the principle of parsimony is no longer fulfilled. In this article, we use different methods for selecting variables, such as Gini, R2, LASSO, and LARS to select variables in the context of predicting the probability of default of a mortgage loan database. A systematic way for variable selection is used taking advantage of the characteristics of the different selection methods.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
2.
Zurück zum Zitat Gualdrón Guerrero, O.E.: Artist, Desarrollo de diferentes métodos de selección de variables para sistemas multisensoriales. [Art]. Universitat Rovira i Virgili (2006) Gualdrón Guerrero, O.E.: Artist, Desarrollo de diferentes métodos de selección de variables para sistemas multisensoriales. [Art]. Universitat Rovira i Virgili (2006)
3.
Zurück zum Zitat Kuhn, M., Johnson, K.: Applied Predictive Modeling, vol. 26, p. 13. Springer, New York (2013)CrossRefMATH Kuhn, M., Johnson, K.: Applied Predictive Modeling, vol. 26, p. 13. Springer, New York (2013)CrossRefMATH
4.
Zurück zum Zitat Cai, J., Luo, J., Wang, S., Yang, S.: Feature selection in machine learning: a new perspective. Neurocomputing. 300, 70–79 (2018)CrossRef Cai, J., Luo, J., Wang, S., Yang, S.: Feature selection in machine learning: a new perspective. Neurocomputing. 300, 70–79 (2018)CrossRef
5.
Zurück zum Zitat Nembrini, S., König, I.R., Wright, M.N.: The revival of the Gini importance? Bioinformatics. 34(21), 3711–3718 (2018)CrossRef Nembrini, S., König, I.R., Wright, M.N.: The revival of the Gini importance? Bioinformatics. 34(21), 3711–3718 (2018)CrossRef
6.
Zurück zum Zitat Strobl, C., Boulesteix, A.: Bias in random forest variable importance measures: illustrations, sources, and a solution. BMC Bioinf. 8, 25 (2007)CrossRef Strobl, C., Boulesteix, A.: Bias in random forest variable importance measures: illustrations, sources, and a solution. BMC Bioinf. 8, 25 (2007)CrossRef
7.
Zurück zum Zitat Nicodemus, K.: On the stability and ranking of predictors from random forest variable importance measures. Brief. Bioinform. 12(4), 369–373 (2011)CrossRef Nicodemus, K.: On the stability and ranking of predictors from random forest variable importance measures. Brief. Bioinform. 12(4), 369–373 (2011)CrossRef
10.
Zurück zum Zitat Kunhn, M., Johnson, K.: Feature Engineering and Selection: A Practical Approach for Predictive Models. CRC Press, Boca Raton (2019)CrossRef Kunhn, M., Johnson, K.: Feature Engineering and Selection: A Practical Approach for Predictive Models. CRC Press, Boca Raton (2019)CrossRef
11.
Zurück zum Zitat Fraiman, R., Justel, A., Svarc, M.: Selection of variables for cluster analysis and classification rules. J. Am. Stat. Assoc. 103(483), 1294–1303 (2008)MathSciNetCrossRefMATH Fraiman, R., Justel, A., Svarc, M.: Selection of variables for cluster analysis and classification rules. J. Am. Stat. Assoc. 103(483), 1294–1303 (2008)MathSciNetCrossRefMATH
12.
Zurück zum Zitat Fowlkes, E., Gnanadesikan, R., Kettenring, J.: Variable selection clustering. J. Classif. 5, 205–228 (1988)MathSciNetCrossRef Fowlkes, E., Gnanadesikan, R., Kettenring, J.: Variable selection clustering. J. Classif. 5, 205–228 (1988)MathSciNetCrossRef
13.
Zurück zum Zitat Hastie, T., Friedman, J.H., Tibshirani, R.: The Elements of Statistical Learning, Segunda ed. Springer, New York (2009)CrossRefMATH Hastie, T., Friedman, J.H., Tibshirani, R.: The Elements of Statistical Learning, Segunda ed. Springer, New York (2009)CrossRefMATH
14.
Zurück zum Zitat Tibshirani, R.: Regression shrinkage and selection via the Lasso. J. R. Stat. Soc. 58(1), 267–288 (1996)MathSciNetMATH Tibshirani, R.: Regression shrinkage and selection via the Lasso. J. R. Stat. Soc. 58(1), 267–288 (1996)MathSciNetMATH
16.
Zurück zum Zitat Wubetie, H.: Application of variable selection and dimension reduction on predictors of MSE’s development. J. Big Data. 6, 6–17 (2019)CrossRef Wubetie, H.: Application of variable selection and dimension reduction on predictors of MSE’s development. J. Big Data. 6, 6–17 (2019)CrossRef
Metadaten
Titel
An Analysis of Different Variable Selection Methods in the Context of a Banking Institution
verfasst von
Jaime Velázquez Juárez
Ana Elisa Lage Ramírez
Copyright-Jahr
2022
DOI
https://doi.org/10.1007/978-3-031-14763-0_33