Skip to main content

2020 | OriginalPaper | Buchkapitel

4. Detailliertes Fallbeispiel zur Kreditdatenanalyse auf Basis von RStudio

verfasst von : Uwe Rudolf Fingerlos, Guido Golla, Alexander Pastwa, Peter Gluchowski, Roland Gabriel

Erschienen in: Risikoreporting in Finanzinstituten

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Das vorliegende Kapitel beschäftigt sich mit einigen typischen Anwendungsfällen von Data Mining im Bereich des Risikoreportings von Finanzinstituten, die den in Abschn. 2.​4.​2 vorgestellten Phasen 2 und 3 (Datenuntersuchung und Datenaufbereitung), 4 (Modellierung) und 5 (Evaluierung) des CRISP-DM-Vorgehensmodells angesprochenen Problemfeldern nachempfunden sind. Dabei greift es auf die in Abschn. 2.​4.​4 vorgestellten Analyseverfahren (Clusterverfahren, Hauptkomponentenanalysen, lineare und logistische Regressionsanalysen, Entscheidungsbaumverfahren, künstliche neuronale Netze) zurück und zeigt in stark vereinfachter Form mithilfe des Programmpaketes RStudio, wie Teilaspekte der Modellierung von Kreditausfallwahrscheinlichkeiten in der Praxis aussehen könnten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Ist der Minimalwert von Xk nicht negativ (Xk ≥ 0), dann entspricht diese Konstante c dem Absolutbetrag der geringsten von 0 verschiedenen Differenz d (also d ≠ 0) zwischen benachbarten Werten von Xk, wenn Xk aufsteigend oder absteigend sortiert werden: c = abs(d). Ist der Minimalwert von Xk negativ (Xk < 0), dann wird zudem der Absolutbetrag des Minimalwertes der Variable Xk zu d addiert: c = abs(d) + abs(min(Xk)) (vgl. Sauerbrei et al. 2006, S. 3478.).
 
2
Insgesamt existieren, wenn J = 2 gewählt wurde, 8 ⋅ 8 = 64 Kombinationen (Modelle), da B insgesamt 8 Elemente besitzt: B = {−2,   − 1,   − 0, 5,  0,  0, 5,  1,  2,  3}. Von diesen 64 Modellen entfallen 8 Modelle auf Fälle mit bj = bj − 1, d. h. dass die beiden Transformationen F1(Xk) und F2(Xk) identisch sind. Die restlichen 56 Modelle entfallen auf Fälle mit bj ≠ bj − 1, wobei hier jede Parameterkombination zweimal vorkommt, da nur die Reihenfolge der Parameter (Transformationen Fj(Xk)) vertauscht ist und die Modelle deshalb redundant sind. Deshalb sind bei J = 2 insgesamt 8 + 56/2 = 36 verschiedene Modelle zu schätzen (vgl. ausführlich Hosmer et al. 2013, S. 94 ff. und Sauerbrei et al. 2006, S. 3464 ff. Für R bzw. RStudio wurde das Paket mfp entwickelt, das ebenfalls in Sauerbrei et al. 2006 erklärt wird und dessen Beschreibung unter https://​cran.​r-project.​org/​web/​packages/​mfp/​index.​html (10.03.2019) abgerufen werden kann.
 
Literatur
Zurück zum Zitat Akkoç, S. (2012): An empirical comparison of conventional techniques, neural networks and the three stage hybrid Adaptive Neuro Fuzzy Inference System (ANFIS) model for credit scoring analysis: The case of Turkish credit card data, in: European Journal of Operational Research 222, S. 168–178. Akkoç, S. (2012): An empirical comparison of conventional techniques, neural networks and the three stage hybrid Adaptive Neuro Fuzzy Inference System (ANFIS) model for credit scoring analysis: The case of Turkish credit card data, in: European Journal of Operational Research 222, S. 168–178.
Zurück zum Zitat Alexander, C. (2008): Market Risk Analysis Volume I: Quantitative Methods in Finance, John Wiley & Sons, Chichester. Alexander, C. (2008): Market Risk Analysis Volume I: Quantitative Methods in Finance, John Wiley & Sons, Chichester.
Zurück zum Zitat Allison, P. D. (2012): Logistic Regression Using SAS – Theory and Application, 2. Aufl., SAS Institute, Cary. Allison, P. D. (2012): Logistic Regression Using SAS – Theory and Application, 2. Aufl., SAS Institute, Cary.
Zurück zum Zitat Alwosheel, A.; Van Cranenburgh, S.; Chorus, C. G. (2018): Is your dataset big enough? Sample size requirements when using artificial neural networks for discrete choice analysis, in: Journal of Choice Modelling 28 (9), S. 167–182. Alwosheel, A.; Van Cranenburgh, S.; Chorus, C. G. (2018): Is your dataset big enough? Sample size requirements when using artificial neural networks for discrete choice analysis, in: Journal of Choice Modelling 28 (9), S. 167–182.
Zurück zum Zitat Ambler, G.; Royston, P. (2001): Fractional Polynomial Model Selection Procedures: Investigation of Type I Error Rates, in: Journal of Statistical Computation and Simulation 69, S. 89–108. Ambler, G.; Royston, P. (2001): Fractional Polynomial Model Selection Procedures: Investigation of Type I Error Rates, in: Journal of Statistical Computation and Simulation 69, S. 89–108.
Zurück zum Zitat Anders, U.; Szczesny, A. (1998): Prognose von Insolvenzwahrscheinlichkeiten mit Hilfe logistischer neuronaler Netzwerke, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung 50 (10), S. 892–915. Anders, U.; Szczesny, A. (1998): Prognose von Insolvenzwahrscheinlichkeiten mit Hilfe logistischer neuronaler Netzwerke, in: Schmalenbachs Zeitschrift für betriebswirtschaftliche Forschung 50 (10), S. 892–915.
Zurück zum Zitat Angelini, E.; di Tollo, G.; Roli, A. (2008): A neural network approach for credit risk evaluation, in: The Quarterly Review of Economics and Finance 48, S. 733–755. Angelini, E.; di Tollo, G.; Roli, A. (2008): A neural network approach for credit risk evaluation, in: The Quarterly Review of Economics and Finance 48, S. 733–755.
Zurück zum Zitat Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (2016): Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 14. Aufl., Springer Gabler, Heidelberg. Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (2016): Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 14. Aufl., Springer Gabler, Heidelberg.
Zurück zum Zitat Backhaus, K.; Erichson, B.; Weiber, R. (2015): Fortgeschrittene Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 3. Aufl., Springer Gabler, Heidelberg. Backhaus, K.; Erichson, B.; Weiber, R. (2015): Fortgeschrittene Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 3. Aufl., Springer Gabler, Heidelberg.
Zurück zum Zitat Baesens, B. (2014): Analytics in a Big Data World: The Essential Guide to Data Science and its Applications, Wiley, Hoboken. Baesens, B. (2014): Analytics in a Big Data World: The Essential Guide to Data Science and its Applications, Wiley, Hoboken.
Zurück zum Zitat Baesens, B.; Rösch, D.; Scheule, H. (2016): Credit Risk Analytics: Measurement Techniques, Applications, and Examples in SAS, Wiley, Hoboken. Baesens, B.; Rösch, D.; Scheule, H. (2016): Credit Risk Analytics: Measurement Techniques, Applications, and Examples in SAS, Wiley, Hoboken.
Zurück zum Zitat Beck, M. W. (2018): NeuralNetTools: Visualization and Analysis Tools for Neural Networks, in: Journal of Statistical Software 85 (11). Beck, M. W. (2018): NeuralNetTools: Visualization and Analysis Tools for Neural Networks, in: Journal of Statistical Software 85 (11).
Zurück zum Zitat Bishop, C. M. (1995): Neural Networks for Pattern Recognition, Clarendon Press, Oxford. Bishop, C. M. (1995): Neural Networks for Pattern Recognition, Clarendon Press, Oxford.
Zurück zum Zitat Bleymüller, J.; Weißbach, R. (2015): Statistik für Wirtschaftswissenschaftler, 17. Aufl., Vahlen, München. Bleymüller, J.; Weißbach, R. (2015): Statistik für Wirtschaftswissenschaftler, 17. Aufl., Vahlen, München.
Zurück zum Zitat Blochwitz, S.; Hohl, S. (2011): Validation of Banks’ Internal Rating Systems: A Supervisory Perspective, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 247–267. Blochwitz, S.; Hohl, S. (2011): Validation of Banks’ Internal Rating Systems: A Supervisory Perspective, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 247–267.
Zurück zum Zitat Blochwitz, S.; Martin, M. R. W.; Wehn, C. S. (2011): Statistical Approaches to PD Validation, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 293–309. Blochwitz, S.; Martin, M. R. W.; Wehn, C. S. (2011): Statistical Approaches to PD Validation, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 293–309.
Zurück zum Zitat Bortz, J.; Lienert, G. A. (2008): Kurzgefasste Statistik für die Klinische Forschung – Leitfaden für die verteilungsfreie Analyse kleiner Stichproben, 3. Aufl., Springer Medizin Verlag, Heidelberg. Bortz, J.; Lienert, G. A. (2008): Kurzgefasste Statistik für die Klinische Forschung – Leitfaden für die verteilungsfreie Analyse kleiner Stichproben, 3. Aufl., Springer Medizin Verlag, Heidelberg.
Zurück zum Zitat Bortz, J.; Lienert, G. A.; Boehnke, K. (2008): Verteilungsfreie Methoden in der Biostatistik, 3. Aufl., Springer Medizin Verlag, Heidelberg. Bortz, J.; Lienert, G. A.; Boehnke, K. (2008): Verteilungsfreie Methoden in der Biostatistik, 3. Aufl., Springer Medizin Verlag, Heidelberg.
Zurück zum Zitat Bortz, J.; Schuster, C. (2010): Statistik für Human- und Sozialwissenschaftler, 7. Aufl., Springer, Berlin. Bortz, J.; Schuster, C. (2010): Statistik für Human- und Sozialwissenschaftler, 7. Aufl., Springer, Berlin.
Zurück zum Zitat Box, G.E.P.; Cox, D.R. (1964): An Analysis of Transformations, in: Journal of the Royal Statistical Society. Series B (Methodological), 26 (2), S. 211–252. Box, G.E.P.; Cox, D.R. (1964): An Analysis of Transformations, in: Journal of the Royal Statistical Society. Series B (Methodological), 26 (2), S. 211–252.
Zurück zum Zitat Breiman, L.; Friedman, J. H.; Olshen, R. A.; Stone, C. J. (1984): Classification and Regression Trees, Wadsworth International Group, Belmont. Breiman, L.; Friedman, J. H.; Olshen, R. A.; Stone, C. J. (1984): Classification and Regression Trees, Wadsworth International Group, Belmont.
Zurück zum Zitat Brown, I. L. (2014): Developing Credit Risk Models Using SAS Enterprise Miner and SAS/STAT: Theory and Applications, SAS Institute, Cary. Brown, I. L. (2014): Developing Credit Risk Models Using SAS Enterprise Miner and SAS/STAT: Theory and Applications, SAS Institute, Cary.
Zurück zum Zitat Brown, I.; Mues, C. (2012): An experimental comparison of classification algorithms for imbalanced credit scoring data sets, in: Expert Systems with Applications 39, S. 3446–3453. Brown, I.; Mues, C. (2012): An experimental comparison of classification algorithms for imbalanced credit scoring data sets, in: Expert Systems with Applications 39, S. 3446–3453.
Zurück zum Zitat Brown, L. D.; Cai, T.; DasGupta, A. (2001): Interval Estimation for a Binomial Proportion, in: Statistical Science 16 (2), S. 101–117. Brown, L. D.; Cai, T.; DasGupta, A. (2001): Interval Estimation for a Binomial Proportion, in: Statistical Science 16 (2), S. 101–117.
Zurück zum Zitat Cameron, A. C.; Trivedi, P. K. (2005): Microeconometrics – Methods and Applications, Cambridge University Press, Cambridge. Cameron, A. C.; Trivedi, P. K. (2005): Microeconometrics – Methods and Applications, Cambridge University Press, Cambridge.
Zurück zum Zitat Carmona, R. A. (2004): Statistical Analysis of Financial Data in S-Plus, Springer, New York. Carmona, R. A. (2004): Statistical Analysis of Financial Data in S-Plus, Springer, New York.
Zurück zum Zitat Castermans, G.; Martens, D.; Van Gestel, B.; Hamers, B.; Baesens, B. (2010): An overview and framework for PD backtesting and benchmarking, in: Journal of the Operational Research Society 61, S. 359–373. Castermans, G.; Martens, D.; Van Gestel, B.; Hamers, B.; Baesens, B. (2010): An overview and framework for PD backtesting and benchmarking, in: Journal of the Operational Research Society 61, S. 359–373.
Zurück zum Zitat Cottin, C.; Döhler, S. (2013): Risikoanalyse – Modellierung, Beurteilung und Management von Risiken mit Praxisbeispielen, Springer, Wiesbaden. Cottin, C.; Döhler, S. (2013): Risikoanalyse – Modellierung, Beurteilung und Management von Risiken mit Praxisbeispielen, Springer, Wiesbaden.
Zurück zum Zitat Crawley, M. J. (2013): The R Book, 2. Aufl., Wiley & Sons, Chichester. Crawley, M. J. (2013): The R Book, 2. Aufl., Wiley & Sons, Chichester.
Zurück zum Zitat Davidson, R.; MacKinnon, J. G. (2009): Econometric Theory and Methods, International Edition, Oxford University Press, Oxford. Davidson, R.; MacKinnon, J. G. (2009): Econometric Theory and Methods, International Edition, Oxford University Press, Oxford.
Zurück zum Zitat DeTienne, K.; DeTienne, D.; Joshi, S. (2003): Neural Networks as Statistical Tools for Business Researchers, in: Organizational Research Methods 6 (2), S. 236–265. DeTienne, K.; DeTienne, D.; Joshi, S. (2003): Neural Networks as Statistical Tools for Business Researchers, in: Organizational Research Methods 6 (2), S. 236–265.
Zurück zum Zitat Dreiseitl, S.; Ohno-Machado, L. (2002): Logistic regression and artificial neural network classification models: a methodology review, in: Journal of Biomedical Informatics 35, S. 352–359. Dreiseitl, S.; Ohno-Machado, L. (2002): Logistic regression and artificial neural network classification models: a methodology review, in: Journal of Biomedical Informatics 35, S. 352–359.
Zurück zum Zitat Efron, B.; Hastie, T. (2016): Computer Age Statistical Inference – Algorithms, Evidence, and Data Science, Corrected Printing November 10, 2017, Cambridge University Press, Cambridge. Efron, B.; Hastie, T. (2016): Computer Age Statistical Inference – Algorithms, Evidence, and Data Science, Corrected Printing November 10, 2017, Cambridge University Press, Cambridge.
Zurück zum Zitat Eid, M.; Gollwitzer, M.; Schmitt, M. (2017): Statistik und Forschungsmethoden, 5. Aufl., Beltz, Weinheim. Eid, M.; Gollwitzer, M.; Schmitt, M. (2017): Statistik und Forschungsmethoden, 5. Aufl., Beltz, Weinheim.
Zurück zum Zitat EMC (2015): Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, John Wiley & Sons, Indianapolis. EMC (2015): Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, John Wiley & Sons, Indianapolis.
Zurück zum Zitat Engelmann, B. (2011): Measures of a Rating’s Discriminative Power: Applications and Limitations, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 269–291. Engelmann, B. (2011): Measures of a Rating’s Discriminative Power: Applications and Limitations, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 269–291.
Zurück zum Zitat Erlenmeier, U. (2011): The Shadow Rating Approach: Experience from Banking Practice, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 37–74. Erlenmeier, U. (2011): The Shadow Rating Approach: Experience from Banking Practice, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 37–74.
Zurück zum Zitat Field, A.; Miles, J.; Field, Z. (2012): Discovering Statistics Using R, Sage Publications, London. Field, A.; Miles, J.; Field, Z. (2012): Discovering Statistics Using R, Sage Publications, London.
Zurück zum Zitat Garg, A.; Tai, K. (2013): Comparison of statistical and machine learning methods in modelling of data with multicollinearity, in: International Journal of Modelling, Identification and Control 18 (4), S. 295–312. Garg, A.; Tai, K. (2013): Comparison of statistical and machine learning methods in modelling of data with multicollinearity, in: International Journal of Modelling, Identification and Control 18 (4), S. 295–312.
Zurück zum Zitat Greene, W. H. (2012): Econometric Analysis, 7. Aufl., Pearson Education, Boston. Greene, W. H. (2012): Econometric Analysis, 7. Aufl., Pearson Education, Boston.
Zurück zum Zitat Günther, F.; Fritsch, S. (2010): neuralnet: Training of Neural Networks, in: The R Journal 2 (1), S. 30–38. Günther, F.; Fritsch, S. (2010): neuralnet: Training of Neural Networks, in: The R Journal 2 (1), S. 30–38.
Zurück zum Zitat Hamerle, A.; Knapp, M.; Wildenauer, N. (2011): Modelling Loss Given Default: A „Point in Time“-Approach, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 137–150. Hamerle, A.; Knapp, M.; Wildenauer, N. (2011): Modelling Loss Given Default: A „Point in Time“-Approach, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 137–150.
Zurück zum Zitat Hansen, L. K.; Salamon, P. (1990): Neural Network Ensembles, in: IEE Transactions on Pattern Analysis and Machine Intelligence 12 (10), S. 993–1001. Hansen, L. K.; Salamon, P. (1990): Neural Network Ensembles, in: IEE Transactions on Pattern Analysis and Machine Intelligence 12 (10), S. 993–1001.
Zurück zum Zitat Harrell, F. E. Jr. (2015): Regression Modeling Strategies – With Applications to Linear Models, Logistic and Ordinal Regression, and Survival Analysis, 2. Aufl., Springer, Cham. Harrell, F. E. Jr. (2015): Regression Modeling Strategies – With Applications to Linear Models, Logistic and Ordinal Regression, and Survival Analysis, 2. Aufl., Springer, Cham.
Zurück zum Zitat Hastie, T.; Tibshirani, R.; Friedman, J. (2009): The Elements of Statistical Learning – Data Mining, Inference, and Prediction, 2. Aufl., Springer, New York. Hastie, T.; Tibshirani, R.; Friedman, J. (2009): The Elements of Statistical Learning – Data Mining, Inference, and Prediction, 2. Aufl., Springer, New York.
Zurück zum Zitat Hayden, E. (2011): Estimation of a Rating Model for Corporate Exposures, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 13–24. Hayden, E. (2011): Estimation of a Rating Model for Corporate Exposures, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 13–24.
Zurück zum Zitat Hayden, E.; Porath, D. (2011): Statistical Methods to Develop Rating Models, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 1–12. Hayden, E.; Porath, D. (2011): Statistical Methods to Develop Rating Models, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 1–12.
Zurück zum Zitat Hill, R. C.; Griffiths, W. E.; Lim, G. C. (2018): Principles of Econometrics, 5. Aufl., Wiley, Hoboken. Hill, R. C.; Griffiths, W. E.; Lim, G. C. (2018): Principles of Econometrics, 5. Aufl., Wiley, Hoboken.
Zurück zum Zitat Hosmer, D. W. Jr.; Lemeshow, S.; Sturdivant, R. X. (2013): Applied Logistic Regression, 3. Aufl., John Wiley & Sons, Hoboken. Hosmer, D. W. Jr.; Lemeshow, S.; Sturdivant, R. X. (2013): Applied Logistic Regression, 3. Aufl., John Wiley & Sons, Hoboken.
Zurück zum Zitat Jahan, A.; Edwards, K. L. (2015): A state-of-the-art survey on the influence of normalization techniques in ranking: Improving the materials selection process in engineering design, in: Materials and Design 65, S. 335–342. Jahan, A.; Edwards, K. L. (2015): A state-of-the-art survey on the influence of normalization techniques in ranking: Improving the materials selection process in engineering design, in: Materials and Design 65, S. 335–342.
Zurück zum Zitat James, G.; Witten, D.; Hastie, T.; Tibshirani, R. (2013): An Introduction to Statistical Learning with Applications in R, Springer, New York. James, G.; Witten, D.; Hastie, T.; Tibshirani, R. (2013): An Introduction to Statistical Learning with Applications in R, Springer, New York.
Zurück zum Zitat Jayalakshmi, T.; Santhakumaran, A. (2011): Statistical Normalization and Back Propagation for Classification, in: International Journal of Computer Theory and Engineering 3 (1), S. 89–93. Jayalakshmi, T.; Santhakumaran, A. (2011): Statistical Normalization and Back Propagation for Classification, in: International Journal of Computer Theory and Engineering 3 (1), S. 89–93.
Zurück zum Zitat Kennedy, P. (2008): A Guide to Econometrics. 6. Aufl., Blackwell Publishing, Malden. Kennedy, P. (2008): A Guide to Econometrics. 6. Aufl., Blackwell Publishing, Malden.
Zurück zum Zitat Khashman, A. (2010): Neural networks for credit risk evaluation: Investigation of different neural models and learning schemes, in: Expert Systems with Applications 37, S. 6233–6239. Khashman, A. (2010): Neural networks for credit risk evaluation: Investigation of different neural models and learning schemes, in: Expert Systems with Applications 37, S. 6233–6239.
Zurück zum Zitat Khemakhem, S.; Boujelbene, Y. (2017): Artificial Intelligence for Credit Risk Assessment: Artificial Neural Network and Support Vector Machines, in: ACRN Oxford Journal of Finance and Risk Perspectives 6, S. 1–17. Khemakhem, S.; Boujelbene, Y. (2017): Artificial Intelligence for Credit Risk Assessment: Artificial Neural Network and Support Vector Machines, in: ACRN Oxford Journal of Finance and Risk Perspectives 6, S. 1–17.
Zurück zum Zitat Kutner, M. H.; Nachtsheim, C. J.; Neter, J.; Li, W. (2005): Applied Linear Statistical Models, 5. Aufl., McGraw-Hill Irwin, Boston. Kutner, M. H.; Nachtsheim, C. J.; Neter, J.; Li, W. (2005): Applied Linear Statistical Models, 5. Aufl., McGraw-Hill Irwin, Boston.
Zurück zum Zitat Larose, D. T.; Larose, C. D. (2015): Data Mining and Predictive Analytics, 2. Aufl., John Wiley & Sons, Hoboken. Larose, D. T.; Larose, C. D. (2015): Data Mining and Predictive Analytics, 2. Aufl., John Wiley & Sons, Hoboken.
Zurück zum Zitat Lessmann, S.; Baesens, B.; Seow, H.-V.; Thomas, L.C. (2015): Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research, in: European Journal of Operational Research 247, S. 124–136. Lessmann, S.; Baesens, B.; Seow, H.-V.; Thomas, L.C. (2015): Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research, in: European Journal of Operational Research 247, S. 124–136.
Zurück zum Zitat Limpert, E.; Stahel, W. A.; Abbt, M. (2001): Log-normal Distributions across the Sciences: Keys and Clues, in: BioScience 51 (5), S. 341–352. Limpert, E.; Stahel, W. A.; Abbt, M. (2001): Log-normal Distributions across the Sciences: Keys and Clues, in: BioScience 51 (5), S. 341–352.
Zurück zum Zitat Miller, M. B. (2014): Mathematics and Statistics for Financial Risk Management, 2. Aufl., John Wiley & Sons, Hoboken. Miller, M. B. (2014): Mathematics and Statistics for Financial Risk Management, 2. Aufl., John Wiley & Sons, Hoboken.
Zurück zum Zitat Moral, G. (2011): EAD Estimates for Facilities with Explicit Limits, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 201–246. Moral, G. (2011): EAD Estimates for Facilities with Explicit Limits, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 201–246.
Zurück zum Zitat Mosteller, F.; Tukey, J. W. (1977): Data Analysis and Regression: A Second Course in Statistics, Addison Wesley, Reading. Mosteller, F.; Tukey, J. W. (1977): Data Analysis and Regression: A Second Course in Statistics, Addison Wesley, Reading.
Zurück zum Zitat Pindyck, R. S.; Rubinfeld, D. L. (1998): Econometric Models and Economic Forecasts, 4. Aufl., McGraw-Hill, Boston. Pindyck, R. S.; Rubinfeld, D. L. (1998): Econometric Models and Economic Forecasts, 4. Aufl., McGraw-Hill, Boston.
Zurück zum Zitat Pukelsheim, F. (1994): The Three Sigma Rule, in: The American Statistician, Vol. 48 (2), S. 88–91. Pukelsheim, F. (1994): The Three Sigma Rule, in: The American Statistician, Vol. 48 (2), S. 88–91.
Zurück zum Zitat Rauhmeier (2011): PD-Validation: Experience from Banking Practice, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estiimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 311–347. Rauhmeier (2011): PD-Validation: Experience from Banking Practice, in: Engelmann, B.; Rauhmeier, R. (Hrsg.): The Basel II Risk Parameters: Estiimation, Validation, Stress Testing – with Applications to Loan Risk Management, 2. Aufl., Springer, Berlin, S. 311–347.
Zurück zum Zitat Rokach, L.; Maimon, O. (2015): Data Mining with Decision Trees – Theory and Applications, 2. Aufl., World Scientific Publishing, Singapur. Rokach, L.; Maimon, O. (2015): Data Mining with Decision Trees – Theory and Applications, 2. Aufl., World Scientific Publishing, Singapur.
Zurück zum Zitat Sauerbrei, W.; Meier-Hirmer, C.; Benner, A.; Royston, P. (2006): Multivariable regression model building by using fractional polynomials: Description of SAS, STATA and R programs, Computational Statistics & Data Analysis 50, S. 3464–3485. Sauerbrei, W.; Meier-Hirmer, C.; Benner, A.; Royston, P. (2006): Multivariable regression model building by using fractional polynomials: Description of SAS, STATA and R programs, Computational Statistics & Data Analysis 50, S. 3464–3485.
Zurück zum Zitat Scheule, H.; Rösch, D.; Baesens, B. (2017): Credit Risk Analytics: The R Companion, CreateSpace, North Charleston. Scheule, H.; Rösch, D.; Baesens, B. (2017): Credit Risk Analytics: The R Companion, CreateSpace, North Charleston.
Zurück zum Zitat Siddiqi, N. (2017): Intelligent Credit Scoring – Building and Implementing Better Credit Risk Scorecards, 2. Aufl., John Wiley & Sons, Hoboken. Siddiqi, N. (2017): Intelligent Credit Scoring – Building and Implementing Better Credit Risk Scorecards, 2. Aufl., John Wiley & Sons, Hoboken.
Zurück zum Zitat Sola, J.; Sevilla, J. (1997): Importance of Input Data Normalization for the Application of Neural Networks to Complex Industrial Problems, in: IEEE Transactions on Nuclear Science 44 (3), S. 1464–1468. Sola, J.; Sevilla, J. (1997): Importance of Input Data Normalization for the Application of Neural Networks to Complex Industrial Problems, in: IEEE Transactions on Nuclear Science 44 (3), S. 1464–1468.
Zurück zum Zitat Suarez-Alvarez, M. M.; Pham, D.; Prostov, M. Y.; Prostov, Y. I. (2012): Statistical approach to normalization of feature vectors and clustering of mixed datasets, in: Proceedings of The Royal Society A (468), S. 2630–2651. Suarez-Alvarez, M. M.; Pham, D.; Prostov, M. Y.; Prostov, Y. I. (2012): Statistical approach to normalization of feature vectors and clustering of mixed datasets, in: Proceedings of The Royal Society A (468), S. 2630–2651.
Zurück zum Zitat Varian, H. R. (2014): Big Data: New Tricks for Econometrics, Journal of Economic Perspectives 28 (2), S. 3–28. Varian, H. R. (2014): Big Data: New Tricks for Econometrics, Journal of Economic Perspectives 28 (2), S. 3–28.
Zurück zum Zitat Venables, W. N.; Ripley, B. D. (2002): Modern Applied Statistics with S, 4. Aufl., Springer, New York. Venables, W. N.; Ripley, B. D. (2002): Modern Applied Statistics with S, 4. Aufl., Springer, New York.
Zurück zum Zitat Verbeek, M. (2012): A Guide to Modern Econometrics, 4. Aufl., John Wiley & Sons, Chichester. Verbeek, M. (2012): A Guide to Modern Econometrics, 4. Aufl., John Wiley & Sons, Chichester.
Zurück zum Zitat Von Auer, L. (2016): Ökonometrie – Eine Einführung, 7. Aufl., Springer Gabler, Berlin. Von Auer, L. (2016): Ökonometrie – Eine Einführung, 7. Aufl., Springer Gabler, Berlin.
Zurück zum Zitat Von Auer, L.; Hoffmann, S. (2017): Ökonometrie – Das R-Arbeitsbuch, Springer Gabler, Berlin. Von Auer, L.; Hoffmann, S. (2017): Ökonometrie – Das R-Arbeitsbuch, Springer Gabler, Berlin.
Zurück zum Zitat Warner, B./Misra, M. (1996): Understanding Neural Networks as Statistical Tools, in: The American Statistician, 50 (4), S. 284–293. Warner, B./Misra, M. (1996): Understanding Neural Networks as Statistical Tools, in: The American Statistician, 50 (4), S. 284–293.
Zurück zum Zitat West, D. (2000): Neural network credit scoring models, in: Computers & Operations Research 27, S. 1131–1152. West, D. (2000): Neural network credit scoring models, in: Computers & Operations Research 27, S. 1131–1152.
Zurück zum Zitat West, D.; Dellana, S.; Qian, J. (2005): Neural network ensemble strategies for financial decision applications, in: Computers & Operations Research 32, S. 2543–2559. West, D.; Dellana, S.; Qian, J. (2005): Neural network ensemble strategies for financial decision applications, in: Computers & Operations Research 32, S. 2543–2559.
Zurück zum Zitat Wickham, H.; Grolemund, G. (2017): R for Data Science – Import, Tidy, Transform, Visualize, and Model Data, O’Reilly Media, Sebastopol. Wickham, H.; Grolemund, G. (2017): R for Data Science – Import, Tidy, Transform, Visualize, and Model Data, O’Reilly Media, Sebastopol.
Zurück zum Zitat Witten, I. H.; Frank, E.; Hall, M. A. (2011): Data Mining – Practical Machine Learning Tools and Techniques, Morgan Kaufmann, Burlington. Witten, I. H.; Frank, E.; Hall, M. A. (2011): Data Mining – Practical Machine Learning Tools and Techniques, Morgan Kaufmann, Burlington.
Zurück zum Zitat Wooldridge, J. M. (2016): Introductory Econometrics – A Modern Approach. 6. Aufl., Cengage Learning, Boston. Wooldridge, J. M. (2016): Introductory Econometrics – A Modern Approach. 6. Aufl., Cengage Learning, Boston.
Zurück zum Zitat Zhang, G.; Patuwo, B. E.; Hu, M. Y. (1998): Forecasting with artificial neural networks: The state of the art, in: International Journal of Forecasting 14, S. 35–62. Zhang, G.; Patuwo, B. E.; Hu, M. Y. (1998): Forecasting with artificial neural networks: The state of the art, in: International Journal of Forecasting 14, S. 35–62.
Metadaten
Titel
Detailliertes Fallbeispiel zur Kreditdatenanalyse auf Basis von RStudio
verfasst von
Uwe Rudolf Fingerlos
Guido Golla
Alexander Pastwa
Peter Gluchowski
Roland Gabriel
Copyright-Jahr
2020
DOI
https://doi.org/10.1007/978-3-658-28440-4_4