Skip to main content
Erschienen in: AStA Wirtschafts- und Sozialstatistisches Archiv 2/2017

12.10.2017 | Originalveröffentlichung

Einsatz von Machine-Learning-Verfahren in amtlichen Unternehmensstatistiken

verfasst von: Florian Dumpert, Martin Beck

Erschienen in: AStA Wirtschafts- und Sozialstatistisches Archiv | Ausgabe 2/2017

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Aufgabe der amtlichen Unternehmensstatistiken ist die Bereitstellung von Informationen über Struktur und Entwicklung der Wirtschaft, die sie durch Erhebungen, die Nutzung von Verwaltungsdaten, den Zukauf kommerzieller Daten und die Verknüpfung von Mikrodaten gewinnt. In jüngster Zeit wurde darüber hinaus auch der Einsatz von Machine-Learning-Verfahren in amtlichen Unternehmensstatistiken experimentell erprobt, und zwar bei Zuordnungsentscheidungen und der Generierung neuer Informationen. In diesem Beitrag wird das Vorgehen im Überblick dargestellt. Dazu werden zunächst die Methodik des maschinellen Lernens in den Grundzügen dargestellt, bisherige Anwendungsgebiete außerhalb und in der amtlichen Statistik beschrieben sowie die in der Unternehmensstatistik experimentell eingesetzten Verfahren erläutert. Anschließend wird die praktische Anwendung von Support Vector Machines und Random Forests auf fünf konkrete Aufgabenstellungen in ausgewählten Unternehmensstatistiken dargestellt. Abschließend werden die bisherigen Erfahrungen zusammenfassend bewertet und potenzielle weitere Aufgabenstellungen sowie absehbare Weiterentwicklungen der maschinellen Lernverfahren aufgezeigt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Andere Bereiche des maschinellen Lernens sind das nichtüberwachte Lernen (unsupervised learning), das halbüberwachte Lernen (semisupervised learning) und das ver- oder bestärkende Lernen (reinforcement learning), siehe beispielsweise Russel und Norvig (2012, S. 811).
 
2
Die nachfolgenden Beschreibungen sind im Wesentlichen jedoch auch für Regression oder die Klassifikation mit mehr als zwei möglichen Optionen gültig.
 
3
Bei genauerer Betrachtung ist zu erkennen, dass bislang hauptsächlich auf den Begriff des statistischen Lernens eingegangen wurde. Jede Berechnung einer Regressionsfunktion o. ä. kann im weiteren Sinne als statistisches Lernen bezeichnet werden, erfasst es doch die Informationen im Datensatz um später zu neuen Beobachtungen entsprechende Outputwerte vorherzusagen. Damit wird auch deutlich, dass die vorgestellten Methoden bessere Ergebnisse als die altbewährten liefern können, aber nicht müssen. Der Anteil des „Maschinellen“ wurde hingegen noch nicht verdeutlicht. Dass man von statistischem maschinellen Lernen spricht liegt darin begründet, dass einige der heute unter diesem Begriff firmierenden Methoden vor der Entwicklung entsprechend leistungsstarker Rechner zwar theoretisch denkbar, praktisch jedoch ohne maschinelle Unterstützung nicht oder nicht für große Datenmengen durchführbar waren. Brücken zu den Forschungsgebieten „Big Data“, „Data Mining“, „Künstliche Intelligenz“ und im Hinblick auf die Algorithmen auch zur Informatik könnten an dieser Stelle ohne weiteres geschlagen werden, sollen aber nicht Bestandteil des Aufsatzes sein.
 
4
Auf das pruning kann und soll verzichtet werden, wenn der Baum nicht alleine die Klassifikation vornimmt, sondern Eingang in einen Random Forest findet (Wyner et al. 2017).
 
5
Zu Hintergründen und weiteren Details zu nachfolgendem Abschnitt siehe Dumpert et al. (2016).
 
6
Zu Hintergründen und weiteren Details zu nachfolgendem Abschnitt siehe Feuerhake und Dumpert (2016).
 
7
Der Ansatz, Random Forests zur Identifizierung der für den späteren SVM-Algorithmus heranzuziehenden Variablen zu nutzen, wurde unter anderem auch von Löw et al. (2013) gewählt.
 
8
Zu Hintergründen und weiteren Details zu nachfolgendem Abschnitt siehe Finke et al. (2017).
 
9
Ein alternatives Zielkriterium stellt das sogenannte G‑Maß dar, das geometrische Mittel aus Spezifität und Sensitivität (Kubat et al. 1997).
 
10
In Tab. 7 werden die Mittelwerte für die Berechnungen über zehn verschiedene Aufteilungen des Gesamtmaterials in Trainings- und Testdatensatz angegeben.
 
Literatur
Zurück zum Zitat Bachofer F, Esch T, Klein D (2009) Ableitung von Versiegelungsgraden basierend auf hochaufgelösten Fernerkundungsdaten mittels Support Vector Machines. In: Strobl J, Blaschke T, Griesebner G (Hrsg) Angewandte Geoinformatik. Wichmann, Heidelberg, S 432–441 Bachofer F, Esch T, Klein D (2009) Ableitung von Versiegelungsgraden basierend auf hochaufgelösten Fernerkundungsdaten mittels Support Vector Machines. In: Strobl J, Blaschke T, Griesebner G (Hrsg) Angewandte Geoinformatik. Wichmann, Heidelberg, S 432–441
Zurück zum Zitat Bader-El-Den M, Gaber M (2012) GARF: Towards self-optimised random forests. In: Huang T, Zeng Z, Li C, Leung C‑S (Hrsg) ICONIP 2012, Part II. Springer, Berlin, S 506–515 Bader-El-Den M, Gaber M (2012) GARF: Towards self-optimised random forests. In: Huang T, Zeng Z, Li C, Leung C‑S (Hrsg) ICONIP 2012, Part II. Springer, Berlin, S 506–515
Zurück zum Zitat Baldi P, Brunak S (2001) Bioinformatics. MIT Press, CambridgeMATH Baldi P, Brunak S (2001) Bioinformatics. MIT Press, CambridgeMATH
Zurück zum Zitat Bennett KP, Campbell C (2000) Support vector machines: Hype or hallelujah? SIGKDD Explor Newsl 2:1–13CrossRef Bennett KP, Campbell C (2000) Support vector machines: Hype or hallelujah? SIGKDD Explor Newsl 2:1–13CrossRef
Zurück zum Zitat Boll C, Leppin JS (2015) Die geschlechtsspezifische Lohnlücke in Deutschland: Umfang, Ursachen und Interpretation. Wirtschaftsdienst 95:249–254CrossRef Boll C, Leppin JS (2015) Die geschlechtsspezifische Lohnlücke in Deutschland: Umfang, Ursachen und Interpretation. Wirtschaftsdienst 95:249–254CrossRef
Zurück zum Zitat Boser BE, Guyon IM, Vapnik VN (1992) A training algorithm for optimal margin classifiers. Fifth Annual ACM Workshop on Computational Learning Theory, S 144–152 (Proceedings) Boser BE, Guyon IM, Vapnik VN (1992) A training algorithm for optimal margin classifiers. Fifth Annual ACM Workshop on Computational Learning Theory, S 144–152 (Proceedings)
Zurück zum Zitat Boulesteix A‑L, Janitza S, Kruppa J, König IR (2012) Overview of random forest methodology and practical guidance with emphasis on computational biology and bioinformatics. Wiley Interdiscip Rev Data Min Knowl Discov 2:493–507CrossRef Boulesteix A‑L, Janitza S, Kruppa J, König IR (2012) Overview of random forest methodology and practical guidance with emphasis on computational biology and bioinformatics. Wiley Interdiscip Rev Data Min Knowl Discov 2:493–507CrossRef
Zurück zum Zitat Breiman L, Friedman JH, Olshen RA, Stone CJ (1984) Classification and regression trees. Chapman & Hall/CRC, Boca RatonMATH Breiman L, Friedman JH, Olshen RA, Stone CJ (1984) Classification and regression trees. Chapman & Hall/CRC, Boca RatonMATH
Zurück zum Zitat Carleo G, Troyer M (2017) Solving the quantum many-body problem with artificial neural networks. Science 355:602–606CrossRefMathSciNet Carleo G, Troyer M (2017) Solving the quantum many-body problem with artificial neural networks. Science 355:602–606CrossRefMathSciNet
Zurück zum Zitat Carrasquilla J, Melko RG (2017) Machine learning phases of matter. Nat Phys 13:431–434CrossRef Carrasquilla J, Melko RG (2017) Machine learning phases of matter. Nat Phys 13:431–434CrossRef
Zurück zum Zitat Caruana R, Niculescu-Mizil A (2006) An empirical comparison of supervised learning algorithms. 23rd International Conference on Machine Learning, S 161–168 (Proceedings) Caruana R, Niculescu-Mizil A (2006) An empirical comparison of supervised learning algorithms. 23rd International Conference on Machine Learning, S 161–168 (Proceedings)
Zurück zum Zitat Caruana R, Karampatziakis N, Yessenalina A (2008) An empirical evaluation of supervised learning in high dimensions. 25th International Conference on Machine Learning, S 96–103 (Proceedings) Caruana R, Karampatziakis N, Yessenalina A (2008) An empirical evaluation of supervised learning in high dimensions. 25th International Conference on Machine Learning, S 96–103 (Proceedings)
Zurück zum Zitat Chang X, Lin S‑B, Zhou D‑X (2017) Distributed semi-supervised learning with Kernel Ridge regression. J Mach Learn Res 18:1–22MATHMathSciNet Chang X, Lin S‑B, Zhou D‑X (2017) Distributed semi-supervised learning with Kernel Ridge regression. J Mach Learn Res 18:1–22MATHMathSciNet
Zurück zum Zitat Christmann A, Zhou D‑X (2016a) Learning rates for the risk of kernel based quantile regression estimators in additive models. Analysis Appl 14:449–477MATHMathSciNet Christmann A, Zhou D‑X (2016a) Learning rates for the risk of kernel based quantile regression estimators in additive models. Analysis Appl 14:449–477MATHMathSciNet
Zurück zum Zitat Christmann A, Zhou D‑X (2016b) On the robustness of regularized pairwise learning methods based on kernels. J Complex 37:1–33CrossRefMATHMathSciNet Christmann A, Zhou D‑X (2016b) On the robustness of regularized pairwise learning methods based on kernels. J Complex 37:1–33CrossRefMATHMathSciNet
Zurück zum Zitat Cortes C, Vapnik VN (1995) Support-vector networks. Mach Learn 20:273–297MATH Cortes C, Vapnik VN (1995) Support-vector networks. Mach Learn 20:273–297MATH
Zurück zum Zitat Dubey R, Zhou J, Wang Y, Thompson PM, Ye J (2014) Analysis of sampling techniques for imbalanced data. Neuroimage 87:220–241CrossRef Dubey R, Zhou J, Wang Y, Thompson PM, Ye J (2014) Analysis of sampling techniques for imbalanced data. Neuroimage 87:220–241CrossRef
Zurück zum Zitat Dumpert F, von Eschwege K, Beck M (2016) Einsatz von Support Vector Machines bei der Sektorzuordnung von Unternehmen. WISTA Wirtschaft Stat 2016(1):87–97 Dumpert F, von Eschwege K, Beck M (2016) Einsatz von Support Vector Machines bei der Sektorzuordnung von Unternehmen. WISTA Wirtschaft Stat 2016(1):87–97
Zurück zum Zitat Fawagreh K, Gaber MM, Elyan E (2014) Random forests: From early developments to recent advancements. Syst Sci Control Eng 2:602–609CrossRef Fawagreh K, Gaber MM, Elyan E (2014) Random forests: From early developments to recent advancements. Syst Sci Control Eng 2:602–609CrossRef
Zurück zum Zitat Fernández-Delgado M, Cernadas E, Barro S (2014) Do we need hundreds of classifiers to solve real world classification problems? J Mach Learn Res 15:3133–3181MATHMathSciNet Fernández-Delgado M, Cernadas E, Barro S (2014) Do we need hundreds of classifiers to solve real world classification problems? J Mach Learn Res 15:3133–3181MATHMathSciNet
Zurück zum Zitat Feuerhake J, Dumpert F (2016) Erkennung nicht relevanter Unternehmen in den Handwerksstatistiken. WISTA Wirtschaft Stat 2016(2):79–94 Feuerhake J, Dumpert F (2016) Erkennung nicht relevanter Unternehmen in den Handwerksstatistiken. WISTA Wirtschaft Stat 2016(2):79–94
Zurück zum Zitat Finke C (2011) Verdienstunterschiede zwischen Männern und Frauen. Wirtsch Stat 2011(1):36–48 Finke C (2011) Verdienstunterschiede zwischen Männern und Frauen. Wirtsch Stat 2011(1):36–48
Zurück zum Zitat Finke C, Dumpert F, Beck M (2017) Verdienstunterschiede zwischen Männern und Frauen. WISTA Wirtschaft Stat 2017(2):43–62 Finke C, Dumpert F, Beck M (2017) Verdienstunterschiede zwischen Männern und Frauen. WISTA Wirtschaft Stat 2017(2):43–62
Zurück zum Zitat Gong J, Kim H (2017) RHSBoost: Improving classification performance in imbalance data. Comput Stat Data Analysis 111:1–13CrossRefMathSciNet Gong J, Kim H (2017) RHSBoost: Improving classification performance in imbalance data. Comput Stat Data Analysis 111:1–13CrossRefMathSciNet
Zurück zum Zitat Hable R (2013) Universal consistency of localized versions of regularized kernel methods. J Mach Learn Res 14:111–144MATHMathSciNet Hable R (2013) Universal consistency of localized versions of regularized kernel methods. J Mach Learn Res 14:111–144MATHMathSciNet
Zurück zum Zitat Hamel L (2009) Knowledge discovery with support vector machines. John Wiley & Sons, HobokenCrossRef Hamel L (2009) Knowledge discovery with support vector machines. John Wiley & Sons, HobokenCrossRef
Zurück zum Zitat Himmelreicher R, vom Berge P, Fitzenberger B, Günther R, Müller D (2017) Überlegungen zur Verknüpfung von Daten der Integrierten Erwerbsbiographien (IEB) und der Verdienststrukturerhebung (VSE). RatSWD Working Papers, Bd. 262. Himmelreicher R, vom Berge P, Fitzenberger B, Günther R, Müller D (2017) Überlegungen zur Verknüpfung von Daten der Integrierten Erwerbsbiographien (IEB) und der Verdienststrukturerhebung (VSE). RatSWD Working Papers, Bd. 262.
Zurück zum Zitat James G, Witten D, Hastie T, Tibshirani R (2013) An introduction to statistical learning with applications in R. Springer, New YorkCrossRefMATH James G, Witten D, Hastie T, Tibshirani R (2013) An introduction to statistical learning with applications in R. Springer, New YorkCrossRefMATH
Zurück zum Zitat Jung S, Käuser S (2016) Herausforderungen und Potenziale der Einzeldatenverknüpfung in der Unternehmensstatistik. WISTA Wirtschaft Stat 2016(2):95–106 Jung S, Käuser S (2016) Herausforderungen und Potenziale der Einzeldatenverknüpfung in der Unternehmensstatistik. WISTA Wirtschaft Stat 2016(2):95–106
Zurück zum Zitat Kaus W, Leppert P (2017) Außenhandelsaktive Unternehmen in Deutschland: neue Perspektiven durch Micro data Linking. WISTA Wirtschaft Stat 2017(3):22–38 Kaus W, Leppert P (2017) Außenhandelsaktive Unternehmen in Deutschland: neue Perspektiven durch Micro data Linking. WISTA Wirtschaft Stat 2017(3):22–38
Zurück zum Zitat Kleber B, Sturm R, Tümmler T (2010) Ergebnisse zu Unternehmensgruppen aus dem Unternehmensregister. Wirtsch Stat 2010(6):527–536 Kleber B, Sturm R, Tümmler T (2010) Ergebnisse zu Unternehmensgruppen aus dem Unternehmensregister. Wirtsch Stat 2010(6):527–536
Zurück zum Zitat Kotsiantis SB (2007) Supervised machine learning: A review of classification techniques. Informatica 31:249–268MATHMathSciNet Kotsiantis SB (2007) Supervised machine learning: A review of classification techniques. Informatica 31:249–268MATHMathSciNet
Zurück zum Zitat Kubat M, Holte R, Matwin S (1997) Learning when negative examples abound. In: van Someren M, Widmer G (Hrsg) Machine Learning: ECML-97 1224, S 146–153CrossRef Kubat M, Holte R, Matwin S (1997) Learning when negative examples abound. In: van Someren M, Widmer G (Hrsg) Machine Learning: ECML-97 1224, S 146–153CrossRef
Zurück zum Zitat LeCun Y, Bottou L, Bengio Y, Haffner P (1998) Gradient-based learning applied to document recognition. Proc IEEE 86:2278–2324CrossRef LeCun Y, Bottou L, Bengio Y, Haffner P (1998) Gradient-based learning applied to document recognition. Proc IEEE 86:2278–2324CrossRef
Zurück zum Zitat Lewis DD, Gale WA (1994) A sequential algorithm for training text classifiers. In: Croft WB, von Rijsbergen CJ (Hrsg) Proceedings Seventeenth Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval. Springer, London, S 3–12 Lewis DD, Gale WA (1994) A sequential algorithm for training text classifiers. In: Croft WB, von Rijsbergen CJ (Hrsg) Proceedings Seventeenth Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval. Springer, London, S 3–12
Zurück zum Zitat Lin W‑J, Chen JJ (2012) Class-imbalanced classifiers for high-dimensional data. Brief Bioinformatics 14:13–26CrossRef Lin W‑J, Chen JJ (2012) Class-imbalanced classifiers for high-dimensional data. Brief Bioinformatics 14:13–26CrossRef
Zurück zum Zitat Lorenz R, Opfermann R (2017) Verwaltungsdaten in der Unternehmensstatistik. WISTA Wirtschaft Stat 2017(1):49–66 Lorenz R, Opfermann R (2017) Verwaltungsdaten in der Unternehmensstatistik. WISTA Wirtschaft Stat 2017(1):49–66
Zurück zum Zitat Löw F, Michel U, Dech S, Conrad C (2013) Impact of feature selection on the accuracy and spatial uncertainty op per-field crop classification using support vector machines. ISPRS J Photogramm Remote Sens 85:102–119CrossRef Löw F, Michel U, Dech S, Conrad C (2013) Impact of feature selection on the accuracy and spatial uncertainty op per-field crop classification using support vector machines. ISPRS J Photogramm Remote Sens 85:102–119CrossRef
Zurück zum Zitat Meister M, Steinwart I (2016) Optimal learning rates for localized SVMs. J Mach Learn Res 17:1–44MATHMathSciNet Meister M, Steinwart I (2016) Optimal learning rates for localized SVMs. J Mach Learn Res 17:1–44MATHMathSciNet
Zurück zum Zitat Mindestlohnkommission (2016) Erster Bericht zu den Auswirkungen des gesetzlichen Mindestlohns. Bericht der Mindestlohnkommission an die Bundesregierung nach § 9 Abs. 4 Mindestlohngesetz Mindestlohnkommission (2016) Erster Bericht zu den Auswirkungen des gesetzlichen Mindestlohns. Bericht der Mindestlohnkommission an die Bundesregierung nach § 9 Abs. 4 Mindestlohngesetz
Zurück zum Zitat van Renterghem P, Sottas P‑E, Saugy M, van Eenoo P (2013) Statistical discrimination of steroid profiles in doping control with support vector machines. Anal Chim Acta 768:41–48CrossRef van Renterghem P, Sottas P‑E, Saugy M, van Eenoo P (2013) Statistical discrimination of steroid profiles in doping control with support vector machines. Anal Chim Acta 768:41–48CrossRef
Zurück zum Zitat van Rijsbergen CJ (1979) Foundation of evaluation. J Documentation 30:365–373CrossRef van Rijsbergen CJ (1979) Foundation of evaluation. J Documentation 30:365–373CrossRef
Zurück zum Zitat Rosenski N (2012) Die wirtschaftliche Bedeutung des Dritten Sektors. Wirtsch Stat 2012(3):209–217 Rosenski N (2012) Die wirtschaftliche Bedeutung des Dritten Sektors. Wirtsch Stat 2012(3):209–217
Zurück zum Zitat Russel S, Norvig P (2012) Künstliche Intelligenz, 3. Aufl. Pearson, München Russel S, Norvig P (2012) Künstliche Intelligenz, 3. Aufl. Pearson, München
Zurück zum Zitat Schaathun HG (2012) Machine learning in image steganalysis. John Wiley & Sons, ChichesterCrossRef Schaathun HG (2012) Machine learning in image steganalysis. John Wiley & Sons, ChichesterCrossRef
Zurück zum Zitat Schölkopf B, Smola AJ (2002) Learning with Kernels. MIT Press, CambridgeMATH Schölkopf B, Smola AJ (2002) Learning with Kernels. MIT Press, CambridgeMATH
Zurück zum Zitat Simon HA (1983) Why should machines learn? In: Michalski RS, Carbonell JG, Mitchell TM (Hrsg) Machine learning: An artificial intelligence approach. Tioga Press, Palo Alto, S 25–38 Simon HA (1983) Why should machines learn? In: Michalski RS, Carbonell JG, Mitchell TM (Hrsg) Machine learning: An artificial intelligence approach. Tioga Press, Palo Alto, S 25–38
Zurück zum Zitat Singh KP, Basant N, Gupta S (2011) Support vector machines in water quality management. Anal Chim Acta 703:152–162CrossRef Singh KP, Basant N, Gupta S (2011) Support vector machines in water quality management. Anal Chim Acta 703:152–162CrossRef
Zurück zum Zitat Steinwart I, Christmann A (2008) Support vector machines. Springer, New YorkMATH Steinwart I, Christmann A (2008) Support vector machines. Springer, New YorkMATH
Zurück zum Zitat Sturm R, Tümmler T (2006) Das statistische Unternehmensregister – Entwicklungsstand und Perspektiven. Wirtsch Stat 2006(10):1021–1036 Sturm R, Tümmler T (2006) Das statistische Unternehmensregister – Entwicklungsstand und Perspektiven. Wirtsch Stat 2006(10):1021–1036
Zurück zum Zitat Wainberg M, Alipanahi B, Frey BJ (2016) Are random forests truly the best classifiers? J Mach Learn Res 17:1–5MathSciNet Wainberg M, Alipanahi B, Frey BJ (2016) Are random forests truly the best classifiers? J Mach Learn Res 17:1–5MathSciNet
Zurück zum Zitat Wang L (2016) Discovering phase transitions with unsupervised learning. Phys Rev B 94:195105-1–195105-5 Wang L (2016) Discovering phase transitions with unsupervised learning. Phys Rev B 94:195105-1–195105-5
Zurück zum Zitat Wyner AJ, Olson M, Bleich J (2017) Explaining the success of AdaBoost and random forests as interpolating classifiers. J Mach Learn Res 18:1–33MATHMathSciNet Wyner AJ, Olson M, Bleich J (2017) Explaining the success of AdaBoost and random forests as interpolating classifiers. J Mach Learn Res 18:1–33MATHMathSciNet
Zurück zum Zitat Xu B, Huang JZ, Williams G, Li MJ, Ye Y (2012a) Hybrid random forests: Advantages of mixed trees in classifying text data. In: Tan P‑N, Chawla S, Ho CK, Bailey J (Hrsg) PAKDD 2012, Part I. Springer, Berlin, S 147–158 Xu B, Huang JZ, Williams G, Li MJ, Ye Y (2012a) Hybrid random forests: Advantages of mixed trees in classifying text data. In: Tan P‑N, Chawla S, Ho CK, Bailey J (Hrsg) PAKDD 2012, Part I. Springer, Berlin, S 147–158
Zurück zum Zitat Xu B, Huang JZ, Williams G, Wang Q, Ye Y (2012b) Classifying very high-dimensional data with random forests built from small subspaces. Int J Data Warehous Min 8:44–63CrossRef Xu B, Huang JZ, Williams G, Wang Q, Ye Y (2012b) Classifying very high-dimensional data with random forests built from small subspaces. Int J Data Warehous Min 8:44–63CrossRef
Zurück zum Zitat Yu L, Wang S, Lai KK, Zhou L (2008) Bio-inspired credit risk analysis. Springer, BerlinCrossRef Yu L, Wang S, Lai KK, Zhou L (2008) Bio-inspired credit risk analysis. Springer, BerlinCrossRef
Metadaten
Titel
Einsatz von Machine-Learning-Verfahren in amtlichen Unternehmensstatistiken
verfasst von
Florian Dumpert
Martin Beck
Publikationsdatum
12.10.2017
Verlag
Springer Berlin Heidelberg
Erschienen in
AStA Wirtschafts- und Sozialstatistisches Archiv / Ausgabe 2/2017
Print ISSN: 1863-8155
Elektronische ISSN: 1863-8163
DOI
https://doi.org/10.1007/s11943-017-0208-6

Weitere Artikel der Ausgabe 2/2017

AStA Wirtschafts- und Sozialstatistisches Archiv 2/2017 Zur Ausgabe

Originalveröffentlichung

Governance der amtlichen Statistik

Editorial

Editorial