Skip to main content
Top

2021 | OriginalPaper | Chapter

2. Methoden des Data Mining für Big Data Analytics

Authors : Peter Gluchowski, Christian Schieder, Peter Chamoni

Published in: Big Data Analytics

Publisher: Springer Fachmedien Wiesbaden

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

Noch nie wurden derart gewaltige Datenmengen produziert wie in jüngster Zeit. Daraus erwächst die Erwartung, dass sich in den Peta- und Exabyte an Daten interessante Informationen finden lassen, wenn es nur gelingt, dieses gewaltige Volumen zielgerichtet auszuwerten. Sowohl in der Wissenschaft als auch zunehmend in der Praxis werden daher Verfahren und Technologien diskutiert, die interessante Muster in umfangreichen Datenbeständen aufdecken und Prognosen über zukünftige Ereignisse und Gegebenheiten anstellen können. Zahlreiche der hierfür verwendeten Methoden sind unter dem Begriffsgebilde Data Mining bereits seit langer Zeit bekannt, wurden jedoch im Laufe der Jahre ausgebaut und verfeinert. Der vorliegende Beitrag setzt sich das Ziel, die wesentlichen Verfahren zur Datenanalyse im Überblick zu präsentieren und dabei auf die grundlegenden Vorgehensweisen sowie potenzielle Einsatzbereiche einzugehen.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Footnotes
1
Prinzipiell eignen sich Entscheidungsbäume auch zur Erstellung von Regressionsmodellen, wenn die Klassen Intervalle einer stetigen Regressionsvariablen darstellen. Allerdings werden in der Praxis eher die weit entwickelten statistischen Verfahren für diese Aufgabe eingesetzt. Aus diesem Grunde erfolgt hier die Konzentration auf den Einsatz zur Klassifikation.
 
2
Salopp formuliert wird Entropie auch als Maß der Unordnung verstanden.
 
3
Dabei darf es sich bei den betrachteten Attributen nur um kategoriale Attribute handeln.
 
Literature
go back to reference Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499 Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499
go back to reference Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, HobokenMATH Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, HobokenMATH
go back to reference Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412 Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412
go back to reference Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282 Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282
go back to reference Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98CrossRef Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98CrossRef
go back to reference Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, BelmontMATH Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, BelmontMATH
go back to reference Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120 Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120
go back to reference Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg
go back to reference Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg
go back to reference Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York
go back to reference Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54 Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54
go back to reference Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen
go back to reference Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York
go back to reference Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985 Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985
go back to reference Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780CrossRef Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780CrossRef
go back to reference Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244 Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244
go back to reference Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan
go back to reference Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, HobokenMATH Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, HobokenMATH
go back to reference Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada
go back to reference Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434CrossRef Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434CrossRef
go back to reference Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11 Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11
go back to reference Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106 Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106
go back to reference Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo
go back to reference Rojas R (1996) Neural networks. A systematic introduction. Springer, BerlinMATH Rojas R (1996) Neural networks. A systematic introduction. Springer, BerlinMATH
go back to reference Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363 Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363
go back to reference Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland. Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland.
Metadata
Title
Methoden des Data Mining für Big Data Analytics
Authors
Peter Gluchowski
Christian Schieder
Peter Chamoni
Copyright Year
2021
DOI
https://doi.org/10.1007/978-3-658-32236-6_2

Premium Partner