Skip to main content

Tipp

Weitere Kapitel dieses Buchs durch Wischen aufrufen

2021 | OriginalPaper | Buchkapitel

2. Methoden des Data Mining für Big Data Analytics

verfasst von : Peter Gluchowski, Christian Schieder, Peter Chamoni

Erschienen in: Big Data Analytics

Verlag: Springer Fachmedien Wiesbaden

Zusammenfassung

Noch nie wurden derart gewaltige Datenmengen produziert wie in jüngster Zeit. Daraus erwächst die Erwartung, dass sich in den Peta- und Exabyte an Daten interessante Informationen finden lassen, wenn es nur gelingt, dieses gewaltige Volumen zielgerichtet auszuwerten. Sowohl in der Wissenschaft als auch zunehmend in der Praxis werden daher Verfahren und Technologien diskutiert, die interessante Muster in umfangreichen Datenbeständen aufdecken und Prognosen über zukünftige Ereignisse und Gegebenheiten anstellen können. Zahlreiche der hierfür verwendeten Methoden sind unter dem Begriffsgebilde Data Mining bereits seit langer Zeit bekannt, wurden jedoch im Laufe der Jahre ausgebaut und verfeinert. Der vorliegende Beitrag setzt sich das Ziel, die wesentlichen Verfahren zur Datenanalyse im Überblick zu präsentieren und dabei auf die grundlegenden Vorgehensweisen sowie potenzielle Einsatzbereiche einzugehen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Prinzipiell eignen sich Entscheidungsbäume auch zur Erstellung von Regressionsmodellen, wenn die Klassen Intervalle einer stetigen Regressionsvariablen darstellen. Allerdings werden in der Praxis eher die weit entwickelten statistischen Verfahren für diese Aufgabe eingesetzt. Aus diesem Grunde erfolgt hier die Konzentration auf den Einsatz zur Klassifikation.
 
2
Salopp formuliert wird Entropie auch als Maß der Unordnung verstanden.
 
3
Dabei darf es sich bei den betrachteten Attributen nur um kategoriale Attribute handeln.
 
Literatur
Zurück zum Zitat Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499 Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499
Zurück zum Zitat Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, Hoboken MATH Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, Hoboken MATH
Zurück zum Zitat Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412 Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412
Zurück zum Zitat Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282 Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282
Zurück zum Zitat Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98 CrossRef Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98 CrossRef
Zurück zum Zitat Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, Belmont MATH Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, Belmont MATH
Zurück zum Zitat Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120 Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120
Zurück zum Zitat Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg
Zurück zum Zitat Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg
Zurück zum Zitat Dorschel J (2015) Praxishandbuch Big Data. Springer Gabler, Wiesbaden CrossRef Dorschel J (2015) Praxishandbuch Big Data. Springer Gabler, Wiesbaden CrossRef
Zurück zum Zitat Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York
Zurück zum Zitat Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54 Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54
Zurück zum Zitat Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen
Zurück zum Zitat Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York
Zurück zum Zitat Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985 Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985
Zurück zum Zitat Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780 CrossRef Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780 CrossRef
Zurück zum Zitat Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244 Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244
Zurück zum Zitat Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan
Zurück zum Zitat Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, Hoboken MATH Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, Hoboken MATH
Zurück zum Zitat LeCun Y, Bengio Y, Hinton G (2015) Deep learning. Nature 521:436–444 CrossRef LeCun Y, Bengio Y, Hinton G (2015) Deep learning. Nature 521:436–444 CrossRef
Zurück zum Zitat Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada
Zurück zum Zitat McCulloch PW (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133 MathSciNetCrossRef McCulloch PW (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133 MathSciNetCrossRef
Zurück zum Zitat Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434 CrossRef Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434 CrossRef
Zurück zum Zitat Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11 Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11
Zurück zum Zitat Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106 Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106
Zurück zum Zitat Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo
Zurück zum Zitat Rojas R (1996) Neural networks. A systematic introduction. Springer, Berlin MATH Rojas R (1996) Neural networks. A systematic introduction. Springer, Berlin MATH
Zurück zum Zitat Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363 Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363
Zurück zum Zitat Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland. Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland.
Metadaten
Titel
Methoden des Data Mining für Big Data Analytics
verfasst von
Peter Gluchowski
Christian Schieder
Peter Chamoni
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-658-32236-6_2

Premium Partner