Skip to main content
Top

2018 | Book

Data Science – was ist das eigentlich?!

Algorithmen des maschinellen Lernens verständlich erklärt

Authors: Annalyn Ng, Kenneth Soo

Publisher: Springer Berlin Heidelberg

insite
SEARCH

About this book

Sie möchten endlich wissen, was sich hinter Schlagworten wie „Data Science“ und „Machine Learning“ eigentlich verbirgt – und was man alles damit anstellen kann? Auf allzu viel Mathematik würden Sie dabei aber gern verzichten? Dann sind Sie hier genau richtig: Dieses Buch bietet einen kompakten Einblick in die wichtigsten Schlüsselkonzepte der Datenwissenschaft und ihrer Algorithmen – und zwar ohne Sie mit mathematischen Formeln und Details zu belasten!

Der Fokus liegt – nach einer übergeordneten Einführung – auf Anwendungen des maschinellen Lernens zur Mustererkennung und Vorhersage von Ergebnissen: In jedem Kapitel wird ein Algorithmus erläutert und mit einem leicht verständlichen, realen Anwendungsbeispiel verknüpft. Die Kombination aus intuitiven Erklärungen und zahlreichen Abbildungen ermöglicht dabei ein grundlegendes Verständnis, das ohne mathematische Formelsprache auskommt. Abschließend werden auch die Grenzen und Nachteile der betrachteten Algorithmen explizit aufgezeigt.

Table of Contents

Frontmatter
Kapitel 1. Das Wichtigste in Kürze …
Zusammenfassung
… aber so kurz dann auch wieder nicht. Um wirklich verstehen zu können, wie die Data-Science-Algorithmen funktionieren, müssen wir bei den Grundlagen beginnen. Daher ist diese Einleitung das längste Kapitel in diesem Buch, etwa doppelt so lang wie die übrigen Kapitel, welche die einzelnen Algorithmen vorstellen. Dafür gewinnen Sie aber mit dieser Einleitung auch einen soliden Überblick über die fundamentalen Schritte, die praktisch im gesamten Data-Science-Bereich immer wieder auftauchen. Wenn Sie diese grundlegenden Prozesse kennen, können Sie für Ihre Untersuchungen geeignete Algorithmen auswählen und auch deren Grenzen abschätzen.
Annalyn Ng, Kenneth Soo
Kapitel 2. k-Means-Clustering
Zusammenfassung
Lassen Sie uns über Filme reden. Vielleicht haben Sie eine Freundin, die 50 erste Dates geliebt hat – dann ist es ziemlich wahrscheinlich, dass sie auch andere Schnulzen wie 27 Dresses gern sieht. So funktioniert Clustering: Man ermittelt gemeinsame Vorlieben oder Eigenschaften von Personen und teilt diese dann in Gruppen, die man zum Beispiel mit auf sie zugeschnittenen Werbekampagnen anspricht.
Annalyn Ng, Kenneth Soo
Kapitel 3. Hauptkomponentenanalyse
Zusammenfassung
Stellen Sie sich vor, Sie sind Ernährungsberater. Wie lassen sich Speisen am besten aufschlüsseln? Nach ihrem Vitamingehalt? Den enthaltenen Proteinen? Oder vielleicht nach einer Kombination von beidem?
Annalyn Ng, Kenneth Soo
Kapitel 4. Assoziationsanalyse
Zusammenfassung
Wenn Sie einkaufen gehen, haben Sie vermutlich eine Liste dabei, auf der steht, was Sie so alles benötigen – entsprechend Ihren Bedürfnissen und Vorlieben. Modernen Haushalte bevorzugen vielleicht eher gesunde Zutaten für das Essen der Familie, während Studenten sich möglicherweise lieber mit Bier und Chips versorgen. Solche Muster zu erkennen, kann die Verkaufszahlen in mehrerlei Hinsicht steigern.
Annalyn Ng, Kenneth Soo
Kapitel 5. Soziale Netzwerkanalyse
Zusammenfassung
Die meisten von uns gehören zu einer Reihe von sozialen Zirkeln, etwa aus Verwandten, Kollegen oder Schulfreunden. Um zu untersuchen, wie diese Leute zueinander in Beziehung stehen, welche Individuen besonders prominent sind oder wie die Gruppendynamik abläuft, können wir eine Methode namens Soziale Netzwerkanalyse (SNA) anwenden. Potenzielle Anwendungen der SNA liegen in viralem Marketing, der Modellierung von Epidemien oder auch bei Strategien für Mannschaftsspiele.
Annalyn Ng, Kenneth Soo
Kapitel 6. Regressionsanalyse
Zusammenfassung
Trendlinien sind ein beliebtes Werkzeug für die Vorhersage von Datenwerten, da sie leicht zu ermitteln und zu verstehen sind. Sie brauchen nur einen Blick in Ihre Tageszeitung zu werfen, schon sehen Sie Trendlinien für Aktienkurse, Wassertemperaturen und alles Mögliche andere.
Annalyn Ng, Kenneth Soo
Kapitel 7. k-nächste Nachbarn und Ausreißererkennung
Zusammenfassung
Lassen Sie uns über Wein reden. Haben Sie sich jemals gefragt, worin eigentlich der wahre Unterschied zwischen Rot- und Weißwein besteht?
Annalyn Ng, Kenneth Soo
Kapitel 8. Support-Vektor-Maschine
Zusammenfassung
Medizinische Diagnosen sind ein komplexes und schwieriges Thema. Unzählige Symptome müssen berücksichtigt werden, und der ganze Prozess kann von subjektiven Vorlieben der Ärztinnen und Ärzte beeinflusst werden. Manchmal gelingt die richtige Diagnose erst, wenn es schon zu spät ist.
Annalyn Ng, Kenneth Soo
Kapitel 9. Entscheidungsbaum
Zusammenfassung
Bei einer Katastrophe wird bestimmten Gruppen von Menschen – etwa Frauen und Kindern – möglicherweise vorrangig geholfen, wodurch sie eine größere Überlebenswahrscheinlichkeit haben. In solchen Situationen können wir mit Entscheidungsbäumen bestimmen, mit welcher Wahrscheinlichkeit die verschiedenen Gruppen überleben.
Annalyn Ng, Kenneth Soo
Kapitel 10. Random Forests
Zusammenfassung
Kann ganz oft falsch richtig sein? Ja! Obwohl es der Intuition zuwiderläuft, ist dies bei einigen der besten Vorhersagemodelle nicht nur möglich – sondern sogar zu erwarten. Hinter diesem Bonmot steckt die Einsicht, dass es zwar immer viele falsche Vorhersagen, aber nur eine korrekte gibt. Wenn wir Modelle mit unterschiedlichen Stärken und Schwächen kombinieren, bestärken diejenigen mit zutreffenden Vorhersagen einander, während sich die falschen Vorhersagen gegenseitig aufheben. Die Idee, durch die Kombination von Modellen die Vorhersagegenauigkeit zu verbessern, ist als Ensembling oder Ensemble-Lernen bekannt.
Annalyn Ng, Kenneth Soo
Kapitel 11. Neuronale Netze
Zusammenfassung
Es dürfte Ihnen keine Schwierigkeiten bereiten, auf einem Bild eine – schwer übergewichtige – Giraffe zu erkennen. Das menschliche Gehirn mit seinen rund 80 Mrd. Neuronen hat die bemerkenswerte Fähigkeit, Objekte auch dann problemlos richtig zu klassifizieren, wenn sie deutlich anders aussehen als gewohnt. Diese Neuronen verarbeiten Input-Signale, zum Beispiel das Bild einer dicken Giraffe, zu einem Output – im Beispiel das Etikett „(trotzdem) Giraffe“. Die Funktionsweise der Neuronennetzwerke in unserem Gehirn ist das Vorbild für den Algorithmus der neuronalen Netze.
Annalyn Ng, Kenneth Soo
Kapitel 12. A/B-Tests und vielarmige Banditen
Zusammenfassung
Stellen Sie sich vor, Sie betreiben einen Onlineshop und möchten eine Anzeige schalten, um die Leute auf eine Rabattaktion aufmerksam zu machen. Welche Formulierung würden sie wählen?
Annalyn Ng, Kenneth Soo
Backmatter
Metadata
Title
Data Science – was ist das eigentlich?!
Authors
Annalyn Ng
Kenneth Soo
Copyright Year
2018
Publisher
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-56776-0
Print ISBN
978-3-662-56775-3
DOI
https://doi.org/10.1007/978-3-662-56776-0

Premium Partner