Skip to main content

2023 | Buch

Künstliche Intelligenz und Machine Learning mit R

Anwendungen im Bereich Business Analytics

insite
SUCHEN

Über dieses Buch

In einer VUCA-Welt, die sich als immer unbeständiger, unsicherer und komplexer erweist, gilt es für Unternehmen, Organisation und Staaten zeitnah und adäquat auf die jeweiligen Situationen zu reagieren. Entscheidungen basierend auf in der Vergangenheit gemachten Erfahrungen zu treffen ist in diesen Zeiten weniger erfolgreich als ein akkurates Verständnis der gegenwärtigen Bedingungen. Die Bedeutung von empirischen Wissenschaften, das permanente Beobachten der Umwelt, die zeitnahe Analyse von Wirkungszusammenhängen und das daraus abgeleitete Gewinnen neuer Erkenntnissen, nimmt zu. Daraus lässt sich ableiten, welche Maßnahmen mit einer vorhersagbaren Wahrscheinlichkeit zur Erreichung der eigenen Ziele geeignet sind, z.B. welcher Preis für ein Angebot die gewünschte Nachfrage erzeugt oder welche Marketingmaßnahme eine gewünschte Zielgruppe erreicht.
Wo früher klassische Statistik für Berechnungen und Vorhersagen herangezogen wurde, da erlauben heute kostenlose (Open Source) Werkzeuge wie R Daten in unterschiedlichsten Formaten und aus beliebig vielen Quellen für die Analyse einzulesen, aufzubereiten und mit Hilfe von Methoden der Künstlichen Intelligenz und des Machine Learning zu analysieren. Die Ergebnisse können dann anschließend perfekt visuell dargestellt werden, so dass die Entscheider schnell und effektiv davon profitieren können.
Das Zeitalter von Data Science ist erreicht. Digitalisierung ist mehr als ein Schlagwort oder ein Versprechen, es ist für jeden umsetzbar und nutzbar.
Dieses Buch vermittelt Ihnen auf Basis der zum Zeitpunkt der Publikation aktuellsten Version von R, wie Sie Künstliche Intelligenz und Machine Learning in der Industrie 4.0 nutzen können.

Inhaltsverzeichnis

Frontmatter
1. Nutzen von Machine Learning und Künstlicher Intelligenz
Zusammenfassung
Die Digitalisierung verändert die Welt, die Märkte, die Konkurrenten und die Erwartungen der Kunden. Die Geschwindigkeit, in der sich Märkte verändern, hat sich so erhöht, dass es immer wichtiger wird relevante Informationen bezüglich der eigenen Organisation, der Konkurrenz und der Kunden zeitnah zur Disposition zu haben.
Bernd Heesen
2. Machine Learning
Zusammenfassung
Es existieren drei Methoden des Machine Learnings: Das Überwachte Machine Learning basiert auf dem Konzept, dass eine Maschine aus Daten lernt und diese nach Beendigung der Lernphase auf andere Daten und Situationen überträgt. Algorithmen bauen beim maschinellen Lernen ein statistisches Modell auf, das auf Trainingsdaten beruht. Das heißt, das Modell merkt sich nicht einfach nur die Daten, mit denen es trainiert wurde, sondern es erkennt Muster und Gesetzmäßigkeiten in den Trainingsdaten. So kann das Modell ggfs. auch etwas Neues aus Daten lernen oder Gelerntes (Trainingsdaten) auf andere Daten (aktuelle Daten) anwenden, z. B. Vorhersagen machen. Bevor ein Modell als „trainiert“ gilt (Trainiertes Modell) und auf andere Daten angewendet wird, werden die Muster und Gesetzmäßigkeiten mit Hilfe von Testdaten evaluiert. Wenn die Güte des Modells (Modellgüte) als ausreichend betrachtet wird, dann wird das trainierte Modell angewendet. Auch die Ergebnisse des trainierten Modells sollten immer weiter geprüft werden, um zu erkennen, wenn sich z. B. alte Muster auf die neuen Daten nicht mehr sinnvoll anwenden lassen und somit ein neues Trainieren des Modells (Re-Training) veranlasst werden sollte.
Bernd Heesen
3. Best Practices
Zusammenfassung
Best Practices für das Machine Learning, sind u.a. der Cross Industry Standard Process for Data Mining (Crisp-DM) und der Team Data-Science-Process (TDSP). Darüber hinaus gibt es Best Practices für die Datenqualität, die Visualisierung, die Einrichtung einer geeigneten Entwicklungsumgebung und auch für die Programmierung.
Bernd Heesen
4. Einrichtung der Entwicklungsumgebung von R
Zusammenfassung
Wie eine R-Umgebung gestaltet wird, hängt wesentlich davon ab, welche Werkzeuge Verwendung finden sollen. Im Folgenden wird vorgestellt, wie die Installation erfolgt, wenn R, R-Tools und RStudio als Integrated Development Environment (IDE) bzw. Entwicklungsumgebung zum Einsatz kommen soll.
Bernd Heesen
5. Grundlagen der Programmiersprache R
Zusammenfassung
R-Anweisungen bestehen aus Ausdrücken, also aus Wertzuweisungen (arithmetischen oder logischen Operatoren) oder Funktionsaufrufen. Funktionsaufrufe sind daran erkennbar, dass nach dem Namen der Funktion Klammern folgen, in denen einer Funktion ggfs. Parameter mitgegeben werden können, z. B. mean(mitarbeiter), um den Mittelwert für die Variable „mitarbeiter“ zu berechnen. Darüber hinaus werden Datentypen, Datenstrukturen, Operationen, Funktionen und Kontrollstrukturen vorgestellt.
Bernd Heesen
6. Grundlagen des Machine Learnings mit R
Zusammenfassung
Um Daten für das Machine Learning nutzen zu können, gilt es diese zunächst als Rohdaten aus einer Quelle zu importieren. Anschließend gilt es die Daten für die nachfolgende Analyse im Rahmen einer Transformation vorzubereiten bzw. aufzubereiten. Eine Datentransformation beinhaltet u. a. die Selektion der für die Analyse erforderlichen Daten, die Validierung, eine Fusion mit anderen Daten, eine Umformung, Ergänzung und Zusammenfassung. Nachdem die Daten bereinigt vorliegen, gilt es diese besser zu verstehen, zu analysieren und mit Unterstützung von Visualisierungen auch Besonderheiten zu erkennen. Dabei kann auch bereits festgelegt werden, wie bei den weitergehenden Analysen mit Ausreißern und fehlenden Daten umgegangen werden soll. Nach diesen vorbereitenden Aktivitäten können dann auch die Methoden und Modelle des Machine Learnings angewendet und deren Tauglichkeit evaluiert werden, bevor schließlich die daraus resultierenden Erkenntnisse kommuniziert werden. Es wird neben der Modellierung auch die Bildung von Stichproben, die Aufteilung der Daten in Trainings- und Testdaten und das Resampling vorgestellt. Neben der Modellwahl und dem Modelltraining wird auch das Parametertuning erklärt.
Bernd Heesen
7. Anwendung von Machine Learning mit R
Zusammenfassung
Machine Learning lässt sich in das Überwachte Lernen, das Unüberwachte Lernen und das Bestärkende Lernen unterteilen. In diesem Kapitel werden die Anwendung diverser Methoden für die Regression, Klassifikation und das Clustering vorgestellt. Darüber hinaus wird erklärt, wie Unüberwachtes Lernen bei der Erstellung von Assoziationsregeln (Warenkorbanalyse) hilft, die dann als Grundlage für Empfehlungssysteme und die Optimierung von Cross-Selling-verfahren dienen.
Bernd Heesen
8. Ausblick
Zusammenfassung
Chancen und Risiken der Nutzung von Machine Learning und Künstlicher Intelligenz.
Bernd Heesen
Backmatter
Metadaten
Titel
Künstliche Intelligenz und Machine Learning mit R
verfasst von
Bernd Heesen
Copyright-Jahr
2023
Electronic ISBN
978-3-658-41576-1
Print ISBN
978-3-658-41575-4
DOI
https://doi.org/10.1007/978-3-658-41576-1