Skip to main content
main-content
Top

About this book

Dieses Open-Access-Buch gibt eine anwendungsorientierte Einführung in die logistische Regression. Ausgehend von Grundkenntnissen der linearen Regression wird diese zuerst als zweistufiges Modell interpretiert, was den Übergang zur logistischen Regression vereinfacht. Neben einer kompakten Einführung der entsprechenden Theorie liegt der Fokus auch auf der Umsetzung mit der Statistiksoftware R und der richtigen Formulierung der entsprechenden Ergebnisse. Alle Schritte werden anhand zahlreicher Beispiele illustriert. Hinzu kommt eine Einführung in die Klassifikation mit den entsprechenden Begriffen.

Table of Contents

Frontmatter

Open Access

Kapitel 1. Einleitung

Zusammenfassung
In der Einführung wird anhand von Beispielen und den damit verbundenen Fragestellungen motiviert, wieso und wann man ein logistisches Regressionsmodell verwenden kann und wieso das lineare Regressionsmodell dazu nicht geeignet ist.
Markus Kalisch, Lukas Meier

Open Access

Kapitel 2. Aspekte des Wahrscheinlichkeitsbegriffs

Zusammenfassung
Ausgehend von dem Begriff der Wahrscheinlichkeit werden die Begriffe der Odds (Chance) und Log-Odds eingeführt und anhand von einem Beispiel illustriert. Beide Größen werden später bei der Interpretation des logistischen Regressionsmodells eine zentrale Rolle spielen. Neben exakten Definitionen wird Wert auf ein intuitives Verständnis der Zusammenhänge gelegt. Die Begriffe Risk-Ratio und Odds-Ratio erlauben es, Wahrscheinlichkeiten bzw. Odds für ein Ereignis in zwei verschiedenen Situationen zu vergleichen.
Markus Kalisch, Lukas Meier

Open Access

Kapitel 3. Das logistische Regressionsmodell

Zusammenfassung
Das lineare Regressionsmodell wird zu Kapitelbeginn als zweistufiges Modell neu interpretiert. Darauf aufbauend wird das logistische Regressionsmodell äquivalent als Modell für binäre Zielgrößen eingeführt. Dabei wird gezeigt, dass die logistische Regression ein Spezialfall der verallgemeinerten linearen Modelle (GLM) ist. Als wichtige Komponenten solcher Modelle werden Verteilung, Erwartungswert, linearer Prädiktor und Linkfunktion besprochen. Als Alternative zu dieser Herangehensweise wird die logistische Regression als latentes Variablenmodell vorgestellt. Anschließend wird die Interpretation der Modellparameter auf der Skala der Log-Odds, Odds und Wahrscheinlichkeit ausführlich besprochen. Den Abschluss bildet ein kurzer Ausblick auf Modelle mit mehreren Variablen und Methoden der Parameterschätzung bzw. Inferenz.
Markus Kalisch, Lukas Meier

Open Access

Kapitel 4. Logistische Regression in R

Zusammenfassung
In diesem Kapitel wird illustriert, wie die bis jetzt gelernten Konzepte mit der Statistiksoftware R umgesetzt werden können. Anhand eines Beispiels wird gezeigt, wie ein Modell ausgehend von Daten geschätzt werden kann. Anschließend wird die Effektstärke inkl. Vertrauensintervall auf der Skala der Log-Odds und der Odds bestimmt. Es folgen Vorhersagen auf der Skala der Log-Odds, der Odds und der Wahrscheinlichkeit. Den Abschluss bildet die effiziente Bearbeitung von gruppierten Daten.
Markus Kalisch, Lukas Meier

Open Access

Kapitel 5. Klassifikation

Zusammenfassung
In diesem Kapitel geht es darum, die logistische Regression als Klassifikationsmethode zu verwenden. Der Unterschied zwischen Trainings- und Testdaten wird erklärt. Um die Güte des Klassifikators abschätzen zu können, wird zunächst die Fehlerrate und die confusion matrix besprochen. Anschließend wird dieses Thema mit der ROC-Kurve vertieft.
Markus Kalisch, Lukas Meier

Open Access

Kapitel 6. Ausblick

Zusammenfassung
Im Ausblick geht es um die Überprüfung der Modellannahmen und häufige Probleme der logistischen Regression. Zusätzlich wird darauf eingegangen, wie die logistische Regression auf mehr als zwei Klassen erweitert werden kann.
Markus Kalisch, Lukas Meier

Backmatter

Additional information

Premium Partner

    Image Credits