Skip to main content
Top

2017 | Book

Parametrische Statistik

Verteilungen, maximum likelihood und GLM in R

Author: Prof. Dr. Carsten F. Dormann

Publisher: Springer Berlin Heidelberg

Book Series : Statistik und ihre Anwendungen

insite
SEARCH

About this book

Beispielreich baut dieses Buch Schritt für Schritt die statistischen Grundlagen moderner Datenanalysen auf. Im Gegensatz zu anderen einführenden Werken legt dieses Buch großen Wert auf einen umfassend gespannten Bogen, einen roten Faden, der alle Methoden zusammenführt. Dabei werden klassische statistische Methoden (etwa t-Test oder multiple Regression) als Spezialfall des Generalisierten Linearen Modells entwickelt. Entsprechend legt das Buch zunächst eine Grundlage in beschreibender Statistik, Verteilungen und maximum likelihood, aus der dann alle anderen Verfahren abgeleitet werden (ANOVA, multiple Regression).

Jeder Schritt ist auf zwei Kapitel verteilt: Im ungradzahligen Kapitel wird anhand von vielen Beispielen und Abbildungen die Idee der statistischen Herangehensweise erläutert. Im sich daran anschließenden gradzahligen Kapitel wird die Umsetzung in der freien Statistiksoftware R gezeigt. Ein Kapitel zur Wissenschafts- und Forschungstheorie und eines zum Design von Experimenten und Stichprobeverfahren komplettiert dieses einleitende Werk.

Das Buch legt großen Wert auf Verständlichkeit und Umsetzung. Mathematische Herleitungen treten demgegenüber stark in den Hintergrund. Jedes Kapitel enthält explizit ausgewiesene Lerninhalte, die durch Übungen zu jedem R-Kapitel geprüft werden können. Ein ausführliches Schlagwortverzeichnis inklusive der R-Funktionen macht das Buch auch als Nachschlagewerk nutzbar.

Die zweite Auflage wurde ergänzt um Schätzung mittels der Momentenmethode, Residuendiagnostik für nicht-normalverteilte Daten und die erschöpfende Modellsuche.

Table of Contents

Frontmatter
1. Stichprobe, Zufallsvariable – Histogramm, Dichteverteilung
Zusammenfassung
In diesem Kapitel werden die gängigsten Stichprobenstatistiken vorgestellt. Eine ″Statistik″ ist eine Zusammenfassung vieler Messungen. Die wichtigsten Statistiken beschreiben die Lage des Zentrums einer Stichprobe (Mittelwert, Median) und die Streuung (Standardabweichung, Varianz, Interquartilabstand, Minimum/Maximum). Zur Visualisierung werden Häufigkeitsverteilungen anhand von Histogramme, Box-and-Whiskerplots sowie Dichtekurven vorgestellt.
Carsten F. Dormann
2. Stichprobe, Zufallsvariable – Histogramm, Dichteverteilung in R
Zusammenfassung
Dieses Kapitel erläutert, wie Daten aus der Erhebung in Feld oder Labor strukturiert in den Rechner gelangen. Danach werden die Funktionen eingeführt, die die Umsetzung von Kapitel 1 (Stichprobenstatistik) mit Hilfe von R für konkrete Beispiele ermöglichen.
Carsten F. Dormann
3. Verteilungen, ihre Parameter und deren Schätzer
Zusammenfassung
Zentrales Element der parametrischen Statistik ist die Verteilung. Dies sind mathematische Funktionen, die beschreiben, mit welcher Häufigkeit ich einen Zahlenwert messe. Neben der bekannten Normalverteilung gibt es viele weitere Verteilungen, von denen die wichtigsten hier vorgestellt werden. Weitherhin betrachten wir, wie man die Parameter dieser Verteilungen aus einer Stichprobe schätzt, und wie man quantifiziert, ob diese Verteilung die Daten gut beschreibt.
Carsten F. Dormann
4. Verteilungen, Parameter und Schätzer in R
Zusammenfassung
Dieses Kapitel erläutert die Umsetzung von Kapitel 3 in R. Konkret werden die Visualisierung von Verteilungen, das Anpassen an Stichprobendaten, und der Vergleich verschiedener Anpassungen vorgestellt.
Carsten F. Dormann
5. Korrelation und Assoziation
Zusammenfassung
Der statistische Zusammenhang zweier kontinuierlicher Messgrößen wird durch die Korrelation beschrieben, zum Beispiel durch Pearsons Korrelationskoeffizient. Robuste Varianten (Spearmans ρ oder Kendalls τ) ergänzen diese in Situationen mit nicht-linearen Zusammenhängen oder extremen Werten. Kategoriale Zusammenhänge beschreibt die Assoziation, etwa mittels χ2-Tests.
Carsten F. Dormann
6. Korrelation und Assoziation in R
Zusammenfassung
Dieses Kapitel stellt die Umsetzung von Kapitel 5 in R vor. Neben den Korrelationsmaßen werden auch Assoziationen mittels Fishers sign-rank-Test durchgeführt. Ein kurzer Ausblick auf die Korrelation zwischen kontinuierlichen und kategorialen Variablen wird vorgestellt.
Carsten F. Dormann
7. Regression – Teil I
Zusammenfassung
Im Gegensatz zur Korrelation liegt bei der Regression eine Richtung vor: x führt zu y. Wir kombinieren hier also die Verteilungen aus Kapitel 3 und den Zusammenhang zweier Variablen aus Kapitel 5. Dazu brauchen wir für manche Verteilungen eine link-Funktion, die verhindert, dass Werte außerhalb des Wertebereichs der Verteilung auftreten (etwa solche <0 für die Poisson-Verteilung). Auch der Umgang mit kategorialen x wird erläutert.
Carsten F. Dormann
8. Regression in R – Teil I
Zusammenfassung
Dieses Kapitel setzt Kapitel 7 in R um. Neben der Berechnung von Regressionen für verschiedenen Verteilungen der Antwortvariablen liegt ein Schwerpunkt auf der Visualisierung: Regressionlinien und ihre Vertrauensbereiche in die Daten einzeichnen.
Carsten F. Dormann
9. Regression – Teil II
Zusammenfassung
Mit der Regression selbst ist die Arbeit nicht getan. Dieses Kapitel beschreibt die nötigen Schritte der Modelldiagnostik. Speziell die Analyse der Residuen steht hier im Vordergrund, aber auch die Überprüfung der Modellannahmen.
Carsten F. Dormann
10. Regression in R – Teil II
Zusammenfassung
Dieses Kapitel setzt Kapitel 9 in R um. Neben den Schritten der Modelldiagnostik, in Zahlen und Abbildungen, schauen wir uns den Spezialfall des „linearen Modells“ an, d.h. normalverteilte Antwortvariablen.
Carsten F. Dormann
11. Das Lineare Modell: $t$-Test und ANOVA
Zusammenfassung
Traditionell sind normalverteilte Daten mit besonderer Aufmerksamkeit bedacht worden. Deshalb stellt dieses Kapitel den wichtigen t-Test und die Varianzanalyse vor. Beide sind Spezialfälle des bisher betrachteten GLM, wie wir hier sehen werden.
Carsten F. Dormann
12. Das Lineare Modell: $t$-Test und ANOVA in R
Zusammenfassung
Dieses Kapitel setzt Kapitel 11 in R um. Über t-Test und Varianzanalyse (ANOVA) hinaus stellen wir vor, wie kategoriale Vergleiche nach der Varianzanalyse auf statistisch signifikante Unterschiede getestet werden können (post-hoc Tests).
Carsten F. Dormann
13. Hypothesen und Tests
Zusammenfassung
Dieses Kapitel stellt ein wenig die Wissenschaftsphilosophie hinter der schließenden (= testenden) Statistik vor. Konkret wird die sog. „wissenschaftliche Methodik“ dargestellt, und die Poppersche Falsifikationsphilosophie. Daraus folgen die wichtigen Konzepte unterschiedlicher Arten von Fehlern, konkret der falsch-positiven und falsch-negativen Vorhersagen. Für den einfachen t-Test wird dargestellt, wie man benötigte Stichprobenumfänge abschätzen kann, und die Teststärke eines nicht-signifikanten Tests.
Carsten F. Dormann
14. Experimentelles Design
Zusammenfassung
Grundlage der meisten Datensätze sind gut geplante Experimente und Datenerhebungen. Dieses Kapitel vermittelt die Ideen hinter beidem: Repräsentativität, Unabhängigkeit und Kontrolle. Konkrete Versuchs- und Stichprobendesigns werden vorgestellt und in einer beispielhaften Analyse durchgerechnet. Häufige Missverständnisse und Fehler werden explizit besprochen.
Carsten F. Dormann
15. Multiple Regression: mehrere Prädiktoren
Zusammenfassung
Dieses Kapitel führt uns vom Fall eines Prädiktors (Kapitel 9) zu zwei oder mehreren Prädiktoren. Damit tauchen verschiedenen neue Probleme auf, die hier behandelt werden: Visualisierung in 3 Dimensionen; statistische Interaktionen zwischen Prädiktoren; Korrelation zwischen Prädiktoren; und Auswahl der wichtigsten Prädiktoren für ein Modell. Die Hauptkomponentenanalyse und die Cluster-Analyse werden als Methoden zur Reduzierung von Kollinearität vorgestellt.
Carsten F. Dormann
16. Multiple Regression in R
Zusammenfassung
Dieses Kapitel setzt Kapitel 15 in R um. Wichtig ist die Visualisierung in der multiplen Regression, so dass wir statistische Interaktionen besser verstehen können. Weiterhin werden verschiedene Methoden der Modellselektion vorgestellt und am konkreten Beispiel kritisch hinterfragt.
Carsten F. Dormann
17. Ausblick
Zusammenfassung
Im Ausblick verweisen wir hier auf die sich nun anschließenden Zweige der fortgeschrittenen Statistik: Bayessche Statistik, machine learning und nicht-parametrische Statistik. Hinweise auf weiterführende Lehrbücher werden hier gegeben, auch im Bereich Zeitreihenanalyse, räumliche Statistik/Geostatistik und multivariate Statistik.
Carsten F. Dormann
Backmatter
Metadata
Title
Parametrische Statistik
Author
Prof. Dr. Carsten F. Dormann
Copyright Year
2017
Publisher
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-54684-0
Print ISBN
978-3-662-54683-3
DOI
https://doi.org/10.1007/978-3-662-54684-0

Premium Partner