Skip to main content

2018 | Buch

Einführung in die Statistik

Theorie und Praxis mit R

verfasst von: Dr. Andreas Handl, Prof. Dr. Torben Kuhlenkasper

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

Dieses Lehrbuch motiviert und erklärt die Inhalte der deskriptiven und induktiven Statistik, indem es die mathematischen Grundlagen der Statistik mit vielfältigen, leicht nachvollziehbaren Anwendungen und Beispielen verbindet: Durch überschaubare Beispiele, die mit Papier und Stift durchgerechnet werden können (und sollten!) gewinnt der Leser zunächst Verständnis und einen routinierten Umgang mit den zentralen Formeln. Für größere Beispiele kommt das frei verfügbare statistische Software R zum Einsatz, welches die Berechnungen schnell und verlässlich auch für große Datensätze umsetzt.

Inhaltsverzeichnis

Frontmatter

Grundlagen

Frontmatter
1. Grundbegriffe
Zusammenfassung
Das Kapitel führt in die Statistik und deren Bedeutung in der Gesellschaft ein. Dabei werden anhand von einführenden Beispielen die unterschiedlichen Erhebungsarten zum „Finding Data in Life“ vorgestellt sowie eine Abgrenzung von deskriptiver und induktiver Statistik vorgenommen. Im Anschluss werden die von der Statistik verwendeten unterschiedlichen Merkmalsarten und deren Skalenniveaus erläutert um so einen Übergang zum „Finding Life in Data“ zu schaffen.
Andreas Handl, Torben Kuhlenkasper
2. Eine kleine Einführung in R
Zusammenfassung
Die vielen Beispieldatensätze im Buch sind vergleichsweise klein und man kann man alle Beispiele mit Papier, Bleistift und Taschenrechner in vertretbarer Zeit nachvollziehen. Bei größeren Datensätzen sollte man auf die Hilfe von Computern zurückgreifen. Im Buch wird die Software R verwendet, die in Kapitel 2 mit kleinen Beispielen für die Datenanalyse und für die Erstellung von Grafiken vorgestellt wird.
Andreas Handl, Torben Kuhlenkasper

Deskriptive Statistik

Frontmatter
3. Univariate Analyse
Zusammenfassung
Kapitel 3 widmet sich der Analyse von univariaten Daten. Dabei werden unterschiedliche Möglichkeiten sowohl zur Darstellung als auch zur Beschreibung von Daten durch geeignete Maßzahlen vorgestellt. Die unterschiedlichen Skalenniveaus von Daten führen zu den verschiedenen Methoden der Darstellung und Beschreibung und sind der Ausgangspunkt für das Kapitel. Jede vorgestellte Methode wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
4. Multivariate Analyse
Zusammenfassung
Kapitel 4 führt in die Analyse multivariater Datensätze ein, mit der zwischen unterschiedlichen Variablen Abhängigkeiten untersucht werden sollen. Das Kapitel beschränkt sich auf die Analyse von jeweils zwei Variablen und stellt die Methoden der bivariaten Datenanalyse für quantitative, qualitative sowie Kombinationen davon mit Beispielen vor, die sowohl „per Hand“ als auch computergestützt mit R nachvollzogen werden können.
Andreas Handl, Torben Kuhlenkasper
5. Wahrscheinlichkeitsrechnung
Zusammenfassung
Der Ausgang von vielen Vorgängen und Ereignissen, mit denen die Statistik sich beschäftigt, ist unbestimmt. Kapitel 5 stellt solche Zufallsvorgänge und den Umgang damit detailliert vor. Die Bewertung von Ereignissen mit Wahrscheinlichkeiten und die sich daraus ergebenden Möglichkeiten zur Berechnung werden mit kleinen Beispielen motiviert und veranschaulicht.
Andreas Handl, Torben Kuhlenkasper

Induktive Statistik

Frontmatter
6. Univariate Zufallsvariablen
Zusammenfassung
Grundlage der induktiven Statistik sind Zufallsvariablen, die auf Wahrscheinlichkeitsmodellen basieren. Kapitel 6 stellt die wichtigsten diskreten und stetigen Zufallsvariablen im univariaten Fall vor und motiviert mit vielen Beispielen, welche Modelle für verschiedene Fragestellungen geeignet sind.
Andreas Handl, Torben Kuhlenkasper
7. Verteilungsparameter
Zusammenfassung
Die Lage und die Streuung von diskreten und stetigen Zufallsvariablen wird durch Verteilungsparameter beschrieben. In Kapitel 7 werden der Erwartungswert, die Varianz sowie Quantile im univariaten Fall vorgestellt. Kapitel 7 wird durch die Tschebyscheff-Ungleichung, die eine für Zufallsvariablen wichtige Beziehung zwischen Erwartungswert und Varianz herstellt, vervollständigt.
Andreas Handl, Torben Kuhlenkasper
8. Multivariate Zufallsvariablen
Zusammenfassung
Basierend auf univariaten Zufallsvariablen werden in Kapitel 8 multivariate Zufallsvariablen im diskreten und stetigen Fall vorgestellt. Darüber hinaus wird das in der Statistik zentrale Konzept der Unabhängigkeit für multivariate Zufallsvariablen vorgestellt. Das Kapitel beschreibt auch die für viele Anwendungsfälle wichtigen Funktionen von Zufallsvariablen.
Andreas Handl, Torben Kuhlenkasper
9. Parameter multivariater Verteilungen
Zusammenfassung
Multivariate Zufallsvariablen, wie sie zuvor in Kapitel 8 vorgestellt wurden, werden ebenfalls durch Verteilungsparameter beschrieben. Neben dem Konzept des Erwartungswertes werden in Kapitel 9 für den multivariaten Fall die Kovarianz und der Korrelationskoeffizient für multivariate Zufallsvariablen vorgestellt.
Andreas Handl, Torben Kuhlenkasper
10. Verteilungsmodelle
Zusammenfassung
Der Umgang mit Zufallsvariablen in konkreten Problemstellungen wird durch die Verwendung von Verteilungsmodellen im diskreten und stetigen Fall vereinfacht. Kapitel 10 stellt die wichtigsten Modelle anhand unterschiedlicher Anwendungssituationen vor und beschreibt den Umgang mit Verteilungsmodellen. Die Normalverteilung hat in der Statistik allgemein eine besondere Bedeutung und wird in Kapitel 10 detailliert vorgestellt. Die sich daraus abgeleiteten Prüfverteilungen für die in nachfolgenden Kapiteln vorgestellten statistischen Hypothesentests werden ebenfalls eingeführt. Das Kapitel stellt ebenfalls die unterschiedlichen Verteilungsmodelle und deren Umsetzung in R vor.
Andreas Handl, Torben Kuhlenkasper
11. Stichproben
Zusammenfassung
Insbesondere die induktive Statistik möchte auf Grundlage von erhobenen Daten in einer Stichprobe Aussagen über die Verteilung eines Merkmals in der Grundgesamtheit machen. Kapitel 11 veranschaulicht anhand eines kleinen Beispiels, wie Stichproben gewonnen werden und welche unterschiedlichen Stichprobenarten mit ihren Vor- und Nachteilen in der induktiven Statistik verwendet werden.
Andreas Handl, Torben Kuhlenkasper
12. Stichprobenfunktionen
Zusammenfassung
Um auf Grundlage einer gezogenen Stichprobe Rückschlüsse auf die Grundgesamtheit ziehen zu können, werden die Informationen der Stichprobe mit Stichprobenfunktionen verdichtet. In Kapitel 12 wird das arithmetische Mittel als wichtigste Stichprobenfunktion detailliert vorgestellt. Insbesondere werden die Vor- und Nachteile der in Kapitel 11 vorgestellten unterschiedlichen Stichprobenarten in Bezug auf die Stichprobenfunktion anhand eines kleinen Beispiels veranschaulicht. Dabei werden in Kapitel 12 auch das (schwache) Gesetz der großen Zahlen sowie der Zentrale Grenzwertsatz motiviert und veranschaulicht. Eine Einführung in statistische Simulationen und deren Umsetzung in R rundet das Kapitel ab.
Andreas Handl, Torben Kuhlenkasper
13. Schätzung von Parametern
Zusammenfassung
Um auf Basis einer Stichprobe Rückschlüsse auf die Grundgesamtheit ziehen zu können, müssen die Charakteristika einer Verteilung geschätzt werden. Kapitel 13 stellt die zentralen Konzepte zur Schätzung von Parametern vor. Dabei werden sowohl die unterschiedlichen Konstruktionsprinzipien von Schätzern als auch deren Anwendungen vorgestellt. Das Kapitel stellt die wichtigsten Eigenschaften von Schätzfunktionen vor und motiviert sowohl die Anwendung von Punktschätzungen für Parameter als auch den Umgang mit Konfidenz-, Prognose- und Toleranzintervallen.
Andreas Handl, Torben Kuhlenkasper
14. Grundbegriffe statistischer Tests
Zusammenfassung
Zur Überprüfung konkreter Vermutungen über Zufallsvariablen und deren Verteilung kommen statistische Hypothesentests zum Einsatz. Kapitel 14 stellt anhand eines kleinen Beispiels alle relevanten Grundbegriffe des statistischen Testens detailliert vor und motiviert das Vorgehen bei Hypothesentests im Allgemeinen. Kapitel 14 bildet eine wichtige Grundlage für alle im Buch folgenden Kapitel, die spezielle statistische Tests für unterschiedliche Fragestellungen vorstellen.
Andreas Handl, Torben Kuhlenkasper
15. Einstichprobenproblem
Zusammenfassung
Kapitel 15 motiviert und veranschaulicht zwei unterschiedliche Arten von Tests für univariate Stichproben. Für Tests auf Lageparameter werden sowohl der t-Test als auch die nichtparametrischen Alternativen des Wilcoxon-Vorzeichen-Rangtests und des Vorzeichentests vorgestellt. Für Tests zur Überprüfung von Verteilungsannahmen wird der Chiquadrat-Anpassungstest ebenfalls beispielgestützt eingeführt. Jeder vorgestellte Test wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
16. Zweistichprobenproblem
Zusammenfassung
Die in Kapitel 16 vorgestellten Tests beziehen sich auf zwei Stichproben. Mit diesen Tests kann in vielen Anwendungen überprüft werden, ob sich zwei Verfahren, Behandlungen oder Methoden in ihrer Wirkung auf eine Variable unterscheiden. Dabei wird zwischen verbundenen und unverbundenen Stichproben unterschieden. In Kapitel 16 werden sowohl die notwendigen Tests mit Annahme von Normalverteilung als auch deren nichtparametrische Alternativen vorgestellt. Jeder vorgestellte Test wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
17. Einfaktorielle Varianzanalyse
Zusammenfassung
In Kapitel 16 werden Tests zum Vergleich von zwei Verfahren vorgestellt. In Kapitel 17 werden mehr als zwei Verfahren betrachtet, wobei wir unverbunden vorgehen. Es soll also untersucht werden, ob mehr als zwei Gruppen sich bei einem Merkmal voneinander unterscheiden. Dafür wird in Kapitel 17 sowohl die einfaktorielle Varianzanalyse (ANOVA) als auch deren Alternative, der Kruskal-Wallis-Test, vorgestellt. Jede Methode wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
18. Unabhängigkeit und Homogenität
Zusammenfassung
Kapitel 18 überträgt das Konzept der statistischen Unabhängigkeit auf qualitative Merkmale. Dabei wird der Chiquadrat-Test auf Unabhängigkeit sowie dessen Anwendung zur Analyse von Homogenität vorgestellt und anhand von Beispielen aus vorangegangenen Kapiteln angewendet. Diese Kontingenzanalyse wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
19. Lineares Modell
Zusammenfassung
Mit Hilfe linearer Modelle kann die Abhängigkeit einer metrischen Variablen von einer oder mehrerer metrischen Variablen erklärt werden. Kapitel 19 stellt die Methode der Kleinsten Quadrate sowie Kriterien für die Beurteilung der Anpassungsgüte vor. Neben den statistischen Tests innerhalb linearer Regression werden in Kapitel 19 auch die Auswirkungen von Ausreißern und anderen einflussreichen Beobachtungen bei linearen Modellen veranschaulicht. Eine Vorstellung von Methoden zur Analyse linearisierbarer Zusammenhänge rundet das Kapitel ab. Die Methoden werden anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.
Andreas Handl, Torben Kuhlenkasper
Backmatter
Metadaten
Titel
Einführung in die Statistik
verfasst von
Dr. Andreas Handl
Prof. Dr. Torben Kuhlenkasper
Copyright-Jahr
2018
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-56440-0
Print ISBN
978-3-662-56439-4
DOI
https://doi.org/10.1007/978-3-662-56440-0