Einführung in die Statistik | springerprofessional.de

Springer Professional

nach oben

2018 | Buch

Kapitel lesen Erstes Kapitel lesen

Einführung in die Statistik

Theorie und Praxis mit R

verfasst von: Dr. Andreas Handl, Prof. Dr. Torben Kuhlenkasper

Verlag: Springer Berlin Heidelberg

Enthalten in: Springer Professional "Wirtschaft+Technik" , Springer Professional "Technik" , Springer Professional "Wirtschaft"

Einloggen, um Zugang zu erhalten

Über dieses Buch

Dieses Lehrbuch motiviert und erklärt die Inhalte der deskriptiven und induktiven Statistik, indem es die mathematischen Grundlagen der Statistik mit vielfältigen, leicht nachvollziehbaren Anwendungen und Beispielen verbindet: Durch überschaubare Beispiele, die mit Papier und Stift durchgerechnet werden können (und sollten!) gewinnt der Leser zunächst Verständnis und einen routinierten Umgang mit den zentralen Formeln. Für größere Beispiele kommt das frei verfügbare statistische Software R zum Einsatz, welches die Berechnungen schnell und verlässlich auch für große Datensätze umsetzt.

Anzeige

Inhaltsverzeichnis

Frontmatter

Grundlagen

Frontmatter

1. Grundbegriffe

Zusammenfassung

Das Kapitel führt in die Statistik und deren Bedeutung in der Gesellschaft ein. Dabei werden anhand von einführenden Beispielen die unterschiedlichen Erhebungsarten zum „Finding Data in Life“ vorgestellt sowie eine Abgrenzung von deskriptiver und induktiver Statistik vorgenommen. Im Anschluss werden die von der Statistik verwendeten unterschiedlichen Merkmalsarten und deren Skalenniveaus erläutert um so einen Übergang zum „Finding Life in Data“ zu schaffen.

Andreas Handl, Torben Kuhlenkasper

2. Eine kleine Einführung in R

Zusammenfassung

Die vielen Beispieldatensätze im Buch sind vergleichsweise klein und man kann man alle Beispiele mit Papier, Bleistift und Taschenrechner in vertretbarer Zeit nachvollziehen. Bei größeren Datensätzen sollte man auf die Hilfe von Computern zurückgreifen. Im Buch wird die Software R verwendet, die in Kapitel 2 mit kleinen Beispielen für die Datenanalyse und für die Erstellung von Grafiken vorgestellt wird.

Andreas Handl, Torben Kuhlenkasper

Deskriptive Statistik

Frontmatter

3. Univariate Analyse

Zusammenfassung

Kapitel 3 widmet sich der Analyse von univariaten Daten. Dabei werden unterschiedliche Möglichkeiten sowohl zur Darstellung als auch zur Beschreibung von Daten durch geeignete Maßzahlen vorgestellt. Die unterschiedlichen Skalenniveaus von Daten führen zu den verschiedenen Methoden der Darstellung und Beschreibung und sind der Ausgangspunkt für das Kapitel. Jede vorgestellte Methode wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

4. Multivariate Analyse

Zusammenfassung

Kapitel 4 führt in die Analyse multivariater Datensätze ein, mit der zwischen unterschiedlichen Variablen Abhängigkeiten untersucht werden sollen. Das Kapitel beschränkt sich auf die Analyse von jeweils zwei Variablen und stellt die Methoden der bivariaten Datenanalyse für quantitative, qualitative sowie Kombinationen davon mit Beispielen vor, die sowohl „per Hand“ als auch computergestützt mit R nachvollzogen werden können.

Andreas Handl, Torben Kuhlenkasper

5. Wahrscheinlichkeitsrechnung

Zusammenfassung

Der Ausgang von vielen Vorgängen und Ereignissen, mit denen die Statistik sich beschäftigt, ist unbestimmt. Kapitel 5 stellt solche Zufallsvorgänge und den Umgang damit detailliert vor. Die Bewertung von Ereignissen mit Wahrscheinlichkeiten und die sich daraus ergebenden Möglichkeiten zur Berechnung werden mit kleinen Beispielen motiviert und veranschaulicht.

Andreas Handl, Torben Kuhlenkasper

Induktive Statistik

Frontmatter

6. Univariate Zufallsvariablen

Zusammenfassung

Grundlage der induktiven Statistik sind Zufallsvariablen, die auf Wahrscheinlichkeitsmodellen basieren. Kapitel 6 stellt die wichtigsten diskreten und stetigen Zufallsvariablen im univariaten Fall vor und motiviert mit vielen Beispielen, welche Modelle für verschiedene Fragestellungen geeignet sind.

Andreas Handl, Torben Kuhlenkasper

7. Verteilungsparameter

Zusammenfassung

Die Lage und die Streuung von diskreten und stetigen Zufallsvariablen wird durch Verteilungsparameter beschrieben. In Kapitel 7 werden der Erwartungswert, die Varianz sowie Quantile im univariaten Fall vorgestellt. Kapitel 7 wird durch die Tschebyscheff-Ungleichung, die eine für Zufallsvariablen wichtige Beziehung zwischen Erwartungswert und Varianz herstellt, vervollständigt.

Andreas Handl, Torben Kuhlenkasper

8. Multivariate Zufallsvariablen

Zusammenfassung

Basierend auf univariaten Zufallsvariablen werden in Kapitel 8 multivariate Zufallsvariablen im diskreten und stetigen Fall vorgestellt. Darüber hinaus wird das in der Statistik zentrale Konzept der Unabhängigkeit für multivariate Zufallsvariablen vorgestellt. Das Kapitel beschreibt auch die für viele Anwendungsfälle wichtigen Funktionen von Zufallsvariablen.

Andreas Handl, Torben Kuhlenkasper

9. Parameter multivariater Verteilungen

Zusammenfassung

Multivariate Zufallsvariablen, wie sie zuvor in Kapitel 8 vorgestellt wurden, werden ebenfalls durch Verteilungsparameter beschrieben. Neben dem Konzept des Erwartungswertes werden in Kapitel 9 für den multivariaten Fall die Kovarianz und der Korrelationskoeffizient für multivariate Zufallsvariablen vorgestellt.

Andreas Handl, Torben Kuhlenkasper

10. Verteilungsmodelle

Zusammenfassung

Der Umgang mit Zufallsvariablen in konkreten Problemstellungen wird durch die Verwendung von Verteilungsmodellen im diskreten und stetigen Fall vereinfacht. Kapitel 10 stellt die wichtigsten Modelle anhand unterschiedlicher Anwendungssituationen vor und beschreibt den Umgang mit Verteilungsmodellen. Die Normalverteilung hat in der Statistik allgemein eine besondere Bedeutung und wird in Kapitel 10 detailliert vorgestellt. Die sich daraus abgeleiteten Prüfverteilungen für die in nachfolgenden Kapiteln vorgestellten statistischen Hypothesentests werden ebenfalls eingeführt. Das Kapitel stellt ebenfalls die unterschiedlichen Verteilungsmodelle und deren Umsetzung in R vor.

Andreas Handl, Torben Kuhlenkasper

11. Stichproben

Zusammenfassung

Insbesondere die induktive Statistik möchte auf Grundlage von erhobenen Daten in einer Stichprobe Aussagen über die Verteilung eines Merkmals in der Grundgesamtheit machen. Kapitel 11 veranschaulicht anhand eines kleinen Beispiels, wie Stichproben gewonnen werden und welche unterschiedlichen Stichprobenarten mit ihren Vor- und Nachteilen in der induktiven Statistik verwendet werden.

Andreas Handl, Torben Kuhlenkasper

12. Stichprobenfunktionen

Zusammenfassung

Um auf Grundlage einer gezogenen Stichprobe Rückschlüsse auf die Grundgesamtheit ziehen zu können, werden die Informationen der Stichprobe mit Stichprobenfunktionen verdichtet. In Kapitel 12 wird das arithmetische Mittel als wichtigste Stichprobenfunktion detailliert vorgestellt. Insbesondere werden die Vor- und Nachteile der in Kapitel 11 vorgestellten unterschiedlichen Stichprobenarten in Bezug auf die Stichprobenfunktion anhand eines kleinen Beispiels veranschaulicht. Dabei werden in Kapitel 12 auch das (schwache) Gesetz der großen Zahlen sowie der Zentrale Grenzwertsatz motiviert und veranschaulicht. Eine Einführung in statistische Simulationen und deren Umsetzung in R rundet das Kapitel ab.

Andreas Handl, Torben Kuhlenkasper

13. Schätzung von Parametern

Zusammenfassung

Um auf Basis einer Stichprobe Rückschlüsse auf die Grundgesamtheit ziehen zu können, müssen die Charakteristika einer Verteilung geschätzt werden. Kapitel 13 stellt die zentralen Konzepte zur Schätzung von Parametern vor. Dabei werden sowohl die unterschiedlichen Konstruktionsprinzipien von Schätzern als auch deren Anwendungen vorgestellt. Das Kapitel stellt die wichtigsten Eigenschaften von Schätzfunktionen vor und motiviert sowohl die Anwendung von Punktschätzungen für Parameter als auch den Umgang mit Konfidenz-, Prognose- und Toleranzintervallen.

Andreas Handl, Torben Kuhlenkasper

14. Grundbegriffe statistischer Tests

Zusammenfassung

Zur Überprüfung konkreter Vermutungen über Zufallsvariablen und deren Verteilung kommen statistische Hypothesentests zum Einsatz. Kapitel 14 stellt anhand eines kleinen Beispiels alle relevanten Grundbegriffe des statistischen Testens detailliert vor und motiviert das Vorgehen bei Hypothesentests im Allgemeinen. Kapitel 14 bildet eine wichtige Grundlage für alle im Buch folgenden Kapitel, die spezielle statistische Tests für unterschiedliche Fragestellungen vorstellen.

Andreas Handl, Torben Kuhlenkasper

15. Einstichprobenproblem

Zusammenfassung

Kapitel 15 motiviert und veranschaulicht zwei unterschiedliche Arten von Tests für univariate Stichproben. Für Tests auf Lageparameter werden sowohl der t-Test als auch die nichtparametrischen Alternativen des Wilcoxon-Vorzeichen-Rangtests und des Vorzeichentests vorgestellt. Für Tests zur Überprüfung von Verteilungsannahmen wird der Chiquadrat-Anpassungstest ebenfalls beispielgestützt eingeführt. Jeder vorgestellte Test wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

16. Zweistichprobenproblem

Zusammenfassung

Die in Kapitel 16 vorgestellten Tests beziehen sich auf zwei Stichproben. Mit diesen Tests kann in vielen Anwendungen überprüft werden, ob sich zwei Verfahren, Behandlungen oder Methoden in ihrer Wirkung auf eine Variable unterscheiden. Dabei wird zwischen verbundenen und unverbundenen Stichproben unterschieden. In Kapitel 16 werden sowohl die notwendigen Tests mit Annahme von Normalverteilung als auch deren nichtparametrische Alternativen vorgestellt. Jeder vorgestellte Test wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

17. Einfaktorielle Varianzanalyse

Zusammenfassung

In Kapitel 16 werden Tests zum Vergleich von zwei Verfahren vorgestellt. In Kapitel 17 werden mehr als zwei Verfahren betrachtet, wobei wir unverbunden vorgehen. Es soll also untersucht werden, ob mehr als zwei Gruppen sich bei einem Merkmal voneinander unterscheiden. Dafür wird in Kapitel 17 sowohl die einfaktorielle Varianzanalyse (ANOVA) als auch deren Alternative, der Kruskal-Wallis-Test, vorgestellt. Jede Methode wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

18. Unabhängigkeit und Homogenität

Zusammenfassung

Kapitel 18 überträgt das Konzept der statistischen Unabhängigkeit auf qualitative Merkmale. Dabei wird der Chiquadrat-Test auf Unabhängigkeit sowie dessen Anwendung zur Analyse von Homogenität vorgestellt und anhand von Beispielen aus vorangegangenen Kapiteln angewendet. Diese Kontingenzanalyse wird anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

19. Lineares Modell

Zusammenfassung

Mit Hilfe linearer Modelle kann die Abhängigkeit einer metrischen Variablen von einer oder mehrerer metrischen Variablen erklärt werden. Kapitel 19 stellt die Methode der Kleinsten Quadrate sowie Kriterien für die Beurteilung der Anpassungsgüte vor. Neben den statistischen Tests innerhalb linearer Regression werden in Kapitel 19 auch die Auswirkungen von Ausreißern und anderen einflussreichen Beobachtungen bei linearen Modellen veranschaulicht. Eine Vorstellung von Methoden zur Analyse linearisierbarer Zusammenhänge rundet das Kapitel ab. Die Methoden werden anhand von Beispielen sowohl „per Hand“ als auch computergestützt mit R präsentiert.

Andreas Handl, Torben Kuhlenkasper

Backmatter

Titel: Einführung in die Statistik
verfasst von: Dr. Andreas Handl
Prof. Dr. Torben Kuhlenkasper
Copyright-Jahr: 2018
Verlag: Springer Berlin Heidelberg
Electronic ISBN: 978-3-662-56440-0
Print ISBN: 978-3-662-56439-4
DOI: https://doi.org/10.1007/978-3-662-56440-0

Weitere Formate
Fachgebiete
Bücher
Zeitschriften
Themenseiten
Jetzt Einzelzugang starten
Zugang für Unternehmen
Referenzkunden
SLX-Digitalkonferenz: Zukunftswerkstatt 2024