Skip to main content

2019 | OriginalPaper | Buchkapitel

16. Inferenzstatistik

verfasst von : Sebastian Sauer

Erschienen in: Moderne Datenanalyse mit R

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

Dieses Kapitel führt in eine moderne Variante der Inferenzstatistik ein: Der Computer wird angewiesen, viele Stichproben aus einer Population (z.B. laut der Nullhypothese) zu ziehen; man bezeichnet dieses Vorgehen als Simulation. Auf dieser Basis werden dann Aussagen über die Passung eines Datensatzes zu der Population laut Hypothese vorgebracht. Neben einigen konzeptionellen Grundlagen wie dem Bootstrapping wird die Umsetzung dieser Simulationsverfahren in R ausführlich erläutert. Das R-Paket mosaic stellt komfortable Befehle für diesen Zweck zur Verfügung.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Die Inferenzstatistik wird oft als Mischung der Ansätze von Fisher (1955) und Neyman und Pearson (1933) dargestellt; besser wäre, die beiden Theorien auseinanderzuhalten. Auch in diesem Buch wird jedoch der Einfachheit halber nicht zwischen den beiden Ansätzen unterschieden. Eine gute Aufschlüsselung der Unterschiede findet sich bei Gigerenzer (2004).
 
3
Der Term „Signifikanz-Hypothesen-Inferenz-Testen“ hat sich nicht durchgesetzt.
 
4
Das ist genau das Gegenteil von dem, was Herr Popper mit seiner Idee des Falsifizierens meinte: Man soll versuchen, seine eigene Hypothese zu falsifizieren, nicht versuchen, sie zu schätzen, indem man die \(H_{0}\) testet. Außerdem sollte es so sein, dass mit steigender Genauigkeit einer Messung bzw. mit größerer Stichprobe eine Hypothese leichter falsifiziert werden müsste: Meine Hypothese beharrt auf einen gewissen Wert, 42.701. Experimente mit besserem Design, also genaueren Ergebnissen, sollten eine härtere Prüfung für meine Hypothese sein, also leichter zu falsifizieren sein: Genauere Prüfung lässt eine Behauptung schneller als falsch erkennen. Mit dem gängigen Vorgehen verhält es sich aber genau andersherum: Größere Stichproben werden meine Hypothese zunehmend in einem günstigeren Licht erscheinen lassen. Diese und weitere Probleme mit dem \(p\)-Wert in den Sozialwissenschaften sind im klassischen Artikel von Meehl (1978) herausgearbeitet.
 
5
Diese Methode, wie sie hier dargestellt und meist gelehrt wird, ist eine Mischung aus der von Fisher (1955) und der von Neyman und Pearson (1933). Eine genauere Auseinandersetzung findet sich bei Gigerenzer (2004) oder Eid et al. (2010).
 
6
Wir sparen uns hier die Diskussion, ob es faire Münzen gibt (vgl. Jaynes (2003)).
 
7
Die 5 %-Grenze sieht sich auch Kritik ausgesetzt (vgl. Benjamin et al. (2018)).
 
9
S. fortunes::fortune(264).
 
12
Damit haben wir die Variable Kater dichotomisiert; das ist nachteilig, s. fortunes::fortune(279).
 
13
Ohne mosaic: chisq.test(x = extra$sex, extra$viel_saeufer).
 
14
Die verschiedenen Stufen einer Variablen kann man sich so ausgeben lassen: extra %>% distinct(clients_freq).
 
15
Das Paket magrittr stellt die „Dollar-Pfeife“ %$% zur Verfügung, so dass man diesen Aufruf in gewohnter Pfeifen-Manier schreiben kann: extra %$% cor.test(extra_mean, n_facebook_friends).
 
16
Konfidenzintervalle werden meist zweiseitig angegeben; aber auch einseitige sind möglich, vgl. Eid et al. (2010).
 
17
Nach Gelman (2014) (Kommentar um 08:15 pm) wird das Konfidenzintervall in der Praxis immer so interpretiert.
 
18
Hier findet sich eine schöne interaktive Visualisierung zum Konfidenzintervall: http://​rpsychologist.​com/​d3/​CI/​.
 
21
Wahrscheinlich habe ich gerade einen Konfidenzfehler begangen.
 
24
F, F, R, F, R, F, F, R, R, R.
 
25
library(pwr); pwr.anova.test(k = 3, f = 0.1, power = .8).
 
26
Z. B. das Odds Ratio.
 
27
Z. B. mit dem \(\chi^{2}\)-Test.
 
28
?pwr liefert folgende Hinweise (wenn das Paket vorher geladen wurde): „Basic Functions for Power Analysis pwr“ und als Beschreibung (Description): „Power calculations along the lines of Cohen (1988) using in particular the same notations for effect sizes. Examples from the book are given.“
 
Metadaten
Titel
Inferenzstatistik
verfasst von
Sebastian Sauer
Copyright-Jahr
2019
DOI
https://doi.org/10.1007/978-3-658-21587-3_16