Skip to main content
Erschienen in:
Buchtitelbild

2017 | OriginalPaper | Buchkapitel

1. Stichprobe, Zufallsvariable – Histogramm, Dichteverteilung

verfasst von : Carsten F. Dormann

Erschienen in: Parametrische Statistik

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In diesem Kapitel werden die gängigsten Stichprobenstatistiken vorgestellt. Eine ″Statistik″ ist eine Zusammenfassung vieler Messungen. Die wichtigsten Statistiken beschreiben die Lage des Zentrums einer Stichprobe (Mittelwert, Median) und die Streuung (Standardabweichung, Varianz, Interquartilabstand, Minimum/Maximum). Zur Visualisierung werden Häufigkeitsverteilungen anhand von Histogramme, Box-and-Whiskerplots sowie Dichtekurven vorgestellt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Ausprägung, Beobachtung und Realisierung sind hier Synonyme. Realisierung ist am technischsten, Beobachtung vielleicht am intuitivsten. In jedem Fall ist die Zufallsvariable ein hypothetisches Konstrukt, von dem wir nur seine Realisierungen beobachten und stichprobenhaft messen können.
 
2
Diese Histogrammklassen heißen im Englischen bins und das Einteilen heißt tatsächlich to bin.
 
3
Der in R benutzte Algorithmus geht auf die Sturges-Formel zurück: es gibt k bins, mit \(k=\lceil 1+\log_{2}n\rceil\), für n Datenpunkte (\(\lceil\,\rceil\) bedeuten Aufrunden). R variiert dies allerdings, anscheinend werden statt n die Anzahl eindeutiger Werte benutzt. Für weniger als 30 Datenpunkte kann das Ergebnis schon mal hässlich sein. Dann gibt es u. a. noch Scotts Vorschlag: \(k=\frac{3.5\sigma}{n^{1/3}}\). Da wir die Standardabweichung σ aber noch nicht kennengelernt haben, führt das hier zu weit.
 
4
Unrealistisch, ich weiß, aber es sind ja imaginäre StudentInnen.
 
5
Ein Beispiel: Unsere Messwerte sind \(x=(4;2;7;1;9)\). Geordnet sind sie dann \(x^{\prime}=(1;2;4;7;9)\). \(x^{\prime}_{1}\) hätte dann den Wert 1, \(x^{\prime}_{4}=7\). Der Median ist dann entsprechend \(x^{\prime}_{(5+1)/2}=x^{\prime}_{3}=4\).
 
6
Die Berechnung erfordert dabei häufig Interpolationen, und die Statistikprogramme unterscheiden sich z. T. sehr stark in der Art und Weise, wie Quantilen berechnet werden; siehe nächstes Kapitel für Beispiele dazu.
 
7
Im Englischen ist es schon länger üblich nicht mehr vom standard error zu sprechen, sondern nur noch vom standard error of the mean. Das sollten wir uns im Deutschen auch angewöhnen.
 
8
Vollkommen analog gibt es auch für jede andere Stichprobenstatistik einen Standardfehler. Der Standardfehler der Standardabweichung einer Stichprobe ist beispielsweise \(se_{\sigma}=\sigma^{2}\sqrt{\frac{2}{n-1}}\), und wir benutzen s als Schätzer für σ.
 
9
Der Faktor ist äquivalent zu Wahrscheinlichkeitsdichte der Standardnormalverteilung bei 0.75 (1/qnorm(3/4)). Hintergründe werden in Tukey, 1977 () beschrieben.
 
10
Die erste Korrektur (g 2) ist etwa bei SAS und SPSS üblich und die Grundeinstellung bei R in e1071. Minitab benutzt hingegen Korrektur 2, bzw. g 3.
 
11
Mit „Zahlenwerten“ meinen wir hier metrische Variable n, also solche, bei denen der Zahlenwert eine quantitative Aussage macht. Manche Menschen glauben, dass der Berechnung dieser Werte die Annahme der Normalverteilung zugrunde liegt. Das ist nicht so. \(\bar{x}\) und s sind hier Stichprobenstatistiken, keine Verteilungsparameter. Was aber nicht heißt, dass Mittelwert und Standardabweichung immer sinnvolle Aussagen für eine Stichprobe machen.
 
12
Häufig wird dieser Wert mit 100 multipliziert und in % angegeben, hier also 20 %.
 
13
Die Mathematik dahinter ist recht kompliziert. Die Idee ist eine gleitende Berechnung der Dichte, wobei nur die Punkte im Einzugsbereich zur Berechnung beitragen.
 
Metadaten
Titel
Stichprobe, Zufallsvariable – Histogramm, Dichteverteilung
verfasst von
Carsten F. Dormann
Copyright-Jahr
2017
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-54684-0_1