Skip to main content

2013 | Buch

Angewandte Statistik

Eine Einführung für Biologen und Mediziner

insite
SUCHEN

Über dieses Buch

Die „Angewandte Statistik“ ist ein Lehr- und Übungsbuch für Anwenderinnen und Anwender der Statistik, die ein Verständnis für statistische Methoden und eine Sicherheit in der Anwendung dieser Methoden erwerben wollen. Vorausgesetzt wird nur die Kenntnis der für den Universtäts- oder Fachhochschulzugang erforderlichen Schulmathematik. Das Lehrbuch führt zuerst in die Wahrscheinlichkeitsrechnung ein und stellt grundlegende Wahrscheinlichkeitsverteilungen vor. Ausführlich werden die Parameterschätzung und das Testen von Hypothesen behandelt. Mit den gängigen Korrelationsmaßen und ausgewählten Regressionsmodellen wird die statistische Grundbildung abgerundet. Die Kapitel über varianzanalytische Modelle und multivariate Verfahren geben einen Einblick in zwei weitere, für die statistische Praxis relevante Gebiete. Darüber hinaus werden Vertiefungen und spezielle Anwendungen in ergänzenden Abschnitten bereitgestellt. Zahlreiche, vollständig durchgerechnete Beispiele und Übungsaufgaben mit einem ausführlichen Lösungsteil machen die „Angewandte Statistik“ zu einem Arbeitsbuch, das sich auch zum Selbststudium eignet. Die Ausrichtung auf die Statistik-Software R (durch Verweise auf die entsprechenden R-Funktionen und die Angabe des R-Codes bei den Lösungen der Aufgaben) trägt der Bedeutung computerunterstützter Problemlösungen in der statistischen Praxis Rechnung.

Inhaltsverzeichnis

Frontmatter
1. Rechnen mit Wahrscheinlichkeiten
Zusammenfassung
Auch wer sich bloß als Anwender von statistischen Methoden sieht, sollte zumindest die in der einschlägigen Literatur (z. B. Softwaredokumentationen) beschriebenen Anwendungsvoraussetzungen verstehen und die erhaltenen Ergebnisse richtig interpretieren können. Zu diesem Zweck ist eine Vertrautheit mit dem Wahrscheinlichkeitsbegriff und einfachen Regeln für das Rechnen mit Wahrscheinlichkeiten ebenso nützlich wie die Kenntnis der grundlegenden Wahrscheinlichkeitsverteilungen. Das erste Kapitel führt in die Begriffswelt der Wahrscheinlichkeitsrechnung ein, die das mathematische Standbein der Statistik darstellt. Die Einführung ist weitgehend heuristisch und verbal-beschreibend abgefasst; auf Grund der wachsenden Durchdringung der Disziplinen mit mathematisch-statistischen Formalismen wird aber auch die mathematische Symbolik soweit verwendet, als sie zum Verständnis von Formeln erforderlich ist, die in Praxis auftreten.
Werner Timischl
2. Zufallsvariablen und Wahrscheinlichkeitsverteilungen
Zusammenfassung
Zu den ersten Erfahrungen beim Messen einer Größe X gehört, dass wiederholtes Messen mehr oder weniger stark abweichende Ergebnisse liefert: Die Messwerte von X zeigen eine Zufallsvariation. Diese kann Ausdruck eines die Messwerte erzeugenden Zufallsexperimentes sein, wie z. B. beim radioaktiven Zerfall, wo die Messgröße (Anzahl der emittierten Teilchen pro Zeiteinheit) statistisch um einen mittleren Zahlenwert schwankt. Aber auch Größen, die an sich einen festen oder wie man auch sagt, wahren Wert besitzen, erhalten durch den Messvorgang eine Zufallskomponente überlagert, die den regellos um den wahren Wert schwankenden Messfehler ausdrückt. Schließlich kann der Zufallscharakter einer Beobachtungsgröße durch die Stichprobenauswahl selbst verursacht sein, wie dies z. B. bei der Anzahl der fehlerhaften Einheiten beim Ziehen einer Prüfstichprobe aus einem Produktionslos der Fall ist. Beobachtungsgrößen zeigen also i.Allg. eine Zufallsvariation und werden – in Verbindung mit Zufallsexperimenten – durch Zufallsvariablen modelliert. In diesem Kapitel geht es um den Begriff und um Eigenschaften von Zufallsvariablen sowie um die Beschreibung der zufälligen Variation von ausgewählten Zufallsvariablen durch Wahrscheinlichkeitsverteilungen.
Werner Timischl
3. Parameterschätzung
Zusammenfassung
Im Mittelpunkt der Arbeit des angewandten Statistikers stehen Daten. Daten gewinnt man durch Beobachten, Befragen oder Messen unter „natürlichen“ oder künstlich geschaffenen Versuchsbedingungen im Rahmen eines Experimentes. An die Datengewinnung schließt als nächster Schritt die Datenbeschreibung in Form von Tabellen, Grafiken oder durch Kenngrößen an. Die Datenbeschreibung stellt meist nur die Vorstufe einer Untersuchung dar, deren eigentliches Ziel darin besteht, von den an einer Stichprobe gewonnenen Ergebnissen zu Aussagen über die Zielpopulation zu gelangen, aus der die Untersuchungseinheiten ausgewählt wurden. Aussagen über die Zielpopulation gewinnt man durch „induktives Schließen“. Eine Form des induktiven Schließens ist die Parameterschätzung, bei der es um die folgende Aufgabenstellung geht: Die Variation eines interessierenden Merkmals ist in der Zielpopulation durch eine Zufallsvariable mit einer gewissen Wahrscheinlichkeitsverteilung modelliert, die i. Allg. unbekannte Parameter enthält. Für diese Parameter sind Schätzwerte zu ermitteln und die Schätzungen durch Angaben über deren Genauigkeit zu ergänzen.
Werner Timischl
4. Testen von Hypothesen
Zusammenfassung
Bei der Sicherung von Wissen spielen logische Schlussweisen und Wahrscheinlichkeitsschlüsse eine entscheidende Rolle. Logische Schlussweisen führen zu gesichertem Wissen, wie es die Sätze der Mathematik sind. Wahrscheinlichkeitsschlüsse erzeugen dagegen unsicheres Wissen, wie es z. B. die Diagnose eines Arztes ist. Auch die statistischen Tests fallen in diese Kategorie. Statistische Tests, wie sie im Folgenden besprochen werden, sind Verfahren, mit denen man eine Entscheidung zwischen zwei alternativen Hypothesen herbeiführen will. Man spricht deshalb auch von Alternativtests. Unter den Hypothesen hat man sich Aussagen über Parameter der Grundgesamtheit vorzustellen; z. B. kann es um die Frage gehen, ob der Mittelwert der Grundgesamtheit von einem festen Sollwert abweicht oder mit diesem übereinstimmt. Die Entscheidung zwischen den Alternativen erfolgt auf der Grundlage von Zufallsstichproben aus der Grundgesamtheit. Aufgabe der mathematischen Statistik ist es, für den Anwender Tests zur Verfügung zu stellen, die zu Entscheidungen mit geringem Fehlerrisiko führen. In diesem Abschnitt werden die Methodik des Testens an Hand von Beispielen erläutert und grundlegende 1- und 2-Stichprobentests vorgestellt.
Werner Timischl
5. Korrelation und Regression
Zusammenfassung
Im Mittelpunkt dieses Kapitels steht die Erfassung der gemeinsamen Variation von zwei Merkmalen. Die Beschreibung der gemeinsamen Variation der Merkmale kann auf zwei verschiedene Arten vorgenommen werden. Einerseits im Rahmen einer Korrelationsanalyse, in der die „Stärke“ des Zusammenhanges durch Kenngrößen (Korrelationsmaße) ausgedrückt wird, und andererseits im Rahmen einer Regressionsanalyse, in der die Abhängigkeit des einen Merkmals vom anderen mit Hilfe von Funktionsgleichungen modelliert wird. Bei Beschränkung auf zwei Merkmale spricht man genauer von einfacher Korrelation bzw. einfacher Regression.
Die damit gewonnenen Ergebnisse lassen sich nur schwer interpretieren, wenn die betrachteten Variablen Einflüssen unterliegen, die von einer dritten Variablen verursacht werden. Der Einfluss dieser Variablen kann mit den Instrumenten der mehrfachen Regression und partiellen Korrelation erfasst bzw. ausgeschaltet werden.
Werner Timischl
6. Ausgewählte Modelle der Varianzanalyse
Zusammenfassung
Wie in anderen Disziplinen werden auch in der Statistik Versuche zur Gewinnung von Erkenntnissen eingesetzt. Es ist nützlich, einen Versuch als ein Input/Output- System zu sehen. Den Systemoutput denken wir uns dabei als eine Zielvariable, den Systeminput als Einflussvariablen, von denen zwei Arten zu unterscheiden sind. Die einen werden vom Experimentator gezielt verändert, um die Abhängigkeit der Zielvariablen von den Einflussvariablen zu studieren. Die anderen entziehen sich der Kontrolle durch den Experimentator; sie haben den Charakter von Störgrößen, die einen mehr oder weniger großen Versuchsfehler bewirken. Es ist ein wichtiges Ziel bei der Planung von Versuchen, den Versuchsfehler klein zu halten. Ein Beispiel für eine einfache Versuchsanlage ist der im Zusammenhang mit dem 2-Stichproben-t - Test betrachtete Parallelversuch. Bei diesem geht es um den Vergleich von zwei Bedingungen (meist einer „Testbehandlung“ mit einer „Kontrollbehandlung“). Die Verallgemeinerung dieser Versuchsanlage auf mehr als zwei Behandlungsgruppen führt zu randomisierten Versuchen mit einem mehrstufigen Faktor, denen das Modell der einfaktoriellen Varianzanalyse zugrunde liegt. Dieses Grundmodell der Varianzanalyse kann in vielfältiger Weise verfeinert und verallgemeinert werden. Einfache und für die Praxis wichtige Versuchsanlagen sind die Blockvarianzanalyse, die Kovarianzanalyse sowie die zweifaktorielle Varianzanalyse.
Werner Timischl
7. Einführung in multivariate Verfahren
Zusammenfassung
Die multivariaten Methoden umfassen eine Vielzahl von beschreibenden und induktiven Verfahren, mit denen mehrere Variable gleichzeitig analysiert werden können. Im Gegensatz zu univariaten Datenanalysen geht es in der multivariaten Statistik primär darum, durch simultane Betrachtung mehrerer Variablen neue Einsichten über Beziehungsstrukturen zwischen den Variablen oder Untersuchungseinheiten (Objekten) zu gewinnen. Man kann z.B. fragen, ob die Stichprobe strukturiert ist, d. h., in Gruppen von in den Variablenwerten „ähnlichen“ Objekten zerlegt werden kann. Wie man Strukturen in der Menge der Objekte aufdeckt, lehrt die Clusteranalyse. In der Hauptkomponentenanalyse stehen die Beziehungen zwischen den Variablen im Mittelpunkt des Interesses. Mit der Hauptkomponentenanalyse wird durch Übergang zu neuen Variablen (den sogenannten Hauptkomponenten) oft eine Reduktion der Anzahl der Variablen erreicht, indem man sich auf die „wesentlichen“ Hauptkomponenten beschränkt und die anderen weglässt. Eine weitere klassische Fragestellung behandelt die Diskriminanzanalyse. Auf Grund der beobachteten Variablenwerte sollen neue Objekte einer von mehreren vorgegebenen Gruppen von Objekten zugewiesen werden. Die Ausführungen können nur eine erste Einführung in das große Gebiet der multivariaten Statistik sein.
Werner Timischl
8. Appendix
Zusammenfassung
Statistische Tafeln, R-Funktionen und Lösungen der Aufgaben.
Werner Timischl
Backmatter
Metadaten
Titel
Angewandte Statistik
verfasst von
Werner Timischl
Copyright-Jahr
2013
Verlag
Springer Vienna
Electronic ISBN
978-3-7091-1349-3
Print ISBN
978-3-7091-1348-6
DOI
https://doi.org/10.1007/978-3-7091-1349-3