Skip to main content

2009 | Buch

Angewandte Statistik

Methodensammlung mit R

verfasst von: Lothar Sachs, Jürgen Hedderich

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

Die Anwendung statistischer Methoden wird heute in der Regel durch den Einsatz von Computern unterstützt. Das frei verfügbare Programm R ist dabei ein leicht erlernbares und flexibel einzusetzendes Werkzeug, mit dem der Prozess der Datenanalyse nachvollziehbar verstanden und gestaltet werden kann. Die Anwendung und der Nutzen des Programms werden in diesem Buch anhand zahlreicher mit R durchgerechneter Beispiele veranschaulicht. Es erläutert statistische Ansätze und gibt leicht fasslich, anschaulich und praxisnah Studenten, Dozenten und Praktikern die notwendigen Details, um Daten zu gewinnen, zu beschreiben und zu beurteilen. Es dient zum Lernen, Nachschlagen und Anwenden bei unterschiedlichen Vorkenntnissen und breit gestreuten Interessen in der Hochschule und in der Praxis. Neben Hinweisen und Empfehlungen zur Planung und Auswertung von Studien ermöglichen zahlreiche Beispiele, Querverweise und ein ausführliches Sachverzeichnis einen gezielten Zugang zur Statistik, insbesondere für Mediziner, Ingenieure und Naturwissenschaftler. Die in der Vorauflage neu eingeführte Struktur hat zahlreiche Ergänzungen und Vertiefungen zu ausgewählten Methoden der Angewandten Statistik ermöglicht. Darüber hinaus erfolgten viele Aktualisierungen, insbesondere auch hinsichtlich der Beispiele in R, sowie eine Überarbeitung des Sachverzeichnisses.

Inhaltsverzeichnis

Frontmatter
1. Einführung
Zusammenfassung
Jeder von uns hat es erlebt, dass er wie der eingebildete Kranke und der eingebildete Gesunde echte Zusammenhänge oder echte Unterschiede nicht erkennt bzw. dass er nicht existente Unterschiede oder Zusammenhänge zu erkennen glaubt. Im Alltag erfassen wir einen Zusammenhang oder einen Unterschied mit Hilfe von Sachkenntnis und nach dem sogenannten ersten "Eindruck". Der Wissenschaftler, der gewisse neue Erscheinungen, Abhängigkeiten, Trends, Effekte vieler Art entdeckt und darauf eine Arbeitshypothese gründet, sichert diese ab gegen die Hypothese: die festgestellten Effekte sind allein durch den Zufall bedingt.
2. Grundlagen aus der Mathematik
Zusammenfassung
In diesem Kapitel werden einige elementare mathematische Kenntnisse wiederholt. Sie bilden mit einigen Ausnahmen (insbesondere hinsichtlich einer kurzen Einführung in den Umgang mit Matrizen) einen Teil des für die mittlere Reife geforderten Wissens. Diese Kenntnisse reichen vollauf für das Verständnis der in den weiteren Kapiteln behandelten Probleme.
3. Deskriptive Statistik
Zusammenfassung
Die Verfahren der deskriptiven Statistik können grundsätzlich nach vier Gesichtspunkten eingeteilt werden. Maßzahlen, die
1. eine zentrale Tendenz (Lage) von Beobachtungen / Messungen ausdrücken,
2. die eine Streuung oder Variabilität in den Beobachtungen / Messungen erfassen,
3. die die Form bzw. das Profil der (Häufigkeits-) Verteilung beschreiben und
4. die weitere spezielle Aspekte, z.B. den Zusammenhang oder eine Assoziation zwischen zwei Beobachtungsreihen, untersuchen.
4. Wahrscheinlichkeiten
Zusammenfassung
Die Unsicherheit von Entscheidungen lässt sich durch die Wahrscheinlichkeitstheorie quantitativ erfassen. Anders ausgedrückt: Wahrscheinlichkeitstheoretische Begriffe gestatten die Gewinnung optimaler Entscheidungsverfahren. Wir haben uns daher zunächst dem Begriff Wahrscheinlichkeit zuzuwenden.
5. Zufallsvariablen, Verteilungen
Zusammenfassung
Eine Zufallsvariable ist eine Größe, die bei einem Zufallsexperiment auftritt, z. B. das Werfen einer "6" mit einem Würfel oder die Länge der Brenndauer einer Glühbirne. Eine Zufallsvariable oder zufällige Variable ordnet jedem Ausgang des Experimentes eine Zahl zu (vgl. Abbildung 5.1). Hat man ein Experiment gemacht, bei dem die Zufallsvariable X einen Wert x angenommen hat, so nennt man x eine Realisierung von X. Die Grundgesamtheit ist eine Menge aller möglichen Realisierungen einer Zufallsvariablen, die Stichprobe ist die n-fache Realisierung. Die Werte von x sind reelle Zahlen. Hierunter versteht man Zahlen, die sich durch Dezimalzahlen mit endlich (2,−4) oder unendlich vielen Stellen [periodisch (−7/3) oder nicht periodisch (√2, lg 3, π, e)] darstellen lassen. Die Wahrscheinlichkeit des Ereignisses, dass X irgendeinen Wert in dem Intervall von a bis b annimmt, bezeichnen wir mit P(a < X < a). Entsprechend ist P(−∞ < X < +∞) das sichere Ereignis, da X ja stets irgendeinen Wert auf der Zahlengeraden annehmen muss.
6. Schätzen
Zusammenfassung
Die Beurteilende Statistik setzt stets Zufallsstichproben voraus. Diese meinen wir auch, wenn wir in den folgenden Kapiteln von "Stichproben", "Daten", "Beobachtungen", "Messreihen" und "Messwerten" sprechen. Daher noch einmal: Zufallsstichproben sind Teile einer Grundgesamtheit, die durch einen Auswahlprozess mit Zufallsprinzip aus dieser entnommen und stellvertretend, repräsentativ für die Grundgesamtheit sind. Ein Teil einer Grundgesamtheit kann auch dann als repräsentative Stichprobe angesehen werden, wenn das den Teil bestimmende Teilungs- oder Auswahlprinzip zwar nicht zufällig, aber von den auszuwertenden Merkmalen stochastisch unabhängig ist.
7. Hypothesentest
Zusammenfassung
Folgende nette Geschichte stammt von R.A. Fisher [Fis60]. auf einer Gesellschaft behauptet eine Dame X: Setze man ihr eine Tasse Tee vor, der etwas Milch beigegeben wurde, so könne sie im allgemeinen einwandfrei schmecken, ob zuerst Tee oder ob zuerst Milch eingegossen worden sei. Wie prüft man diese Behauptung? Sicher nicht so: Zwei äußerlich völlig gleichartige Tassen vorsetzen,wobei in die erste zuerst Milch und dann Tee (Reihenfolge MT) und in die zweite zuerst Tee und dann Milch (TM) eingegossen wurde. Würde man jetzt die Dame wählen lassen, so hätte sie offenbar eine Chance von 50% die richtige Antwort zu geben, auch wenn ihre Behauptung falsch ist.
8. Statistische Modellbildung
Zusammenfassung
In zahlreichen wissenschaftlichen Studien (in der Medizin, der Industrie, der Ökonometrie) ist es erforderlich, den Zusammenhang zwischen mindestens zwei Variablen in mathematischen Modellen darzustellen. Diese Modelle führen zu
- einem besseren Verständnis dieser Zusammenhänge,
- ermöglichen Vorhersagen oder
- unterstützen Entscheidungsprozesse.
Dabei handelt es sich nicht um deterministische (vollständig reproduzierbare), sondern um ’stochastische’ Zusammenhänge, in denen eine Zufallskomponente zu berücksichtigen ist.
9. Einführung in R
Zusammenfassung
R ist in erster Linie eine Programmiersprache und Programmierumgebung für die statistische Analyse von Daten. R kann einerseits elementare mathematische Rechenoperationen ausführen, berechnet andererseits aber auch anspruchsvolle komplexe statistische Funktionen. R wurde ursprünglich von Ross Ihaka und Robert Gentleman am Statistics Department of the University of Auckland entwickelt [IG96]. Aktuell wird das Programm durch eine internationale Arbeitsgruppe, das "R Development Core Team" gepflegt und weiterentwickelt [R D08].
Backmatter
Metadaten
Titel
Angewandte Statistik
verfasst von
Lothar Sachs
Jürgen Hedderich
Copyright-Jahr
2009
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-540-88904-5
Print ISBN
978-3-540-88901-4
DOI
https://doi.org/10.1007/978-3-540-88904-5

Premium Partner