Skip to main content

2019 | Buch

Einführung in die Statistik mit EXCEL und SPSS

Ein anwendungsorientiertes Lehr- und Arbeitsbuch

verfasst von: Prof. Dr. Christine Duller

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

Dieses Lehrbuch führt leicht verständlich und anwendungsorientiert in die beschreibende und schließende Statistik sowie in die Wahrscheinlichkeitsrechnung ein:

Die Methoden der Statistik werden nicht nur beschrieben, sondern auch in EXCEL und SPSS umgesetzt.Zahlreiche Beispiele mit Lösungen ergänzen die Darstellung, daher ist das Buch auch für das Selbststudium gut geeignet.Wesentliche Aspekte sind übersichtlich zusammengefasst, um das Lernen zu erleichtern und ein schnelles Nachschlagen zu ermöglichen.

In der vierten Auflage wurden inhaltliche Ergänzungen (Boxplots und Fisher-Test) vorgenommen und die Software-bezogenen Inhalte an die jeweils aktuellen Versionen angepasst (IBM SPSS Statistics 25, Microsoft EXCEL 2019).

Inhaltsverzeichnis

Frontmatter

Einführung

Frontmatter
Kapitel 1. Was ist Statistik?
Zusammenfassung
In diesem Kapitel wird der Begriff Statistik definiert und einige Anwendungsbeispiele zeigen, dass Statistik auch im Alltag eine wichtige, wenngleich oft wenig wahrgenommene Rolle spielt. Die Einführung der wichtigsten Grundbegriffe und eine kurze Beschreibung von Teilbereichen der Statistik runden dieses Einführungskapitel ab.
Christine Duller
Kapitel 2. Ablauf einer statistischen Analyse
Zusammenfassung
Dieses Kapitel skizziert die Schritte, die vor bzw. nach der eigentlichen statistischen Auswertung notwendig sind. NewcomerInnen in der Statistik kennen zwar die Methoden zur Datenauswertung, in der Praxis liegen aber die Probleme oft in den Phasen vor bzw. nach der statistischen Auswertung. Wichtige Begriffe, wie Merkmal, Merkmalsausprägung und Skalenniveau von Merkmalen werden definiert und anhand von Beispielen beschrieben.
Christine Duller
Kapitel 3. Das Tabellenkalkulationsprogramm EXCEL
Zusammenfassung
In diesem Kapitel werden einige wenige wichtige Grundelemente von Excel beschrieben. Besonderheiten, die für statistische Analysen bzw. für Berichte mit statistischen Analysen wichtig sind, werden gesondert herausgegriffen (z. B. Zahlenformate, Zellenformatierungen, Anlegen einer Datenmatrix).
Christine Duller
Kapitel 4. Das Statistikprogramm IBM SPSS Statistics
Zusammenfassung
IBM SPSS Statistics (SPSS = Statistical Package for the Social Sciences), im Folgenden kurz SPSS, ist eine Software, welche speziell für statistische Auswertungen konzipiert ist. Die Ausführungen in diesem Buch beziehen sich auf die Version 25 für Windows. In diesem Kapitel werden der Aufbau des Programms und einige grundlegenden Funktionen zur Variablenbearbeitung vorgestellt.
Christine Duller

Beschreibende Statistik

Frontmatter
Kapitel 5. Eindimensionale Häufigkeitsverteilungen
Zusammenfassung
Häufigkeitsverteilungen geben einen ersten guten Überblick über wesentliche Informationen in den Daten. Normalerweise liegen viele einzelne Datenwerte vor (großer Untersuchungsumfang), daher müssen die Daten in einem ersten Schritt in geeigneter Form aufbereitet werden. Dazu werden die Daten nach Ausprägungen zusammengefasst und in Tabellen und/oder Grafiken dargestellt. Je nach Skalenniveau und Anzahl der Ausprägungen gibt es unterschiedliche Darstellungsformen. In diesem Kapitel werden Häufigkeitsverteilungen für diskrete und stetige Merkmale und als Grafiken Kreisdiagramme, Stabdiagramme und Histogramme vorgestellt. Die Verteilungsfunktion und ihre grafische Darstellung rundet diese erste Datenanalyse ab. Die Umsetzung erfolgt insbesondere auch in Excel und SPSS.
Christine Duller
Kapitel 6. Maßzahlen für eindimensionale Verteilungen
Zusammenfassung
Häufigkeitsverteilungen geben einen ersten Überblick über Informationen aus der Urliste. Oft ist man aber an Informationen in sehr komprimierter Form interessiert. Dabei soll möglichst viel Information über die Daten in einer einzigen Zahl verarbeitet werden. Dies gelingt bis zu einem gewissen Grad mit Lagemaßzahlen (z. B. dem Mittelwert), die das Zentrum einer Verteilung widerspiegeln. Dieses Zentrum kann auf unterschiedliche Arten festgestellt werden, daher gibt es auch unterschiedliche Lagekennzahlen. Welche Lagemaßzahl für den konkreten Fall geeignet ist, entscheidet unter anderem das Skalenniveau des Merkmals, aber auch andere Kriterien sind zu beachten. Die Aussagekraft einer Lagemaßzahl ist begrenzt, daher wird im Normalfall zur besseren Charakterisierung der Datenverteilung noch zusätzlich eine Streuungsmaßzahl erhoben. Diese gibt an, wie weit die Daten von einander oder von einer Lagemaßzahl abweichen. Neben Maßzahlen der Lage und der Streuung werden auch weitere Gestaltmerkmale (Schiefe und Wölbung) vorgestellt, die beispielsweise messen, ob eine Verteilung symmetrisch ist oder nicht.
Christine Duller
Kapitel 7. Multivariate deskriptive Statistik
Zusammenfassung
In den meisten Anwendungsfällen ist man nicht nur an einem Merkmal interessiert, sondern an mehreren Merkmalen und insbesondere an den Zusammenhängen zwischen diesen Merkmalen. Beispielsweise soll die Frage beantwortet werden, ob bei Kindern die sportliche Aktivität die Schlafdauer beeinflusst oder Ähnliches. Zu diesem Zweck müssen von den Erhebungseinheiten mehrere Merkmale gleichzeitig erhoben und einer gemeinsamen Analyse unterzogen werden. Im einfachsten Fall sollen zwei Merkmale gemeinsam analysiert werden. Dieses Kapitel zeigt den Umgang und die Interpretation von zweidimensionalen Häufigkeitsverteilungen und stellt geeignete Maßzahlen für die Messung des Zusammenhanges zwischen zwei Merkmalen vor. Nach einer allgemeinen Darstellung wird die Umsetzung in EXCEL und SPSS beschrieben.
Christine Duller
Kapitel 8. Die Regressionsanalyse
Zusammenfassung
Mit dem Begriff Regressionsanalyse werden Verfahren bezeichnet, die den Einfluss von einer oder mehreren Variablen auf eine Zielgröße untersuchen. Der Ursache-Wirkungs-Zusammenhang soll mit Hilfe einer mathematischen Funktion modelliert werden. Es gibt eine Vielfalt an Regressionsverfahren, die sich hinsichtlich der Anzahl der erklärenden Variablen, der mathematischen Funktionen und der Skalenniveaus der Merkmale unterscheiden. Im einfachsten Fall gibt es nur eine erklärende Variable, es wird eine lineare Funktion verwendet und die Merkmale sind metrisch. Dieser Fall der linearen Einfachregression wird hier vorgestellt.
Christine Duller

Wahrscheinlichkeitsrechnung

Frontmatter
Kapitel 9. Wahrscheinlichkeitsrechnung
Zusammenfassung
Bisher haben wir Datensätze beschrieben, uns also mit der deskriptiven Statistik beschäftigt. Diese Datensätze können entweder alle interessierenden Objekte umfassen (Vollerhebung einer Grundgesamtheit) oder nur einen Auszug aus dieser Grundgesamtheit (Stichprobe). In der Praxis wird der Datensatz meistens eine Stichprobe beinhalten, weil die Vollerhebung zu teuer oder nur schwer möglich ist. Die schließende (induktive) Statistik stellt Methoden bereit, um Rückschlüsse von einer Stichprobe auf die Grundgesamtheit zu ermöglichen. Diese Methoden basieren auf wahrscheinlichkeitstheoretischen Grundlagen. Daher ist es notwendig, sich mit den Grundbegriffen und Denkweisen der Wahrscheinlichkeitsrechnung vertraut zu machen.
Christine Duller
Kapitel 10. Diskrete Wahrscheinlichkeitsverteilungen
Zusammenfassung
Analog zur beschreibenden Statistik wird auch in der Wahrscheinlichkeitsrechnung zwischen diskreten und stetigen Zufallsvariablen unterschieden. Bei Zufallsexperimenten mit diskreten Zufallsvariablen besteht der Ereignisraum bei entsprechender Kodierung aus einer Teilmenge der natürlichen Zahlen. Gedanklich sind manche diskrete Wahrscheinlichkeitsverteilungen mit sogenannten Urnenmodellen hinterlegt. Als spezielle diskrete Verteilungen werden in diesem Kapitel die Alternativverteilung, die diskrete Gleichverteilung, die Binomialverteilung, die Hypergeometrische Verteilung und die Poissonverteilung beschrieben.
Christine Duller
Kapitel 11. Stetige Wahrscheinlichkeitsverteilungen
Zusammenfassung
Ausgangspunkt für stetige Wahrscheinlichkeitsverteilungen ist ein Zufallsexperiment und eine Zufallsvariable mit stetigem Ausgang, dem entsprechend umfasst der Wertebereich ein Intervall \([a,b] \subset \mathbb {R}\). Als Realisierung einer in [ab] stetigen Zufallsvariablen kann damit jeder beliebige Wert aus diesem Intervall auftreten. Es gibt somit überabzählbar unendlich viele mögliche Realisationen. Nach den Definitionen für Dichte, Verteilungsfunktion, Erwartungswert und Varianz werden zwei konkrete stetige Wahrscheinlichkeitsverteilungen betrachtet, die stetige Gleichverteilung und die Normalverteilung. Abschließend werden auf die Möglichkeiten zur Approximation durch die Normalverteilung eingegangen.
Christine Duller

Schließende Statistik

Frontmatter
Kapitel 12. Die Gedankenwelt der schließenden Statistik
Zusammenfassung
In der Praxis ist es oft nicht möglich, alle interessierenden Objekte der Grundgesamtheit zu untersuchen. Man muss sich dann mit einer Auswahl aus dieser Grundgesamtheit, der Stichprobe, begnügen. Ziel der schließenden Statistik ist es nun, Rückschlüsse von der Stichprobe auf die Grundgesamtheit zu ermöglichen. Die schließende Statistik umfasst die beiden Teilbereiche Schätzen und Testen. Grundlage der Analyse ist in beiden Fällen eine Zufallsstichprobe aus der Grundgesamtheit. Alle hier vorgestellten Formeln und Verfahren beruhen auf dem Vorliegen einer einfachen Zufallsauswahl und dürfen daher nicht angewendet werden, wenn diese Voraussetzung verletzt ist.
Christine Duller
Kapitel 13. Statistisches Testen
Zusammenfassung
Ein statistischer Test ist eine Regel zur Entscheidung bei Unsicherheit. Diese Unsicherheit liegt vor, weil man keine Kenntnisse über die Grundgesamtheit im vollen Umfang hat, sondern nur über eine Stichprobe aus dieser Grundgesamtheit. Die Entscheidung ist zwischen zwei Behauptungen zu treffen, die als Hypothesen bezeichnet werden. In diesem Kapitel werden zuerst einige Begriffe der Testtheorie eingeführt und danach einige wichtige Tests (Mittelwert, Anteil, Zusammenhang für zwei nominale Merkmale) genauer beschrieben.
Christine Duller
Kapitel 14. Tabellen
Zusammenfassung
In diesem Kapitel werden Tabellen als Grundlage für eine händische Berechnung zur Verfügung gestellt. Die Tabellen enthalten Werte der Verteilungsfunktion der Standardnormalverteilung (Tab. 14.1), ausgewählte Quantile der Standardnormalverteilung (Tab. 14.2), Quantile der Student-Verteilung (t-Verteilung, Tab. 14.3) und Quantile der Chi-Quadrat-Verteilung (Tab. 14.4).
Christine Duller
Backmatter
Metadaten
Titel
Einführung in die Statistik mit EXCEL und SPSS
verfasst von
Prof. Dr. Christine Duller
Copyright-Jahr
2019
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-59410-0
Print ISBN
978-3-662-59409-4
DOI
https://doi.org/10.1007/978-3-662-59410-0