2008 | OriginalPaper | Chapter
Univariate Statistik
Author : Dr. Nina Baur
Published in: Datenanalyse mit SPSS für Fortgeschrittene
Publisher: VS Verlag für Sozialwissenschaften
Activate our intelligent search to find suitable subject content or patents.
Select sections of text to find matching patents with Artificial Intelligence. powered by
Select sections of text to find additional relevant content using AI-assisted search. powered by
Wenn Sie Datensätze analysieren, sollten Sie als erstes die eindimensionalen Häufigkeitsverteilungen untersuchen, d. h. Sie sollten jede Variable zunächst für sich analysieren. Insbesondere die Verteilung, Lage, Streuung und Schiefe jeder Variablen müssen untersucht werden. Die Ziele hierbei sind:
1)
Man bekommt ein Gefühl für die Daten. Dadurch kann man später leichter abschätzen, ob bestimmte Ergebnisse überhaupt richtig sein können. Wenn man z. B. den Datensatz einer Untersuchung analysiert, in der Jugendliche befragt wurden, kann es nachher nicht sein, dass eine Person bei der Variable „Alter“ den Wert „89 Jahre“ aufweist oder dass der Mittelwert der Variable „Alter“ bei „40 Jahren“ liegt. Solche Ergebnisse sind Hinweise auf Fehler im Datensatz oder falsche Syntaxen.
2)
Die Untersuchung der eindimensionalen Häufigkeitsverteilungen ergibt erste Hinweise, ob die Fragebögen richtig ausgefüllt wurden oder ob bei der Eingabe in den PC Fehler gemacht wurden. Ein typischer Fehler ist z. B., dass fehlende Werte nicht als solche definiert wurden. Auch kann es z. B. nicht sein, dass jemand ein negatives Alter hat usw. (siehe auch Kapitel 3 in diesem Band).
3)
Wenn Variablen zu schief verteilt sind, sind sie oft für die weitere Analyse wertlos.
Beispiel
: Man möchte den Unterschied zwischen Männern und Frauen untersuchen. Man hat einen Datensatz mit 100 Fällen. Von diesen 100 Befragten waren 98 männlich, 2 weiblich. Die Verteilung ist also extrem schief. Durch diese Schiefe kann man die Unterschiede zwischen Männern und Frauen nicht sinnvoll untersuchen. Es macht beispielsweise nicht viel Sinn, bei zwei Frauen das durchschnittliche Alter zu untersuchen.
4)
Man prüft die Voraussetzungen (sofern diese existieren) für die Verfahren, die man später anwenden will. Z. B. verlangen viele Verfahren zur Verarbeitung metrischer Variablen eine (approximative) Normalverteilung (vgl. hierzu
Behnke
und
Behnke
(2006),
Benninghaus
(2005),
Jann
(2002) oder
Vogel (2000)).
Wenn diese Voraussetzungen nicht erfüllt sind, darf man das entsprechende Verfahren nicht anwenden. Tut man es doch, besteht die Gefahr, dass man Datenartefakte produziert. Man kann sich nun überlegen, wie man damit umgeht: Entweder man wendet ein anderes Verfahren an, oder man transformiert die Daten (vgl. hierzu
Vogel
(2000)). In manchen Fällen ist die Anwendung eines Verfahrens unter Einschränkungen auch dann möglich, wenn bestimmte Voraussetzungen nicht erfüllt sind. Dies erfordert dann aber eine vorsichtige Interpretation. Näheres hierzu finden Sie — am Beispiel der Ordinalskalen-in Kapitel 12.
5)
Schließlich kann man alle absolut interpretierbaren Variablen mit Hilfe der eindimensionalen Häufigkeitsverteilungen interpretieren und so erste wertvolle Informationen erhalten.