Skip to main content
main-content

Über dieses Buch

Intelligentes Datenmanagement ist unabdingbare Grundlage und Voraussetzung für informationsbasierte Entscheidungen in allen Anwendungsbereichen und –ebenen.

Dies ist das erste deutschsprachige Buch zum anwendungsorientierten Datenmanagement mit SPSS. Es hebt die fundamentale Rolle von explizitem und kontrolliertem Datenmanagement für die Analyse von Daten hervor, indem es beim Zugang zum Programm Einsatzmöglichkeiten von SPSS aufzeigt, die weit über die Optionen für Mauslenker hinausgehen. Die Didaktik des Buches ist dabei anwendungs- und erfolgsorientiert. Die Einsatzmöglichkeiten des Datenmanagements mit SPSS Syntax sind dabei nach praxisorientierten Fragestellungen geordnet, die wiederum von unkomplizierten Zugängen bis zu anspruchsvolleren Ansätzen gesteigert werden.

Inhaltsverzeichnis

Frontmatter

1. Nicht aller Anfang ist schwer

2. Start! Am Anfang ist der Datensatz

Zusammenfassung
In diesem Kapitel wird ein Datensatz zunächst per Mausklick geladen. Die von SPSS dabei ausgegebene Syntax wird als erstes eigenes SPSS-Programm verwendet. Die Basissyntax wird später weiter verfeinert, z.B. wird der geöffnete Datensatz unter anderem Namen abgespeichert.

3. Datenmanagement auf Datensatzebene

Zusammenfassung
Das Datenmanagement auf der Ebene des Datensatzes zielt auf Operationen am Datensatz selbst ab, z.B. Laden, Speichern, Unterteilen uvam. Ob Variablen in irgendeiner Form von diesen Operationen betroffen sind, ist von nachgeordneter Bedeutung.
Zu beachten ist, dass die Ergebnisse dieser Operationen nur über die Protokollierung durch die Befehlssyntax oder, bei kleineren Datensätzen, am Datensatz und seinen Variablen geprüft werden können und auch immer überpruft werden sollten. Um diese Operationen durchführen zu können, muss der Dateneditor einen aktiven Datensatz enthalten. Zu den in Kapitel 2 bereits vorgestellten Grundoperationen gehören u.a. das Öffnen (GET FILE=), das Umbenennen und das Speichern eines Datensatzes (SAVE OUTFILE=).
Im Folgenden werden die am häufigsten vorkommenden Fälle des komplexeren Datenmanagements vorgestellt und in Syntaxbeispielen dargestellt, u.a. Daten einlesen (3.8.) und Dateien zusammenfügen (3.3.), Transponieren (3.2.) und weitere Formen des Umstrukturierens von Datensätzen (3.6.), Daten aggregieren (3.5.), Dateien aufteilen (3.6.) und die vielen Möglichkeiten des Bildens von Subsets (3.1., u.a. gezielt ausgewählte Fälle, Zufall, alphanumerische oder numerische Filter). Im Prinzip können Sie alle in der Forschungspraxis anfallenden und erforderlichen Datenmanagementaktionen über Syntax steuern.

4. Datenmanagement auf Variablenebene

Zusammenfassung
Das Datenmanagement auf der Ebene der Variablen zielt auf Operationen an den Variablen selbst ab, z.B. Formatieren und Sortieren, Umkodieren, arithmetische Transformationen, Kategorisieren, uvam. (vgl. v.a. den Menüpunkt „ Transformieren“). Ob der Datensatz selbst in irgendeiner Form von diesen Operationen betroffen ist, ist von nachgeordneter Bedeutung.
Zu beachten ist, dass die Wirksamkeit dieser Operationen nicht immer sichtbar, sondern manchmal nur über die Protokollierung durch die Befehlssyntax, im Output oder auch nur an veranderten Einträgen im Datensatz überprüft werden kann und daher auch immer sorgfältig überprüft werden sollte. Gehen Sie nicht davon aus, dass statistische Berechnungen das Komplizierte an Auswertungen sind; es ist häufiger der Fall, dass erforderliche Datenmanagementmaßnahmen komplizierter als Analysen sind. Um diese Operationen durchführen zu können, muss der Dateneditor einen aktiven Datensatz enthalten.
Im Folgenden werden die am häufigsten vorkommenden Fälle vorgestellt und in Syntaxbeispielen dargestellt, zunächst die Grundoperationen und dann anschlielßend etwas schwierigere.

5. Analyse von Mehrfachantworten

6. Operationen mit Datums- und Zeitangaben

Zusammenfassung
Der Umgang mit Datums- und Zeitangaben gleicht weder dem mit Strings, noch dem mit numerischen Variablen. Operationen mit Datums- und Zeitangaben sind daher anders anzugehen und sind oft nicht unknifflig. Um mit diesen speziellen Daten umgehen zu können, wird im Folgenden zunächst ausführlich auf die Besonderheiten dieser Variablen hingewiesen.

7. Analyse von (halb)offenen Textantworten

Zusammenfassung
Das Gemeinsame von offenen und halboffenen Antworten ist, dass Studienteilnehmer die jeweils gestellte Aufgabe bzw. Frage in Form von frei formulierten Textangaben beantworten. Offene Antworten stammen z.B. aus Aufgaben zur freien Beschreibung, Gestaltung, Deutung oder Assoziation, z.B. „Beschreiben Sie Ihren typischen Warenkorb in einem typischen Einkaufsmonat“. Halboffene Antworten gehören meist zu Fakten- oder Wissensfragen, die mit einer oder mehreren (vorgegebenen) Antworten gelöst werden, z.B. „Welches Medikament nehmen Sie üblicherweise ein?“. Ein erster Unterschied ist, dass bei halboffenen Antworten zum Zeitpunkt der Erhebung die Frage meist so präzise ist, dass eine relativ eingeschränkte Antwortvariation auftritt. Ein zweiter Unterschied rührt daher, dass durch die leitende Frage die Antwort- und damit auch Textvariation bei halboffenen Antworten geringer und somit leichter auszuwerten ist. Eine fundamentale Gemeinsamkeit von offenen und halboffenen Antworten ist, dass sie in Form von syntaktisch und semantisch unregelmaßigen Strings in einer Maximallä nge von 255 Zeichen pro Variable vorliegen, wie auch, dass sie dennoch mittels SPSS ausgewertet werden können und zwar auch, wenn diese länger als 255 Zeichen sind.

8. Erste Hinweise für die Arbeit mit Syntaxprogrammen

9. Makroprogrammierung mit SPSS — erste Schritte

10. Übersicht

11. Hinweise für Macintosh-User

12. Ihre Meinung zu diesem Buch

Backmatter

Weitere Informationen

Premium Partner

    Bildnachweise