Skip to main content

2018 | Buch

Datenanalyse mit SAS®

Statistische Verfahren und ihre grafischen Aspekte

verfasst von: Prof. Dr. Walter Krämer, Dr. Olaf Schoffer, Dr. Lars Tschiersch, Joachim Gerß

Verlag: Springer Berlin Heidelberg

insite
SUCHEN

Über dieses Buch

Das Programmpaket SAS hat sich im Lauf der Jahre als Standardprogramm zur statistischen Datenanalyse etabliert. Der souveräne Umgang mit statistischen Methoden und deren praktischer Umsetzung in SAS bietet somit einen unschätzbaren Vorteil für die tägliche Arbeit des Datenanalytikers. Im vorliegenden Buch erlernt der Leser zunächst die Grundlagen der Programmierung. Anschließend wird eine große Auswahl statistischer Verfahren und deren Umsetzung als SAS-Programm vorgestellt. Dabei wird großes Augenmerk auf die grafischen Aspekte der statistischen Datenanalyse gelegt. Ein zusätzlicher Teil über Programmierung mit IML und Makros sowie hilfreiche Assistenten in SAS runden die Darstellung ab. Kommentierte Beispiele und Übungsaufgaben mit Lösungshinweisen ermöglichen das Selbststudium. Mit seiner umfassenden Themenauswahl ist das Buch als Einführung, aber auch als Nachschlagewerk für den fortgeschritteneren Leser geeignet. Für die 4. Auflage wurden Kapitel zur Epidemiologie und Biometrie ergänzt.

Inhaltsverzeichnis

Frontmatter

Einführung in die Benutzung von SAS

Frontmatter
Kapitel 1. Grundlagen des Umgangs mit SAS
Zusammenfassung
Das SAS-System ist ein umfangreiches, eigenständiges statistisches Programmpaket. Es arbeitet auf Großrechnern und PCs unter Betriebssystemen wie Unix, Linux, Mac OS oder Windows. Dieses Buch legt die Windows-Version zugrunde, aber der Großteil der hier vorgestellten Syntax läuft auch unter anderen Betriebssystemen.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 2. Das Hilfesystem
Zusammenfassung
Klassische Hilfe bietet das Benutzerhandbuch (engl.: User’s Guide). Benutzerhandbücher gibt es zu jedem SAS-Modul. Ein Nachschlagen innerhalb der umfangreichen Benutzerhandbücher ist aber oft sehr mühsam und nur mit genauem Wissen über das Gesuchte zielführend. Erheblich komfortabler ist eine Suche über die „SAS Product Documentation“, eine elektronische Umsetzung dieser Bücher als HTML-Hilfe.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 3. Der DATA-Step
Zusammenfassung
Dieses Kapitel bildet die Grundlage für alle Datenanalysen. Wie werden Daten in SAS erzeugt, eingelesen, gespeichert und verändert? Das alles erfolgt innerhalb des DATA-Step. Dessen Verständnis ist also notwendig für ein sinnvolles Herangehen an statistische Auswertungen. Denn Auswertungen basierend auf inkorrektem Datenmaterial führen zu fehlerhaften Ergebnissen.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 4. Der PROC-Step
Zusammenfassung
Nach dem DATA-Step ist der PROC-Step ein wesentlicher Bestandteil von SAS-Programmen. Er ermöglicht unter anderem die Analyse der zuvor vorbereiteten Daten, die Ausgabe der dabei gefundenen Ergebnisse auf dem Bildschirm oder in neue Datensatze sowie die Erzeugung von Grafiken.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß

Präsentation und Aufbereitung von Ergebnissen

Frontmatter
Kapitel 5. Das Aufbereiten von Textausgaben
Zusammenfassung
Die Ergebnisse einer Datenanalyse erscheinen im Textausgabe-Fenster. Ausnahmen sind die Option NOPRINT, die eine Ausgabe unterdrückt, und die Prozedur PROC SUMMARY, die keine Textausgabe erzeugt.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 6. Grafiken in SAS
Zusammenfassung
Grafiken ermöglichen einen schnellen Einblick in Daten. Viele meinen, Grafiken seien nicht die Stärke von SAS. In der Tat sind die Standardeinstellungen oft nicht befriedigend. Diese lassen sich aber leicht ändern, und damit sind auch in SAS aussagekräftige, gut lesbare Grafiken möglich.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß

Grundlagen der Statistik

Frontmatter
Kapitel 7. Standardverfahren der beschreibenden Statistik
Zusammenfassung
Die beschreibende oder auch deskriptive Statistik fasst große Datenmengen durch geeignete Kennzahlen zusammen. Das bedeutet aber auch einen Informationsverlust. Die wichtigsten derartigen Kennzahlen sind Mittelwerte und Streuungsmaße.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 8. Standardverfahren der schließenden Statistik
Zusammenfassung
Wührend die beschreibende Statistik Auffälligkeiten in den Daten finden oder die Daten mit geeigneten Kenngrößen charakterisieren soll, leitet die schließende Statistik aus Stichproben Aussagen über Grundgesamtheiten oder über Eigenschaften von Zufallsvariablen ab.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 9. Regressionsanalyse
Zusammenfassung
Im Jahr 1885 untersuchte der englische Statistiker Francis Galton den Zusammenhang zwischen den Körpergrößen von Vatern und Söhnen. Er stellte fest: Große Väter haben im Durchschnitt größere Söhne, wenn auch nicht ganz so groß wie sie selbst. Kleine Vöter haben dagegen kleinere Söhne, wenn auch nicht ganz so klein wie sie selbst. Die Körpergröße der Söhne bewegt sich somit auf den allgemeinen Durchschnitt zu. Diese Bewegung hin zum Durchschnitt nannte Galton „Regression“ (von lateinisch: regredi = zurückgehen). Abbildung 9.1 zeigt anhand der Daten Galtons den Zusammenhang zwischen den Körpergrößen. Darin eingezeichnet ist auch die nachfolgend vorgestellte Regressionsgerade.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß

Spezialgebiete und Anwendungen

Frontmatter
Kapitel 10. Varianzanalyse und Versuchsplanung
Zusammenfassung
Die Varianzanalyse (engl.: ANOVA = Analysis of Variance) untersucht den Einfluss von einer oder mehreren qualitativen Variablen (= Faktoren) auf eine abhängige metrische Variable. Faktoren sind kontrollierbare Einflussgrößen und können verschiedene Stufen annehmen. Ein möglicher Faktor ist beispielsweise die Behandlung von Patienten mit verschiedenen Medikamenten. Die wesentliche Aufgabe der Varianzanalyse ist, zu untersuchen, ob die verschiedenen Stufen eines Faktors unterschiedliche Wirkungen aufweisen.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 11. Nichtparametrische Verfahren
Zusammenfassung
Nichtparametrische statistische Verfahren kommen mit nur wenigen Annahmen über die Verteilung der beobachteten Zufallsvariablen aus. Oft werden sie mit dem Begriff „verteilungsfreie“ Verfahren gleichgesetzt. Eine Unterscheidung ist aber möglich. Ein „verteilungsfreies“ Verfahren basiert auf einer Statistik, deren Verteilung unabhängig von der Verteilung der beobachteten Zufallsvariablen in der Grundgesamtheit ist. Ein derartig universelles Verfahren herzuleiten ist nicht immer möglich. Stattdessen sind schwache Annahmen notwendig, beispielsweise die Stetigkeit der Verteilung. Ein „nichtparametrisches“ Verfahren trifft keine Annahmen über die Parameter der Verteilung der Grundgesamtheit. Naheres siehe Büning, Trenkler (1994).
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 12. Multivariate Verfahren
Zusammenfassung
Multivariate Verfahren lassen sich in strukturprüfende sowie strukturentdeckende Verfahren einteilen. Die hier behandelten strukturentdeckenden Verfahren wie die Faktoren- oder die Clusteranalyse decken Zusammenhänge zwischen verschiedenen Variablen auf.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 13. Zeitreihenverfahren
Zusammenfassung
Zeitreihen sind Daten, die zeitlich angeordnet sind. Beispiele sind die Tagesschlusskurse von BMW für das aktuelle Börsenjahr, das bundesdeutsche Sozialprodukt ab 1948 oder die monatliche Zahl der Verkehrstoten in Nordrhein-Westfalen des Jahres 2012. Die Abbildung 13.1 zeigt beispielhaft die Zahl der Arbeitslosen in Deutschland über ein Jahrzehnt. Man erkennt deutlich Trends und zyklische Schwankungen.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 14. Ökonometrie
Zusammenfassung
Ökonomische Daten und Modelle weisen oft Besonderheiten auf, die eine Schätzung mit der „gewöhnlichen“ KQ-Methode erschweren oder sogar unmöglich machen. So beeinflussen sich makrooökonomische Phänomene mitunter gegenseitig, oder die Zusammenhänge zwischen Regressoren und Regressanden sind nicht linear. Diesen Besonderheiten tragen die nachfolgend vorgestellten Verfahren und Modelle Rechnung.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 15. Epidemiologie
Zusammenfassung
Das vorliegende Kapitel beschäftigt sich nach der Vorstellung verschiedener Studientypen mit der statistischen Auswertung epidemiologischer Daten. Es stellt in Ergänzung zu den Kenngrößen und Verfahren der vorstehenden Kapitel die Inzidenz, die Prävalenz, das Odds Ratio und das relative Risiko vor und erläutert deren Umsetzung in SAS.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 16. Biometrie
Zusammenfassung
Der Begriff Biometrie wird sowohl im Sinne der biometrischen Statistik als auch für biometrische Erkennungsverfahren verwendet. Das vorliegende Kapitel beschäftigt sich mit der statistischen Auswertung biometrischer Daten. Es stellt in Ergänzung zu den Kenngrößen und Verfahren der vorstehenden Kapitel die Ereigniszeitanalyse, gruppensequentielle Verfahren und gemischte lineare Modelle vor und erläutert deren Umsetzung in SAS.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 17. Explorative Datenanalyse
Zusammenfassung
Die Explorative Datenanalyse (EDA) hilft, bislang unbekannte Eigenschaften und Strukturen in den Daten aufzudecken. Kurz: „Exploratory data analysis is detective work“ (Tukey, 1977). Die nachfolgend vorgestellten deskriptiven und grafischen Methoden wurden teilweise bereits beschrieben und erscheinen hier in einem neuen Kontext.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß

Besonderheiten von SAS

Frontmatter
Kapitel 18. Interactive Matrix Language – IML
Zusammenfassung
SAS bietet eine Vielzahl von Prozeduren zur Durchführung verschiedenster statistischer Analysen. Die Prozedur REG beispielsweise führt eine Regression durch und ARIMA passt einen stochastischen Prozess an eine Zeitreihe an.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 19. Makroprogrammierung
Zusammenfassung
Die in SAS/BASE enthaltene Makrosprache erweitert das SAS-System und ermöglicht das wiederholte Verwenden von Programmsegmenten ohne diese immer wieder neu erstellen zu müssen. Solche wiederholbaren Programmsegmente werden als Makros bezeichnet.
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Kapitel 20. Assistenten
Zusammenfassung
Neben dem vorgestellten Schreiben eigener Programme stehen in SAS auch sogenannte Assistenten für bestimmte statistische Analysen zur Verfügung. Die Assistenten werden über das Menü
Walter Krämer, Olaf Schoffer, Lars Tschiersch, Joachim Gerß
Backmatter
Metadaten
Titel
Datenanalyse mit SAS®
verfasst von
Prof. Dr. Walter Krämer
Dr. Olaf Schoffer
Dr. Lars Tschiersch
Joachim Gerß
Copyright-Jahr
2018
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-662-57799-8
Print ISBN
978-3-662-57798-1
DOI
https://doi.org/10.1007/978-3-662-57799-8