Skip to main content
main-content

Über dieses Buch

Dieses Lehrbuch ist der Folgeband zu „Regressionsanalyse in der empirischen Wirtschafts- und Sozialforschung Band 1“. Es richtet sich an Studierende und Wissenschaftler, die im Rahmen einer Forschungsarbeit Daten analysieren oder vorhandene empirische Publikationen auswerten müssen. Regressionsanalysen stellen die wichtigsten Verfahren zur Untersuchung empirischer Fragestellungen in den Wirtschafts- und Sozialwissenschaften dar. Im Unterschied zu anderen ökonometrischen oder statistischen Lehrbüchern verzichtet der Autor auf abschreckende mathematische Ausführungen. Alle Aspekte werden verbal und grafisch erläutert. Die Kapitel sind so aufgebaut, dass ein selbständiges Studium problemlos möglich ist. Lesende werden Schritt für Schritt in komplexere Verfahren eingeführt.

Dabei sind sämtlichen Kapiteln die wichtigsten Lernziele und Schlüsselbegriffe vorangestellt. Jedes Kapitel schließt mit einer Reihe von Übungsaufgaben einschließlich Lösungen. Praxisorientiert werden alle Regressionsverfahren und Tests anhand der Statistikprogramme SPSS und Stata sowie mittels Screenshots erklärt.

Zusätzliche Fragen per App
Laden Sie die Springer Nature Flashcards-App kostenlos herunter und nutzen Sie exklusives Zusatzmaterial, um Ihr Wissen zu prüfen.

Inhaltsverzeichnis

Frontmatter

1. Einführung: Kausale Aussagen und Prognosemodelle

Zusammenfassung
Regressionsmodelle können im einfachsten Fall zur Ermittlung und Beschreibung von Zusammenhängen zwischen Variablen herangezogen werden (Abschn. 1.2). Zweitens besteht ihr Nutzen aber vor allem darin, kausale Abhängigkeiten zu identifizieren und drittens Prognosen zukünftiger Entwicklungen zu fundieren. Abschn. 1.3 erläutert daher grundlegende Probleme bei der Ermittlung von Ursache-Wirkungs-Zusammenhängen. Er konkretisiert und erweitert den Abschnitt 4.1 im Band 1 (Stoetzer 2017). Darauf basierend beschreibt Abschn. 1.4 kurz Aspekte des Einsatzes von Regressionsanalysen zur Vorhersage zukünftiger Entwicklungen. Abschließend fasst Abschn. 1.5 die Ergebnisse zusammen und erläutert deren Relevanz im Kontext der aktuellen Diskussion zu Big Data und Data Mining.
Matthias-W. Stoetzer

2. Abhängige Variablen mit begrenztem Wertebereich

Zusammenfassung
In der Regressionsanalyse sind uns bisher nur metrisch skalierte abhängige Variablen begegnet. In vielen Anwendungsfällen besteht das Ergebnis (Outcome, Response) eines Daten generierenden Prozesses aber lediglich aus zwei oder mehr Zuständen (Kategorien). Begrenzte abhängige Variablen (Limited Dependent Variables) existieren immer dann, wenn die abhängige (endogene) Variable in einem Bereich liegt, der nur ganz bestimmte Werte annimmt. Abschn. 2.2 gibt eine Übersicht der verschiedenen Formen solcher Limited Dependent Variables. Die Untersuchung abhängiger Variablen mit lediglich zwei Ausprägungen ist in der empirischen Forschung häufig anzutreffen. Abschn. 2.3 erläutert daher diesen Fall ausführlicher anhand eines praktischen Beispiels. Anschließend geht Abschn. 2.4 kurz auf ordinale und multinomiale sowie Zählvariablen und spezielle Arten von beschränkten abhängigen Variablen ein. Abschn. 2.5 erläutert Schritt für Schritt die konkrete Durchführung einer binären logistischen Regression in SPSS und Stata.
Matthias-W. Stoetzer

3. Zeitreihenanalyse und dynamische Modelle

Zusammenfassung
Zunächst beschreibt Abschn. 3.2 Formen und Merkmale von Zeitreihendaten (Längsschnittdaten). Abschn. 3.3 analysiert, inwieweit eine einfache OLS-Schätzung auf der Basis von Daten aus mehreren Perioden durchführbar ist. Die Abschn. 3.4, 3.5 und 3.6 veranschaulichen, welche speziellen Probleme bei der Regression auf der Basis von Zeitreihen auftreten. In diesem Kontext stellt Abschn. 3.4 das Problem der Autokorrelation dar, Abschn. 3.5 diskutiert die Exogenität der unabhängigen Variablen und Abschn. 3.6 erläutert die Stationarität von Zeitreihen. Darauf aufbauend zeigt Abschn. 3.7, wie die Bestimmung der Modellspezifikation (Lags bzw. Leads) erfolgt und fasst die praktische Vorgehensweise zusammen. Da hier nur eine kurze Einführung in die Grundlagen der Untersuchung von Zeitreihen gegeben wird, enthält abschließend Abschn. 3.8 eine Reihe von weiterführenden Hinweisen zu Prognosemodellen und Variablen mit gemeinsamen Trends.
Matthias-W. Stoetzer

4. Paneldatenanalyse

Zusammenfassung
Einführend stellt Abschn. 4.2 eine Reihe von Besonderheiten bei Paneldatensätzen dar. Abschn. 4.3 charakterisiert die grundlegenden Arten von Abweichungsanalysen (Varianzanalysen) im Rahmen von Paneldaten. Darauf aufbauend beschreibt Abschn. 4.4 die vier wichtigsten Schätzverfahren zur Analyse echter Paneldaten: die gepoolte OLS-, die Fixed-Effects (FE)-, die Random-Effects (RE)- und die First-Differences (FD)-Methode. Dieser Abschnitt erläutert außerdem die Entscheidungsverfahren zur Wahl einer geeigneten Schätzmethode. Abschn. 4.5 beschreibt das Vorgehen bei unechten Panels (gepoolten Paneldaten), d. h. die Differences-in-Differences (DiD)-Methode und Abschn. 4.6 erläutert kurz einige komplexere Weiterentwicklungen. Abschließend stellt Abschn. 4.7 die praktische Anwendung in SPSS und Stata dar. Alle Abschnitte fokussieren die Verwendung von Paneldaten zur Identifikation kausaler Wirkungen.
Matthias-W. Stoetzer

5. Fehlende Datenwerte/Missing Values

Zusammenfassung
Der Abschn. 5.2 erläutert einige grundlegende Abgrenzungen ebenso wie die Relevanz fehlender Datenwerte. Unterschiedliche Formen von Missing Values erfordern jeweils spezielle Verfahren des Umgangs und werden daher im Abschn. 5.3 behandelt. Abschn. 5.4 stellt die wichtigsten Verfahren der Behandlung fehlender Daten knapp dar und konzentriert sich dabei auf die modernen Methoden. Die zentralen Schlussfolgerungen und praktischen Handlungsempfehlungen sind Thema des Abschn. 5.5, und 5.6 zeigt die praktische Anwendung der verschiedenen Verfahren mittels SPSS und Stata.
Matthias-W. Stoetzer

6. Anhang I Maximum-Likelihood-Schätzung

Zusammenfassung
Die Maximum-Likelihood-Schätzung (ML) ist eine Alternative zur OLS-Schätzung. Sie findet vor allem bei der Schätzung von Parametern nicht linearer Zusammenhänge Verwendung. Dazu gehören Verfahren bei abhängigen Variablen, die nicht metrisch bzw. intervallskaliert sind. Dies sind u. a. die Logit- und Probitregressionen sowie multinomiale und ordinale Regressionen. Außerdem sind ML-Schätzungen geeignet, mit dem Problem von Missing Values umzugehen und darüber hinaus simultane Gleichungssysteme zu schätzen. Abschn. 6.1 erläutert das Prinzip dieser Schätzmethode und Abschn. 6.2 die Anwendung im Rahmen von Maximum-Likelihood-Tests und Goodness-of-Fit-Werten.
Matthias-W. Stoetzer

Backmatter

Weitere Informationen

Premium Partner

    Bildnachweise