Skip to main content
Top

2020 | OriginalPaper | Chapter

4. Paneldatenanalyse

Author : Matthias-W. Stoetzer

Published in: Regressionsanalyse in der empirischen Wirtschafts- und Sozialforschung Band 2

Publisher: Springer Berlin Heidelberg

Activate our intelligent search to find suitable subject content or patents.

search-config
loading …

Zusammenfassung

Einführend stellt Abschn. 4.2 eine Reihe von Besonderheiten bei Paneldatensätzen dar. Abschn. 4.3 charakterisiert die grundlegenden Arten von Abweichungsanalysen (Varianzanalysen) im Rahmen von Paneldaten. Darauf aufbauend beschreibt Abschn. 4.4 die vier wichtigsten Schätzverfahren zur Analyse echter Paneldaten: die gepoolte OLS-, die Fixed-Effects (FE)-, die Random-Effects (RE)- und die First-Differences (FD)-Methode. Dieser Abschnitt erläutert außerdem die Entscheidungsverfahren zur Wahl einer geeigneten Schätzmethode. Abschn. 4.5 beschreibt das Vorgehen bei unechten Panels (gepoolten Paneldaten), d. h. die Differences-in-Differences (DiD)-Methode und Abschn. 4.6 erläutert kurz einige komplexere Weiterentwicklungen. Abschließend stellt Abschn. 4.7 die praktische Anwendung in SPSS und Stata dar. Alle Abschnitte fokussieren die Verwendung von Paneldaten zur Identifikation kausaler Wirkungen.

Dont have a licence yet? Then find out more about our products and how to get one now:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Footnotes
1
Falls die abhängige monetäre Variable – bspw. das Einkommen – logarithmiert wird und die verschiedenen Zeitpunkte der Paneldaten in Form von Dummys berücksichtigt werden, ist die Verwendung realer Größen nicht notwendig. Dies ergibt sich, weil die unterschiedlichen Preisniveaus zu den verschiedenen Zeitpunkten durch die Dummys der Zeitpunkte kontrolliert werden (Wooldridge 2018, S. 406).
 
2
Geeignete Vorgehensweisen, um dieses Abschmelzen und damit Verfälschen zu vermeiden, werden unter dem Begriff „Panel Design“ erläutert. Siehe dazu Günter et al. (2018); Schnell et al. (2018); Frees (2004).
 
3
Der Begriff „gepoolte OLS-Schätzung“ bezieht sich hier auf den Einbezug aller Beobachtungen ohne Berücksichtigung der unterschiedlichen Zeitpunkte und Beobachtungsträger. Der Ausdruck „gepoolte Paneldaten“ meint, dass der Datensatz zu den verschiedenen Zeitpunkten nicht immer dieselben Beobachtungseinheiten umfasst, es sich also um ein unechtes Panel handelt (siehe dazu Abschn. 4.5). Beide Begriffe sind auseinanderzuhalten!
 
4
Andere Bezeichnungen sind: „Within-Schätzverfahren“, „Covariance-Modell“, „Individual-Dummy-Methode“ (siehe dazu Stock und Watson 2015, S. 356 ff.; Wooldridge 2018, S. 435 ff.; Park 2009, 2011).
 
5
Das LSDV-Verfahren wird in der Literatur zum Teil nicht zu den FE-Verfahren gezählt, sondern der Begriff FE nur für die anschließend behandelte Mittelwertabweichungsmethode verwendet.
 
6
In der Literatur werden die ai häufig ui genannt.
 
7
Verschiedene Vorgehensweisen hinsichtlich der Verwendung von Dummyvariablen mit oder ohne Konstante stellt Park (2009, 2011) ausführlich dar.
 
8
Das eit in Gl. (4.7) ist natürlich nicht mehr dasselbe wie in der Gl. (4.6). Zur Vereinfachung wird darauf verzichtet, diese Differenzierung kenntlich zu machen. Es wird außerdem angenommen, dass ai (ebenso wie eit) die Realisationen eines i. i. d.-Zufallsprozesses sind (mit dem Mittelwert 0 und der Varianz \( {\sigma}_{\mathrm{v}}^2 \)). Die Abkürzung i.i.d. steht für „Independent and Identically Distributed“. Also soll es sich um unabhängig und identisch verteilte Zufallsvariablen handeln. Unterschiedliche Strukturen von Autokorrelation und Heteroskedastie hinsichtlich der ai führen zu differierenden RE-Schätzverfahren. Baltagi (2013) und Stata (2019) behandeln diese ausführlicher.
 
9
Zur Erinnerung: Wenn sich die Beobachtungen immer auf die gleichen Unternehmen, Hochschulen usw. beziehen, handelt es sich um ein echtes Panel. Beziehen sich die Beobachtungen zu den verschiedenen Zeitpunkten auf unterschiedliche Unternehmen, ist dies ein gepoolter Querschnittsdatensatz, d. h. ein unechtes Panel.
 
10
Siehe dazu im Vergleich das Rubin-Neyman-Kausalmodell des Kap. 1.
 
11
Die Unterschiede der Studierendenzahlen im Jahr 2008 (bzw. im Jahr 2012) stehen für die Between-Varianz. Die Unterschiede innerhalb der Gruppe mit Treatment T (bzw. der Gruppe K) zwischen den Jahren 2008 und 2012 sind jeweils die Within-Varianz.
 
12
Der Fehlerterm ∆ei ist für die Durchführung der Regressionsschätzung nicht weiter problematisch. Das ∆ macht nur deutlich, dass es sich nicht um den gleichen Fehlerterm ei wie bspw. in Gl. (4.1) handelt.
 
13
Eine weitere Möglichkeit ist die oben bereits erwähnte Differences-in-Differences (DiD) Methode. Diese ist aber bei echten Paneldaten den genannten Verfahren unterlegen. Sie wird daher nur bei gepoolten Querschnittsdaten (unechten Panels) eingesetzt, da in diesem Fall die Verwendung von Entity-spezifischen Dummys und die Bildung erster Differenzen nicht möglich sind. Abschn. 4.5 erläutert die DiD-Methode.
 
14
Allerdings ist dies noch kein Beweis für die Richtigkeit des FE-Ansatzes. Dies wird genauer von Baltagi (2013, S. 79–80) erläutert, der zusätzliche Tests empfiehlt.
 
15
Die sich daraus ergebenden Probleme sind im Kap. 3 zur Zeitreihenanalyse kurz beschrieben worden. Eine ausführliche Darstellung der komplexen Verfahren, die in diesen Fällen verwendet werden, erfolgt in dieser Einführung nicht (siehe dazu Cameron und Trivedi 2009, S. 272–273 und Baltagi 2013, S. 275–315).
 
16
Außerdem dürfen keine Messfehler bei den exogenen Variablen existieren. Dieser Aspekt wird hier ausgeklammert.
 
17
Dabei ist immer im Auge zu behalten, dass die statistische Signifikanz eines Koeffizienten noch nichts über dessen inhaltliche Relevanz aussagt (siehe Stoetzer 2017, Kap. 2)!
 
18
Sie entspricht insoweit dem oben behandelten FD-Verfahren. Allerdings werden hier Differenzen auf Gruppenebene und nicht auf der Eben der einzelnen Beobachtungsträger gebildet.
 
19
Mittels Interaktionseffekten können auch die Einflüsse zeitkonstanter Variablen (wie Schulabschluss oder Geschlecht) ermittelt werden (Wooldridge 2018, S. 437–438).
 
20
Verfahren, um eine adäquate Kontrollgruppe zu finden, bezeichnet man als Matching-Verfahren. Hierzu existiert eine Vielzahl von Ansätzen. Guo und Fraser (2015) bieten einen umfassenden Überblick.
 
21
Ein Tipp zum schnellen Einfügen der 225 Hochschuldummys: Wir gehen auf die erste Hochschule, drücken „Shift“ und gehen dann auf die letzte Hochschule, die wir einbeziehen wollen. Alle dazwischen liegenden Hochschulen werden dadurch markiert, und wir können sie im Block in das Feld „Unabhängige Variable(n)“ befördern.
 
22
Diese SPSS-Prozedur wird bspw. von Stoetzer (2017, Kap. 3 Anhang 3.1) erklärt.
 
23
Diese Verknüpfungsfunktionen werden auch als Link-Funktionen bezeichnet. Der einfache lineare Zusammenhang nennt sich auch Identitäts-Funktion. Für die Verknüpfungen sind verschiedene Funktionen verwendbar. Sie stellen Verallgemeinerungen des einfachen linearen OLS-Modells dar und firmieren deshalb als „Generalized Linear Models“. Einen guten Überblick verschafft Fox (2016).
 
24
Zur Berechnung von robusten Standardfehlern existieren leicht unterschiedliche Verfahren (siehe Angrist und Pischke (2009) und Long und Erwin (2000)). Mit anderen Verfahren in SPSS sind auch clusterrobuste Standardfehler schätzbar (UCLA IDRE 2019c).
 
25
Wie oben erwähnt, sind die Messwiederholungen in der Psychologie, Medizin und Soziologie nichts anderes als Paneldaten. Für solche Datensätze mit Messwiederholungen bietet SPSS verschiedene Verfahren. Die Methoden unter „Gemischte Modelle“ lassen zu, dass die Daten korrelierte Residuen und Residuen mit differierenden Varianzen (also Autokorrelation und Heteroskedastie) aufweisen. Hier existiert als Basisoption [Analysieren > Gemischte Modelle > Linear…]. In weiteren Optionen können wir auch die Kovarianzen und Varianzen analysieren, also Autokorrelation und Heteroskedastie berücksichtigen. Die verschachtelte Verfahrensweise und die vielen weiteren – hier nicht behandelten Optionen – sind aus ökonometrischer Sicht sehr unübersichtlich. Sie sind vorhanden, da SPSS auf die statistischen Ansätze in der Psychologie und Soziologie zurückgeht, d. h. insbesondere auf varianzanalytische Methoden (siehe Stoetzer 2017, Kap. 3 Anhang 3.1).
 
26
Nach Field (2018, S. 1205) ist diese SPSS-Prozedur „completely indecipherable“.
 
27
Alternativ ist auch folgende Menüführung verwendbar: [Statistics > Longitudinal/panel data > Linear models > Linear regression(FE, RE, PA, BE)].
 
28
Wann der Unterschied groß und wann er klein ist, erläutern Kopp und Lois (2009, S. 37–38).
 
29
Eine weitergehende, die Voraussetzungen und Grenzen des Hausman-Tests sowie zusätzliche Aspekte enthaltende Darstellung erfolgt in dieser Einführung nicht (siehe dazu Cameron und Trivedi 2009, S. 260–262; Ashley 2012, S. 486–487). Der in Stata implementierte Hausman-Test ist numerisch instabil. Ashley (2012, S. 486) empfiehlt daher die Verwendung der Option „sigmamore“. Dies wird im Stata Reference Manual der Version 16 ebenfalls vorgeschlagen. Der Hausman-Test ist nicht verwendbar, wenn Heteroskedastie vorliegt. Die heteroskedastierobuste Version „xtoverid“ kann mittels Eingabe von „ssc install xtoverid“ im Fenster „Command“ installiert werden (Schaffer und Stillmann 2010).
 
Literature
go back to reference Acock, A. C. (2016). A gentle introduction to Stata (5. Aufl.). College Station: Stata Press. Acock, A. C. (2016). A gentle introduction to Stata (5. Aufl.). College Station: Stata Press.
go back to reference Andreß, H.-J., Golsch, K., & Schmidt, A. W. (2013). Applied panel data analysis for economic and social surveys. Berlin: Springer. Andreß, H.-J., Golsch, K., & Schmidt, A. W. (2013). Applied panel data analysis for economic and social surveys. Berlin: Springer.
go back to reference Angrist, J. D., & Pischke, J.-S. (2009). Mostly harmless econometrics, an empiricist’s companion. Princeton: Princeton University Press. Angrist, J. D., & Pischke, J.-S. (2009). Mostly harmless econometrics, an empiricist’s companion. Princeton: Princeton University Press.
go back to reference Angrist, J. D., & Pischke, J.-S. (2015). Mastering metrics, the path from cause to effect. Princeton: Princeton University Press. Angrist, J. D., & Pischke, J.-S. (2015). Mastering metrics, the path from cause to effect. Princeton: Princeton University Press.
go back to reference Ashley, R. A. (2012). Fundamentals of applied econometrics. Hoboken: Wiley. Ashley, R. A. (2012). Fundamentals of applied econometrics. Hoboken: Wiley.
go back to reference Athey, S., & Imbens, G. W. (2006). Identification and inference in nonlinear difference in differences models. Econometrica, 74(2), 431–497.CrossRef Athey, S., & Imbens, G. W. (2006). Identification and inference in nonlinear difference in differences models. Econometrica, 74(2), 431–497.CrossRef
go back to reference Baltagi, B. H. (2013). Econometric analysis of panel data (5. Aufl.). Chichester: Wiley. Baltagi, B. H. (2013). Econometric analysis of panel data (5. Aufl.). Chichester: Wiley.
go back to reference Baum, C. F. (2006). An introduction to modern econometrics using Stata. College Station: Stata Press. Baum, C. F. (2006). An introduction to modern econometrics using Stata. College Station: Stata Press.
go back to reference Bortz, J. (2005). Statistik für Human- und Sozialwissenschaftler (6. Aufl.). Heidelberg: Springer. Bortz, J. (2005). Statistik für Human- und Sozialwissenschaftler (6. Aufl.). Heidelberg: Springer.
go back to reference Brüderl, J., & Ludwig, V. (2015). Chapter 15: Fixed-effects panel regression. In H. Best & C. Wolf (Hrsg.), The SAGE handbook of regression analysis and causal inference (S. 327–357). Los Angeles: Sage Publications. Brüderl, J., & Ludwig, V. (2015). Chapter 15: Fixed-effects panel regression. In H. Best & C. Wolf (Hrsg.), The SAGE handbook of regression analysis and causal inference (S. 327–357). Los Angeles: Sage Publications.
go back to reference Cameron, A. C., & Trivedi P. K. (2007). Microeconometrics – Methods and applications. Cambridge: Cambridge University Press. Cameron, A. C., & Trivedi P. K. (2007). Microeconometrics – Methods and applications. Cambridge: Cambridge University Press.
go back to reference Cameron, L. A., & Trivedi, P. K. (2009). Microeconometrics using Stata. College Station: Stata Press. Cameron, L. A., & Trivedi, P. K. (2009). Microeconometrics using Stata. College Station: Stata Press.
go back to reference Cameron, L. A., & Trivedi, P. K. (2010). Microeconometrics using stata. College Station Texas, Stata Press. Cameron, L. A., & Trivedi, P. K. (2010). Microeconometrics using stata. College Station Texas, Stata Press.
go back to reference Card, D., & Krueger, A. B. (1994). Minimum wages and employment: A case study of the fast-food industry in New Jersey and Pennsylvania. American Economic Review, 84(4), 772–793. Card, D., & Krueger, A. B. (1994). Minimum wages and employment: A case study of the fast-food industry in New Jersey and Pennsylvania. American Economic Review, 84(4), 772–793.
go back to reference Carpenter, C., & Dobkin, C. (2011). The minimum legal drinking age and public health. Journal of Economic Perspectives, 25(2), 133–156.CrossRef Carpenter, C., & Dobkin, C. (2011). The minimum legal drinking age and public health. Journal of Economic Perspectives, 25(2), 133–156.CrossRef
go back to reference Dietrich, H., & Gerner, H.-D. (2012). The effects of tuition fees on the decision for higher education: Evidence from a German policy experiment. Economics Bulletin, 32(2), 1–17. Dietrich, H., & Gerner, H.-D. (2012). The effects of tuition fees on the decision for higher education: Evidence from a German policy experiment. Economics Bulletin, 32(2), 1–17.
go back to reference Field, A. (2018). Discovering statistics using SPSS (5. Aufl.). London: Sage Publications. Field, A. (2018). Discovering statistics using SPSS (5. Aufl.). London: Sage Publications.
go back to reference Fox, J. (2016). Applied regression analysis and generalized linear models. Thousand Oaks: Sage Publications. Fox, J. (2016). Applied regression analysis and generalized linear models. Thousand Oaks: Sage Publications.
go back to reference Frees, E.-W. (2004). Longitudinal and panel data, analysis and applications in the social sciences. Cambridge: Cambridge University Press. Frees, E.-W. (2004). Longitudinal and panel data, analysis and applications in the social sciences. Cambridge: Cambridge University Press.
go back to reference Greene, W. H. (2012). Econometric analysis (7. Aufl.). Boston: Pearson. Greene, W. H. (2012). Econometric analysis (7. Aufl.). Boston: Pearson.
go back to reference Günter, M., Vossebein, G., & Wildner, R. (2018). Marktforschung mit Panels (3. Aufl.). Berlin: Springer Gabler. Günter, M., Vossebein, G., & Wildner, R. (2018). Marktforschung mit Panels (3. Aufl.). Berlin: Springer Gabler.
go back to reference Guo, S., & Fraser, M. W. (2015). Propensity score analysis, Statistical methods and applications. Los Angeles: Sage Publications. Guo, S., & Fraser, M. W. (2015). Propensity score analysis, Statistical methods and applications. Los Angeles: Sage Publications.
go back to reference Kennedy, P. (2008). A guide to econometrics (6. Aufl.). Malden: Wiley-Blackwell. Kennedy, P. (2008). A guide to econometrics (6. Aufl.). Malden: Wiley-Blackwell.
go back to reference Kopp, J., & Lois, D. (2009). Einführung in die Panelanalyse. Chemnitz: Institut für empirische Sozialforschung, TU Chemnitz. Kopp, J., & Lois, D. (2009). Einführung in die Panelanalyse. Chemnitz: Institut für empirische Sozialforschung, TU Chemnitz.
go back to reference Long, J. S., & Erwin, L. H. (2000). Using heteroscedasticity-consistent standard errors in the linear regression model. The American Statistician, 54, 217–224. Long, J. S., & Erwin, L. H. (2000). Using heteroscedasticity-consistent standard errors in the linear regression model. The American Statistician, 54, 217–224.
go back to reference Monkerud, L. C. (2010). GRA 5917: Input politics and public opinion, Panel data regression in political economy, Lecture slides, BI Norwegian School of Business. Zugegriffen am 20.09.2019. Monkerud, L. C. (2010). GRA 5917: Input politics and public opinion, Panel data regression in political economy, Lecture slides, BI Norwegian School of Business. Zugegriffen am 20.09.2019.
go back to reference Richardson, G., & Troost, W. (2009). Monetary intervention mitigated banking panics during the great depression: Quasi-experimental evidence from a Federal Reserve District Border, 1929–1933. Journal of Political Economy, 117(6), 1031–1073. https://doi.org/10.1086/649603.CrossRef Richardson, G., & Troost, W. (2009). Monetary intervention mitigated banking panics during the great depression: Quasi-experimental evidence from a Federal Reserve District Border, 1929–1933. Journal of Political Economy, 117(6), 1031–1073. https://​doi.​org/​10.​1086/​649603.CrossRef
go back to reference Schnell, R., Hill, P. B., & Esser, E. (2018). Methoden der empirischen Sozialforschung (11. Aufl.). München: Oldenbourg. Schnell, R., Hill, P. B., & Esser, E. (2018). Methoden der empirischen Sozialforschung (11. Aufl.). München: Oldenbourg.
go back to reference Stock, J. H., & Watson, M. W. (2015). Introduction to econometrics (Updated 3. Aufl., Global Edition). Amsterdam: Pearson. Stock, J. H., & Watson, M. W. (2015). Introduction to econometrics (Updated 3. Aufl., Global Edition). Amsterdam: Pearson.
go back to reference Stoetzer, M.-W. (2017). Regressionsanalyse in der empirischen Wirtschafts- und Sozialforschung (Bd. 1)., Berlin: Springer. Stoetzer, M.-W. (2017). Regressionsanalyse in der empirischen Wirtschafts- und Sozialforschung (Bd. 1)., Berlin: Springer.
go back to reference Verbeek, M. (2008). Pseudo-panels and repeated cross-sections. In L. Mátyás & P. Sevestre (Hrsg.), The econometrics of panel data: Fundamentals and recent developments in theory and practice (3. Aufl., S. 369–383). Berlin: Springer. Verbeek, M. (2008). Pseudo-panels and repeated cross-sections. In L. Mátyás & P. Sevestre (Hrsg.), The econometrics of panel data: Fundamentals and recent developments in theory and practice (3. Aufl., S. 369–383). Berlin: Springer.
go back to reference Wooldridge, J. M. (2010). Econometric analysis of cross-section and panel data (2. Aufl.). Boston: The MIT Press. Wooldridge, J. M. (2010). Econometric analysis of cross-section and panel data (2. Aufl.). Boston: The MIT Press.
go back to reference Wooldridge, J. M. (2018). Introductory econometrics – A modern approach (7. Aufl.). Boston: South Western Education Publications. Wooldridge, J. M. (2018). Introductory econometrics – A modern approach (7. Aufl.). Boston: South Western Education Publications.
Metadata
Title
Paneldatenanalyse
Author
Matthias-W. Stoetzer
Copyright Year
2020
Publisher
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-61438-9_4