Skip to main content
main-content

Über dieses Buch

Dieses R-Arbeitsbuch bietet seinen Lesern ökonometrische Übungsaufgaben, die eigenständig am Computer bearbeitet werden können. Die notwendigen Kenntnisse des kostenlosen Ökonometrie-Programms R werden in eigenständigen „R-Boxen“ quasi nebenbei Schritt für Schritt vermittelt. Den Auftakt bildet dabei eine einfache Installationsanleitung. Auch alle Lösungen der Übungsaufgaben sind sorgfältig dokumentiert.Das R-Arbeitsbuch lässt sich zwar mit jedem einführenden Ökonometrie-Lehrbuch kombinieren, die optimale Verzahnung besteht jedoch mit dem Lehrbuch „Ökonometrie - Eine Einführung, v. Auer, 7. Auflage, Springer 2016“. Die Adressaten dieser Lehrbuch-Arbeitsbuch-Kombination sind die doppelten Einsteiger, also die Leser ohne statistische oder ökonometrische Kenntnisse und ohne Erfahrung in der Anwendung statistischer Programme.

Inhaltsverzeichnis

Frontmatter

Aufgaben und R-Boxen

Frontmatter

A1. Einleitung

Um mit der ökonometrischen Software R arbeiten zu können, muss das Programm zunächst installiert werden. Alle hierfür notwendigen Schritte werden in der R-Box » Einrichten der Arbeitsumgebung« (S. 4) erläutert. Diese R-Box ist allerdings hinter den Aufgaben 1.1 und 1.2 platziert, denn bei diesen beiden Aufgaben kommen wir noch ganz ohne R aus.Wer R bereits installiert hat, kann die erste R-Box getrost überspringen. In der zweiten R-Box » Erste Schritte « (S. 6) probieren wir R erstmals aus. Dabei werden wir uns auch die notwendigen R-Kenntnisse aneignen, um die anschließenden Übungsaufgaben 1.3 und 1.4 bearbeiten zu können.

Ludwig von Auer, Sönke Hoffmann

A2. Spezifikation

In diesem Kapitel geht es inhaltlich um die Spezifikation ökonometrischer Modelle. Aufgabe 2.1 kommt dabei ganz ohne R aus. Wir werden uns in diesem Kapitel aber auch die wichtigsten Grundkenntnisse für das Arbeiten mit R aneignen. Den ersten Schritt vollziehen wir in der R-Box » Die vier Hauptfenster « (S. 16) in der wir die grafische Oberfläche von RStudio kennenlernen.

Ludwig von Auer, Sönke Hoffmann

A3. Schätzung I: Punktschätzung

Dieses Kapitel ist der Schätzung des ökonometrischen Modells gewidmet. Zunächst werden in den drei R-Boxen » Objektverwaltung « (S. 32), » Datentypen, Datenstrukturen und Objektklassen « (S. 32) und » Datenstrukturen I: Überblick « (S. 34) weitere Grundkenntnisse für das Arbeiten mit R vermittelt. Die ersten beiden dieser R-Boxen erläutern, wie R mit Zahlen und anderen Informationen umgeht. Die dritte R-Box beschäftigt sich damit, wie solche Informationen in Objekten gespeichert werden können. Dafür stehen in R vor allem fünf verschiedene Datenstrukturen zur Verfügung.

Ludwig von Auer, Sönke Hoffmann

A4. Indikatoren für die Qualität von Schätzverfahren

Ökonometrischer Themenschwerpunkt des Kapitels sind die qualitativen Eigenschaften von Schätzverfahren und dabei insbesondere die Vorteile der KQ-Methode. Wir setzen aber auch in diesem Kapitel unsere R-Einführung fort. Den Auftakt bildet die R-Box » Objektverarbeitung I: Funktionen«. Sie vermittelt die wichtigsten Aspekte zum Thema »Funktionen in R«. Direkt im Anschluss erklärt die R-Box » Hilfe! « wie man das in R eingebaute Hilfesystem sinnvoll nutzt. Das Erlernte wird in Aufgabe 4.1 sofort angewendet. In der R-Box »Auskommentierung« (S. 78) wird ein wichtiges Hilfsmittel für den flexiblen Umgang mit Skripten vorgestellt und in Aufgabe 4.2 umgesetzt. Die daran anschließende R-Box »Wiederholte Stichproben « (S. 79) erläutert, dass das theoretische Konzept gedanklich wiederholter Stichproben in R in einfacher Weise konkret umgesetzt werden kann. In der daran anschließenden Aufgabe 4.3 wird diese Umsetzung eigenständig ausprobiert.

Ludwig von Auer, Sönke Hoffmann

A5. Schätzung II: Intervallschätzer

Das ökonometrische Thema dieses Kapitels ist die Intervallschätzung. Gleichzeitig wird aber auch der Umgang mit R weiter vertieft. Neben den im letzten Kapitel vorgestellten Funktionen sind auch Operatoren ein wichtiges Werkzeug, um in R Objekte zu verarbeiten. Solche Operatoren werden in der gleich anschließenden R-Box » Objektverarbeitung II: Operatoren « vorgestellt. In den Aufgaben 5.1 und 5.2 werden einige dieser Operatoren im Kontext der Intervallschätzer verwendet. Wie man in R eigene Funktionen definiert, wird in der R-Box » Definition eigener Funktionen« (S. 93) erläutert. Erprobt werden diese Kenntnisse in Aufgabe 5.3, welche ebenfalls der Berechnung von Intervallschätzern gewidmet ist. In Aufgabe 5.4 wird die Berechnung von Intervallschätzern weiter eingeübt. Der Zusammenhang zwischen der Breite von Intervallschätzern und einigen zentralen Parametern der Regression wird in Aufgabe 5.5 veranschaulicht.

Ludwig von Auer, Sönke Hoffmann

A6. Hypothesentest

Viele Hypothesen können mit t-Tests überprüft werden. Das Kapitel ist ausschließlich diesen t-Tests gewidmet. Aufgabe 6.1 führt einen solchen Test mit Hilfe der bereits bekannten R-Befehle durch. In der R-Box »t-Test: Testen einzelner Parameter« (S. 106) wird ein neuer R-Befehl erläutert, mit dessen Hilfe t-Tests noch einfacher durchgeführt werden können. Angewendet wird dieser Befehl in den Aufgaben 6.2 bis 6.4.

Ludwig von Auer, Sönke Hoffmann

A7. Prognose

Das Kapitel ist den Prognosen gewidmet. In Aufgabe 7.1 werden zunächst der Zusammenhang und die Unterschiede zwischen Prognoseintervallen und den beiden anderen bislang behandelten Intervallkonzepten (Konfidenz- und Akzeptanzintervalle) thematisiert. In der anschließenden R-Box »Punktprognosen« (S. 116) wird die für Punktprognosen konzipierte Funktion ols.predict() des Pakets desk vorgestellt. Die Berechnung von Punktprognosen und Prognoseintervallen wird in Aufgabe 7.2 geübt und in der Simulationsaufgabe 7.3 weiter vertieft. Die anschließende R-Box »Grafiken für Einfachregressionen« (S. 123) stellt ein speziell für die Einfachregression entworfenes grafisches Hilfsmittel vor. Dieses wird in Aufgabe 7.4 gleich ausprobiert. Den Abschluss des Kapitels bildet Aufgabe 7.5. Sie wendet die vier Hauptaufgaben der Ökonometrie (Spezifikation, Schätzung, Hypothesentest und Prognose) auf ein neues Beispiel an.

Ludwig von Auer, Sönke Hoffmann

A8. Spezifikation (K > 1)

Bislang haben wir uns auf Modelle mit K = 1 exogene Variablen beschränkt. In diesem Kapitel lassen wir erstmals mehrere exogene Variablen in unserem Regressionsmodell zu.Wir vollziehen also den Übergang von der Einfachregression (K = 1) zur Mehrfachregression (K > 1). Auch in der Mehrfachregression bildet die Spezifikation des ökonometrischen Modells den ersten Schritt. Die erste Übungsaufgabe dieses Kapitels widmet sich deshalb der Frage, inwieweit sich die im Lehrbuch beschriebenen A-, B- und C-Annahmen der Mehrfachregression von denen der Einfachregression unterscheiden. In der sich direkt anschließenden Aufgabe 8.2 wird das Dünger-Beispiel des Lehrbuches vorgestellt. Die R-Box »Zufallsstichproben« (S. 128) erläutert eine weitere Möglichkeit, mit R eigene Zufallswerte zu erzeugen. Ausprobiert wird diese Möglichkeit in Aufgabe 8.3.

Ludwig von Auer, Sönke Hoffmann

A9. Schätzung (K > 1)

In diesem Kapitel geht es um die konkrete Durchführung und Analyse der linearen Mehrfachregression in R. Dabei werden wir uns neben der Schätzung insbesondere den Begriffen »autonome Komponente«, »autonome Variation« und »partielles Bestimmtheitsmaß« zuwenden. In der untenstehenden R-Box »KQ-Schätzung des multiplen Regressionsmodells« erläutern wir zunächst, wie eine Mehrfachregression in die Formelschreibweise von R übertragen wird, stellen dann das Argument data der ols()-Funktion vor und gehen zum Schluss auf zwei Besonderheiten der ols()-Funktion ein. Angewendet werden die neuen Erkenntnisse in den Aufgaben 9.1 bis 9.3.

Ludwig von Auer, Sönke Hoffmann

A10. Hypothesentest (K > 1)

Der einfache t-Test und seine Durchführung mit Hilfe der Funktion t.coef.test() wurde bereits in der R-Box »t-Test: Testen einzelner Parameter« (S. 106) besprochen. Die dort getestete Hypothese bezog sich auf einen einzelnen Parameter β. Da wir inzwischen Modelle mit mehreren Steigungsparametern schätzen können, reicht eine solch einfache Hypothese oftmals nicht aus. Insbesondere könnte es notwendig sein, eine Linearkombination von zwei oder mehr Parametern des Modells auf einen bestimmten q-Wert zu testen. Die Umsetzung eines solchen Tests in R wird in der folgenden R-Box »t-Test: Testen einer Linearkombination« vorgestellt. In Aufgabe 10.1 kann das Erlernte gleich ausprobiert werden.

Ludwig von Auer, Sönke Hoffmann

A11. Prognose (K > 1)

Prognosen im Rahmen der Mehrfachregression unterscheiden sich nur unwesentlich von Prognosen im Rahmen der Einfachregression. Die in der R-Box 7.1 (S. 116) vorgestellte Funktion ols.predict() lässt sich deshalb auch in der Mehrfachregression wieder nutzen. Dies wird nachfolgend in der R-Box »Prognose in der Mehrfachregression« erläutert. Die wichtigste Neuerung in diesem Kapitel ist, dass wir Regressionsmodelle zulassen, deren endogene Variable mit dem natürlichen Logarithmus transformiert wurde. In diesem Fall entsteht bei der Rücktransformation der zu prognostizierenden Werte in die ursprüngliche Einheit eine Verzerrung, die es zu korrigieren gilt. Wie dies mit der bereits verwendeten Funktion ols.predict() ganz leicht bewerkstelligt werden kann, zeigen wir ebenfalls in der R-Box »Prognose in der Mehrfachregression«. Angewendet werden diese Erkenntnisse in Aufgabe 11.1. In der Aufgabe 11.2 wird ausprobiert, wie mehrere Prognosewerte gleichzeitig berechnet werden können.

Ludwig von Auer, Sönke Hoffmann

A12. Präsentation und Vergleich von Schätzergebnissen

Bislang haben wir die Schätzergebnisse einer KQ-Schätzung hauptsächlich in der von der ols()-Funktion erzeugten Tabellenform dargestellt. Wir hatten auch darauf hingewiesen, dass die Funktion summary() eine Alternative darstellt. Mit dieser Funktion könnten wir uns zudem einige statistische Kennzahlen des verwendeten Datensatzes anzeigen lassen.

Ludwig von Auer, Sönke Hoffmann

A13. Annahme A1: Variablenauswahl

Das Kapitel widmet sich der korrekten Auswahl der exogenen Variablen. In Aufgabe 13.1 werden zunächst die Konsequenzen aus einer fehlerhaften Variablenauswahl untersucht. Für die Variablenauswahl stehen verschiedene Kennzahlen zur Verfügung, darunter auch einige sogenannte Informationskriterien. Ihre Nutzung wird in der R-Box »Informationskriterien« (S. 169) erläutert. In Aufgabe 13.2 werden sowohl diese Informationskriterien als auch andere wichtige Instrumente der Variablenauswahl angewendet.

Ludwig von Auer, Sönke Hoffmann

A14. Annahme A2: Funktionale Form

Annahme A2 fordert, dass der wahre Zusammenhang zwischen der endogenen Variable y t und den exogenen Variablen x1t , x2t , . . . , x Kt linear ist. In diesem Kapitel wird untersucht, wie man mit R Nichtlinearitäten diagnostizieren kann, welche Konsequenzen diese Annahmeverletzung hat und wie man mit ihr umgeht.Das Kapitel beginnt mit der R-Box »RESET-Verfahren«. Diese erläutert, wie der Regression Specification Error Test (RESET) in R umgesetzt wird. Ausprobiert wird das Erlernte in Aufgabe 14.1. In der R-Box »Box-Cox-Test« (S. 183) wird die Anwendung dieses Tests in R erläutert. Eingeübt werden diese Inhalte in Aufgabe 14.2. Die Aufgaben 14.3 und 14.4 wenden sowohl das RESET-Verfahren als auch den Box-Cox-Test an. Die Besonderheiten des logarithmischen Modells sind Gegenstand der Aufgabe 14.5. Die Aufgaben 14.6, 14.7 beschäftigen sich mit derLinearisierung nicht-linearer Zusammenhänge sowie mit den Komplikationen, die daraus erwachsen.

Ludwig von Auer, Sönke Hoffmann

A15. Annahme A3: Konstante Parameterwerte

Die Erzeugung von Grafiken gehört sicherlich nicht zum Pflichtkanon der Ökonometrie-Ausbildung. Warum eröffnen wir dieses Kapitel dennoch mit der R-Box »Grafiken gestalten und exportieren«? Grafiken dienen in vielen Fällen der Veranschaulichung und helfen bei der Analyse formaler Zusammenhänge. Die Identifizierung von nicht-konstanten Parameterwerten bzw. Strukturbrüchen ist ein solcher Fall. Daher geben wir zunächst eine kurze Einführung in das Gestalten und Exportieren von Grafiken und wenden anschließend die neu erworbenen Grafik-Kenntnisse in Aufgabe 15.1 an.

Ludwig von Auer, Sönke Hoffmann

A16. Annahme B1: Erwartungswert der Störgröße

Weicht der Erwartungswert der Störgrößen von Null ab, schränkt das die Aussagekraft unserer ökonometrischen Schätzungen erheblich ein. Eine mögliche Ursache für E(u t ) ≠ 0 sind konstante Messfehler bei der Erfassung der Daten. Aufgabe 16.1 ist diesem Thema gewidmet.Ein sehr arbeitssparendes Instrument bei der Erstellung ökonometrischer Skripte sind Schleifen. Wie solche Schleifen in ganz einfacher Weise programmiert werden können, wird in der R-Box » Schleifen« (S. 219) erläutert. Ausprobiert wird das Erlernte in Aufgabe 16.2, die auch die Konsequenzen gestutzter Daten untersucht.

Ludwig von Auer, Sönke Hoffmann

A17. Annahme B2: Homoskedastizität

Das Kapitel widmet sich dem Fall heteroskedastischer Störgrößen, also Störgrößen, welche die Annahme der Homoskedastizität verletzen. In Aufgabe 17.1 geht es vor allem um die grafische Veranschaulichung heteroskedastischer Störgrößen. Die R-Box »Datensätze umsortieren« (S. 225) erläutert, wie die Elemente von Vektoren oder Dataframes nach bestimmten Kriterien umgeordnet werden können. Diese Möglichkeit wird uns helfen, Aufgabe 17.2 zu bearbeiten, in der ein Goldfeld-Quandt-Test zur Diagnose von Heteroskedastizität durchgeführt wird.

Ludwig von Auer, Sönke Hoffmann

A18. Annahme B3: Freiheit von Autokorrelation

Um den Umgang mit solchen autokorrelierten Störgrößen geht es in diesem Kapitel.

Ludwig von Auer, Sönke Hoffmann

A19. Annahme B4: Normalverteilte Störgrößen

In diesem Kapitel geht es ausschließlich um die Frage, ob die Störgrößen des zu untersuchenden Regressionsmodells normalverteilt sind, ob also Annahme B4 erfüllt ist. Ein populärer Test ist in diesem Zusammenhang der Jarque-Bera-Test. Seine Umsetzung in R wird in der R-Box „Jarque-Bera-Test“ erläutert. Angewendet wird der Test in Aufgabe 19.1, in welcher auch grafische Hilfsmittel zur Überprüfung der Normalverteilungsannahme vorgestellt werden.

Ludwig von Auer, Sönke Hoffmann

A20. Annahme C1: Zufallsunabhängige exogene Variablen

Besteht in einer Regressionsgleichung zwischen mindestens einer exogenen Variable und der Störgröße eine kontemporäre Korrelation, dann liefert die KQ-Methode verzerrte und nicht-konsistente Ergebnisse. Stattdessen sollte eine zweistufige KQ-Schätzung eingesetzt werden (ZSKQ-Schätzung). Sie ist ein Spezialfall der Instrumentvariablen-Schätzung (IV-Schätzung). Wie die ZSKQ-Schätzung in R umgesetzt werden kann, wird in der R-Box »Zweistufige KQ-Schätzung« erläutert. In der anschließenden Aufgabe 20.1 wird das Verfahren ausprobiert. Eine weitere Anwendung bietet die Aufgabe 20.2.

Ludwig von Auer, Sönke Hoffmann

A21. Annahme C2: Multikollinearität

Das Kapitel widmet sich den Problemen, die aus der Korrelation zwischen den exogenen Variablen erwachsen. In Aufgabe 21.1 wird veranschaulicht, dass die Berechnung der paarweisen Korrelationen nicht ausreicht, um einen Eindruck von der tatsächlich vorherrschenden Multikollinearität der exogenen Variablen zu erhalten. In der R-Box »Korrelationstabelle« (S. 268) wird eine Funktion vorgestellt, welche auf einfache Weise einen Eindruck von der Multikollinearität in den Daten vermittelt. Aufgabe 21.2 nutzt diese Funktion und widmet sich der KQ-Schätzung von Modellen mit multikollinearen exogenen Variablen.

Ludwig von Auer, Sönke Hoffmann

A22. Dynamische Modelle

Dynamische Regressionsmodelle werden eingesetzt, wenn eine oder mehrere exogene Variablen nicht nur einen unmittelbaren, sondern auch einen zeitlich verzögerten Einfluss auf die endogene Variable ausüben. Ein Beispiel wird in Aufgabe 22.1 betrachtet. Dieses wird auch Kapitel 22 des Lehrbuches behandelt, wo auch die grundlegenden theoretischen Konzepte dargestellt sind.

Ludwig von Auer, Sönke Hoffmann

A23. Interdependente Gleichungssysteme

Viele Wirkungszusammenhänge besitzen eine komplexe Kausalitätsstruktur, die sich nicht durch eine einzelne Regressionsgleichung darstellen lässt. Notwendig sind dann interdependente Gleichungssysteme. Wie solche Systeme zu interpretieren und zu schätzen sind, ist Gegenstand der Aufgabe 23.1. Diese wird auch in Kapitel 23 des Lehrbuches behandelt. Dort sind auch die entsprechenden theoretischen Konzepte dargestellt.

Ludwig von Auer, Sönke Hoffmann

Lösungen

Frontmatter

L1. Einleitung

Ludwig von Auer, Sönke Hoffmann

L2. Spezifikation

Ludwig von Auer, Sönke Hoffmann

L3. Schätzung I: Punktschätzung

Ludwig von Auer, Sönke Hoffmann

L4. Indikatoren für die Qualität von Schätzverfahren

Ludwig von Auer, Sönke Hoffmann

L5. Schätzung II: Intervallschätzer

Ludwig von Auer, Sönke Hoffmann

L6. Hypothesentest

Ludwig von Auer, Sönke Hoffmann

L7. Prognose

Ludwig von Auer, Sönke Hoffmann

L8. Spezifikation (K > 1)

Ludwig von Auer, Sönke Hoffmann

L9. Schätzung (K > 1)

Ludwig von Auer, Sönke Hoffmann

L10. Hypothesentest (K > 1)

Ludwig von Auer, Sönke Hoffmann

L11. Prognose (K > 1)

Ludwig von Auer, Sönke Hoffmann

L12. Präsentation und Vergleich von Schätzergebnissen

Ludwig von Auer, Sönke Hoffmann

L13. Annahme A1: Variablenauswahl

Ludwig von Auer, Sönke Hoffmann

L14. Annahme A2: Funktionale Form

Ludwig von Auer, Sönke Hoffmann

L15. Annahme A3: Konstante Parameterwerte

Ludwig von Auer, Sönke Hoffmann

L16. Annahme B1: Erwartungswert der Störgröße

Ludwig von Auer, Sönke Hoffmann

L17. Annahme B2: Homoskedastizität

Ludwig von Auer, Sönke Hoffmann

L18. Annahme B3: Freiheit von Autokorrelation

Ludwig von Auer, Sönke Hoffmann

L19. Annahme B4: Normalverteilte Störgrößen

Ludwig von Auer, Sönke Hoffmann

L20. Annahme C1: Zufallsunabhängige exogene Variablen

Ludwig von Auer, Sönke Hoffmann

L21. Annahme C2: Multikollinearität

Ludwig von Auer, Sönke Hoffmann

L22. Dynamische Modelle

Ludwig von Auer, Sönke Hoffmann

L23. Interdependente Gleichungssysteme

Ludwig von Auer, Sönke Hoffmann

Backmatter

Weitere Informationen

Premium Partner

    Bildnachweise