Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form...

26
Kapitel 10 Endogenit¨ at und Instrumentvariablen “The whole problem with the world is that fools and fanatics are always so certain of themselves, but wiser people are so full of doubts.” (Bertrand Russell) 10.1 Einleitung Bei Konferenzen ist es gef¨ urchtet, das ber¨ uhmte ‘E’ -Wort, die Frage nach der Endo- genit¨ at. Warum? Probleme mit der Endogenit¨ at sind in Sozialwissenschaften omni- pr¨ asent, die Konsequenzen k¨ onnen dramatisch sein, und doch ist sie schwer fassbar. Wir haben nur wenige Waffen dagegen, und diese sind meist nicht beliebig verf¨ ugbar, schwer handhabbar, und obendrein h¨ aufig ungenau. Nicht selten sind die gegen die Endogenit¨ at vorgeschlagenen Maßnahmen schlimmer als die Krankheit selbst. Aber richtig angewandt versprechen sie die L¨ osung eines unserer Urprobleme, Kausalit¨ ats- aussagen. Wir haben bereits gezeigt, dass die OLS Sch¨ atzer unter den Gauss Markov An- nahmen BLUE (Best Linear Unbiased Estimators ) sind, also erwartungstreu und effizient. Die entscheidende Annahme f¨ ur die Konsistenz des OLS Sch¨ atzers ist, dass die erkl¨ arenden x Variablen nicht mit den St¨ ortermen ε korreliert sind, oder etwas all- gemeiner, dass sie stochastisch unabh¨ angig sind 1 cov(x, ε)=0 Da diese Annahme die unbeobachtbaren St¨ orterme der Grundgesamtheit betrifft, kann sie empirisch nicht einfach ¨ uberpr¨ uft werden (die Stichprobenresiduen ˆ ε i sind immer unkorreliert mit den Regressoren, warum?). 1 Etwas allgemeiner kann dies auch mit Hilfe des bedingten Erwartungswertes geschrieben wer- den E(ε i |x jh ) = 0 f¨ ur i, j =1,...,n und h =1,...,k. 1

Transcript of Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form...

Page 1: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Kapitel 10

Endogenitat undInstrumentvariablen

“The whole problem with the world is thatfools and fanatics are always so certain ofthemselves, but wiser people are so full ofdoubts.” (Bertrand Russell)

10.1 Einleitung

Bei Konferenzen ist es gefurchtet, das beruhmte ‘E’ -Wort, die Frage nach der Endo-genitat. Warum? Probleme mit der Endogenitat sind in Sozialwissenschaften omni-prasent, die Konsequenzen konnen dramatisch sein, und doch ist sie schwer fassbar.Wir haben nur wenige Waffen dagegen, und diese sind meist nicht beliebig verfugbar,schwer handhabbar, und obendrein haufig ungenau. Nicht selten sind die gegen dieEndogenitat vorgeschlagenen Maßnahmen schlimmer als die Krankheit selbst. Aberrichtig angewandt versprechen sie die Losung eines unserer Urprobleme, Kausalitats-aussagen.

Wir haben bereits gezeigt, dass die OLS Schatzer unter den Gauss Markov An-nahmen BLUE (Best Linear Unbiased Estimators) sind, also erwartungstreu undeffizient.

Die entscheidende Annahme fur die Konsistenz des OLS Schatzers ist, dass dieerklarenden x Variablen nicht mit den Stortermen ε korreliert sind, oder etwas all-gemeiner, dass sie stochastisch unabhangig sind1

cov(x, ε) = 0

Da diese Annahme die unbeobachtbaren Storterme der Grundgesamtheit betrifft,kann sie empirisch nicht einfach uberpruft werden (die Stichprobenresiduen εi sindimmer unkorreliert mit den Regressoren, warum?).

1Etwas allgemeiner kann dies auch mit Hilfe des bedingten Erwartungswertes geschrieben wer-den E(εi|xjh) = 0 fur i, j = 1, . . . , n und h = 1, . . . , k.

1

Page 2: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 2

E(ε|x) = 0:

y x

ε

β

E(ε|x) 6= 0:

y x

ε

β∗

Abbildung 10.1: Wenn cov(x, ε) = 0 ist der OLS Schatzer unverzerrt, β misstden Effekt von x auf y. Falls cov(x, ε) 6= 0 ist der OLS Schatzerverzerrt; β∗ misst den direkten Effekt von x und den indirektenEffekt, der von ε uber x auf y wirkt.

Wir werden gleich sehen, dass endogene Regressoren in den Sozialwissenschafteneher die Regel als die Ausnahme sind. Da in diesen Fallen OLS Schatzer weder er-wartungstreu noch konsistent sind, spielt diese Annahme in der Okonometrie eineganz zentrale Rolle, ja, man kann sogar sagen, dass die Okonometrie als eigenstandi-ge Wissenschaft ganz wesentlich aus der Auseinandersetzung mit diesem Problementstanden ist.

Um eine intuitive Vorstellung von den Problemen zu bekommen erinnern wir uns,dass durch eine Regression eine zu erklarende Variable y gewissermaßen in zwei Teilezerlegt wird, in einen durch die Regressoren erklarten (systematischen) Teil, und ineinen unerklarten Teil, der durch im Storterm abgebildet wird. Dies ist im linkenPanel von Abbildung 10.1 dargestellt; der zu schatzende Koeffizient β2 beschreibtgewissermaßen die ‘Starke’ des Zusammenhangs zwischen y und x.

Falls aber die erklarende Variable x mit dem Storterm ε korreliert ist, wie im rech-ten Panel von Abbildung 10.1 dargestellt, wird der eigentlich interessierende Zusam-menhang zwischen x und y durch den zusatzlichen Zusammenhang zwischen x undε gewissermaßen ‘verschmutzt’.

Wenn ein Regressor x mit ε korreliert ist konnen wir uns vorstellen, ε ist eine Funk-tion von x, das heißt ε = ε(x). In diesem Fall misst β2 nicht mehr den marginalenEffekt von x, da

y = β1 + β2x+ ε(x)

In diesem Fall gibt es einen direkten und indirekten Zusammenhang zwischen x undy

dy

dx= β2 +

dx:= β∗

2

Der OLS Schatzer misst den gemeinsamen Einfluss β∗

2 := β2 +dεdx

anstelle des meistinteressierenden marginalen Effekts β2, der OLS Schatzer ist systematisch verzerrt.

Wenn der Regressor x mit dem Storterm ε korreliert ist, gibt es ohne zusatzlicherInformation keine Moglichkeit den Koeffizienten β2 unverzerrt zu schatzen! Da dieseKorrelation zwischen x und ε in der Regel auch mit zunehmender Stichprobengroßenicht verschwinden wird, ist der OLS Schatzer im Fall eines endogenen Regressorsauch nicht konsistent.

Page 3: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 3

10.2 Ursachen von Endogenitat

Da endogene Regressoren derart schwerwiegende Probleme aufwerfen stellt sich alsnachstes die Frage, inwieweit dieses Problem relevant ist, das heißt, inwieweit wirdamit rechnen mussen, mit diesem Problem bei unserer praktischen Arbeit konfron-tiert zu werden. Leider stellt sich heraus, dass dieses Problem alltaglich ist, und beifast allen empirischen Arbeiten im sozialwissenschaftlichen Umfeld berucksichtigtwerden muss.

Die wichtigsten Falle, die zu endogenen Regressoren fuhren, sind

1. Nichtberucksichtigung zumindest einer relevanten erklarenden Variablen, diemit der berucksichtigten x Variable korreliert ist (‘omitted variables’ ).

2. Simultane Kausalitat, das heißt, wenn zur Beschreibung eines Zusammenhangsmehr als eine Gleichung benotigt wird, und dies zu feed-back Mechanismenfuhrt.

3. Messfehler in der erklarenden x Variable.

4. Autokorrelation mit verzogerten endogenen Variablen.

Im Folgenden wollen wir diese Falle etwas ausfuhrlicher darstellen.

10.2.1 Nichtberucksichtigung relevanter Variablen (Omit-

ted Variables)

Wir haben bereits fruher gezeigt, dass die Nichtberucksichtigung relevanter Varia-blen zu einem Endogenitatsbias fuhrt. Wenn der datengenerierende Prozess durchdas ‘wahre’ Modell

yi = β1 + β2xi2 + β3xi3 + εi, εi ∼ i.i.d.(0, σ2)

beschrieben beschrieben wird, wir aber falschlich ein ‘kurzes’ Modell

yi = β∗

1 + β∗

2xi2 + ε∗i

dann istE(β∗

2) = β2 + β3 ∗ δ2

wobei δ2 den linearen Zusammenhang zwischen x2 und x3 in der Form

xi3 = δ1 + δ2xi2 + υi

beschreibt.

Wann immer β3 und δ2 ungleich Null sind, ist der OLS Schatzer β∗

2 des ‘kurzen’Modells verzerrt!

Der Grund ist einfach, wenn wir falschlich das ‘kurze’ Modell schatzen ist x3 imStorterm enthalten, d.h.

yi = β1 + β2xi2 + εi, mit εi = β3xi3 + εi

Page 4: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 4

Wenn x2 und x3 korreliert sind und β3 6= 0 fuhrt dies zu einer Korrelation zwischenx2 und ε, was die Endogenitat erzeugt. Diesen Fall haben wir im Kapitel “MarginaleEffekte & nichtlineare Funktionsformen” bereits ausfuhrlich diskutiert.

Man beachte, dass in diesem Fall eine kausale Interpretation von β2 als margi-naler Effekt falsch ware, β2 misst nur in einem korrekt spezifizierten Modell denmarginalen ceteris paribus Effekt von x2 auf y. Der Schatzer des ‘kurzen’ Modellsβ2 darf nich als marginaler ceteris paribus Effekt von x2 interpretiert werden, daE(β2) = β2 + β3δ2.

Achtung: Falls in einem multiplen Regressionsmodell

yi = β1 + β2xi2 + β3xi3 + . . .+ βkxik + εi

ein einziger Regressor xh endogen ist (d.h. mit dem Storterm korreliert ist), wer-

den in der Regel alle Koeffizienten β1, β2, . . . , βk verzerrt geschatzt! Dies ist wenigverwunderlich, da die Regressoren – und damit auch die Koeffizienten – meist un-tereinander korreliert sind.

10.2.2 Simultane Kausalitat

Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er-klarenden Variable x und der abhangigen Variablen y angenommen, namlich dassdass die x Variable unmittelbar y beeinflusst.

Was passiert aber, wenn die Variablen auf komplexere Weise verknupft sind, sodass wir zur Beschreibung mindestens zwei oder mehrere Gleichungen benotigen?Dies ist in den Sozialwissenschaften eher die Regel als die Ausnahme, selbst zurBeschreibung des einfachsten Marktes benotigen wir bereits eine Nachfrage- undAngebotsfunktion!

Wir werden nun zeigen, dass eine solche gegenseitige Abhangigkeit, zu deren Be-schreibung mehr als eine Gleichung benotigt wird, ebenfalls zu einer Korrelationzwischen dem Storterm und den erklarenden x Variablen fuhrt.

Der einfachste Fall einer solchen Korrelation zwischen Regressor und Storterm kanneinfach anhand des keynesianischen Eingaben-Ausgaben Modells mit einer stocha-stischen Konsumfunktion und Einkommensidentitat erlautert werden.

Das der Abbildung 10.2 zugrunde liegende datengenerierende Prozess ist

Ci = 60 + 0.5Yi + εi mit εi ∼ U(−30,+30)

Yi = Ci + Ii mit Ii ∼ U(30, 80)

wobei U hier fur die Gleichverteilung steht, Ii ∼ U(30, 80) bedeutet also, dass dieVariable Ii mit gleicher Wahrscheinlichkeit irgendeinen Wert zwischen 30 und 80annimmt. Die Gleichverteilung wurde nur gewahlt um eine ubersichtlichere Grafikzu erhalten und spielt sonst keine Rolle.

Abbildung 10.2 zeigt diese Funktionen fur die Extremwerte von εi und Ii (d.h.Ci = 60+ 0.5Yi − 30 und Ci = 60+ 0.5Yi + 30, bzw. Ci = Yi − 30 und Ci = Yi − 80;die strichlierten Linen zeigen die Funktionen fur εi = 0 und Ii = 0).

Page 5: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 5

0

50

100

150

200

250

300

350

0 50 100 150 200 250 300 350 400 450Y

C

b

b

b

b

bb b

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

bbb

b

b

b

b

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

C = 60 + 0.5Y

C = 60 + 0.5Y + 30

C = 60 + 0.5Y − 30

C=Y−

30C=Y−

80

C = Y

0

50

100

150

200

250

300

350

0 50 100 150 200 250 300 350 400 450Y

C

b

b

b

b

bb b

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

bbb

b

b

b

b

b

b

b

b

b

b

b

b

bb

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

C = β1 + β2Y

= 60 + 0.5Y

C = β1 + β2Y

= −9.2 + 0.81Y

C = Y

Abbildung 10.2: Ein einfaches Keynesianisches Modell.

Die Daten wurden diesem Modell entsprechend vom Computer erzeugt. Eine einfa-che OLS Schatzung der Konsumfunktion liefert statt der wahren Werte β1 = 60 undβ2 = 0.5 vollig andere Werte.

C = −9.175 + 0.808 Y(5.685) (0.024)***

R2 = 0.934, s = 10.818, F -Stat = 1096.971, n = 80(Standardfehler in Klammern)

Abbildung 10.2 zeigt, was schief gelaufen ist, die Einkommensidentitat Y = C + Ierzwingt, dass alle Realisationen im gelben Parallelogramm liegen mussen!

Wie Abbildung 10.3 zeigt fuhrt dies zu einer Korrelation zwischen den Stortermenund der erklarenden Variable Y , denn ein in einer Periode zufallig großer Stortermfuhrt zu erhohten Konsumausgaben, diese uber die Identitat zu einem hoheren Ein-kommen, weshalb Einkommen und Storterme korreliert sind.

Ci = β1 + β2 Yi + εi

Yi = Ci + I +G

1

2

3

4

cov(Yi, εi) 6= 0

Abbildung 10.3: Simultanitat im keynesianischen Eingaben-Ausgaben Modell [lo-cal, www]

Wie das rechte Panel von Abbildung 10.2 zeigt, liefert die OLS Gerade zwar ei-ne optimale Beschreibung der realisierten Daten, aber sie liefert keine konsistente

Page 6: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 6

Schatzung der Konsumfunktion, weil die Abhangigkeit zwischen Konsum und Ein-kommen uber die Einkommensidentitat nicht berucksichtigt wird!

Die OLS Koeffizienten β1 und β2 liefern deshalb keine unverzerrten Schatzer fur denautonomen Konsum β1 und die marginale Konsumneigung β2! Da dieses Problemunabhangig von der Stichprobengroße existiert wird das Problem mit zunehmenderStichprobengroße auch nicht kleiner, deshalb ist der OLS Schatzer in diesem Fallauch nicht konsistent!

Eine einfache Monte Carlo Simulation soll das Problem wieder veranschaulichen.Das folgende kleine EViews Programm erzeugt tausend Mal ein Modell mit zweiGleichungen, einer Konsumfunktion und einer Identitat

Ci = 60 + 0.5Y + εi

Yi = Ci + Zi

mit εi ∼ U(−30,+30) und Zi ∼ U(30, 80), wobei Z alle exogenen Nachfragekatego-rien enthalt (zum Beispiel Investitionen und Staatsausgaben).

Das folgende EViews-Programm lost dieses Modell bei jedem der tausendDurchgange neu und schatzt jedes Mal aus der Losungen die marginale Konsumnei-gung. Man beachte, dass die ‘wahre’ marginale Konsumneigung mit 0.5 vorgegebenwurde.

wfcreate u 25

rndseed 123456789

!REP = 1000

vector(!REP) MCP = na

series Cons

series Y

series Z

for !r = 1 to !REP

Z = @runif(30,80)

’ Modell losen

model Keynes

Keynes.append Cons = 60 + 0.5*Y + @runif(-30,30)

Keynes.append Y = Cons + Z

Keynes.solve

delete Keynes

’ Konsumfunktion mit Modelllosungen schatzen

equation temp.ls Cons_0 c Y_0

MCP(!r) = c(2)

next

MCP.distplot hist

Abbildung 10.4 zeigt das Ergebnis, offensichtlich ist die Schatzung der margina-len Konsumneigung systematisch verzerrt, obwohl der wahre Wert der marginalenKonsumneigung mit 0.5 vorgegeben wurde, liegt der Mittelwert der empirischenStichprobenkennwertverteilung des OLS Schatzers bei 0.8 (bei tausend Replikatio-nen).

Page 7: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 7

0

20

40

60

80

100

120

140

.50 .55 .60 .65 .70 .75 .80 .85 .90 .95

Fre

qu

en

cy

Marginale Konsumneigung

Abbildung 10.4: Monte Carlo Simulation fur endogenen Regressor. Der wahreWert der marginalen Konsumneigung ist 0.5; aufgrund des feed-backs uber die Einkommensidentitat uberschatzt OLS diesenWert systematisch.

Da die Sozialwissenschaften in der Regel hochkomplexe interdependente Systemeuntersuchen tritt dieser Fall sehr haufig auf.

Im Kern tritt diese Problem immer dann auf, wenn zwei Variablen auf mehr alseine Art verknupft sind, das heißt, wenn zur Beschreibung des Verhaltens einerVariable mehr als eine Gleichung benotigt wird. Das klassische Beispiel sind naturlichAngebots- und Nachfragefunktionen oder Makromodelle, aber ahnliche Problemeexistieren fast uberall in den Sozialwissenschaften.

Das Identifikationsproblem

Simultane Strukturmodelle sind insbesondere in den Sozialwissenschaften wichtig,da dort Zusammenhange sehr haufig interdependenter Natur sind. Dies wirft einigeschwerwiegende Probleme auf, die zum einen logischer Natur sind (z.B. das Identi-fikationsproblem), zum anderen Probleme bei der Schatzung verursachen (z.B. eineKorrelation zwischen Storterm und abhangigen Variablen).

Die damit einhergehenden Probleme sowie deren Losung stehen an der Wiege derOkonometrie als eigener Wissenschaft.

Eine Strukturgleichung stellt einen theoretisch begrundeten Zusammenhang dar. Ineinem simulatanen Strukturmodell sollte jede Gleichung im System eine eigenstandi-ge kausale Interpretation haben.

Die endogenen Variablen werden im Modell erklart und sind – wenn sie als erklarendeVariablen verwendet werden – mit dem Storterm korreliert.

Die exogenen Variablen werden außerhalb des Modells bestimmt, und sollten deshalbmit dem Storterm unkorreliert sein. Eine Anderung einer endogenen Variable hat

Page 8: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 8

keine Auswirkungen auf die exogenen Variablen, aber umgekehrt hat die Anderungeiner exogenen Variable naturlich Auswirkungen auf die endogenen Variablen.

Welche Variablen endogen (bzw. exogen) sind ist eine zentrale Frage, die eng mit dervermuteten Kausalitatsstruktur zusammenhangt. In einem Modell mit ausschließlichendogenen Variablen macht die Kausalitatsfrage keinen Sinn, da alles von allemabhangt. Im Idealfall sollte aufgrund theoretischer Uberlegungen von vornhereinklar sein, welche Variablen endogen (bzw. exogen) sind, aber in einem gewissenAusmaß ist es moglich darauf empirisch zu testen (z.B. mit einem Hausman-Tests).

Wichtig ist, dass in einem Strukturmodell jede Gleichung eine eigene kausale Inter-pretation hat.

Durch Losung eines Modells in Strukturform nach den endogenen Variablen erhaltman die reduzierte Form des Gleichungssystems, in dem es per Definition keine‘feed backs’ mehr gibt.

Strukturform:

Y1 = Y1(Y2, X)

Y2 = Y2(Y1)

X

Y1 Y2

⇒ Interdependenz

Reduzierte Form:

Y ∗

1= Y1(X)

Y ∗

2= Y2(X)

X

Y1 Y2

⇒ keine feed-backs!

Abbildung 10.5: Strukturform und reduzierte Form eines Gleichungssystems

Das klassische Beispiel ist ein einfaches partielles Marktmodell mit Angebots- undNachfragefunktion. Die Angebotsfunktion beschreibt das Verhalten der Anbieter, da-von unabhangig beschreibt die Nachfragefunktion das Verhalten der Konsumenten.Uber die Gleichgewichtsbedingung sind diese beiden Verhaltensgleichungen mitein-ander verknupft.

Das Identifikationsproblem stellt sich schon vor der Schatzung. Wenn die ‘Da-ten’ mit mehr als einer Theorie kompatibel sind, dann sind diese Theorien ‘beobach-tungsaquivalent ’, d.h. sie konnen empirisch nicht unterschieden werden. In diesemFall nennt man die Struktur ‘nicht identifizierbar ’.

Haufig handelt es sich dabei um die Frage, ob aus den reduzierten Gleichungen alleParameter des Systems in Strukturform bestimmen werden konnen.

In der reduzierten Form eines Gleichungssystems stehen auf der rechten Seite nurexogene Variablen, die per Definition mit dem Storterm unkorreliert sind. Deshalbkann die reduzierte Form problemlos mittels OLS geschatzt werden.

Page 9: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 9

In vielen Fallen interessiert man sich aber fur die Strukturform, weil diese eine un-mittelbare theoretische Interpretation hat. Es ist deshalb naheliegend zu versuchen,die Koeffizienten der reduzierten Form zu schatzen und anschließend daraus dieKoeffizienten der Strukturform ‘zuruckzurechnen’.

Dies ist aber haufig unmoglich, da die reduzierte Form eines Modells oft mit vielenmoglichen Strukturformen kompatibel ist (Beobachtungsaquivalenz ), nur unter ganzbestimmten Bedingungen gibt es eine eindeutige Beziehung zwischen den Koeffizi-enten der reduzierten Form und der Strukturform.

Diese Restriktionen mussen aus dem theoretischen Vorwissen uber die Struktur desProblems kommen und umfassen v.a. Ausschlußbedingungen (d.h. dass ein bestimm-ter Koeffizient einer Strukturgleichung den Wert Null hat, zum Beispiel, dass dasEinkommen nicht in einer Angebotsfunktion vorkommt) und Normalisierungen. DieIntuition kann am einfachsten anhand eines Beispiels vermittelt werden.

Nachfrage- Angebotmodell:

Angebot: Qt = a1 + a2Pt + ut

Nachfrage: Qt = b1 + b2Pt + vt

wobei u und v die Storterme bezeichnen.

Wenn der Markt im Gleichgewicht ist konnen wir nur Schnittpunkte dieser beidenGeraden beobachten, und es gibt keine Moglichkeit die Parameter a1, a2, b1 und b2zu schatzen, d.h. beide Gleichungen sind nicht identifizierbar! Dies kann man auchanhand von Abbildung 10.6 (Seite 10) erkennen (Folien, www).

Panele a), b), c) und d) zeigen, dass jede Beobachtung der Schnittpunkt von einerAngebots- und Nachfragefunktion ist, und die Daten deshalb keine Information uberden Anstieg von Angebots- bzw. Nachfragefunktion enthalten.

Die reduzierten Gleichungen fur das System in ‘Abweichungsform’ (d.h. die Varia-blen sind als Abweichungen vom Mittelwert gemessen) sind:

pt =vt − ut

a2 − b2und qt =

a2vt − b2ut

a2 − b2

Offensichtlich konnen beliebig viele Kurven durch die Schnittpunkte (Gleichgewicht-punkte) gelegt werden, d.h. es gibt unendlich viele strukturelle Modelle, die mit demgleichen reduzierten System vereinbar sind! Dieses Problem andert sich nicht wennmehr Beobachtungen verfugbar werden, solange dies nur mehr vom Gleichen bedeu-tet.

Es sollte aber auch klar sein, dass die Identfikation einer Gleichung nicht erforder-lich ist, wenn anstelle der Strukturparameter nur eine Prognose angestrebt wird, dadiese unmittelbar mit Hilfe der reduzierten Gleichungen erstellt werden kann (sofernexogene erklarende Variablen existieren). Wenn aber die Koeffizienten der Struktur-gleichungen geschatzt werden sollen muss vorher die Identifikation gepruft werden.Dazu ist offensichtlich zusatzliche Information erforderlich.

Stellen wir uns z.B. vor, die Nachfrage im obigen Modell sei zusatzlich vom Einkom-men abhangig:

Angebot: Qt = a1 + a2Pt + ut

Nachfrage: Qt = b1 + b2Pt + b3Yt + vt

Page 10: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 10

a)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

bD

b)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

S

c)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

d)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

e)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

S1

S2

S3

D

bc

bc

bc

f)

P

Q

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

D3

D2D1

S

bc

bc

bc

Abbildung 10.6: Das Identifikationsproblem: Wenn wir nur Gleichgewichts-punkte beobachten sind die Koeffizienten ohne zusatzliche Infor-mation nicht identifizierbar. Wenn aber eine exogene Variablenur das Angebot verschiebt (z.B. das Wetter) wird dadurch dieNachfragefunktion identifizierbar, usw. [lokal, www]

diesem Fall (und wenn b3 6= 0) wird die Nachfragekurve im Zeitablauf verschoben,und es ist deshalb moglich eine Angebotskurve zu zeichnen, d.h. durch die zusatzlicheVariable in der Nachfragefunktion wird die Angebotsfunktion identifizierbar, obwohles nach wie vor keine Moglichkeit gibt die Nachfragefunktion zu identifizieren (d.h.das Interzept und den Steigungskoeffizienten der Nachfragefunktion zu schatzen)!Wurde hingegen die Angebotskurve z.B. wegen Temperaturschwankungen laufend

Page 11: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 11

verschoben, so wurde dadurch die Nachfragefunktion identifizierbar.

Enthalten alle Strukturgleichungen eines simulatanen Gleichungssystems die glei-chen Variablen, so kann aus den Daten nicht ermittelt werden, welche Gleichungwelche ist, die Strukturkoeffizienten sind nicht ermittelbar. Die Strukturkoeffizien-ten einer bestimmten Gleichung konnen nur ermittelt werden, wenn diese Gleichungbestimmte Variablen nicht enthalt, damit Schwankungen dieser Variablen die ande-ren Gleichungen verschieben und somit der Verlauf der in Frage stehenden Struk-turgleichung ermittelt werden kann (vgl. Abbildung 10.6, Seite 10, Panel e) undf)).

Diese intuitive Idee ist nur eine andere Darstellung des fruheren Problems einer ein-deutigen Beziehung zwischen Strukturgleichungen und reduzierter Form und fuhrtzum Abzahlkriterium (order condition).

Das Abzahlkriterium ( order condition) besagt, dass eine Gleichung identifizierbarist, wenn die Anzahl der in einer Gleichung nicht vorkommenden pradeterminiertenVariablen großer oder gleich ist wie die Anzahl der in der Gleichung vorkommendenendogenen Variablen minus Eins.

Die Anzahl der in der Gleichung vorkommenden endogenen Variablen umfasst dieVariablen links und rechts vom Gleichheitszeichen.

Achtung: Das Abzahlkriterium ist nur eine notwendige, aber keine hinreichende,Bedingung fur die Identifizierbarkeit einer Gleichung! Eine hinreichende Bedingungbildet das sogenannte ‘Rangkriterium’ (rank condition), auf das hier nicht nahereingegangen werden soll.

Abzahlkriterium:

• wenn g − 1 > K − k ist die Gleichung unteridentifiziert,

• wenn g − 1 = K − k ist die Gleichung genau identifiziert,

• wenn g − 1 < K − k ist die Gleichung uberidentifiziert.

mit

g: die Anzahl der endogenen Variablen in der betreffenden Gleichungk: die Anzahl der pradeterminierten Variablen in der GleichungK: die Anzahl der pradeterminierten Variablen im System (incl. Interzept!)

das heißt, K − k bezeichnet die in einer Gleichung ausgeschlossenen exogenen Va-riablen (Nullrestriktionen).

Wie wir schon fruher angedeutet haben lauft das Argument im Kern darauf hinaus,dass eine Okonometrikerin a priori Restriktionen auf die Parameter legen muss,um eine Gleichung identifizierbar zu machen (in der Regel bedeutet eine solche Re-striktion, dass bestimmte Parameter in manchen Gleichungen den Wert Null habenmussen, also in diesen Gleichung nicht vorkommen durfen!).

Page 12: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 12

Das Abzahlkriterium (order condition) ist nur eine notwendige, aber keine hinrei-chende Bedingung fur Identifizierbarkeit. Selbst wenn das Abzahlkriterium erfulltist kann es nur als Faustregel fur die Identifizierbarkeit einer Gleichung gelten. Stel-len wir uns z.B. vor, dass das Einkommen in der obigen Nachfragegleichung kaumschwankt, bzw. dass b3 fast gleich Null ist. In diesem Fall ist das Abzahlkriteriumzwar erfullt, aber trotzdem wird es nur schwer moglich sein zwischen Nachfrage- undAngebotsfunktion verlasslich zu unterscheiden.2

Man beachte, dass eine nicht identifizierte Gleichung identifizierbar werden kann,wenn entweder mehr Restriktionen auf die Parameter gelegt werden, oder wennmehr exogene Variablen in andere Gleichungen des Modells aufgenommen werden.

Generell gilt, dass die Identifikation in kleinen Modellen relativ einfach uberpruftwerden kann, und dass große Modelle haufig uberidentifiziert sind.

10.2.3 Messfehler in den erklarenden (x) Variablen*

Eine weitere mogliche Ursache fur Endogenitat sind Messfehler in mindestens einerx Variablen. Um dies zu zeigen nehmen wir an, dass anstelle des ‘wahren’ Wertes3

xi nur ein fehlerhaft gemessenes

x∗

i = xi + υi

beobachtet werden kann (xi := xi − x bezeichne wieder Abweichungen vom Mittel-wert), mit υi ∼ i.i.d.(0, σ2

υi).

Das wahre (und unbeobachtbare) Regressionsmodell sei

yi = βxi + εi

= β(x∗

i − υi) + εi

= βx∗

i + (εi − βυi)

aber wir konnen nur das Modell

yi = βx∗

i + ε∗i = β (xi + υi)︸ ︷︷ ︸x∗

i

+ (εi − βυi)︸ ︷︷ ︸ε∗i

schatzen.

Wir beschranken uns auf den einfachsten Fall, wenn die Storterme alle ange-nehmen Eigenschaften aufweisen: E(εi) = E(υi) = 0, var(εi) = E(ε2i ) = σ2

ε ,var(υi) = E(υ2

i ) = σ2υ, cov(εi, εj) = cov(υi, υj) = 0 fur i 6= j, und cov(εi, υj) = 0 fur

alle i, j.

Selbst wenn die Storterme all diese angenehmen Eigenschaften aufweisen und mitden wahren Werten xi unkorreliert sind, so ist der OLS–Schatzer in der Regel den-noch weder erwartungstreu noch konsistent! Dies kann einfach gezeigt werden

2Eine notwendige und hinreichende Bedingung fur Identifizierbarkeit ist das Rang-Kriterium

(rank condition), auf das hier aber nicht naher eingegangen werden soll.3Einfachheitshalber beschranken wir uns im folgenden wieder auf den 2-Variablen Fall. Fur eine

allgemeinere Darstellung in Matrixschreibweise siehe z.B. Johnston 1997, S. 154ff.

Page 13: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 13

Der OLS-Schatzer mit dem fehlerhaft gemessenen x∗ ist

β2 =

∑x∗y∑(x∗)2

=

∑x∗(βx+ ε)∑

(x∗)2

= β

∑(x∗)x∑(x∗)2

+

∑x∗ε∑(x∗)2

In diesem Fall konnen wir nicht einfach den Erwartungswert berechnen, da aufgrunddes Messfehlers auch der Nenner des Schatzers stochastisch ist.4 Aber man kann mitHilfe des probability limits immerhin die Konsistenz uberprufen.

Wenn die entsprechenden Momente 2. Ordnung existieren und

plim

(1

n

∑(x∗)2

)= σ2

x + σ2

υ

plim

(1

n

∑(x∗)x

)= σ2

x

plim

(1

n

∑x∗ε

)= 0

folgt daraus

plim(β2) = plim

∑(x∗)x∑(x∗)2

+

∑x∗ε∑(x∗)2

)= β

(σ2x

σ2x + σ2

υ

)

Da Varianzen immer positiv sind ist der Nenner von σ2x/(σ

2x + σ2

υ) immer großerals der Zahler (σ2

υ > 0). Deshalb fuhrt der Messfehler im bivariaten Modell dazu,

dass der OLS Steigungsparameter β2 naher bei Null liegt als der wahre Wert β2 (aufenglisch wird dies ‘attenuation bias’ genannt). Die ‘attenuation’ gilt allerdings nurim bivariaten Modell, in multiplen Regressionsmodellen kann der Bias kompliziertersein.

Fehlerhaft gemessene Variable treten haufig auf, wenn Proxy-Variablen verwendetwerden, da die eigentlich interessierenden Variable unbeobachtbar ist (z.B. das per-manente Einkommen in einer Konsumfunktion nach Friedmann, oder die Begabungeines Arbeitnehmers), wenn Fragen in einem Fragebogen zweideutig sind, oder wennGerate ungenaue Daten liefern. In allen diesen Fallen ist mit systematisch verzerrtenSchatzergebnissen zu rechnen!

Die folgende kleine Monte Carlo Simulation soll dies demonstrieren:

’ Monte Carlo: errors in variables

!n = 300

!REP = 1000

4Erinnern Sie sich, E(X/Y ) 6= E(X)/E(Y )!

Page 14: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 14

wfcreate u !n

vector(!REP) R

rndseed 1234567

series x = @rnorm

for !r = 1 to !REP

series u = @rnorm

series y = 5 + 5*x + u ’ Datengen. Prozess

series xs = x + @rnorm ’ x wird fehlerhaft gemessen

equation eq.ls y c xs ’ xs = x + Fehler

R(!r) = c(2)

next

R.distplot hist

Da in diesem einfachen Fall β2 = 5, xi ∼ N(0, 1), υi ∼ N(0, 1) εi ∼ N(0, 1) ist

plim(β2) = β

(σ2x

σ2x + σ2

υ

)= β

1

1 + 1= 0.5β2 = 2.5

Der Mittelwert dieser tausend Replikationen (gespeichert in Vektor R) ist ungefahr2.46 und die Standardabweichung 0.11, was denn Erwartungen entspricht. Abbildung10.7 zeigt das Histogramm

0

20

40

60

80

100

2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0

Fre

qu

en

cy

Abbildung 10.7: Monte Carlo Simulation fur Messfehler im Regressor. Der wahreWert ist β2 = 5, aufgrund der Messfehler wird dieser Wert massivunterschatzt.

Wir fassen zusammen: bei endogenen x Variablen liefert der OLS-Schatzer selbstin großen Stichproben systematisch verzerrte Ergebnisse, d.h. OLS Schatzer sind insolchen Fallen weder erwartungstreu noch konsistent! Deshalb sind andere Schatz-verfahren erforderlich.

Leider sind keine Schatzer bekannt, die in solchen Fallen BLUE (d.h. auch in kleinenStichproben unverzerrt und effizient) sind, aber die Methode Zweistufiger Kleinster

Page 15: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 15

Quadrate (‘two stage least squares’, 2SLS) und der Instrumentvariablen Schatzer(IV-Schatzer) liefern in diesen Fallen zumindest konsistente Ergebnisse (d.h. dieSchatzungen werden mit zunehmender Stichprobengroße zunehmend genauer).

10.3 Die Methode der zweistufigen kleinste Qua-

drate (2SLS)

Erinnern wir uns: die OLS Methode beruht auf einer orthogonalen Zerlegung von yin eine systematische – durch die x Variablen erklarte – Komponente, und in einestochastische nicht-systematische Komponente, die Residuen ε. Der OLS Schatzerstellt sicher, dass die Residuen mit den x Variablen in der Stichprobe unkorreliertsind (orthogonal), aber dies muss nicht fur die Storterme der Grundgesamtheit εgelten.

Das Kernproblem bei Endogenitat besteht darin, dass die erklarenden x Variablenin der Grundgesamtheit auch mit der nicht-systematischen (unbeobachteten) Kom-ponente von y korreliert sind.

Wir konnen uns intuitiv vorstellen, dass die erklarende x Variable ‘zwei Arten vonStreuung’ enthalt, eine erwunschte Streuung, die zur Korrelation mit der systemati-schen Komponente von y fuhrt, und eine unerwunschte Streuung, die zur Korrelationmit der nicht-systematischen Komponente von y, den Stortermen, fuhrt.

Diese intuitive Idee der Zerlegung der Streuung von x in einen unproblematischenTeil und einen unerwunschten problematischen Teil fuhrt unmittelbar zur Idee derMethode der zweistufigen kleinsten Quadrate (‘two stage least squares’ bzw. 2SLS).

Wir beginnen mit dem einfachsten Fall, dem bivariaten Modell und einer einzigenInstrumentvariablen.

Wir gehen von einer Strukturgleichung der Form

yi = β1 + β2xi + εi

aus. Wenn x endogen ist (d.h. cov(x, ε) 6= 0), ist der OLS Schatzer bekanntlich wedererwartungstreu noch konsistent.

Das Problem besteht darin, dass der interessierende Effekt von x auf y durch dieKorrelation zwischen x und ε gewissermassen ‘verschmutzt’ wird (siehe Abbildung10.8 linkes Panel).

Die Idee der 2SLS Schatzung besteht einfach darin, dass man versucht mit Hilfeeiner Regression (der 1. Stufe) die Streuung von x in diese zwei Teile zu zerlegen,in eine erwunschte Streuungen, die aus der Korrelation mit y herruhrt, und in eineunerwunschte Streuungen, die aus der Korrelation mit ε folgt.

Dies kann nur mit Hilfe zusatzlicher Information gelingen, man benotigt eine (odermehrere) zusatzliche Variable(n) z, die ganz besondere Eigenschaften haben mussen,sie sollten moglichst hoch mit x korreliert sein, durfen aber nicht mit ε korreliertsein.

Solche Variablen werden ‘Instrumentvariablen’ (z) genannt, und sie mussen diebeiden folgenden Anforderungen erfullen

Page 16: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 16

y x

ε

β∗y

xυx

z

ε

βIV

Abbildung 10.8: Falls E(ε|X) 6= 0 ist der OLS Schatzer β∗ verzerrt, da der Ein-fluss von x auf y durch die Korrelation mit dem Storterm ‘ver-schmutzt’ wird (linkes Panel). Bei einer IV Schatzung wird xgewissermaßen in einen exogenen Teil x – der durch die Instru-mentvariable erklart wird – und einen endogenen Teil υx zerlegt.Die IV Schatzer verwenden nur die exogene Streuung x (rechtesPanel).

1. Relevanz: cov(z, x) 6= 0, und

2. Exogenitat: cov(z, ε) = 0

Mit Hilfe einer solchen Instrumentvariable kann die gewunschte Zerlegung der Streu-ung des endogenen x in eine ‘unproblematische’ exogene Streuung und in eine ‘pro-blematische’ Streuung, die aus der Korrelation mit ε folgt, erfolgen.

Abbildung 10.8 (rechtes Panel) zeigt das Grundprinzip einer 2SLS Schatzung. Dieendogene abhangige Variable x wird in zwei Teile zerlegt, einen exogenen Teil x, derdurch die Instrumentvariable erklart wird, und einen endogenen Teil υx. Praktischerfolgt diese Zerlegung mit Hilfe einer einfachen OLS Regression, der potentiell en-dogene Regressor x der Gleichung y = β1+β2x+ ε wird in einem ersten Schritt miteiner Hilfsregression in zwei Teile zerlegt

x = α1 + α2z + υx

= x+ υx

Man kann sich vorstellen, dass die Streuung von x mit Hilfe einer Regression auf dieInstrumentvariable in einen unproblematischen exogenen Anteil – d.h. die Streuungvon x – und einen problematischen endogenen Anteil – d.h. die Streuung von υx –zerlegt wird.

Die Streuung von x ist deshalb unproblematisch, da sie ausschließlich durch die perDefinition exogene Instrumentvariable erklart wird. Die problematische Streuungvon υx wird verworfen, vgl Abbildung 10.8.

Wir werden spater sehen, dass – wenn die Annahmen fur Instrumentvariablen (Re-levanz und Exogenitat) erfullt sind – Instrumentvariablenschatzer konsistent sind.

Fur eine Schatzung mit der Methode der Zweistufigen Kleinsten Quadrate wird –wie der Name schon sagt – zweistufig vorgegangen:

1. Stufe: Zerlege x mit Hilfe einer Regression x in eine Komponente, die durchdie exogenen Instrumentvariable z erklart wird, und in eine problematische

Page 17: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 17

‘unerwunschte’ Komponente υi. Dazu wird in einer Hilfsregression die Variablex auf die Instrumentvariable z regressiert

xi = α1 + α2zi + υi

und daraus werden die gefitteten Werte xi berechnet.

Da diese gefitteten Werte x nur von der exogenen Instrumentvariable zabhangen, ist die Streuung von xi sicher nicht mit dem Storterm der Struk-turgleichung εi korreliert.

2. Stufe: Deshalb werden auf der 2. Stufe die gefitteten Werte x der 1. Stufe anstelleder ‘verschmutzten’ x Werte verwendet, um den Effekt von x auf y zu messen

yi = β1 + β2xi + εi

Diese intuitiv sehr einleuchtende Methode der zweistufigen kleinsten Quadrate(2SLS oder ‘Two Stage Least Squares’ ) liefert numerisch die gleichen Ergebnisse wiedie allgemeineren Instrumentvariablenschatzer, die wir gleich vorstellen werden.

Wenn man derartig zweistufig vorgeht erhalt man zwar die korrekten Koeffizienten,allerdings sind die Standardfehler der 2. Stufe nicht korrekt, da diese die 1. Stu-fe nicht berucksichtigen! Deshalb sollte man die in allen Okonometrieprogammenverfugbaren Befehle zur Schatzung von 2SLS verwenden (fur R ivreg aus dem AERpackage; z.B. myeq <- ivreg(y ~ x | z, data = mydata); fur EViews 2SLS oderfur Stata ivregress), da diese automatisch die korrekten Standardfehler liefern.5

Beispiel: welchen Einfluss hat die Anzahl der Polizisten in einer Stadt auf dieKriminalitat? (Levitt, 1997)

Dies ist ein typisches Beispiel fur Simultanitat: Polizisten sollen Kriminalitat senken,aber Stadte mit hoherer Kriminalitat heuern mehr Polizisten an. Eine Regressionder Anzahl der Polizisten (P ) auf die Anzahl der Verbrechen (V ) kann das falscheVorzeichen liefern.

Levitt verwendet Wahljahre (W ) als Instrumentvariable. Ist dies ein geeignetes In-strument?

1. Relevanz: Die Ausgaben fur Sicherheit nehmen in Wahljahren zu, damit auchdie Anzahl der Polizisten.

2. Exogenitat: Die Wahlzyklen sind exogen (pradeterminiert).

Zweistufige kleinste Quadrate:

1. Stufe: Zerlege x in eine Komponente, die mit der exogenen Instrumentvariable zerklart werden kann, und in eine problematische ‘unerwunschte’ Komponente

Pi = α1 + α2Wi + υi

5Das Problem besteht darin, dass fur die Schatzung von σ2 die Residuen εi = yi−β1,IV−β

2,IVxi

verwendet werden mussen, und nicht die Residuen der 2. Stufe mit den gefitteten x, d.h. ε∗i =

yi − β1,IV − β

2,IVxi

Page 18: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 18

2. Stufe: Verwende den gefitteten Wert der 1. Stufe um den Effekt auf die Anzahlder Verbrechen zu schatzen

Vi = β1 + β2Pi + εi

Levitt’s Ergebnis: Eine Erhohung der Anzahl der Polizisten vermindert die Zahl derGewaltverbrechen (aber hat wenig Einfluss auf die Zahl der Eigentumsdelikte).

Diese Methode kann einfach auf die multiple Regression ubertragen werden.

Instrumentvariablen durfen nicht mit Proxy-Variablen verwechselt werden. ProxyVariablen sollten eine fehlende Variable gewissermaßen ‘ersetzen’, kommen also inder Regressionsgleichung direkt vor, wahrend Instrumentvariablen nur ‘indirekt’ vor-kommen (d.h. nicht als Regressor aufscheinen).

Die Instrumentvariablen z sollten moglichst hoch mit dem endogenen Regressor xkorreliert sein, und nur uber x auf y einwirken (d.h. mit ε unkorreliert sein), undauch mit keinen anderen Regressoren korreliert sein, die y direkt beeinflussen.

Proxy-Variablen sollten hingegen moglichst hoch mit den fehlenden Variablen korre-liert sein, wahrend Instrumentvariablen nicht mit den fehlenden Variablen korreliertsein durfen.

Im Falle einer Lohngleichung Wage = β1 + β2Education + β3Ability + ε konnte alsProxy-Variable fur die unbeobachtbaren Fahigkeiten z.B. der gemessene Intelligenz-quotient verwendet werden.

Eine Instrumentvariable sollte hingegen mit den unbeobachtbaren Fahigkeiten unddem Storterm unkorreliert sein, aber moglichst hoch mit der Variablen ‘Education’korrelieren. Arbeitsmarktokonomen haben z.B. die Entfernung zwischen Heimat-und Studienort (Card 1995, Aspects of Labour Market Behavior) oder die Anzahl derGeschwister als Instrumentvariable fur ‘Education’ vorgeschlagen, da Jugendlicheaus kinderreichen Familien typischerweise eine kurzere Schulbildung erhalten, aber(hoffentlich) nicht uber weniger Fahigkeiten verfugen (vgl. Wooldridge 2000, Chapter15.1).6

Beispiel: Mit Hilfe einer Monte Carlo Simulation kann die Wirksamkeit der IV-Methode wieder einfach demonstriert werden. Wir haben fruher gezeigt, dass eineeinfache OLS Schatzung der Konsumfunktion im Modell

Ci = 60 + 0.5Y + εi

Yi = Ci + Zi

aufgrund des feed-backs mit der Identitat zu systematisch verzerrten Ergebnissenfuhrt. In diesem einfachen Fall bietet sich allerdings ein fast ideales Instrument an,die exogene Variable Z. Da es sich um ein simultanes Gleichungssystem handelthangen alle endogenen Variablen von der exogenen Variable Z ab, sie sind alsokorreliert (Relevanz).

6Allerdings konnten Kinder aus kinderreichen Familien uber mehr soziale Fahigkeiten verfugen.Wurde dies die Qualitat der Instrumentvariable ‘Anzahl der Geschwister’ beeinflussen?

Page 19: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 19

Hingegen hat Z keinen direkten Einfluss auf den Konsum Cons, sondern wirkt nurindirekt uber das Einkommen Y auf Cons. In anderen Worten, Z kommt in derKonsumfunktion nicht vor und ist mit dem Storterm ε unkorreliert (Exogenitat).

Deshalb bietet sich in diesem einfachen Modell Z als ideales Instrument an. Wirkonnen dies wieder mit Hilfe der Monte Carlo Simulation uberprufen. Das folgendeProgramm entspricht der fruheren Simulation, aber anstatt einer fruheren Stichpro-bengroße n = 25 wahlen wir hier eine großere Stichprobe mit n = 250 um zu zeigen,dass die Verzerrung des OLS Schatzers auch bei großeren Stichproben auftritt, undwir fuhren zusatzlich 2SLS (IV) Schatzungen durch.

wfcreate u 250

rndseed 123456789

!REP = 1000

vector(!REP) MCP_OLS = na

vector(!REP) MCP_IV = na

series Cons

series Y

series Z

for !r = 1 to !REP

Z = @runif(30,80)

’ Modell losen

model Keynes

Keynes.append Cons = 60 + 0.5*Y + @runif(-30,30)

Keynes.append Y = Cons + Z

Keynes.solve

delete Keynes

’ Konsumfunktion mit Modelllosungen schatzen

equation eqOLS.ls Cons_0 c Y_0

MCP_OLS(!r) = c(2)

equation eqIV.tsls Cons_0 c Y_0 @ Z

MCP_IV(!r) = c(2)

next

MCP_OLS.distplot hist

MCP_IV.distplot hist

Abbildung 10.9 zeigt das Ergebnis, offensichtlich ist die OLS Schatzung der margi-nalen Konsumneigung systematisch verzerrt, die IV-Schatzung (2SLS) liegt dagegenim Mittelwert deutlich naher am wahren Wert 0.5. Man beachte, dass der Standard-fehler des IV Schatzers deutlich großer ist.

Ubung: Angenommen wir haben Daten fur den Lernerfolg (Y ) und Lernzeit (LZ)

einer Gruppe Studierende gesammelt und mochten den Zusammenhang Y = β1 +β2LZ + ε schatzen. Da fallt Ihnen ein, dass moglicherweise ein ‘omitted variable’Problem auftritt, denn Sie haben keine Daten fur die ‘Begabung’ der Studierenden.

• Ein Kollege empfiehlt Ihnen, den Intelligenzquotienten (IQ) der Studierendenzu messen und als Instrument zu verwenden.

Page 20: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 20

0

20

40

60

80

100

120

.48 .52 .56 .60 .64 .68 .72 .76 .80 .84

Fre

qu

en

cy

OLS

0

20

40

60

80

100

120

.34 .36 .38 .40 .42 .44 .46 .48 .50 .52 .54 .56 .58 .60 .62

Fre

qu

en

cy

IV

Abbildung 10.9: Monte Carlo Simulation fur endogenen Regressor. OLS und IVSchatzungen der marginalen Konsumneigung (der wahre Wertist 0.5, n = 250).

Hinweis: schlechte Idee! (uberlegen Sie sich, ob Auswirkungen des IQ imStorterm auftauchen konnten; → Proxyvariablen)

• Eine Kollegin empfiehlt Ihnen das Wetter am Vorabend der Prufung (W )als Instrument zu verwenden (angenommen, die Studierenden schreiben diePrufung an sehr unterschiedlichen Tagen).

Hinweis: schon weit besser! (in einer Regression Y = β1 + β2LZ + β3W + ε

wurden wir erwarten, dass β3 nicht signifikant von Null verschieden ist, deshalbsollte W nicht mit dem Storterm korreliert sein)

Schwache Instrumente (‘weak instruments’)

Wenn die Annahmen fur Instrumentvariablen nicht erfullt sind konnen IV-Schatzerextrem verzerrte Ergebnisse liefern. Aber selbst wenn die Annahmen im strengenSinne erfullt sind, aber die Instrumente nur schwach mit den Regressoren korreliertsind, konnen IV Schatzer sehr schlechte Resultate liefern, selbst wenn die Stichprobegroß ist.

Page 21: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 21

Im einfachsten bivariaten Fall ist der IV-Schatzer fur den Steigungskoeffizienten

β2,IV =cov(yi, zi)

cov(xi, zi)=

1

n

∑n

i=1(yi − y)(zi − z)

1

n

∑n

i=1(xi − x)(zi − z)

Wenn der Nenner cov(xi, zi) dieses Schatzers in der Grundgesamtheit ungleich Nullist, ist dieser Schatzer in (sehr) großen Stichproben annahernd normalverteilt. Wennder Nenner exakt Null ist, ist der Schatzer in großen Stichproben Cauchy verteilt,die weder Erwartungswert noch Varianz besitzt.

Von ‘weak instruments’ spricht man, wenn die Kovarianz sehr kleine ist, also nahebei Null liegt. Es zeigte sich namlich, dass in solchen Fallen der 2SLS Schatzer auchin ziemlich großen Stichproben noch verzerrt ist und die Konfidenzintervalle ein zuoptimistisches Bild zeichnen (siehe z.B. Bound et al., 1995).

Eine der Lehren aus dieser Literatur ist, dass die Signifikanz der Instrumente aufder 1. Stufe ein Indikator fur die Relevanz der Instrumente ist. Deshalb sollte dieSignifikanz Signifikanz der Instrumente auf der 1. Stufe immer uberpruft werden,und in Publikationen auch angegeben werden!

Beginnend mit Staiger and Stock (1997) entwickelte sich eine umfangreiche Literaturzu der Problematik ‘schwacher Instrumente’, die noch keineswegs abgeschlossen ist.

Stock & Watson’s Faustregel: Die F -Statistik auf gemeinsame Signifikanz allerInstrumentvariablen in der 1. Stufe sollte großer als 10 sein, bzw. im bivariaten Fallsollte die t-Statistik großer als 3.3 sein!

Ein kleiner Wert der F -Statistik ist ein Indikator fur schwache Instrumente (sie er-klaren wenig Streuung in y2)! Im Fall schwacher Instrumente liefern IV Schatzungenhaufig schlechtere Ergebnisse als OLS Schatzungen!

Dies ist allerdings nur eine sehr grobe Faustregel, das Problem schwacher Instrumen-te war die letzten Jahre eines der aktivsten Forschungsgebiete mit sehr fruchtbarenErgebnissen. Fur eine Ubersicht siehe z.B. Murray (2006).7

Identifikation

Im multivariaten Fall muss mindestens fur jeden endogenen Regressor eine Instru-mentvariable zur Verfugung stehen.

Allgemeiner, die Regressionskoeffizienten sind

• exakt identifiziert, wenn die Anzahl der Instrumente gleich der Anzahl derendogenen Regressoren ist.

• uberidentifiziert, wenn die Anzahl der Instrumente großer ist als die Anzahlder endogenen Regressoren.

• unteridentifiziert, wenn die Anzahl der Instrumente kleiner ist als die Anzahlder endogenen Regressoren.

Unteridentifizierte Systeme konnen nicht geschatzt werden!

7 http://papers.ssrn.com/sol3/papers.cfm?abstract_id=843185

Page 22: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 22

10.4 Tests auf Endogenitat und uberidentifizie-

rende Restriktionen*

Fur die Anwendung der IV-Methode sind zwei Fragen wichtig

• ist eine erklarende Variable der Strukturgleichung tatsachlich endogen? DieseFrage kann mit Hilfe eines Hausman Tests getestet werden. Sollte dieser TestHinweise auf Endogenitat liefern kann z.B. ein IV-Schatzer verwendet werden.

• wenn auf einen IV-Schatzer zuruckgegriffen werden muss, sind die verwendetenInstrumente tatsachlich exogen? Ein Test dieser Hypothese ist nur in uberiden-tifizierten Gleichungen moglich (Test auf uberidentifizierende Restriktionen).

10.4.1 Hausman Test (Test auf Endogenitat)

Da die Auswirkungen einer Korrelation zwischen den erklarenden Variablen undden Residuen der Grundgesamtheit sehr weitreichend sind (d.h. der Schatzer waresystematisch verzerrt) ware ein Test auf diese Korrelation sehr hilfreich. Allerdingskonnen dafur nicht die aus der Stichprobe geschatzten Residuen εi herangezogenwerden, da diese per Konstruktion immer mit den x unkorreliert sind (diese Ortho-gonalitat ist eine Bedingung erster Ordnung!).

Hausman (1978) hat dafur einen sehr einfachen asymptotischen Test vorgeschlagen.

Die entsprechende Null- und Alternativhypothese ist

H0 : plim1

n

∑(xi − x)εi = 0 H1 : plim

1

n

∑(xi − x)εi 6= 0

Die Grundidee des Hausman Tests besteht in einem Vergleich zweier Schatzer, wo-von einer sowohl unter der Null-Hypothese als auch unter der Alternativhypothesekonsistent ist, wahrend der zweite nur unter Nullhypothese konsistente Schatzre-sultate liefert. Ein großer Unterschied zwischen diesen beiden Schatzungen wird alsEvidenz zugunsten der Alternativhypothese gedeutet.

Hausman hat gezeigt, dass unter Gultigkeit der Nullhypothese die folgende Statistikasymptotisch χ2 verteilt ist mit einem Freiheitsgrad

H =

(β2,IV − β

2,OLS

)2

var(β2,IV

)− var

(β2,OLS

) a∼ χ2

1

wobei β2,IV der Instrumentvariablen und β2,OLS der OLS-Schatzer ist.

Fur die Berechnung der Varianzen sollten in beiden Fallen die gleiche Schatzung furσ2 herangezogen werden!

Wir verwerfen die Nullhypothese und schließen auf eine kontemporare Korrelationzwischen xi und εi wenn H > χ2

c (fur ein 5% Signifikanzniveau ist der kritische Wertχ2c = 3.84).

Hausman-Tests werden vor allem verwendet fur die Erkennung von

Page 23: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 23

• Simulanitats-Bias

• Messfehlern

• Omitted Variables

oder allgemeiner, in Fallen in denen die Storterm ε mit erklarenden Variablen xkorreliert ist.

Eine einfache Version dieses Tests mittels Hilfsregression wurde von Davidson andMacKinnon (1989) vorgeschlagen. Die Idee beruht einfach darauf, dass eine z.B.moglicherweise fehlerhaft gemessene Variable in einer ersten Stufe auf ein Instru-ment regressiert wird, und die Residuen dieser Hilfsregression in der ursprunglichenRegression als zusatzlicher Regressor berucksichtigt wird. Wenn der Koeffizient die-ser Residuen signifikant von Null verschieden ist wird dies als Hinweis dafur inter-pretiert, dass die eine Korrelation zwischen x und ε (moglicherweise hervorgerufendurch Messfehler, fehlende Variablen, Endogenitat) einen Einfluss auf das Schatzer-gebnis hat. Da es ein asymptotischer Test ist wird die Normalverteilung angenom-men (bzw. wenn mehrere Variablen getestet werden die χ2 Verteilung), aber es hatsich eingeburgert die meist einfacher im Regressionsoutput verfugbare t-Statistik(bzw. F -Statistik) heranzuziehen. Aufgrund der asymptotischen Gultigkeit machtdies keinen großen Unterschied (fur nahere Hinweise zum Wu-Hausman Test siehez.B. Johnston, DiNardo 1997, S. 257ff).

Angenommen, das Modell in Strukturform sei

y1 = β1 + β2y2 + β4x1 + β5x2 + ε

und wir vermuten, dass y2 endogen ist, d.h. mit ε korreliert ist. Wenn wir fur y2uber ein Instrument z verfugen gehen wir 2-stufig vor

1. Man schatzt eine reduzierte Form fur y2

y2 = α0 + α1x1 + α2x2 + α3z + ν

und berechnet daraus die Residuen ν.

2. Man schatzt die ursprungliche Strukturform und verwendet die Stichproben-residuen der reduzierten Form als zusatzlichen Regressor.

y1 = β1 + β2y2 + β4x1 + β5x2 + β6ν + ε

Wenn β6 signifikant von Null verschieden ist schließen wir daraus, dass y2tatsachlich endogen ist, OLS also verzerrte Ergebnisse liefert.

Dieser Test kann einfach fur mehrere endogene Variablen verallgemeinert werden.Man berechnet fur jede endogene Variable die Residuen der reduzierten Form, ver-wendet diese als zusatzliche Regressoren in der Strukturform, und testet deren ge-meinsame Signifikanz mit Hilfe eines einfachen F -Tests.

Page 24: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 24

Beispiel: Dies soll anhand der Abbildung 10.2 zugrunde liegenden Daten veran-schaulicht werden.

Die einfache OLS Schatzung lieferte die verzerrten Schatzer

C = −9.175 + 0.808 Y(5.685) (0.024)***

R2 = 0.934, s = 10.818, F -Stat = 1096.971, n = 80(Standardfehler in Klammern)

Wir berechnen aus der Hilfsregression

Y = 105.804 + 2.305 INV(16.049)*** (0.293)***

R2 = 0.442, s = 37.49, F -Stat = 61.889, DW = 2.073, n = 80(Standardfehler in Klammern)

die Residuen Res dieser Hilfsregression, und anschließend die eigentlich interessie-rende Regression

CONS = 45.901 + 0.566 Y + 0.434 Res(0.000)*** (0.000)*** (0.000)***

R2 = 0.999, s = 0, F -Stat = 4.77e+13, n = 80(Standardfehler in Klammern)

Der t-Wert von Res ist riesengroß und der p-Wert entsprechend klein, es kann alsokaum ein Zweifel an der Endogenitat von Y bestehen!

Die Anwendung der 2SLS Methode mit den Investitionen als Instrument liefert einedeutlich bessere Schatzung der wahren Werte β1 = 60 und β2 = 0.5

C = 45.901 + 0.566 Y(12.687)*** (0.055)***

R2 = 0.85, s = 16.264, F -Stat = 105.402, n = 80(Standardfehler in Klammern)

Das folgende EViews Programm produzierte diese Ergebnisse:

wfopen http://www.uibk.ac.at/econometrics/data/iv_keynesgraph.xls

equation eq_ols.ls Cons c Y

equation eq_2sls.tsls Cons c Y @ Inv

’Hausman:

equation eq1.ls Y c Inv

eq1.makeresids r

equation eq_h.ls Cons c Y r

show eq_h

Page 25: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 25

10.4.2 Test auf uberidentifizierende Restriktionen

Instrumente mussen relevant und exogen sein. Wahrend ein F -Test auf die gemein-same Signifikanz aller Instrumente in der 1. Stufe Hinweise auf die Relevanz derInstrumente liefert kann die Korrelation zwischen den Instrumenten und den unbe-obachtbaren Stortermen der Grundgesamtheit (d.h. die Exogenitat) nicht unmittel-bar getestet werden.

Allerdings gibt es einen Test fur uberidentifizierte Systeme. Angenommen, die Struk-turgleichung sei

yi1 = β1 + β2yi2 + β3xi + εi

und wir verfugen uber zwei potentielle Instrumentvariablen z1 und z2.

Wir konnten diese Gleichung mit nur einer Instrumentvariable 2-stufig schatzen, z.B.mit z1, daraus die Residuen ε1 berechnen und uberprufen, ob diese mit der nichtverwendeten Instrumentvariable z2 korreliert sind. Wenn corr(ε1, z2) 6= 0 ware offen-sichtlich z1 oder z2 ein schlechtes Instrument! Umgekehrt konnte auch mit z2 als In-strument begonnen werden und die Korrelation der Residuen dieser 2SLS Schatzungmit z1 uberpruft werden.

Ein einfacher Test auf uberidentifizierende Restriktionen kann wieder mit Hilfe einerHilfsregression durchgefuhrt werden:

1. Schatze die uberidentifizierte Strukturgleichung mit 2SLS und berechne darausdie Stichproben-Residuen ε, z.B.

yi1 = β1 + β2yi2 + β3xi + εi → Stichprobenresiduen ε

2. Schatze eine Hilfsregression von ε auf alle exogenen Variablen und Instrumenteund bestimme daraus das Bestimmtheitsmaß R2

∗, z.B.

εi = α0 + α1zi1 + α2zi2 + α3xi + υi → R2

3. Unter der Nullhypothese, dass alle Instrumentvariablen exogen sind, ist

nR2

a∼ χ2

q

wobei n die Anzahl der Beobachtungen ist. Die Anzahl der Freiheitsgrade qist die Anzahl der Instrumentvariablen außerhalb des Modells abzuglich derAnzahl der endogenen erklarenden Variablen, d.h. der Grad der ‘Uberidentifi-kation’.

Wenn der Wert von nR2∗großer ist als der entsprechende kritische Wert der χ2-

Verteilung muss die Nullhypothese, dass alle Instrumente exogen sind, verworfenwerden.

Dieser Test ist ein Spezialfall des Sargan-Tests und ist nur fur uberidentifizierte Glei-chungen anwendbar. Er gibt allerdings keine Hinweise darauf, welche Instrumentemoglicherweise endogen sind!

Page 26: Kapitel 10 Endogenit¨at und Instrumentvariablen · Bisher haben wir stets eine sehr einfache Form von Abhangigkeit zwischen der er- kl¨arenden Variable x und der abhangigen Variablen

Empirische Wirtschaftsforschung 26

Literaturverzeichnis

Bound, J., Jaeger, D. A. and Baker, R. M. (1995), ‘Problems with InstrumentalVariables Estimation When the Correlation Between the Instruments and theEndogeneous Explanatory Variable is Weak’, Journal of the American StatisticalAssociation 90(430), 443–450.

Davidson, R. and MacKinnon, J. G. (1989), ‘Testing for consistency using artificialregressions’, Econometric Theory 5(3), 363–384.URL: http://www.jstor.org/stable/3532374

Hausman, J. A. (1978), ‘Specification tests in econometrics’, Econometrica46(6), 1251–1271.URL: http://www.jstor.org/stable/1913827

Levitt, S. D. (1997), ‘Using electoral cycles in police hiring to estimate the effect ofpolice on crime’, The American Economic Review 87(3), 270–290.URL: http://www.jstor.org/stable/2951346

Murray, M. P. (2006), ‘The Bad, the Weak, and the Ugly: Avoiding the Pitfalls ofInstrumental Variables Estimation’, Journal of Economic Perspectives 20(4), 111–132.

Staiger, D. and Stock, J. H. (1997), ‘Instrumental variables regression with weakinstruments’, Econometrica 65(3), 557–586.