Par Tie 2

download Par Tie 2

of 54

Transcript of Par Tie 2

Partie 2Biais de la variable omise

1

Wooldridge

Chapitre 3

Section 3.3 Section 3.4

Omitted Variable Bias: The Simple Case, 89-93 Omitted Variable Bias: More General Cases, 93-94 Variances in Misspecified Models, 99-101 General Omitted Variable Bias, 114-115

Appendix 3A.4 Section 5.1

Chapitre 5

Deriving Inconsistency in OLS, 170-172

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

2

1. IntroductionQuelles sont les consquences de lomission dune variable importante sur lestimateur des MCO? Variable importante =

(i) a un effet partiel sur la variable dpendante dans la population (ii) est corrle avec une ou plusieurs variables explicatives dj incluses dans le modlePartie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

3

(cont.)Tous les estimateurs des MCO seront en gnral biaiss et non convergents Pourquoi? Violation de lhypothse MLR.4 (et MLR.4) dans le modle qui omet une variable importante

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

4

2. Biais de la variable omise Cas simple

Supposons que le vrai modle dans la population soit : y=0+1x1+2x2+u, sous MLR1-MLR.4 Exemple : log(wage)=0+1educ+2abil+u

Problme : on ignore ou nobserve pas x2 (abil) variable omise5

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

(cont.)

On va alors estimer un modle mal spcifi : y=0+1x1+v, o v=2x2+u Exemple :log(wage)=0+1educ+v, o v=2abil+u

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

6

(cont.)Si 20 et Cov(x1,x2)0 Exemple : si abil a un effet partiel sur log(wage) et est corrle avec educ Alors, violation de MLR.4* : E(v| x1)=2E(x2|x1)0 x1 est endogne

* MLR.4 aussi viole : Cov(x1,v)=2Cov(x1,x2)0Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

7

(cont.)

Consquence : lestimateur des MCO de 1 dans le modle mal spcifi est biais et non-convergent asymptotiquement

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

8

Biais de lestimateur des MCO de 1Le modle de rgression estim par MCO : ~ = ~ + ~ x , o y0 1 1

~ = 1

n i= 1 n

( xi1 x1 ) yi ( xi1 x1 ) 2

Cf. Partie 1, p.19

i= 1

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

9

(cont.)

Comme chaque yi doit en ralit provenir de lestimation par MCO du vrai modle :

c' est - - dire : yi = yi + ui = 0 + 1xi1 + 2 xi 2 + ui ~ le numrateur de 1 devient : n 0 ( xi1 x1 ) = n i= 1 ( xi1 x1 ) 0 + 1xi1 + 2 xi 2 + ui = n

1

i= 1

(

)

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

n i= 1

( xi1 x1 )

2

+ 2

n i= 1

( xi1 x1 )xi 2

x1

0

i= 1 n

xi1ui = 0 ui = 010

Cf. Partie 1, p.32

i= 1

(cont.)~ + ~ 1 = 1 2 1 ~ o = 1 n i= 1 n

( xi1 x1 ) xi 2

~ 1 est l' estimateur des MCO de la pente du modle de rgression simple : xi 2 = 0 + 1xi1 + eiPartie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

i= 1

(n 1)Cov( xi1, xi 2 ) = (n 1)Var ( xi1) 2 ( xi1 x1 )

11

(cont.)~ + ~ = * + ~ E 1 = E 1 2 1 1 2 1 ~ ~ ~ Biais 1 = E 1 - 1 = 2 1* 1) Les esprances sont conditionn elles aux valeurs de x1 et x 2 ~ dans l' chantillon. Comme 1 n' est fonction que de x1 et x 2 , il est non - alatoire et sort donc de l' esprance 2) 1 et 2 sont des estimateurs non biaiss de 1 et Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

( )

(

)

( )

( )

2

12

Absence de biais

Deux cas pour lesquels le biais=02=0, cest--dire x2 na pas deffet partiel sur y dans la population x1 et x2 ne sont pas corrls dans lchantillon

Biais=0 MLR.4 (MLR.4) non viole

Dans le modle mal spcifi : E(v|x1)=2E(x2|x1)=0 2=0 et/ou Cov(x1,x2)=013

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Sens et taille du biaisCorr(xi1,xi2) > 0 Corr(xi1,xi2) < 0

2 > 0 2 < 0

Biais positif Biais ngatif ou ou vers le haut vers le bas Biais ngatif ou Biais positif vers le bas ou vers le haut

Taille du biais : dtermin par la taille ~ de 2 et de 114

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Terminologie

Si 1 > 0 et

Biais > 0, on dit quon sur-estime, en moyenne, la valeur de 1 Biais < 0, on dit quon sous-estime, en ~ moyenne, la valeur de 1 (ou 1biais vers 0) Biais > 0, on dit quon sous-estime, en ~ moyenne, la valeur absolue de 1 (ou biais 1 vers 0) Biais < 0, on dit quon sur-estime, en moyenne, la valeur absolue de 115

Si 1 < 0 et

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Ce que signifie la prsence dun biais

La prsence dun biais (positif par exemple) ne signifie pas que lestimateur des MCO obtenu en utilisant un chantillon particulier soit ncessairement plus grand (si biais positif) que le paramtre de la population (1)16

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

(cont.)

Elle signifie plutt que, si on pouvait tirer indfiniment des chantillons alatoires (chacun de taille n) de la population, calculer chaque fois lestimateur des MCO, et prendre la moyenne de ces estimateurs travers tous les chantillons, on trouverait une valeur plus grande que le paramtre de la population, 117

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Reprsentation graphique si 1>0 et biais > 0~ f 1

( )~ 1 Distribution de

travers diffrents chantillons alatoires de taille n, centre droite de 1~ 1 + 2 1 1

~ 118

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Exemple 3.6, p.92 (Hourly wage equation)

Le vrai modle dans la population : log(wage)=0+1educ+2abil+u Le modle (mal spcifi) estim par MCO :

~ ~ ~ age) = + educ log( w 0 1

~ Si 2>0 et Corr(educ,abil)>0 : Biais( 1)>0

en moyenne (sur plusieurs chantillons ~ alatoires de taille n), 1 trop grand (le rendement de lducation est sur-estim)Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

19

cont.

Rappel (cf. p.151, W2-8.pdf) Si le modle est log(y) = 0 + 1x + u

1 est la semi-lasticit de y par rapport xsi x augmente de 1, la variation en % de y est approximativement gale 100.1 *1*2

*1 variation exacte : 100.[exp(1x)-1]; ici x=1 *2 bonne approximation si 1 et x petits

1 = 0.083 Si le nombre dannes dtudes augmente de 1 unit, le salaire augmente approximativement de 8,3% (variation exacte = 100.[exp(0,083)-1] = 8,6%)20

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Test de significativit globale: H0: 1==k=0 F=(R2/k) / ((1- R2)/(n-k-1)) ~ Fk,n-k-1 = F1,524 2 = t ~ car k=1 1

( ) cont.

97.5e percentile dune N(0,1)

R2=1-((1-R2)(n-1)/(n-k-1)) R2=SSE/SST =1-(SSR/SST) =

~ 1 1.96 * ~nSSR ( n k 1)

1

SSE SSR SST

=

SSR ( n k 1)

k

n-k-1

=

SSR

~ 1 ~ tn-k-1=524 P-valeur : proba dobserver |t.|=10.94 si t ~ = = 0.0827 1 ~ 0.0076 1 ~ N(0,1) H0 (1=0) vraie. 0 et Corr(educ,abil)>0 : Biais( 1)>0 ~ Si Corr(exper,abil)=0 : Biais( 2)=0Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

30

cont.

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

31

4. Non-convergence asymptotique

Si on omet une variable importante dans le modle de rgression, lestimateur des MCO est biais, cest--dire :

en moyenne (sur plusieurs chantillons de taille n), on va sur-(ou sous-)estimer la valeur du paramtre dans la population

Il est en plus non-convergent asymptotiquement, cest--dire :

quand n , la distribution de lestimateur se concentre sur une valeur plus grande ou plus petite que celle du paramtre dans la population32

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Non-convergence Cas simple~ + ~ Rappel: 1 = 1 2 1 ~ + p lim p lim ~ p lim 1 = p lim 1 2 1 On peut montrer que : ~ Cov( x1, x2 ) p lim 1 = 1 + 2 1 o 1 = Var ( x1 )

( )

( )

( )

~ Non - convergence (biais) asymptotique de 1 : ~ p lim 1 1 = 2 1Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

33

(cont.)

Rflchir la non-convergence asymptotique de lestimateur des MCO = rflchir son biais (k=2 ou k>2) Diffrence principale :

Non-convergence : fait intervenir variance de x1 et covariance entre x1 et x2 dans la population Biais : fait intervenir leurs quivalents dans lchantillon

Non-convergence = problme de grand chantillon ne disparat pas avec plus de donnes ! 34 Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

5. Solutions au biais de la variable omise(1) Ignorer le problme pas srieux; estimateurs des MCO biaiss et non-convergents (2) Recourir une exprience contrle (cf. transparent suivant) difficile, si pas souvent impossible mettre en uvre (+ problmes juridiques et tiques, cot, etc.)Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

35

Une exprience pour estimer le rendement de lducation?Tirer un chantillon alatoire dune population bien dfinie (jeunes de 18 ans diplms de secondaire) Rpartir au hasard les individus dans un des 2 groupes suivants :

un groupe exprimental qui reoit une anne dtudes supplmentaire un groupe tmoin qui ne reoit pas cette anne dtudes supplmentairePartie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

36

(cont.)

Estimer par MCO le modle suivant : log(wage)=0+1educ+u

o educ=1 si groupe exprimental =0 si groupe tmoin Lestimateur de 1 sera sans biais et convergent car E(u|educ)=0 ou Cov(u,educ)=0 [ayant t forms

alatoirement, les 2 groupes doivent avoir la mme composition] 37 Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

(cont.)

Le R2 sera sans doute petit :cela signifie quil y a beaucoup de facteurs non contrls, autres que educ, qui influencent log(wage) cela ne signifie pas que ces facteurs sont corrls avec educ, et donc cela ne signifie pas que lestimateur de 1 est biais et non-convergent !Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

38

(cont.)

Il est toutefois recommand dajouter des variables de contrle dans le modle de rgression

Permettent de rduire la variance de lerreur, sans induire ici de problme de multicolinarit, et donc de diminuer lcart-type de lestimateur de 1 (cf. Partie 1, pp.44-45)39

Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

Solutions (cont.)(3) Essayer de trouver une variable proxy pour la variable non observe (4) Avoir recours des donnes de panel et supposer que la variable non observe ne change pas travers le temps (5) Essayer de trouver une variable instrumentale pour la variable non observePartie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

40

Questions, problmes, exercices STATA Wooldridge

Questions 5.1 p.172; Info on GPA (Grade Point Average) http://www.back2college.com/gpa.htm Problmes (p.108) 3.7 3.8 3.9 Exercices STATA (pp.111-112) C3.1 C3.6 C3.7 (+ interprtation de lestimateur de 1)Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

41

Correction Problme 3.8(ex. obligatoire 2009)

Seul (ii) = omettre une variable importante (soit une variable qui a un effet partiel sur la variable dpendante) peut causer un biais dans les estimateurs des MCO, mais seulement au cas o cette variable est corrle avec une ou plusieurs des variables explicatives dj prsentes dans le modle (violation de MLR.4). Lhypothse dhomoscdasticit (MLR.5) ne joue aucun rle pour dmontrer labsence de biais des estimateurs MCO. Le degr de colinarit entre des variables explicatives de lchantillon, mme sil est lev, na aucun effet sur les hypothses de Gauss-Markov (MLR.1-2-3-4) ncessaires pour dmontrer labsence de biais des estimateurs MCO. Ce nest quen cas de relation linaire exacte entre deux ou plusieurs rgresseurs que lhypothse MLR.3 est viole.Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

42

Un autre Problme(ex. obligatoire 2010)

Des chercheurs sintressent leffet davoir un 3e enfant sur loffre de travail des femmes de moins de 35 ans ayant au moins 2 enfants, partir dun chantillon alatoire tir dans cette population. Ils supposent que lquation expliquant loffre de travail des femmes de moins de 35 ans dans la population est:

hours = 0 + 1age + 2educ + 3kids3 + u1

o la variable hours est le nombre dheures de travail hebdomadaire dune femme, age est son ge, educ est son nombre dannes dtude et kids3 est gale 1 si la femme a 3 enfants (= 0 autrement)Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011

43

(cont.)

Question: (i) Mentionnez une variable omise importante qui est, selon vous, susceptible dentraner une corrlation entre kids3 et le terme derreur u1, (ii) prcisez le sens du biais de lestimateur des MCO de 3 si on omet cette variable importante (en supposant une corrlation nulle entre kids3 et age, et kids3 et educ) et (iii) en moyenne, on va sur ou sous-estimer la valeur (absolue si 3