Exercices corriges en econometrie financiere
Exercices corrigés en économétrie financière
Le modèle linéaire - Rendements d’une fonction de production Cobb-Douglas
Présentation du problème: On considère la fonction de production suivante à deux facteurs, le travail L et le capital K, correspondant à une technologie de type Cobb-Douglas:
Y (L, K) = ALαKβ | (1) |
où α et β sont des réels compris entre 0 et 1.
Soit un échantillon {(yi, i, ki) , i = 1, ..., n} d’observations indépendantes de logarithmes d’outputs et d’inputs de n entreprises. On suppose que
yi = a + αli + βki + ui, | (2) |
où les ui sont iid et normaux d’espérance nulle et de variance σ2. On supposera de plus ui orthogonal à li et ki.
Données numériques : n = 1000
i | i | = 500 |
Pi ki | = 490 | |
Pi | yi | = 1490 |
2 | ||
Pi | i2 | = 330 |
Pi | ki | = 320 |
2 | = 3200 | |
Pi | yi | |
Pi | iyi = 800 |
i kiyi = 770
Questions:
- Justifier l’équation (2). Interpréter en particulier le sens de la variable ui. Le fait de la traiter comme une variable aléatoire signifie-t-il que la valeur de ui est le produit du hasard pour l’entreprise i?
2. Ecrire le modèle (2) sous la forme matricielle suivante :
y = Xb + u, | (3) |
où y, X, b et u sont des matrices que l’on déterminera et dont on indiquera les dimensions.
3. Donner l’expression de l’estimateur des MCO b de b en fonction de y et de X.
…
Interpréter cette hypothèse.
e0 e
(d) Calculer la matrice X X , ainsi que son inverse, sachant que l’hypothèse (5) est vérifiée. En déduire l’estimateur des MCO des coefficients de la régression de yei sur i et ki sans constante.
- En déduire, par l’application du théorème de régression partitionnée, l’estimateur des MCO des coefficients de la régression de yi sur i et ki avec constante.
- Application numérique.
5. | b | β. |
Significativité des coefficients: On teste ici la significativité de α et b |
- b
- Ecrire l’équation d’orthogonalité entre Xb et y − Xb.
- Donner l’expression de la somme des carrés des résidus, SCR, en fonction de yi,
- b
- Tester la significativité de α et de β à 10% et 5% près. Conclusion?
6. Test de l’hypothèse de rendements constants: On teste l’hypothèse nulle suivante
(H) : α + β = 1
Contre l’alternative :
(Ha) : α + β 6= 1
- Ecrire le modèle contraint associé à H, modèle dans lequel β n’intervient plus. Quelles sont les variables dépendantes et indépendantes de ce nouveau problème?
- Calculer la somme des carrés des résidus du modèle contraint SCRc. Application numérique : On vérifiera que αc ' 0.594.
- Calculer alors la statistique de Fischer associée au test de rendements constants. Tester H à 5% près. Conclusion ?
2 Théorie asymptotique des MCO
2.1 Lancer d’une pièce de monnaie pipée
On lance un grand nombre de fois une pièce de monnaie déséquilibrée, dont la probabilité d’obtenir "face" est égale à α ∈ [0, 1].
1. On modélise le problème par le modèle suivant:
y = β + ε,
où y est la réalisation du lancer (y = 0 si "pile", y = 1 si "face"), et ε est d’espérance nulle.
Que vaut le scalaire β? Dessiner la fonction de répartition de ε. Sa loi est-elle normale?
2. Calculer l’estimateur des MCO de β: β. Préciser les hypothèses ("naturelles") que vous faites sur les résidus.
Vers quelle valeur converge β lorsque le nombre de lancers tend vers +∞?
3. Donner l’expression de la variance de ε en fonction de α.
4. Déduire de la question précédente la densité asymptotique de β (NB: on pourra noter n le nombre de lancers).
2.2 Inclusion et oubli de variables non pertinentes
On dispose d’un échantillon {(yi, x1i, x2i) , i = 1, ..., n} d’observations indépendantes.
1. On suppose tout d’abord que le modèle de yi sachant x1i, x2i est
yi = α + β1x1i + ui, | (6) |
avec E(ui|x1i, x2i) = 0. On cherche à mesurer les conséquences de l’introduction d’une seconde variable explicative, x2i.
- b
- Calculer les estimateurs des MCO β1 et β2 des coefficients de x1i et x2i dans la régression de yi sur x1i et x2i.
(b) Montrer que β1 est asymptotiquement équivalent à l’estimateur des MCO de la régression de yi sur x1i sans x2i. Ces deux estimateurs sont-ils pour autant identiques?
2. On suppose maintenant que le vrai modèle est
yi = α + β1x1i + β2x2i + vi | (7) |
avec E(vi|x1i, x2i) = 0.
- Poser ui = β2x2i + vi et calculer E(ui|x1i, x2i). A quelle condition E(ui|x1i, x2i) = 0?
- On suppose d’abord que x1 et x2 sont orthogonaux (cov(x1, x2) = 0). Montrer que l’estimateur des MCO du coefficient de x1i dans la régression de yi sur x1i sans x2i est convergent mais moins efficace (asymptotiquement moins précis) que l’estimateur des MCO du coefficient de x1i dans la régression de yi sur x1i et x2i.
- Si x1 et x2 sont corrélés, montrer que l’estimateur des MCO du coefficient de x1i dans la régression de yi sur x1i sans x2i est non convergent (asymptotiquement biaisé).
2.3 Test d’égalité de deux moyennes
On cherche à tester l’influence du sexe sur le salaire. Soit {w1i, i = 1, ..., T1} un échantillon de salaires d’hommes et {w2i, i = 1, ..., n2} un échantillon de salaires de femmes. On suppose les observations iid. Pour cela, on divise le panel en deux sous-échantillons, femmes (1, taille n1) et hommes (2, taille n2). On considère alors les deux modèles suivants
• Le modèle non contraint s’écrit :
w1i = α1 + u1i, Eu1i = 0,
w2i = α2 + u2i, Eu2i = 0,
où α1 et α2 ne sont pas supposés égaux a priori.
• Le modèle contraint impose l’égalité des coefficients α1 et α2:
…
(a) Ecrire le modèle de wi sous la forme:
wi = α1Si + α2 (1 − Si) + ui, i = 1, ..., n | (8) |
où l’on précisera Si et ui.
- Comment s’interprètent les variables Si et 1 − Si et combien vaut E(ui|Si)?
- Montrer que l’estimateur des MCO de α1 (resp. de α2) dans la régression de wi sur Si et 1 − Si est identique à l’estimateur des MCO de α1 dans la régression de w1i (resp. de w2i) sur la constante 1. Expliciter αb1 et αb2.
- Le test à distance finie (rappels de licence). On suppose les résidus du modèle
- sont iid et normaux, de variance Vui = σ2.
- L’hypothèse Vui = σ2 pour tout i = 1, ..., n vous paraît-elle discutable?
- Ecrire le modèle non contraint sous forme matricielle.
- Montrer que la somme des carrés des résidus non contraints SCRnc s’écrit très simplement en fonction des sommes des carrés des résidus u1 et u2. La calculer.
Montrer de plus que SCRnc suit un χ2 dont on précisera le nombre de degrés de σ2 liberté.
(d) Montrer que, sous l’hypothèse d’absence de changement structurel que l’on pré-cisera, l’estimateur (αb1, αb2) suit une loi normale dont on calculera la moyenne et la variance.
(e) Exprimer la différence SCRc − SCRnc en fonction de n1, n2, et de la différence αb1 − αb2.
(f) En déduire que cette quantité, convenablement normalisée, suit un χ2 à un degré de liberté. Interpréter.
(g) Calculer la statistique de Fischer associé au problème. Tester à 5% l’égalité entre α1 et α2. Conclusion?
3. Le test asymptotique. On abandonne ici l’hypothèse de normalité des résidus, ceux-ci restant iid.
(a) Calculer l’estimateur des MCO de α1 − α2.
(b) Sous quelle hypothèse quant au comportement asymptotique de la statistique
n | cet estimateur est-il convergent? Interpréter. |
S = n1Pi=1 Si = nn1 |
Sous ces hypothèses, montrer que
√\ L nα1 −α2 n−→∞→N
où p = ESi.
Pour cela, montrer successivement que:
…
- Comment estimer la variance asymptotique de α\1−α2, Vasα\1−α2?
- Tester alors l’absence de changement structurel, à 5%, à l’aide d’un test de Student (asymptotique).
3 Le Modèle Hétéroscédastique
3.1 Test d’égalité de deux moyennes (suite de (2.3))
…
- On suppose que n1 → ∞ et n1/n2 → k = 0.
- Interpréter.
3.2 Un test de Goldfeld-Quandt
Dans cet exercice, on cherche à quantifier l’influence du diplôme sur le salaire. On considérera donc le modèle linéaire suivant :
wi = αxi + β + ui
Où xi repère le niveau d’éducation de l’individu i. On supposera les résidus ui inid et orthogonaux aux variables explicatives.
On teste l’hétéroscédasticité des résidus en divisant l’échantillon en deux sous-échantillons I1 et I2 correspondant aux "non-diplômés" (niveau inférieur au bac) et aux "diplômés" (au moins le bac). On retire ensuite de ces deux sous-échantillons une proportion des individus telle que tous deux aient la même taille. On calcule ensuite les sommes des résidus des deux sous-modèles, soit SR1 et SR2.
1. Montrer que SR2 suit, sous l’hypothèse d’homoscédasticité, une loi de Fisher dont on SR1 précisera le nombre de degrés de liberté.
- Tester l’hypothèse d’homoscédasticité aux niveaux 1%, 5% et 10%. Qu’en déduire ?
- On considère alors le modèle :
ln(wi) = αxi + β + ui. | (9) |
Justifier la forme choisie: pourquoi utilise-t-on le logarithme?
- Tester l’hypothèse d’homoscédasticité sur ce modèle. Conclusion ?
3.3 Utilisation à tort des MCO
On évalue l’erreur qui est faite lorsque l’on estime un modèle linéaire hétéroscédastique par les MCO.
On considère le modèle hétéroscédastique :
yi = a + bxi + ui, | (10) |
où la matrice de variance-covariance des ui est diagonale, égale à σ2diag(ω1, ..., ωn). On suppose que les poids ωj sont positifs, et somment à 1.
1. Calculer bMCO. Est-il sans biais? Convergent?
2. Mêmes questions pour bMCP , l’estimateurs des Moindres Carrés Pondérés du paramètre b.
3. Calculer les variances de bMCO et bMCP .
4. Montrer que bMCP est plus précis.
5. On calcule un estimateur de la variance de bMCP par la méthode des MCP. Montrer que cet estimateur n’est pas biaisé.
6. On calcule maintenant un estimateur de la variance de bMCO par les MCO. Montrer que cet estimateur est biaisé. Dans quelle direction?
3.4 Observations Groupées
Soit un échantillon d’observations iid {(yi, di), i = 1, ..., N }, avec yi ∈ R et di ∈ {1, ..., J}. La variable di est une variable discrète qui indique un groupe social d’appartenance de l’individu i (les diplômés par opposition aux non diplômés, différentes PCS, etc.). Chaque groupe social j∈ {1, ..., J} est caractérisé par un vecteur de constantes zj ∈ RK (revenu N le nombre d’individus i dans moyen, âge moyen, etc.). Pour tout j ∈ {1, ..., J}, on note j le groupe j et j la moyenne de yi dans le groupe j. Enfin, δi y = 1 {di = j} dénote la variable indiquant si le groupe d’appartenance est le groupe j (δij = 1 si di = j, = 0 sinon).
1. Soit β = (β | , ..., β | )0 l’estimateur des MCO de la régression de y sur le vecteur x | = | |||
(δi , bi | 0b1 | bJ | i | i | ||
1 ..., δJ ) .
(a) Remplacer les ? dans les deux équations suivantes par l’expression appropriée:
2. On considère maintenant le modèle de régression linéaire suivant:
(a) Montrer que les équations normales définissant l’estimateur des MCO de a et b
où Nj est le nombre d’individus i appartenant au groupe j.
- Combien y-a-t’il d’équations et de variables dans le système (12)?
3. On considère ensuite le modèle de régression linéaire suivant:
= a + z0 b + vj , j = 1, ..., J. | (15) | ||
y | j |
(a) Montrer que l’équation (15) se déduit de l’équation (11) pour un choix de vj que vous expliciterez.
(b) Montrer que E(vj |X) = 0 où X = (δ1i, ..., δJi )i=1,...,N .
(c) Montrer que V(vj|X) = σ2 . Nj
- Montrer que Cov(vj, vj0 |X) = 0, ∀j 6= j0 ∈ {1, ...J} .
- Calculer l’estimateur des MCO de la régression de yj sur 1 et zj.
- Calculer l’estimateur des MCG et montrer que c’est le même estimateur que celui obtenu dans la question 2c.
4 Endogénéité des variables explicatives
4.1 Rendements de l’éducation
On considère l’équation de salaire suivante :
yi = a + bxi + ui,
où xi représente le niveau d’éducation de l’individu i, et yi le logarithme de son salaire. On s’intéresse aux éventuels problèmes d’endogénéité posés par cette formulation.
1. Pour mettre ces problèmes en évidence, on postule dans cette question l’existence d’une caractéristique inobservée, zi, qui influence à la fois ui et xi. Soit :
ui = bzi + ηi,
xi = α + βzi + ei.
- Interpréter ce modèle structurel.
- En supposant ηi et ei non corrélés et de moyenne nulle, déterminer le biais asymtotique de l’estimateur des MCO bMCO. Montrer qu’il est vraisemblablement positif.
(c) On calcule empiriquement le biais de b. Quelle méthode peut-on utiliser? On trouve alors un biais significativement négatif.
2. On interprète le paradoxe des questions précédentes en postulant la présence d’erreurs de mesure. On suppose que le vrai modèle s’écrit :
yi∗ = a + bx∗i + ui,
où yi∗ est le salaire mesuré par yi avec erreur:
yi = yi∗ + νi,
et x∗i le vrai niveau d’éducation mesuré avec erreur par xi:
xi = x∗i + εi.
On suppose les erreurs de mesure εi et νi non corrélées entre elles, iid et non corrélées avec x∗i.
(a) Soit b l’estimateur des MCO du coefficient de xi dans la régression de yi sur xi avec constante. Exprimer le biais asymptotique sur b et montrer que l’erreur de mesure biaise l’estimateur vers 0.
(b) Soit bc l’estimateur des MCO du coefficient de yi dans la régression de xi sur yi avec constante. Exprimer le biais asymptotique de 1/bc sur b. Montrer que le biais est positif.
(c) En déduire que l’on peut obtenir un encadrement du vrai rendement de l’éducation, et discuter la précision de cet encadrement. Montrer en particulier que 1/bc reste biaisé même lorsqu’il n’y a pas d’erreur de mesure.
4.2 Un modèle d’offre de travail
Dans cet exercice, on considère le modèle suivant:
yi = a + bxi + ui. | (16) |
La variable yi représente le nombre d’heures travaillées par l’individu i dans la semaine précédant l’enquête, et xi est le salaire horaire de ce même individu.
- Quelles sont les deux interprétations possibles du résidu ui vues en cours. Pour quelle raisons, dans l’éventualité d’une interprétation causale de cette relation, la variable xi est-elle susceptible d’être corrélée au résidu ui?
- On suppose dans cette question que xi est endogène dans l’équation (16). Montrer qu’alors l’estimateur des MCO b de b est biaisé, et calculer son biais en fonction de xi et ui. S’attend-on à un biais positif ou négatif? Justifier.
- Parmi les variables suivantes, lesquelles peut-on rejeter immédiatement comme n’étant pas des instruments convenables pour le modèle (16) : indicatrice de temps partiel, profession de l’individu, région de résidence, diplôme, salaire hebdomadaire. Justifier chacune de vos affirmations.
- On retient dans cette question et la suivante la profession des parents comme instru-ment. Expliquer comment on obtient l’estimateur des doubles moindres carrés de b, associé au modèle (16) et à l’instrument considéré (que l’on pourra noter zi pour les besoins de l’explication).
On effectue le calcul de b2MC sur un échantillon de 10000 individus. La régression augmentée de yi sur xi, vbi et la constante donne :
yˆi = 174xi − 204vbi + 14,
(12)(12)(3)
où les écarts-types sont entre parenthèse. Que représente la variable vi? Donner la moyenne et l’écart-type de b2MC . Tester ensuite l’exogénéité de xi pour le modèle (1) à 5%. Dans quel sens l’estimateur des MCO est-il biaisé? Commenter.
- Peut-on tester la validité de l’instrument "profession des parents" à partir des infor-mations contenues dans l’énoncé ? Comment pourrait-on s’y prendre pour la tester? Expliquer.
- On s’intéresse maintenant à l’éventuelle hétéroscédasticité du modèle (16). Expliquer pourquoi la variance conditionnelle V(yi|xi) est vraisemblablement monotone en xi. Quelle méthode peut-on appliquer pour tester l’hétéroscédasticité du modèle?
- On suppose le modèle (16) hétéroscédastique. On instrumente alors par la profession des parents, comme dans la question 4. Le coefficient b2MC est-t-il convergent? Que dire de son écart-type?
- Donner une méthode permettant d’éliminer asymptotiquement le biais mis en évidence à la question précédente. Expliquer son fonctionnement.
- D’après les conclusions de l’exercice, quel effet, revenu ou substitution, est dominant dans l’échantillon? Proposer une autre forme pour le modèle (16) qui permette de prendre en compte ces deux effets simultanément.
4.3 Régression vers la Moyenne?
Soit un échantillon d’observations iid {(yi, xi), i = 1, ..., N}, avec yi ∈ R, xi ∈ R. On suppose qu’il existe une variable di ∈ {1, ..., J}, inobservée, qui partitionne les individus en J groupes. La variable xi est la taille du père de l’individu i et yi est sa propre taille. En régressant yi − y sur xi − x le statisticien Galton a trouvé un coefficient inférieur à un, phénomène qu’il a qualifié de régression vers la moyenne. En réalité, il s’agit d’un artefact statistique qu’on va chercher à comprendre.
Soit z1, ..., zJ ∈ R. On suppose vérifié le modèle suivant:
yi − | =zdi | + ui, | ||
y | ||||
xi − | =zdi | + vi, | ||
x | ||||
où ui et vi sont deux perturbations de moyennes nulle et de variances constantes non nulles conditionnellement à di:
E(ui|di) | = | et | V(ui|di) = σu2, | |
E(vi|di) | = | et | V(vi|di) = σv2. |
- Calculer E(yi − y|di = j) et E(xi − x|di = j).
- Interprétez zj . Quelle justification donner au fait que l’on suppose que c’est le même zj qui apparaît dans les deux équations?
3. Calculer l’estimateur des MCO b du coefficient de la régression sans constante de yi −y sur xi − x.
4. Montrer que 0 < plimN→∞ b < 1.
5. Les économistes de la croissance ont souvent régressé le taux de croissance moyen du PIB (sur une période donnée) sur le PIB de début de période:
ln P IBi1 − ln P IBi = a + b ln P IBi + ui
pour un échantillon de pays i = 1, ..., N. Une estimation négative du coefficient b est souvent interprétée comme le signe d’une convergence vers un niveau de PIB commun. Montrer à l’aide du modèle précédent qu’une telle interprétation peut être fallacieuse.
5 Equations simultanées
5.1 Modèle de Haavelmo
On considère le modèle d’équilibre général formé des deux équations suivantes:
c | = | αy + β + u, |
y | = | c + i, |
où y est la production, c la consommation et l’investissement i est considéré comme exogène.
- Interpréter ces deux équations.
- Exprimer les formes réduites de ce système.
- Calculer la limite en probabilité de αbMCO, l’estimateur de α par les MCO.
- Quelles remarques pouvez-vous faire sur l’estimation des modèles d’équilibre général. Proposez une méthode d’estimation convergente des paramètres.
5.2 Offre et demande
On estime dans cet exercice un modèle Offre/Demande. Soit :
Si(pi, vi) = α + βpi + vi,
Di(pi, ui) = a + bpi + ui.
On suppose de plus que les résidus suivent une loi normale bivariée dont les paramètres sont :
E(ui) = E(vi) = 0,
V (ui) = σ2u ; V (vi) = σ2v ; Cov(ui, vi) = ρσuσv.
- La loi conditionnelle vi|ui est normale. Calculer sa moyenne et sa variance. En déduire par symétrie la loi de ui|vi.
- Calculer la loi marginale du prix d’équilibre pi.
- Calculer E(ui|pi) et E(vi|pi).
- Vérifier que :
a + bpi + E(ui|pi) = α + βpi + E(vi|pi)
5.3 Identification
- Soit le système d’équations simulatanées :
y1t = a1 + b1 · y2t + c1 · x1t + u1t y2t = a2 + b2 · y1t + c2 · x2t + u2t
avec u1t et u2t corrélés.
- Ecrire les formes structurelle et réduite correspondantes.
- Que veut dire : "les paramètres du modèle sont identifiés." Donner la définition.
- A l’aide de la condition d’ordre, dire si les équations sont identifiables.
- Montrer à l’aide de la forme réduite que les paramètres sont en effet identifiés.
2. Soit le modèle :
y1t = a1 + b1 · y2t + c1 · x1t + u1t y2t = a2 + c2 · x1t + u2t
- La condition d’ordre reste-t-elle satisfaite pour chaque équation ?
- Quels paramètres ou fonctions des paramètres sont identifiables?