Exercices corriges en econometrie financiere

Participez au vote ☆☆☆☆☆★★★★★

Exercices corrigés en économétrie financière

Le modèle linéaire - Rendements d’une fonction de production Cobb-Douglas

Présentation du problème: On considère la fonction de production suivante à deux facteurs, le travail L et le capital K, correspondant à une technologie de type Cobb-Douglas:

Y (L, K) = AL^αK^β

(1)

où α et β sont des réels compris entre 0 et 1.

Soit un échantillon {(y_i, _i, k_i) , i = 1, ..., n} d’observations indépendantes de logarithmes d’outputs et d’inputs de n entreprises. On suppose que

y_i = a + αl_i + βk_i + u_i,

(2)

où les u_i sont iid et normaux d’espérance nulle et de variance σ². On supposera de plus u_i orthogonal à l_i et k_i.

Données numériques : n = 1000

i	i	= 500
^P_i k_i		= 490
^Pi	yi	= 1490
^Pi	2
P_i	i₂	= 330
^Pi	^ki	= 320
^Pi	2	= 3200
P_i	y_i	= 3200
P_i	_iy_i = 800

_i k_iy_i = 770

Questions:

Justifier l’équation (2). Interpréter en particulier le sens de la variable u_i. Le fait de la traiter comme une variable aléatoire signifie-t-il que la valeur de u_i est le produit du hasard pour l’entreprise i?

2. Ecrire le modèle (2) sous la forme matricielle suivante :

y = Xb + u,

(3)

où y, X, b et u sont des matrices que l’on déterminera et dont on indiquera les dimensions.

3. Donner l’expression de l’estimateur des MCO b de b en fonction de y et de X.

…

Interpréter cette hypothèse.

e⁰ e

(d) Calculer la matrice X X , ainsi que son inverse, sachant que l’hypothèse (5) est vérifiée. En déduire l’estimateur des MCO des coeﬃcients de la régression de ye_i sur _i et k_i sans constante.

En déduire, par l’application du théorème de régression partitionnée, l’estimateur des MCO des coeﬃcients de la régression de y_i sur _i et k_i avec constante.
Application numérique.

5.	b	β.
	Significativité des coeﬃcients: On teste ici la significativité de α et ^b

b
Ecrire l’équation d’orthogonalité entre Xb et y − Xb.
Donner l’expression de la somme des carrés des résidus, SCR, en fonction de y_i,
^b
Tester la significativité de α et de β à 10% et 5% près. Conclusion?

6. Test de l’hypothèse de rendements constants: On teste l’hypothèse nulle suivante

(H) : α + β = 1

Contre l’alternative :

(H_a) : α + β 6= 1

Ecrire le modèle contraint associé à H, modèle dans lequel β n’intervient plus. Quelles sont les variables dépendantes et indépendantes de ce nouveau problème?
Calculer la somme des carrés des résidus du modèle contraint SCR_c. Application numérique : On vérifiera que α_c ' 0.594.
Calculer alors la statistique de Fischer associée au test de rendements constants. Tester H à 5% près. Conclusion ?

2 Théorie asymptotique des MCO

2.1 Lancer d’une pièce de monnaie pipée

On lance un grand nombre de fois une pièce de monnaie déséquilibrée, dont la probabilité d’obtenir "face" est égale à α ∈ [0, 1].

1. On modélise le problème par le modèle suivant:

y = β + ε,

où y est la réalisation du lancer (y = 0 si "pile", y = 1 si "face"), et ε est d’espérance nulle.

Que vaut le scalaire β? Dessiner la fonction de répartition de ε. Sa loi est-elle normale?

2. Calculer l’estimateur des MCO de β: β. Préciser les hypothèses ("naturelles") que vous faites sur les résidus.

Vers quelle valeur converge β lorsque le nombre de lancers tend vers +∞?

3. Donner l’expression de la variance de ε en fonction de α.

4. Déduire de la question précédente la densité asymptotique de β (NB: on pourra noter n le nombre de lancers).

2.2 Inclusion et oubli de variables non pertinentes

On dispose d’un échantillon {(y_i, x₁_i, x₂_i) , i = 1, ..., n} d’observations indépendantes.

1. On suppose tout d’abord que le modèle de y_i sachant x₁_i, x₂_i est

y_i = α + β₁x₁_i + u_i,

(6)

avec E(u_i|x₁_i, x₂_i) = 0. On cherche à mesurer les conséquences de l’introduction d’une seconde variable explicative, x₂_i.

b
Calculer les estimateurs des MCO β₁ et β₂ des coeﬃcients de x₁_i et x₂_i dans la régression de y_i sur x₁_i et x₂_i.

(b) Montrer que β₁ est asymptotiquement équivalent à l’estimateur des MCO de la régression de y_i sur x₁_i sans x₂_i. Ces deux estimateurs sont-ils pour autant identiques?

2. On suppose maintenant que le vrai modèle est

y_i = α + β₁x₁_i + β₂x₂_i + v_i

(7)

avec E(v_i|x₁_i, x₂_i) = 0.

Poser u_i = β₂x₂_i + v_i et calculer E(u_i|x₁_i, x₂_i). A quelle condition E(u_i|x₁_i, x₂_i) = 0?
On suppose d’abord que x₁ et x₂ sont orthogonaux (cov(x₁, x₂) = 0). Montrer que l’estimateur des MCO du coeﬃcient de x₁_i dans la régression de y_i sur x₁_i sans x₂_i est convergent mais moins eﬃcace (asymptotiquement moins précis) que l’estimateur des MCO du coeﬃcient de x₁_i dans la régression de y_i sur x₁_i et x₂_i.
Si x₁ et x₂ sont corrélés, montrer que l’estimateur des MCO du coeﬃcient de x₁_i dans la régression de y_i sur x₁_i sans x₂_i est non convergent (asymptotiquement biaisé).

2.3 Test d’égalité de deux moyennes

On cherche à tester l’influence du sexe sur le salaire. Soit {w₁_i, i = 1, ..., T₁} un échantillon de salaires d’hommes et {w₂_i, i = 1, ..., n₂} un échantillon de salaires de femmes. On suppose les observations iid. Pour cela, on divise le panel en deux sous-échantillons, femmes (1, taille n₁) et hommes (2, taille n₂). On considère alors les deux modèles suivants

• Le modèle non contraint s’écrit :

w₁_i = α₁ + u₁_i, Eu₁_i = 0,

w₂_i = α₂ + u₂_i, Eu₂_i = 0,

où α₁ et α₂ ne sont pas supposés égaux a priori.

• Le modèle contraint impose l’égalité des coeﬃcients α₁ et α₂:

…

(a) Ecrire le modèle de w_i sous la forme:

w_i = α₁S_i + α₂ (1 − S_i) + u_i, i = 1, ..., n

(8)

où l’on précisera S_i et u_i.

Comment s’interprètent les variables S_i et 1 − S_i et combien vaut E(u_i|S_i)?
Montrer que l’estimateur des MCO de α₁ (resp. de α₂) dans la régression de w_i sur S_i et 1 − S_i est identique à l’estimateur des MCO de α₁ dans la régression de w₁_i (resp. de w₂_i) sur la constante 1. Expliciter αb₁ et αb₂.
Le test à distance finie (rappels de licence). On suppose les résidus du modèle
sont iid et normaux, de variance Vu_i = σ².
L’hypothèse Vu_i = σ² pour tout i = 1, ..., n vous paraît-elle discutable?
Ecrire le modèle non contraint sous forme matricielle.
Montrer que la somme des carrés des résidus non contraints SCR_nc s’écrit très simplement en fonction des sommes des carrés des résidus u₁ et u₂. La calculer.

Montrer de plus que ^SCRnc suit un χ² dont on précisera le nombre de degrés de σ² liberté.

(d) Montrer que, sous l’hypothèse d’absence de changement structurel que l’on pré-cisera, l’estimateur (αb₁, αb₂) suit une loi normale dont on calculera la moyenne et la variance.

(e) Exprimer la diﬀérence SCR_c − SCR_nc en fonction de n₁, n₂, et de la diﬀérence αb₁ − αb₂.

(f) En déduire que cette quantité, convenablement normalisée, suit un χ² à un degré de liberté. Interpréter.

(g) Calculer la statistique de Fischer associé au problème. Tester à 5% l’égalité entre α₁ et α₂. Conclusion?

3. Le test asymptotique. On abandonne ici l’hypothèse de normalité des résidus, ceux-ci restant iid.

(a) Calculer l’estimateur des MCO de α₁ − α₂.

(b) Sous quelle hypothèse quant au comportement asymptotique de la statistique

n	cet estimateur est-il convergent? Interpréter.
S = _n¹^P_i₌₁ S_i = ⁿ_n¹

Sous ces hypothèses, montrer que

^√_\ L ^nα1 ⁻^α2 _n⁻_→_∞^→^N

où p = ES_i.

Pour cela, montrer successivement que:

…

Comment estimer la variance asymptotique de α\₁−α₂, V_asα\₁−α₂?
Tester alors l’absence de changement structurel, à 5%, à l’aide d’un test de Student (asymptotique).

3 Le Modèle Hétéroscédastique

3.1 Test d’égalité de deux moyennes (suite de (2.3))

…

On suppose que n₁ → ∞ et n₁/n₂ → k = 0.
Interpréter.

3.2 Un test de Goldfeld-Quandt

Dans cet exercice, on cherche à quantifier l’influence du diplôme sur le salaire. On considérera donc le modèle linéaire suivant :

w_i = αx_i + β + u_i

Où x_i repère le niveau d’éducation de l’individu i. On supposera les résidus u_i inid et orthogonaux aux variables explicatives.

On teste l’hétéroscédasticité des résidus en divisant l’échantillon en deux sous-échantillons I₁ et I₂ correspondant aux "non-diplômés" (niveau inférieur au bac) et aux "diplômés" (au moins le bac). On retire ensuite de ces deux sous-échantillons une proportion des individus telle que tous deux aient la même taille. On calcule ensuite les sommes des résidus des deux sous-modèles, soit SR₁ et SR₂.

1. Montrer que ^SR² suit, sous l’hypothèse d’homoscédasticité, une loi de Fisher dont on SR₁ précisera le nombre de degrés de liberté.

Tester l’hypothèse d’homoscédasticité aux niveaux 1%, 5% et 10%. Qu’en déduire ?
On considère alors le modèle :

ln(w_i) = αx_i + β + u_i.

(9)

Justifier la forme choisie: pourquoi utilise-t-on le logarithme?

Tester l’hypothèse d’homoscédasticité sur ce modèle. Conclusion ?

3.3 Utilisation à tort des MCO

On évalue l’erreur qui est faite lorsque l’on estime un modèle linéaire hétéroscédastique par les MCO.

On considère le modèle hétéroscédastique :

y_i = a + bx_i + u_i,

(10)

où la matrice de variance-covariance des u_i est diagonale, égale à σ²diag(ω₁, ..., ω_n). On suppose que les poids ω_j sont positifs, et somment à 1.

1. Calculer b_MCO. Est-il sans biais? Convergent?

2. Mêmes questions pour b_MCP , l’estimateurs des Moindres Carrés Pondérés du paramètre b.

3. Calculer les variances de b_MCO et b_MCP .

4. Montrer que b_MCP est plus précis.

5. On calcule un estimateur de la variance de b_MCP par la méthode des MCP. Montrer que cet estimateur n’est pas biaisé.

6. On calcule maintenant un estimateur de la variance de b_MCO par les MCO. Montrer que cet estimateur est biaisé. Dans quelle direction?

3.4 Observations Groupées

Soit un échantillon d’observations iid {(y_i, d_i), i = 1, ..., N }, avec y_i ∈ R et d_i ∈ {1, ..., J}. La variable d_i est une variable discrète qui indique un groupe social d’appartenance de l’individu i (les diplômés par opposition aux non diplômés, diﬀérentes PCS, etc.). Chaque groupe social j∈ {1, ..., J} est caractérisé par un vecteur de constantes z_j ∈ R^K (revenu N le nombre d’individus i dans moyen, âge moyen, etc.). Pour tout j ∈ {1, ..., J}, on note _j le groupe j et _j la moyenne de y_i dans le groupe j. Enfin, δ_i y = 1 {d_i = j} dénote la variable indiquant si le groupe d’appartenance est le groupe j (δ_i^j = 1 si d_i = j, = 0 sinon).

1. Soit β = (β		, ..., β	)⁰ l’estimateur des MCO de la régression de y sur le vecteur x			=
(δ_i , ^b_i	₀^b1	b_J		i	i

¹ ..., δ^J ) .

(a) Remplacer les ? dans les deux équations suivantes par l’expression appropriée:

2. On considère maintenant le modèle de régression linéaire suivant:

(a) Montrer que les équations normales définissant l’estimateur des MCO de a et b

où N_j est le nombre d’individus i appartenant au groupe j.

Combien y-a-t’il d’équations et de variables dans le système (12)?

3. On considère ensuite le modèle de régression linéaire suivant:

		= a + z⁰ b + v_j , j = 1, ..., J.	(15)
y	j

(a) Montrer que l’équation (15) se déduit de l’équation (11) pour un choix de v_j que vous expliciterez.

(b) Montrer que E(v_j |X) = 0 où X = (δ¹_i, ..., δ^J_i )_i₌₁_,...,N .

Montrer que Cov(v_j, v_j0 |X) = 0, ∀j 6= j⁰ ∈ {1, ...J} .
Calculer l’estimateur des MCO de la régression de y_j sur 1 et z_j.
Calculer l’estimateur des MCG et montrer que c’est le même estimateur que celui obtenu dans la question 2c.

4 Endogénéité des variables explicatives

4.1 Rendements de l’éducation

On considère l’équation de salaire suivante :

y_i = a + bx_i + u_i,

où x_i représente le niveau d’éducation de l’individu i, et y_i le logarithme de son salaire. On s’intéresse aux éventuels problèmes d’endogénéité posés par cette formulation.

1. Pour mettre ces problèmes en évidence, on postule dans cette question l’existence d’une caractéristique inobservée, z_i, qui influence à la fois u_i et x_i. Soit :

u_i = bz_i + η_i,

x_i = α + βz_i + e_i.

Interpréter ce modèle structurel.
En supposant η_i et e_i non corrélés et de moyenne nulle, déterminer le biais asymtotique de l’estimateur des MCO b_MCO. Montrer qu’il est vraisemblablement positif.

(c) On calcule empiriquement le biais de b. Quelle méthode peut-on utiliser? On trouve alors un biais significativement négatif.

2. On interprète le paradoxe des questions précédentes en postulant la présence d’erreurs de mesure. On suppose que le vrai modèle s’écrit :

y_i^∗ = a + bx^∗_i + u_i,

où y_i^∗ est le salaire mesuré par y_i avec erreur:

y_i = y_i^∗ + ν_i,

et x^∗_i le vrai niveau d’éducation mesuré avec erreur par x_i:

x_i = x^∗_i + ε_i.

On suppose les erreurs de mesure ε_i et ν_i non corrélées entre elles, iid et non corrélées avec x^∗_i.

(a) Soit b l’estimateur des MCO du coeﬃcient de x_i dans la régression de y_i sur x_i avec constante. Exprimer le biais asymptotique sur b et montrer que l’erreur de mesure biaise l’estimateur vers 0.

(b) Soit bc l’estimateur des MCO du coeﬃcient de y_i dans la régression de x_i sur y_i avec constante. Exprimer le biais asymptotique de 1/bc sur b. Montrer que le biais est positif.

(c) En déduire que l’on peut obtenir un encadrement du vrai rendement de l’éducation, et discuter la précision de cet encadrement. Montrer en particulier que 1/bc reste biaisé même lorsqu’il n’y a pas d’erreur de mesure.

4.2 Un modèle d’oﬀre de travail

Dans cet exercice, on considère le modèle suivant:

y_i = a + bx_i + u_i.

(16)

La variable y_i représente le nombre d’heures travaillées par l’individu i dans la semaine précédant l’enquête, et x_i est le salaire horaire de ce même individu.

Quelles sont les deux interprétations possibles du résidu u_i vues en cours. Pour quelle raisons, dans l’éventualité d’une interprétation causale de cette relation, la variable x_i est-elle susceptible d’être corrélée au résidu u_i?
On suppose dans cette question que x_i est endogène dans l’équation (16). Montrer qu’alors l’estimateur des MCO b de b est biaisé, et calculer son biais en fonction de x_i et u_i. S’attend-on à un biais positif ou négatif? Justifier.
Parmi les variables suivantes, lesquelles peut-on rejeter immédiatement comme n’étant pas des instruments convenables pour le modèle (16) : indicatrice de temps partiel, profession de l’individu, région de résidence, diplôme, salaire hebdomadaire. Justifier chacune de vos aﬃrmations.
On retient dans cette question et la suivante la profession des parents comme instru-ment. Expliquer comment on obtient l’estimateur des doubles moindres carrés de b, associé au modèle (16) et à l’instrument considéré (que l’on pourra noter z_i pour les besoins de l’explication).

On eﬀectue le calcul de b₂_MC sur un échantillon de 10000 individus. La régression augmentée de y_i sur x_i, vb_i et la constante donne :

yˆ_i = 174x_i − 204vb_i + 14,

(12)(12)(3)

où les écarts-types sont entre parenthèse. Que représente la variable v_i? Donner la moyenne et l’écart-type de b₂_MC . Tester ensuite l’exogénéité de x_i pour le modèle (1) à 5%. Dans quel sens l’estimateur des MCO est-il biaisé? Commenter.

Peut-on tester la validité de l’instrument "profession des parents" à partir des infor-mations contenues dans l’énoncé ? Comment pourrait-on s’y prendre pour la tester? Expliquer.
On s’intéresse maintenant à l’éventuelle hétéroscédasticité du modèle (16). Expliquer pourquoi la variance conditionnelle V(y_i|x_i) est vraisemblablement monotone en x_i. Quelle méthode peut-on appliquer pour tester l’hétéroscédasticité du modèle?
On suppose le modèle (16) hétéroscédastique. On instrumente alors par la profession des parents, comme dans la question 4. Le coeﬃcient b₂_MC est-t-il convergent? Que dire de son écart-type?
Donner une méthode permettant d’éliminer asymptotiquement le biais mis en évidence à la question précédente. Expliquer son fonctionnement.
D’après les conclusions de l’exercice, quel eﬀet, revenu ou substitution, est dominant dans l’échantillon? Proposer une autre forme pour le modèle (16) qui permette de prendre en compte ces deux eﬀets simultanément.

4.3 Régression vers la Moyenne?

Soit un échantillon d’observations iid {(y_i, x_i), i = 1, ..., N}, avec y_i ∈ R, x_i ∈ R. On suppose qu’il existe une variable d_i ∈ {1, ..., J}, inobservée, qui partitionne les individus en J groupes. La variable x_i est la taille du père de l’individu i et y_i est sa propre taille. En régressant y_i − y sur x_i − x le statisticien Galton a trouvé un coeﬃcient inférieur à un, phénomène qu’il a qualifié de régression vers la moyenne. En réalité, il s’agit d’un artefact statistique qu’on va chercher à comprendre.

Soit z₁, ..., z_J ∈ R. On suppose vérifié le modèle suivant:

y_i −			⁼^zd_i	+ u_i,
		y
x_i −			⁼^zd_i	+ v_i,
	x

où u_i et v_i sont deux perturbations de moyennes nulle et de variances constantes non nulles conditionnellement à d_i:

E(u_i\|d_i)	=		et	V(u_i\|d_i) = σ_u²,
E(v_i\|d_i)	=		et	V(v_i\|d_i) = σ_v².

Calculer E(y_i − y|d_i = j) et E(x_i − x|d_i = j).
Interprétez z_j . Quelle justification donner au fait que l’on suppose que c’est le même z_j qui apparaît dans les deux équations?

3. Calculer l’estimateur des MCO b du coeﬃcient de la régression sans constante de y_i −y sur x_i − x.

4. Montrer que 0 < plim_N_→_∞ b < 1.

5. Les économistes de la croissance ont souvent régressé le taux de croissance moyen du PIB (sur une période donnée) sur le PIB de début de période:

ln P IB_i₁ − ln P IB_i = a + b ln P IB_i + u_i

pour un échantillon de pays i = 1, ..., N. Une estimation négative du coeﬃcient b est souvent interprétée comme le signe d’une convergence vers un niveau de PIB commun. Montrer à l’aide du modèle précédent qu’une telle interprétation peut être fallacieuse.

5 Equations simultanées

5.1 Modèle de Haavelmo

On considère le modèle d’équilibre général formé des deux équations suivantes:

c	=	αy + β + u,
y	=	c + i,

où y est la production, c la consommation et l’investissement i est considéré comme exogène.

Interpréter ces deux équations.
Exprimer les formes réduites de ce système.
Calculer la limite en probabilité de αb_MCO, l’estimateur de α par les MCO.
Quelles remarques pouvez-vous faire sur l’estimation des modèles d’équilibre général. Proposez une méthode d’estimation convergente des paramètres.

5.2 Oﬀre et demande

On estime dans cet exercice un modèle Oﬀre/Demande. Soit :

S_i(p_i, v_i) = α + βp_i + v_i,

D_i(p_i, u_i) = a + bp_i + u_i.

On suppose de plus que les résidus suivent une loi normale bivariée dont les paramètres sont :

E(u_i) = E(v_i) = 0,

V (u_i) = σ²_u ; V (v_i) = σ²_v ; Cov(u_i, v_i) = ρσ_uσ_v.

La loi conditionnelle v_i|u_i est normale. Calculer sa moyenne et sa variance. En déduire par symétrie la loi de u_i|v_i.
Calculer la loi marginale du prix d’équilibre p_i.
Calculer E(u_i|p_i) et E(v_i|p_i).
Vérifier que :

a + bp_i + E(u_i|p_i) = α + βp_i + E(v_i|p_i)

5.3 Identification

Soit le système d’équations simulatanées :

y₁_t = a₁ + b₁ · y₂_t + c₁ · x₁_t + u₁_t y₂_t = a₂ + b₂ · y₁_t + c₂ · x₂_t + u₂_t

avec u₁_t et u₂_t corrélés.

Ecrire les formes structurelle et réduite correspondantes.
Que veut dire : "les paramètres du modèle sont identifiés." Donner la définition.
A l’aide de la condition d’ordre, dire si les équations sont identifiables.
Montrer à l’aide de la forme réduite que les paramètres sont en eﬀet identifiés.

2. Soit le modèle :

y₁_t = a₁ + b₁ · y₂_t + c₁ · x₁_t + u₁_t y₂_t = a₂ + c₂ · x₁_t + u₂_t

La condition d’ordre reste-t-elle satisfaite pour chaque équation ?
Quels paramètres ou fonctions des paramètres sont identifiables?

Télécharger

E(u_i\|d_i)	=		et	V(u_i\|d_i) = σ_u²,
E(v_i\|d_i)	=		et	V(v_i\|d_i) = σ_v².