Problème à signaler:


Télécharger Formation sur la statistique econometrie pour debutant



★★★★★★★★★★3.5 étoiles sur 5 basé sur 1 votes.
Votez ce document:

Formation sur la statistique économétrie pour débutant

Introduction

 O N RENCONTRE DES VARIABLES DE DURÉE dans de nombreux cas. A l’origine, ces modèles ont été développés pour étudier la durée de vie mais d’autres applications ont été mises en œuvre. En économie, on étudie la durée passée au chômage, dans un emploi ou entre deux

emplois, la durée d’un trajet de transport, la durée de vie d’une entreprise ou encore la durée d’un crédit de type "revolving". Or les variables de durée ont des caractéristiques particulières : elles sont strictement positives et souffrent souvent de problèmes de censure. En effet, l’arrêt de la collecte à une date fixe ou après une certaine durée fait que des durées commencées n’ont pas eu le temps de se terminer et sont donc censurées. On peut juste affecter une valeur minimale à ces durées observées de manière incomplète. On parle de censure droite. Inversement, il est possible que le fichier disponible commence à une date où le processus observé a déjà commencé pour certains individus, la durée est alors censurée à gauche. Pour obtenir une bonne estimation, il faut tenir compte de toutes les observations, censurées ou non.

En effet, plus une durée est longue plus elle a de chances d’être censurée, de sorte qu’enlever les durées censurées revient à causer un biais de sélection. Par exemple, si l’on étudie la durée du chômage, enlever les données censurées reviendrait à réaliser une étude sans les chômeurs de longue durée, ce qui est difficilement envisageable. Comme pour les variables aléatoires habituelles, on peut définir la loi d’une variable de durée par sa fonction de répartition. Toutefois, on préfère pour des raisons pratiques, utiliser d’autres concepts plus parlants que la fonction de répartition ou la densité. Cette pratique provient de la démographie et utilise donc des concepts spécifiques comme le taux de mortalité, la probabilité de survie ou l’espérance de vie à la naissance. Nous allons montrer que ces concepts sont rigoureusement équivalents à ceux utilisés dans les autres branches de l’économétrie.

Cet ouvrage vise à présenter toutes les bases nécessaires à la pratique de l’économétrie des variables de durées. Nous commencerons, dans un premier chapitre, par présenter les concepts qui sont utilisés en statistique des variables de durée et qui s’écartent parfois des pratiques habituelles tout en leur restant équivalentes. Dans le chapitre 2, nous verrons les distributions usuelles et leurs propriétés principales. Ces distributions constituent un ingrédient de base des modèles paramétriques d’économétrie des durées. Nous présenterons ensuite, dans le chapitre 3, une synthèse sur l’estimation des paramètres des distributions usuelles. Le chapitre 4 sera entièrement consacré à l’estimation de ces modèles usuels avant d’aborder les questions d’économétrie appliquée. Ce chapitre constitue une véritable introduction à SAS-IML et propose 11 applications différentes liées à l’estimation des modèles de durée. Nous introduisons progressivement les méthodes d’optimisation non linéaires qui sont nécessaires pour estimer les modèles dont les durées sont censurées.

Chaque méthode donne lieu à une application sous SAS-IML. Ce chapitre est essentiel pour bien comprendre l’estimation des modèles de durée et peut aussi être utilisé comme une introduction à l’économétrie non linéaire. Nous présenterons ensuite, dans le chapitre 5, le cas le plus populaire d’estimation semi paramétrique : le modèle à hasard constant par morceaux. Cette modélisation permet de mieux choisir un modèle de durée car elle fait des hypothèses relativement faibles sur la distribution des durées. Ce chapitre se poursuit assez naturellement par le chapitre 6 sur l’estimation non paramétrique des modèles de durée, dont le contenu est important pour comprendre certaines méthodes d’estimation semi-paramétriques avec variables explicatives. Nous verrons l’estimateur de Kaplan-Meier et l’estimateur actuariel. Les applications de ce chapitre permettront de voir à la fois une programmation directe en SAS-IML et avec la procédure lifetest de SAS. Enfin, nous ne pouvions pas finir cet ouvrage sans proposer une estimation avec variables explicatives.

Nous verrons les modèles exponentiel et de Weibull. Nous les avons choisis pour deux raisons. D’une part, leur simplicité permet de se focaliser sur les nouveautés engendrées par l’introduction des variables explicatives dans un modèle de durée. D’autre part, ces deux modèles sont à la fois à hasards proportionnels et à durée accélérée, deux grandes familles de modèles de durée, de sorte que nous n’avons pas besoin de choisir entre ces deux modélisations. Les applications seront présentées à la fois sous SAS-IML et avec la procédure lifereg de SAS.

Sommaire

1 Les variables de durée 3

1.1 Fonction de répartition . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Fonction de densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Fonction de survie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Fonction de hasard . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5 Relations entre les définitions . . . . . . . . . . . . . . . . . . . . . . 8

1.6 Les distributions en logarithmes . . . . . . . . . . . . . . . . . . . . 9

2 Distributions usuelles 11

2.1 Distribution à un paramètre . . . . . . . . . . . . . . . . . . . . . . . 12

2.1.1 Loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.1.2 Loi Gamma à un paramètre . . . . . . . . . . . . . . . . . . . 13

2.1.3 Loi de Lomax à un paramètre . . . . . . . . . . . . . . . . . . 14

2.2 Distributions à deux paramètres . . . . . . . . . . . . . . . . . . . . 15

2.2.1 Loi exponentielle avec état absorbant . . . . . . . . . . . . . 15

2.2.2 Loi de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.3 Loi Gamma à deux paramètres . . . . . . . . . . . . . . . . . 18

2.2.4 Loi log-normale . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.5 Loi log-logistique . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.6 Loi de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3 Autres distributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.1 Mélange discret de lois exponentielles . . . . . . . . . . . . 25

2.3.2 Loi de Burr de type 12 . . . . . . . . . . . . . . . . . . . . . . 29

2.3.3 Loi Gamma généralisée . . . . . . . . . . . . . . . . . . . . . 31

3 Estimation paramétrique : théorie 39

3.1 Maximum de vraisemblance . . . . . . . . . . . . . . . . . . . . . . 39

3.2 Ecritures de la vraisemblance . . . . . . . . . . . . . . . . . . . . . . 41

3.3 Changements de paramètres . . . . . . . . . . . . . . . . . . . . . . 42

3.4 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.5 Estimation des fonctions . . . . . . . . . . . . . . . . . . . . . . . . . 44

4 Estimation paramétrique : pratique 47

4.1 Loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.1.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 47

4.1.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.1.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.1.4 Programmation I . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.5 Application I . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2 Loi Gamma à un paramètre . . . . . . . . . . . . . . . . . . . . . . . 66

4.2.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 66

4.2.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.2.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.2.4 Programmation II . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.2.5 Application II . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.3 Loi de Lomax à un paramètre . . . . . . . . . . . . . . . . . . . . . . 80

4.3.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 80

4.3.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.3.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.3.4 Programmation III . . . . . . . . . . . . . . . . . . . . . . . . 82

4.3.5 Application III . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

4.4 Loi exponentielle avec état absorbant . . . . . . . . . . . . . . . . . 90

4.4.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 90

4.4.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.4.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 92

4.4.4 Application IV . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

4.5 Loi de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.5.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 110

4.5.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

4.5.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 114

4.5.4 Programmation V . . . . . . . . . . . . . . . . . . . . . . . . . 116

4.5.5 Application V . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4.6 Loi Gamma à deux paramètres . . . . . . . . . . . . . . . . . . . . . 127

4.6.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 127

4.6.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.6.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 128

4.6.4 Programmation VI . . . . . . . . . . . . . . . . . . . . . . . . 129

4.6.5 Application VI . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

4.7 Loi log-normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

4.7.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 139

4.7.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

4.7.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 141

4.7.4 Programmation VII . . . . . . . . . . . . . . . . . . . . . . . . 142

4.7.5 Application VII . . . . . . . . . . . . . . . . . . . . . . . . . . 148

4.8 Loi log-logistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

4.8.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 151

4.8.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

4.8.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 153

4.8.4 Programmation VIII . . . . . . . . . . . . . . . . . . . . . . . 155

4.8.5 Application VIII . . . . . . . . . . . . . . . . . . . . . . . . . . 161

4.9 Loi de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

4.9.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 165

4.9.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

4.9.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 166

4.9.4 Programmation IX . . . . . . . . . . . . . . . . . . . . . . . . 167

4.9.5 Application IX . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

4.10 Loi Gamma généralisée . . . . . . . . . . . . . . . . . . . . . . . . . 177

4.10.1 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

4.10.2 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 178

4.10.3 Programmation X . . . . . . . . . . . . . . . . . . . . . . . . . 180

4.10.4 Application X . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

4.11 Loi de Burr de type 12 . . . . . . . . . . . . . . . . . . . . . . . . . . 201

4.11.1 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . 201

4.11.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

4.11.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 203

4.11.4 Programmation XI . . . . . . . . . . . . . . . . . . . . . . . . 204

4.11.5 Application XI . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

5 Hasard constant par morceaux 223

5.1 Le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

5.2 Log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

5.3 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

5.4 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

5.5 Programmation XII . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

5.6 Application XII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242

6 Estimation non paramétrique 253

6.1 Estimateur de Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . . 253

6.1.1 Formule de Greenwood . . . . . . . . . . . . . . . . . . . . . 258

6.1.2 Estimateur de Breslow . . . . . . . . . . . . . . . . . . . . . . 259

6.1.3 Statistiques utiles . . . . . . . . . . . . . . . . . . . . . . . . . 261

6.1.4 Programmation XIII . . . . . . . . . . . . . . . . . . . . . . . 262

6.1.5 Application XIII . . . . . . . . . . . . . . . . . . . . . . . . . . 271

6.2 Estimateur actuariel . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

6.2.1 Dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

6.2.2 Programmation XIV . . . . . . . . . . . . . . . . . . . . . . . 283

6.2.3 Application XIV . . . . . . . . . . . . . . . . . . . . . . . . . . 285

7 Introduction des variables explicatives 291

7.1 L’effet des variables explicatives . . . . . . . . . . . . . . . . . . . . 291

7.1.1 Modèles à hasards proportionnels . . . . . . . . . . . . . . . 291

7.1.2 Modèles à durée accélérée . . . . . . . . . . . . . . . . . . . . 294

7.1.3 Ecriture en logarithmes . . . . . . . . . . . . . . . . . . . . . 296

7.2 Aspects appliqués . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

7.2.1 Interprétation des coefficients . . . . . . . . . . . . . . . . . 296

7.2.2 Terme constant et centrage . . . . . . . . . . . . . . . . . . . 297

7.3 Estimation du modèle exponentiel . . . . . . . . . . . . . . . . . . . 300

7.3.1 Programmation XV . . . . . . . . . . . . . . . . . . . . . . . . 301

7.3.2 Application XV . . . . . . . . . . . . . . . . . . . . . . . . . . 302

7.4 Estimation du modèle de Weibull . . . . . . . . . . . . . . . . . . . 312

7.4.1 Paramétrage à hasards proportionnels . . . . . . . . . . . . 313

7.4.2 Paramétrage à durée accélérée . . . . . . . . . . . . . . . . . 313

7.4.3 Programmation XVI . . . . . . . . . . . . . . . . . . . . . . . 314

7.4.4 Application XVI . . . . . . . . . . . . . . . . . . . . . . . . . . 316

A Rappels de statistique 327

A.1 Espérance mathématique et fonction de survie . . . . . . . . . . . 327

A.2 Le changement de variable . . . . . . . . . . . . . . . . . . . . . . . 327

A.3 Constante d’Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

A.4 Fonctions Gamma, Beta et Polygamma . . . . . . . . . . . . . . . . 329

A.4.1 Fonction Gamma . . . . . . . . . . . . . . . . . . . . . . . . . 329

A.4.2 La fonction Beta . . . . . . . . . . . . . . . . . . . . . . . . . . 330

A.4.3 La fonction Polygamma . . . . . . . . . . . . . . . . . . . . . 330

A.4.4 La fonction Gamma tronquée . . . . . . . . . . . . . . . . . . 330

A.5 Loi Gamma à deux paramètres . . . . . . . . . . . . . . . . . . . . . 331

B Calcul des moments 333

B.1 Approche par la fonction génératrice des moments . . . . . . . . . 333

B.1.1 Moments non centrés . . . . . . . . . . . . . . . . . . . . . . 333

B.1.2 Moments centrés . . . . . . . . . . . . . . . . . . . . . . . . . 334

B.1.3 Moments du logarithme . . . . . . . . . . . . . . . . . . . . . 334

B.1.4 Loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . 335

B.1.5 Loi de Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

B.1.6 Loi Gamma à un paramètre . . . . . . . . . . . . . . . . . . . 337

B.1.7 Loi Gamma à deux paramètres . . . . . . . . . . . . . . . . . 338

B.1.8 Loi de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . 338

B.1.9 Loi Gamma généralisée . . . . . . . . . . . . . . . . . . . . . 340

B.1.10 Loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341

B.1.11 Loi log-normale . . . . . . . . . . . . . . . . . . . . . . . . . . 342

B.1.12 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

B.2 Approche par le calcul direct . . . . . . . . . . . . . . . . . . . . . . 343

B.2.1 Loi de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344

B.2.2 Loi log-logistique . . . . . . . . . . . . . . . . . . . . . . . . . 346

B.2.3 Loi de Burr de type 12 . . . . . . . . . . . . . . . . . . . . . . 347

C Modélisation en logarithmes 349

C.1 Distributions à un paramètre . . . . . . . . . . . . . . . . . . . . . . 349

C.1.1 Modèle exponentiel et loi de Gumbel . . . . . . . . . . . . . 349

C.1.2 Modèle exponentiel et loi exponentielle . . . . . . . . . . . . 351

C.1.3 Modèle Gamma à un paramètre . . . . . . . . . . . . . . . . 352

C.2 Distributions à deux paramètres . . . . . . . . . . . . . . . . . . . . 352

C.2.1 Modèle de Weibull . . . . . . . . . . . . . . . . . . . . . . . . 352

C.2.2 Modèle Gamma à deux paramètres . . . . . . . . . . . . . . 353

C.2.3 Modèle log-normal . . . . . . . . . . . . . . . . . . . . . . . . 354

C.2.4 Modèle log-logistique . . . . . . . . . . . . . . . . . . . . . . 355

C.2.5 Modèle de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . 356

C.3 Modèle Gamma à trois paramètres . . . . . . . . . . . . . . . . . . . 356

D Propriétés du modèle exponentiel 359

D.1 Propriété utile pour la statistique du score . . . . . . . . . . . . . . 359

D.2 Matrice d’information . . . . . . . . . . . . . . . . . . . . . . . . . . 360

E Les algorithmes d’optimisation 363

E.1 Présentation des algorithmes . . . . . . . . . . . . . . . . . . . . . . 363

E.2 Les méthodes de gradient . . . . . . . . . . . . . . . . . . . . . . . . 364

E.3 Algorithme de Newton-Raphson . . . . . . . . . . . . . . . . . . . . 365

viii SOMMAIRE

E.4 Algorithme de Berndt-Hall-Hall-Hausman . . . . . . . . . . . . . . 366

E.5 Algorithme du score . . . . . . . . . . . . . . . . . . . . . . . . . . . 367

E.6 Méthodologie de programmation . . . . . . . . . . . . . . . . . . . 367

Table des Graphiques 371

Table des Tableaux 373



206