Cours d’introduction a la finance actuariat

Table des matières v
1 Modèles de sinistres sans variables explicatives 1
1.1 Rappels des lois usuelles en actuariat ... . . ..... . . . 1
1.2 Estimation non-paramétrique ......... . . . . 16
1.3 Estimation paramétrique ........... . 20
1.4 Estimation des copules ........... . . 27
1.5 Exercices ............. . . . 35
2 La tarification a priori 37
2.1 Les modèles linéaires généralisés ......... . . 39
2.2 Régression logistique et arbre de régression ....... . . 52
2.3 Modéliser la fréquence de sinistralité ......... 62
2.4 Les variables qualitatives ou facteurs ......... 63
2.5 Modéliser les couˆts individuels des sinistres ....... . . 79
2.6 Exercices ............. . . . 87
3 Les provisions pour sinistres à payer 91
3.1 La problématique du provisionnment ......... 91
3.2 Les cadences de paiements et la méthode Chain Ladder ..... . 94
3.3 De Mack à Merz & Wu¨thrich ......... . . . . 97
3.4 Régression Poissonnienne et approches économétriques ..... . . 108
3.5 Les triangles multivariés ........... . 123
3.6 Borhutter-Fergusson, Benktander et les méthodes bayésiennes ... . . . . 126
3.7 Exercices ............. . . . 132
4 Calculs de base en assurance vie et décès 133
4.1 Quelques notations ........... . . . . 133
4.2 Calculs d’annuités ........... . . . . 137
4.3 Calculs de provisions mathématiques ......... 140
4.4 Algorithme récursif en assurance-vie ......... 147
4.5 Le package lifecontingencies ......... . . . . 150
4.6 Exercices ............. . . . 155
v
5 Les tables prospectives 159
5.1 Les bases de données prospectives ......... . . 159
5.2 Le modèle de Lee & Carter ..........166
5.3 Utilisation du modèle de Lee-Carter projeté ....... . . 178
5.4 Aller plus loin que le modèle de Lee-Carter ....... . . 181
5.5 Exercices ............. . . . 182
A Annexes 185
A.1 Les lois de probabilités ........... . . 185
A.2 Générateurs aléatoires ........... . . 187
Bibliographie 195
Index 203
Index des commandes 206
Chapitre 1 Modèles de sinistres sans variables explicatives
Plusieurs des techniques actuarielles étudiées dans cet ouvrage requièrent de connaˆ?tre la loi de probabilité du montant ou du nombre de sinistres dans un portefeuille d’assurance non-vie. Le présent chapitre passe en revue les techniques les plus couramment utilisées pour déterminer ces lois à partir d’échantillon de données. En dehors de données simulées pour évaluer la robustesses des estimateurs, nous étudierons deux jeux de données : dental et vents contenant des montants de réclamation en assurance dentaire et des vitesses de vent de deux stations en région RhôneAlpes, respectivement.
Nous débutons le chapitre par un rappel des principales lois utilisées en assurance nonvie dans la section 1.1. En sections 1.2 et 1.3, nous présentons les deux grandes méthodes d’estimation, à savoir l’approche non-paramétrique et l’approche paramétrique, respectivement. Enfin, la section 1.4 termine ce chapitre en présentant les méthodes de calibration standard pour les copules.
1.1 Rappels des lois usuelles en actuariat
De la définition même des risques d’assurance (et leur caractère incertain), les actuaires ont besoin d’utiliser les outils probabilistiques pour modéliser les phénomènes aléatoires. Les lois de probabilités s’attachent à préciser, formaliser et différencier les phénomènes aléatoires. Cette section a pour but de rappeler les lois de probabilités usuelles en actuariat non-vie. Pour une introduction aux probabilités, nous renvoyons le lecteur vers les ouvrages de références, par exemple, Amiot (1999), Moral et al. (2006), Delmas (2012).
Notons X une variable aléatoire représentant notre quantité d’intérêt, par exemple le montant du sinistre ou le nombre de sinistres au sein d’un portefeuille d’assurance. Une fa¸con classique de caractériser X est d’en préciser sa fonction de répartition FX : x 7? P(X ? x) sur R, ou un domaine D ? R pouvant être borné ou non. Rappelons que FX doit être une fonction croissante, continue à gauche de D dans [0,1]. Deux cas doivent être distingués, soit la fonction FX possède une dérivée notée fX : cas des variables continues, soit elle n’en possède pas : cas des variables discrètes et/ou des variables mixtes. Ci-dessous, nous présentons donc dans un premier temps les lois continues. Ensuite, nous décrivons les lois discrètes et les mixtes. Enfin, nous terminons par les lois multivariées et les copules.
En commentaire général sur les distribution les plus classiques, R fournit la densité ou la fonction de masse de probabilité d, la fonction de répartition p, la fonction quantile q et un générateur aléatoire r associées. Pour une loi de probabilité de racine toto, on a dons les 4 fonctions dtoto, ptoto, qtoto, rtoto. Si on souhaite utiliser une loi non-implémentée dans R, de nombreux packages comblent ce manque, voir la “task view” pour une liste exhaustive . Dans cette longue liste, citons notamment le package actuar - dédié à l’actuariat - implémentant en plus les 18 lois de probabilités que nous détaillons dans la section suivante. De plus, actuar fournit également des fonctions auxiliaires pour les 18 lois et celles de R : les moments ordinaires E(Xk), les moments limités E(min(X,x)k), la fonction génératrice des momentssous réserve que ces quantités existent. Trois préfixes ont donc été rajoutés m, lev et mgf. Par exemple, la fonction mgfgamma implémente la fonction génératrice des moments de la loi gamma.
1.1.1 Les lois continues
Dans cette sous-section, nous supposons que la loi de probabilité possède une densité fX. En annexe A.1.1, nous rappelons la génèse des différentes densités proposées dans la littérature scientifique à l’aide du système de Pearson. Nous renvoyons le lecteur vers Kotz et al. (1994a,b) pour plus de détails sur les lois continues.
Les lois classiques en actuariat
Traditionnellement en actuariat, comme les principales quantités d’intérêt sont des couˆts ou des durées, les lois de probabilités les plus utilisées sont celles à support positif. Les trois lois positives les plus courantes sont les suivantes :
– la loi gamma dont la densité dgamma s’écrit :
,
ou` x ? 0, ?,? > 0 (les paramètres sont notés shape et rate sous R) et ? représente la fonction Gamma. Si ? = 1, on retrouve la loi exponentielle. La fonction de répartition n’a de forme explicite puisqu’elle s’exprime à l’aide de la fonction Gamma incomplète ?(,) :
FX(x) = ?(?,?x)/?(?),
ou`, voir Olver et al. (2010) pour les détails sur la fonction gamma incomplète inférieure.
Lorsque ? = 1, la distribution est appelée une exponentielle et lorsque ? = r/2 et ? = 1/2, la distribution est appelée loi du chi-deux avec r degrés de liberté. Le mode de la distribution est en x = 0 si ? ? 1 et en x > 0 si ? > 1.
Enfin, une distribution gamma avec paramètre ? entier est également nommée Erlang. Dans ce cas, on a
.
– la loi log-normale dont la densité dlnorm s’écrit :
,
pour x > 0, µ ? R et ?2> 0 (les paramètres sont notés meanlog et sdlog respectivement sous R). Sa fonction de répartition est simplement
,
ou` x > 0 et ? dénote la fonction de répartition de la loi normale centrée réduite). – la loi de Weibull dont la densité dweibull s’écrit :
,
ou` x > 0 and ?,? > 0 (notés scale et shape respectivement. Sa fonction de répartition possède l’expression suivante ?(x)?
FX(x) = 1 ? e ? .
Comme le montre la figure 1.1, ces lois des plus usuelles ont des densités assez différentes et possèdent des propriétés très différentes. Les paramètres ont été choisis de manière à ce que les trois lois soient d’espérance 1.
Figure 1.1 – Densités de lois usuelles pour des variables positives.
Dans le tableau 1.1, on a listé par ordre alphabétique les lois continues présentes avec R. Notons que ce tableau 1.1 contient des lois à support infini comme la loi normale, des lois à support borné comme la loi béta ou des lois à support positif comme la loi exponentielle.
Les familles de lois continues
Pour obtenir d’autres lois, on peut appliquer différentes transformations sur ces lois :
– une translation X ? c (par exemple la loi lognormale translatée pour X lognormale),
Lois de probabilité |
Racine |
Lois de probabilité |
Racine |
beta |
beta |
logistique |
logis |
Cauchy |
cauchy |
lognormale |
lnorm |
chi-2 |
chisq |
normale |
norm |
exponentielle |
exp |
Student t |
t |
Fisher F |
f |
uniforme |
unif |
gamma |
gamma |
Weibull |
weibull |
Table 1.1 – Loi implémentées dans R.
– une mise à l’échelle ?X (par exemple la loi normale pour X normale centrée réduite),
– une puissance X? (par exemple la loi beta type 1 généralisée pour X de loi beta type 1),
– un inverse 1/X (par exemple la loi inverse gamma pour X gamma),
– un logarithme log(X) (par exemple la loi loglogistique pour X logistique),
– une exponentielle eX (par exemple la loi Pareto pour X exponentiel), – un ratio X/(1 ? X) (par exemple la loi béta type 2 pour X une loi béta type 1). Pour chacune des transformations ci-dessus, on peut facilement déduire la densité en calculant la transformée inverse. Par exemple, pour Y = ?X, on a fY (y) = fX(y/?). Dans R, il est facile de générer des réalisations de telles transformations. Choisissons par exemple Y = logX ou` X est une loi uniforme sur [0,1].
> x
> y
> par(mar=c(4, 4, 2, 1), mfrow=c(1, 2))
> hist(y)
> plot(ecdf(y), do.points=FALSE)

> curve(pexp, 0, max(y), add=TRUE, col="grey50")
Comme nous le verrons plus tard, la variable Y est de loi exponentielle de paramètre 1, voir la figure 1.2.
Histogram of y ecdf(y)
Figure 1.2 – Transformée logarithmique.
Nous présentons maintenant deux grandes familles de lois basées sur les transformées puissance et ratio, respectivement la famille gamma transformée et béta transformée.
?Gamma transformée ?
Figure 1.3 – Relations entre les membres de la famille gamma transformée
Gamma transformée Les trois lois de la figure ?? n’étant pas à queue de distribution épaisse, on utilise très souvent d’autres lois pour modéliser le montant des sinistres élevés. La famille gamma transformée est une extension de la famille gamma obtenue par transformation d’une variable aléatoire gamma. Soit X ? G(?,1) et
Y = X1/?/?,
alors Y suit une loi gamma transformée GT(?,?,?) pour ? > 0. Elle a pour densité et fonction de répartition
, et FY (y) = ?(?,(?y)?)/?(?).
Lorsque ?? ? 1, le mode de la distribution est en y = 0. Lorsque ?? > 1, le mode de la densité est alors en y > 0.
Notons que pour ? = 1, on retrouve la loi de Weibull et pour ? = 1 la loi gamma. Ces relations sont illutrées à la figure 1.3. Si ? < 0 dans la transformation de X en posant ?? = ??, alors on obtient
, et FY (y) = 1 ? ?(?,(?y)???)/?(?).
Béta transformée La loi béta (de première espèce) est une variable aléatoire continue sur [0,1] et peut être utilisée quelque fois pour modéliser des taux de destruction. Néanmoins c’est surtout sa transformée logit à valeurs dans R+ qui est utilisé pour modéliser le montant des sinistres. Cette loi est appélée loi béta de seconde espèce.
Soit X une variable de loi Béta 1 ?1(a,b). Sa densité est donnée par
ou` x ? [0,1], a,b > 0 et ?(.,.) est la fonction béta, au sens ou` ?(a,b) = ?(a)?(b)/?(a + b). Très logiquement sa fonction de répartition s’exprime en fonction d’une fonction béta incomplète ?(a,b,.)
On en déduit que la variable a pour densité
En appliquant deux transformations de plus, a pour densité une loi béta transformée
Sa fonction de réparatition s’exprime par
, avec v = (y/?)?.
La famille bêta transformée compte plusieurs membres dont, entre autres : la loi de Burr(b,?,?) lorsque a = 1, la loi de Pareto généralisée(b,a,?) lorsque ? = 1, la loi de Pareto (b,?) lorsque ? = a = 1. Ces relations sont illustrées à la figure 1.4.
Fig. 1.6. Relations entre les membres de la famille bêta transformée
Figure 1.4 – Relations entre les membres de la famille béta transformée
Comparaison de lois actuarielles
La figure 1.5 trace la densité de trois grandes lois utilisées en actuariat non vie, à savoir la loi de Pareto, la Béta transformée et la gamma transformée.
Figure 1.5 – Densités de lois actuarielles
Le tableau 1.1 présentait les lois de base de R. Dans le tableau 1.2, on trouve la liste de lois très spécifiques et très adaptées à l’actuariat non-vie, proposées dans le package actuar, (Dutang et al. 2008). Il est composé de colonnes comportant le nom de la famille de lois, le nom de la loi de probabilité et de la racine de la fonction R correspondante.
Famille |
Lois de probabilité |
Racine |
Transformed beta |
Transformed beta |
trbeta |
Burr |
burr |
|
Loglogistic |
llogis |
|
Paralogistic |
paralogis |
|
Generalized Pareto |
genpareto |
|
Pareto |
pareto |
|
Inverse Burr |
invburr |
|
Inverse Pareto |
invpareto |
|
Inverse paralogistic |
invparalogis |
|
Transformed gamma |
Transformed gamma |
trgamma |
Inverse transformed gamma |
invtrgamma |
|
Inverse gamma |
invgamma |
|
Inverse Weibull |
invweibull |
|
Inverse exponential |
invexp |
|
Other |
Loggamma |
lgamma |
Single parameter Pareto |
pareto1 |
|
Generalized beta |
genbeta |
Table 1.2 – Loi implémentées dans actuar
1.1.2 Les lois discrètes
Considérons maintenant une variable aléatoire X que l’on associera à un comptage. On caractérisera ces variables discrètes par leur probabilité élémentaire, ou leur fonction de masse de probabilité. Les 3 lois usuelles discrètes sont :
– la loi binomiale de fonction de probabilité dbinom donnée par
,
ouèst le nombre de combinaison de k éléments parmiet ?
0 ? p ? 1 la probabilité de “succès”. Cette loi vérifie EX > V[X]. – la loi de Poisson de fonction de probabilité dpois donnée par,
ou` ? > 0 est le paramètre de forme et k ? N. Cette loi vérifie EX = V[X]. – la loi binomiale négative de fonction de probabilité dnbinom donnée par
ou` k ? N et p ? [0,1]. Lorsque m = 1, on trouve la loi géométrique de paramètre p. Cette loi vérifie EX < VarX.
Ces 3 lois permettent de modéliser une majorité des variables discrètes. La figure 1.6 compare les lois discrètes à espérance égale (E(X) = 5).
Figure 1.6 – Fonctions de masse de probabilité des lois discrètes usuelles
En fait, ces trois lois font partie de la famille dite de Sundt (a,b, 0), dont les probabilités élémentaires vérifient pour k ? 0 et a,b deux paramètres. On retrouve la loi binomiale avec la loi de Poisson avec
a = 0 et b = ?,
et enfin la loi Binomiale Négative avec
a = 1 ? p et b = (1 ? p)(m ? 1).
La famille (a, b, 0) va être utilisée pour les lois composées. De manière plus générale, on peut définir la famille (a, b, n) en tronquant la variable aléatoire pour les valeurs plus petites ou
égales à n ? 1. C’est à dire, on a
? 0 si k < n?
si k n
De plus, on peut parfois appliquer des transformations à ces lois usuelles comme supprimer la valeur en k = 0 ou en modifiant la valeur en k = 0. Pour obtenir les lois zéro-tronqués, il suffit de considérer la famille (a, b, 1).
Les versions zéros-modifiées s’obtiennent à partir des versions zéro-tronquées (a, b, 1). Notons XM la variable zéro-modifiée obtenu par d’une variable X. On définit les probabilités élémentaire par
si k = 0, ) sinon
ou` est la probabilité en 0 et X est la variable aléatoire sous-jacente que l’on considère, e.g. la loi de Poisson.
Des packages implémentent ces lois usuelles, néanmoins il est facile de les construire à la main! Créons la fonction de masse de probabilite
> dpoism
+ ifelse(x == 0, p0, (1-p0)/(1-dpois(0, ))*dpois(x, ))
Ensuite, il est facile d’afficher cette fonction en appelant le code suivant :
> x
> y
> y2
> y3
> y4
> plot(x, y, xlab="x", ylab="f(x)", ylim=range(y, y2, y3, y4[-(1:15)]),
+ col="black", type="b")
> lines(x, y2, col="blue", type="b")
> lines(x, y3, col="red", type="b")
> lines(x, y4, col="green", type="b")
> legend("topright",, col=c("black","blue","red","green"),lty=1) Sur la figure 1.7, on peut observer la décrochage en 0 pour la loi de Poisson zéro-modifiée de paramètre 1 et 2.
Figure 1.7 – La loi de Poisson zéro-modifiée.
Enfin, des lois plus paramétrées comme la loi hypergéométrique peuvent parfois être utilisées. Pour aller plus loin sur les lois discrètes, nous renvoyons le lecteur intéressé vers Johnson et al. (2005).
1.1.3 Les lois mixtes
Zéro-modifié
Les lois mixtes sont des lois de probabilité qui sont ni entièrement continues ni entièrement discrètes. Ce sont généralement des lois continues auxquelles on a rajouté des masses de probabilités. Typiquement pour modéliser le montant des sinistres, il peut être intéressant de considérer une masse en zéro (i.e. aucun sinistre) et une loi continue au delà de zéro (i.e. occurence d’un sinistre). Dans la littérature, on appelle ces lois du nom de la loi continue complétée de zéromodifié.