Document de formation en statistique et probabilites

Document de formation en statistique et probabilités
I- Le modèle probabiliste
Voici les premières phrases d'un manuel (1): "La théorie des probabilités est une science mathématique étudiant les lois régissant les phénomènes aléatoires. Un phénomène est aléatoire si, reproduit maintes fois, il se déroule chaque fois un peu différemment, de sorte que le résultat de l'expérience change d'une fois à l'autre d'une manière aléatoire, imprévisible."
L'usage même du mot expérience sous-entend que le phénomène aléatoire est observé par le biais d'un critère bien défini, et que le résultat de cette observation peut être décrit sans ambiguïté. L'expérience peut aussi être répétée, et on suppose que chacun des résultats possibles est observé avec une certaine fréquence dont la valeur se stabilise si on répète l'expérience maintes et "maintes fois". C'est cette "loi" que présuppose l'existence d'un modèle probabiliste.
Ce premier chapitre est une rapide présentation du cadre formel des m o d è l e sprobabilistes.
1-Evènements
Etant donnée une expérience aléatoire, on note W l'ensemble de tous les résultats possibles de cette expérience.
Un singleton de W est appelé évènement élémentaire .
Un sous-ensemble A de W est appelé un évènement . Un évènement A est donc un ensemble constitué de résultats possibles de l'expérience. Si le résultat d'une expérience est dans A, on dit que A est réalisé.
Exemple 1-1 : On détermine le sexe d'un nouveau-né. On posera :
W = {g, f}
Le résultat g signifie que le nouveau-né est un garçon et f que c'est une fille. ·
Exemple 1-2 : Sept étudiants doivent passer un oral d'examen. On leur distribue un numéro d'ordre. On pose :
W = {tous les alignements des sept lettres a, b, c, d, e, f, g} Le résultat cfabdeg signifie que l'étudiant c est le premier, a le second, ....
L'ensemble des arrangements qui commencent par cf est un évènement. ·
1 H.Ventsel : Théorie des probabilités. (Ed.MIR, traduction française 1973).
Exemple 1-3 : L'expérience consiste à déterminer la dose d'anésthésique minimale (exprimée en ml) à administrer à un patient pour l'endormir. On choisit :
W = ] 0, +¥[
L'évènement ] 2, 3] est réalisé si la dose minimale à administrer est comprise entre 2 et 3, c'est-à-dire si une quantité supérieure ou égale à 3 suffit à endormir le patient, mais une quantité inférieure à 2 est insuffisante. ·
Dans le cadre de la théorie des probabilités, un évènement est généralement défini comme l'ensemble des résultats ayant une propriété donnée. La plupart du temps, l'ensemble A est noté comme la propriété qui le définit. Donnons quelques exemples de telles assimilations :
W | : | évènement certain | |
Ø | : | évènement impossible | |
A | B | : | évènement (A ou B) |
A | B | : | évènement (A et B) |
Ac | : | (non A), évènement contraire de A | |
A | B = Ø | : | les évènements A et B sont incompatibles |
Exercice 1-1 : Soit W l'ensemble des résultats possibles d'une expérience aléatoire, et soient A, B et C des évènements. Traduire en termes ensemblistes les évènements :
- les trois évènements A, B et C sont réalisés
- aucun des évènements A, B ou C n'est réalisé
- au moins un des évènements est réalisé
- deux au plus des évènements est réalisé
2- Loi de probabilité, espace de probabilité
On tire une boule dans une urne contenant 2 boules blanches, 1 noire, 4 vertes, 5 rouges, et on regarde sa couleur. Si on répète cette expérience, la fréquence avec laquelle on obtient une boule rouge se stabilise peu à peu sur une valeur, égale ici à 5/12. On dit couramment qu'on a 5 chances sur 12 de tirer une boule rouge. Dans le cadre d'un modèle mathématique de cette expérience aléatoire, on dira que l'évènement "tirer une boule rouge" a la probabilité 5/12. Plus généralement, dans un modèle probabiliste, chaque évènement est pondéré par un nombre compris entre 0 et 1, sa probabilité. Ces probabilités doivent respecter certaines règles de compatibilité, naturelles si on les interprète en termes de "nombre de chances sur 100". L'additivité est la principale de ces règles. Appliquée à un cas particulier dans notre exemple, elle exprime simplement que, puisqu'on a 5 chances sur 12 de tirer une boule rouge et 2 chances sur 12 de tirer une blanche, on a 5+2 chances sur 12 de tirer une boule soit rouge soit blanche. L'autre règle dit seulement que si on tire une boule, on a 100% de chances de …tirer une boule…
Définition 1-1 : Soit W un ensemble. Une loi de probabilité P sur W est une fonction qui à tout évènement A associe un nombre réel P(A), et qui a les trois propriétés :
- 0 £ P(A) £ 1,
- P (W) = 1
- Pour toute famille finie ou dénombrable (A n)nÎI d'évènements deux à deux disjoints :
P(An) = | å P(An) . |
nÎI | nÎI |
(W, P) s'appelle un espace de probabilité .
Exemple 1-4 : On lance un dé et on observe la face du dessus. On posera :
W = {1, 2, 3, 4, 5, 6} et on supposera que le dé est parfaitement équilibré, de sorte que la probabilité de chaque face est la même :
1 P({1}) = P({2}) = P({3}) = P({4}) = P({5}) = P({6}) = 6 .
Remarquons qu'alors, la probabilité de tout évènement est calculable en utilisant la propriété c) de la définition. Par exemple, comme {1, 3, 4} est la réunion des trois ensembles 2 à 2 incompatibles {1}, {3} et {4}, on a :
P({1, 3, 4}) = P({1}) + P({3}) + P({4}) = | 1 | + | 1 | + | 1 | = | 3 | = | 1 | .· | |
6 | 6 | 6 | 6 | 2 |
Plus généralement, soit W un ensemble fini :
W = {w1, w2, ...., wn}
Définir une loi de probabilité P sur W revient à se donner n réels positifs ou nuls p 1, p2,
...., pn tels que å pk = 1, et à poser, pour tout indice k, P({ wk}) = pk. La loi de k=1
probabilité sur W est alors complètement déterminée car, étant donné un évènement A, P(A) est calculable en additionnant les probabilités p k de chacun des évènements élémentaires { wk} qui composent A.
Il en est de même si W est un ensemble dénombrable, les sommes finies sont alors remplacées par les sommes de séries.
Exercice 1-2 : Soit (W, P) un espace de probabilité. Répondre aux questions en utilisant la définition 1-1 :
- Si A est un évènement de probabilité P(A) connue, que vaut P(A c) ?
- Si A B, comparer P(A) et P(B).
- Calculer P(A ou B) en fonction de P(A et B), P(A) et P(B).
d) Montrer que P(A ou B) £ P(A)+P(B). Généraliser cette inégalité à un nombre fini d'évènements.
On pourrait aussi démontrer les propriétés suivantes :
Proposition 1-1 : a) Pour toute famille finie ou dénombrable (A n)nÎI d'évènements :
…
3- Le cas où les évènements élémentaires sont équiprobables
Soit (W, P) un espace de probabilité correspondant à une expérience aléatoire dont l'ensemble des résultats possibles est fini :
W = {w1, w2, ...., wn}
Supposons que chaque résultat "a autant de chances d'être réalisé qu'un autre", soit, en termes probabilistes, que P est telle que :
P({w1}) = P({w2}) = ... = P({wn})
…
Exercice 1-3 : Un jeune enfant qui ne sait pas lire prend les 6 jetons d'un jeu de Scrabble qui composaient le mot "CARTON". Il réaligne ces jetons au hasard. Avec quelle probabilité recompose-t-il ce mot ? Même question s'il a pris les 8 jetons qui composaient le mot "INSTITUT".
Exercice 1-4 : 20 sujets sont au programme d'un oral d'examen. Le candidat tire au sort 3 de ces sujets et traite l'un de ces trois. Combien doit-il avoir révisé de sujets pour avoir au moins 9 chances sur 10 de pouvoir traiter un sujet qu'il a révisé ?
Remarque sur le choix du modèle probabiliste
Comme dans tout problème de modélisation, il n'y a pas d'automatisme qui permette d'associer un espace de probabilité à une expérience aléatoire "concrète". Même dans des cas d'école, il n'y a jamais un seul "bon" choix : reprenons l'exemple de l'urne introduisant le paragraphe 2. Deux modèles peuvent être considérés comme naturels :
- On peut distinguer les 12 boules contenues dans l'urne en posant :
W = {B1, B2, N, V1, V2, V3, V4, R1, R2, R3, R4, R5} On munit alors W de la probabilité uniforme.
- On peut aussi choisir de ne représenter que la couleur de la boule tirée, en posant :
W = {B, N, V, R}
et en définissant P par :
P({B}) = 2/12 P({N}) = 1/12 P({V}) = 4/12 P({R}) = 5/12 . Il est clair cependant qu'il est difficile de justifier le deuxième modèle sans faire appel à l'idée d'équiprobabilité des tirages, idée qui par contre est clairement exprimée dans le premier modèle.
Un autre exemple, celui-là célèbre, est du type de celui de l' aiguille de Buffon : quelle est la longueur moyenne d'une corde d'un cercle de rayon r, comment représenter le tirage au hasard d'une telle corde ?
Dans des cas concrets de modélisation, les hypothèses sur lesquelles reposent la définition du modèle doivent être clairement énoncées, de telle sorte qu'elles puissent être commentées et éventuellement remises en question, soit directement, soit par leurs implications théoriques, soit par une confrontation avec des données expérimentales.
4-Exercices
Exercice 1-5 : Soit (W, P) un espace de probabilité, et soient A et B deux évènements. Montrer que si P(A) = P(B) = 0,9 , alors, P(A B) ³ 0,8 .
Dans le cas général, montrer que P(A B) ³ P(A)+ P(B) - 1 .
Exercice 1-6 : Deux personnes sont tirées au sort dans un groupe de 30 composé de 10 femmes et 20 hommes. Avec quelle probabilité ces deux personnes sont-elles des hommes ? Avec quelle probabilité sont-elles des femmes ?
Exercice 1-7 : Deux amis font partie d'un groupe de n personnes, auxquelles on a distribué au hasard des numéros d'ordre pour constituer une file d'attente.
- Avec quelle probabilité sont-ils les deux premiers ?
- Avec quelle probabilité sont-ils distants de r places, c'est-à-dire séparés par r-1 personnes. Représenter ces probabilités par un diagramme en bâtons.
Exercice 1-8 : Un tiroir contient en vrac les 20 chaussettes de 10 paires différentes. On en sort au hasard 4 chaussettes. Avec quelle probabilité obtient-on :
a) 2 paires b) au moins une paire
II- Probabilités conditionnelles
1-Définition
Lançons un dé parfaitement équilibré. Un bon modèle probabiliste en est donné par :
W = { 1, 2, 3, 4, 5, 6 }
muni de la loi de probabilité P uniforme.
Notons A l'évènement "le dé donne au moins 4 points" et B l'évènement "le résultat est impair". Supposons qu'on ne retienne le résultat du lancer que s'il est dans B. Dans cette nouvelle expérience, l'évènement A est réalisé quand on obtient un 5, et c'est avec la
…
A sachant que B, ou probabilité conditionnelle de A relative à B, etc…
Définition 2-1 : Soit (W, P) un espace de probabilité, et soit B un évènement tel que
P(B) ¹ 0. La probabilité de A sachant que B est notée P(A | B), et est définie par :
P(A | B) = P(A B)· P(B)
Exercice 2-1 : a) Soit B un évènement tel que P(B) ¹ 0. Montrer que l'application qui à A associe P( A | B ) est une loi de probabilité sur W.
b) Donner une propriété de A qui implique P(A | B) = 1, qui implique P(A | B) = 0, qui
P(A) implique P( A | B ) = P(B) .
Exercice 2-2 : Un couple a deux enfants. Sous l'une des conditions suivantes :
- l'aîné est un garçon,
- l'un des enfants est un garçon, avec quelle probabilité le couple a-t-il un fils et une fille ?
2- Deux résultats de décomposition
Les deux résultats de ce paragraphe utilisent "à l'envers" la définition 2-1, c'est-à-dire donnent un moyen de calcul de probabilités connaissant des probabilités conditionnelles. Ils sont très utiles dans la pratique.
Soient C1, C2, …, C |
Exemple 2-1 : Une urne contient deux boules blanches et une boule noire. Une personne tire une boule et la garde, une deuxième personne tire une boule. Avec quelle probabilité les deux boules tirées sont-elles blanches ? On peut répondre à cette question en utilisant la définition 2-1. En effet, notons A l'évènement "la première personne a tiré une boule blanche" et B l'évènement "la deuxième personne a tiré une boule blanche". D'après la définition, P(A et B) = P(B | A) P(A). Mais P(A) est connue, c'est 2/3. P(B | A) est aussi connue : c'est 1/2 car, la première personne ayant tiré une boule blanche, la deuxième personne tire une boule au hasard dans une urne qui contient une boule blanche et une boule noire. Ainsi, P(A et B) vaut (2/3).(1/2) = 1/3 .·
La proposition suivante, parfois appelé "théorème des probabilités composées", généralise ce procédé de calcul :
Proposition 2-1 : Soit (W, P) un espace de probabilité, et soient A 1, A2,…, A n des évènements. On a :
P(An et An-1 et… et A 1) =
= P(An | An-1 et… et A 1) P(An-1 | An-2 et… et A 1) … P(A 2 | A1) P(A1). ·
Cet énoncé est constamment utilisé dans le contexte des "chaînes de Markov", qui interviennent naturellement dans les problèmes concrets où A 1, A2,…, A n représente une succession (temporelle) d'évènements, la probabilité de réalisation du n-ième évènement An étant conditionnée par "le passé" (probabilité sachant que A 1 et … et A n-1 ont eu lieu). En voici un exemple simple :
Exercice 2-3: On sait que si le flash d'un appareil photo n'a pas eu panne durant les n premiers déclenchements (n entier positif ou nul), la probabilité pour qu'il fonctionne au (n+1)-ième est égale à p (0 < p <1 ).
- Quel est la probabilité pour qu'il n'ait pas de panne au cours des 100 premiers déclenchements ?
- Sachant qu'il a fonctionné n fois, avec quelle probabilité fontionnera-t-il au moins 100 fois de plus ?
n n évènements deux à deux disjoints et dont la réunion est l'ensemble de tous les résultats possibles W. En termes ensemblistes, {C1, C2, …, C n} est donc une partition de W ; en termes probabilistes, on l'appelle un système completd'évènements . Soit A un évènement. On a bien sûr :
A = (A C1) (A C2) … (A Cn)
et les ensembles (A C1), (A C2), …, (A Cn) sont deux à deux disjoints. Ainsi :
P(A) = P(A C1) + P(A C2) + … + P(A Cn)
et en utilisant la définition 2-1, on obtient le résultat :
Proposition 2-2 : Soit (W, P) un espace de probabilité, et soit {C 1, C2, …, C n} un système complet d'évènements. Soit A un évènement. On a :
P(A) = P(A | C1) P(C1) + P(A | C2) P(C2) + … + P(A | C n) P(Cn) ·
(Remarquons sans démonstration que ce résultat se généralise à un système complet dénombrable d'évènements.)
Exercice 2-4 : En mars 1994 (enquête sur l'emploi INSEE 1994), la population active en France comprend 44,7% de femmes. Le taux de chômage chez les hommes est 10,8% ; il est chez les femmes 14,3% . On tire au sort une personne parmi les actifs.
- Avec quelle probabilité est-elle au chômage ?
- Sachant qu'elle est au chômage, avec quelle probabilité est-ce une femme ?
3- Evènements indépendants
Il est naturel de poser que, du point de vue de leur probabilité de réalisation, deux évènements A et B sont indépendants si le fait de savoir que B est réalisé n'apporte pas d'information sur les chances de réalisation de A, c'est-à-dire si la probabilité de A sachant que B est égale à P(A), et donc si P(A B) = P(A) P(B). Posons pour définition plus générale la suivante :
Définition 2-2 : Soit (W, P) un espace de probabilité, et soit (A i)iÎI une famille d'évènements. On dit que ces évènements sont indépendants dans leur ensemble si,
quelle que soit la partie finie J de I, P( | Aj ) = Õ P(Aj). · |
jÎJ | jÎJ |
Exercice 2-5 : a) Montrer que si A et B sont indépendants, A et B c, Ac et B, Ac et Bc le sont aussi. Généraliser cette remarque au cas d'une famille finie d'évènements indépendants dans leur ensemble.
- Deux évènements A et B incompatibles sont-ils indépendants ?
- Par un diagramme donner un exemple d'évènements A, B, C deux à deux indépendants mais qui ne sont pas indépendants dans leur ensemble.
Remarque : Lançons deux dés, chacun parfaitement équilibré. L'ensemble des résultats possibles est :
W = { (i, j), 1 £ i £ 6, 1 £ j £ 6 } = {1, …, 6} {1, …, 6}
Notons A l'évènement "le premier dé donne 4". Comme le premier dé est parfaitement équilibré, la probabilité de A est 1/6. Notons B l'évènement "le deuxième dé donne 6". Comme le deuxième dé est parfaitement équilibré, la probabilité de A est 1/6. De plus, nous pouvons sans difficulté supposer que les évènements A et B sont indépendants. Donc, la probabilité de (A et B), c'est-à-dire de l'évènement élémentaire (4, 6), est égale à (1/6).(1/6) = 1/36, et de même bien sûr pour tout autre couple (i, j). Ce raisonnement confirme le choix de la loi uniforme sur W pour représenter l'expérience aléatoire du lancer de deux dés.
Exercice 2-6 : On lance deux dés. Avec quelle probabilité la somme des points obtenus est-elle égale à 11 ? à 10 ?
Plus généralement, considérons une expérience aléatoire dont ( W, P) est un modèle
…
4-Exercices
Exercice 2-7 : Avec quelle probabilité une famille de 3 enfants comporte-t-elle au moins un garçon ?
Exercice 2-8 : Dans un groupe de 20 personnes, quelle est la probabilité pour qu'il n'y ait jamais plus d'un anniversaire par jour ? Et dans un groupe de 50 personnes ? (on fera comme si toutes les années avaient 365 jours).
Exercice 2-9 : Une expérience est conduite pour étudier la mémoire des rats. Un rat est mis devant trois couloirs. Au bout de l'un d'eux se trouve de la nourriture qu'il aime, au bout des deux autres, il reçoit une décharge électrique. Cette expérience élémentaire est répétée jusqu'à ce que le rat trouve le bon couloir. Sous chacune des hypothèses suivantes
:
(H1) le rat n'a aucun souvenir des expériences antérieures,
(H2) le rat se souvient de l'expérience immédiatement précédente,
(H3) le rat se souvient des deux expériences précédentes, avec quelle probabilité la première tentative réussie est-elle la k-ième ? Représenter graphiquement les réponses.
Exercice 2-10 : Pour décider d'un traitement thérapeutique, on utilise un test qui est positif 99 fois sur 100 si une personne est effectivement malade. Mais si une personne n'est pas malade, le test est positif une fois sur 100. On sait par ailleurs que 5 personnes sur 100 ont cette maladie.
- Si le test d'une personne est positif, avec quelle probabilité cette personne est-elle effectivement malade ?
- Si le test d'une personne est négatif, avec quelle probabilité cette personne n'est-elle effectivement pas malade ?
Calculer ces probabilités quand on sait que 5 personnes sur 1000 ont cette maladie.
Exercice 2-11 : La probabilité de fermeture du relai i des circuits décrits ci-dessous est p i. Tous les relais fonctionnent indépendamment. Dans chacun des cas suivants, quelle est la probabilité pour que le courant passe entre A et B ?
- A et B sont séparés par n relais reliés en série.
- A et B sont séparés par n relais reliés en parallèle.
…
Exercice 2-12 : On transmet un message composé de n symboles binaires '0' ou '1'. Lors de la transmission, chaque symbole est perturbé avec la probabilité p et se transforme alors en symbole opposé. Par précaution, le message est transmis deux fois. Si les deux messages transmis coïncident, l'information est considérée comme correcte.
- Avec quelle probabilité le i-ième symbole du premier message transmis est-il identique au i-ième symbole du deuxième message transmis ?
- Avec quelle probabilité les deux messages transmis sont-ils identiques ?
- Trouver la probabilité pour que, malgré la coïncidence des deux messages, l'information s'avère erronée. (Application numérique : n = 100 p = 0,001 ).
Exercice 2-13 : Un candidat d'un jeu télévisé américain est face à trois portes. Derrière l'une d'elles se trouve le prix, - une voiture -. Le candidat se place devant la porte de son choix. Le présentateur de l'émission, qui lui sait où se trouve la voiture, ouvre alors l'une des deux autres portes et indique au candidat que la voiture ne s'y trouve pas. Le candidat peut à son tour ouvrir une porte. S'il découvre la voiture, il la gagne.
Un candidat décide d'adopter l'une des trois stratégies suivantes :
- ouvrir la porte devant laquelle il s'est placé à l'issu de son premier choix,
- ouvrir l'autre porte,
- tirer à pile ou face et, s'il obtient pile, ouvrir la porte devant laquelle il s'est placé à l'issu de son premier choix, ouvrir l'autre porte s'il obtient face.
L'une de ces trois stratégies est-elle préférable aux autres ?
III- Variables aléatoires : généralités
1-Définitions
Dans beaucoup de situations, le détail du résultat d'une expérience aléatoire ne nous intéresse pas, mais seulement une valeur numérique fonction de ce résultat. Par exemple, on peut se demander quel est le nombre de pannes d'un ordinateur sur une durée d'un an, sans être intéressé par les dates auxquelles ont lieu ces pannes. Etudions un exemple plus simple :
Exemple 3-1 : On lance deux dés, et on regarde la somme des points obtenus. On choisit pour modèle probabiliste du lancer des deux dés :
W = { (i, j) , 1 £ i £ 6 , 1 £ j £ 6 }
muni de la loi de probabilité P uniforme, qui affecte à chaque évènement élémentaire (i, j) la probabilité P{(i, j)} = 1/36. Avec quelle probabilité la somme des points obtenus est-elle égale, par exemple, à 5 ? C'est la probabilité de l'ensemble des évènements élémentaires (i, j) qui réalisent cette condition.
Introduisons l'application S de W dans , qu'on dira être unevariable aléatoire , définie par :
" (i, j)ÎW S(i, j) = i + j
La question posée est le calcul de la probabilité de l'évènement { (i, j) ÎW / S(i, j) = 5 }, c'est-à-dire de l'évènement { (1, 4), (2, 3), (3, 2), (4, 1) }. On notera cet évènement, de façon simplifiée, { S = 5 }. On trouve :
P({ S = 5 }) = P({ (i, j)ÎW / S(i, j) = 5 }) = P({ (1, 4), (2, 3), (3, 2), (4, 1) }) = 4/36 . Remarquons que S prend ses valeurs dans {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} et que, par conséquent :
12 | { S = k } ) = P(W) = 1 . · |
å P({ S = k }) = P( | |
k=2 | kÎ{2,…,12} |
Abordons maintenant le cas général, dans lequel l'ensemble des valeurs prises par une variable aléatoire n'est pas forcément fini ou dénombrable :
Définition 3-1 : On appellevariable aléatoire une application X définie sur un espace de probabilité ( W, P) et à valeurs réelles.
La fonction de répartition F d'une variable aléatoire X est la fonction de dans définie, pour tout réel x, par :
F(x) = P({ X£x }) ·
P( X = 1 ), |
Exercice 3-1 : Représenter la fonction de répartition de la variable aléatoire S de l'exemple 3-1.
Exercice 3-2 : Soit X une variable aléatoire, et soit F sa fonction de répartition. Pour a et b réels (a < b), exprimer en fonction de F :
P( X > a ), P( a < X £ b ),
P( X < a ) (utiliser la proposition 1-1-b), P( X ³ a), P( X = a ), P( a £ X < b ), …
Cet exercice montre que la connaissance de la fonction de répartition F d'une variable aléatoire X permet de calculer, pour n'importe quel intervalle I de , la probabilité P({ XÎI }). On peut démontrer qu'elle permet aussi, - en principe tout du moins -, de calculer la probabilité P({ X ÎB }) pour n'importe quel sous-ensemble B de . On dit en résumé que la fonction de répartition de X détermine la loi ou la loi de probabilité de X. (Le vocabulaire est justifié par le fait que l'application qui à un sous-ensemble B de associe P({ XÎB }) est une loi de probabilité sur ).
On peut montrer sans difficulté que, si F est la fonction de répartition d'une variable aléatoire :
- F est croissante,
- F est continue à droite en tout point,
c)lim | ¥ | F(x) = 0 | lim | F(x) = 1. |
x ® - | x ® + ¥ |
et inversement, mais la démonstration n'est pas élémentaire, qu'une fonction F de dans qui vérifie les propriétés a), b) et c) est la fonction de répartition d'une variable aléatoire.
Exercice 3-3: Soit X une variable aléatoire. On suppose que sa fonction de répartition F est donnée par :
F(x) = 0 | si | x < 0 | ||||
= | 1 | + | 2 | (1- e-x ) | si | x ³ 0 |
3 | 3 |
- Dessiner le graphe de F.
- Calculer :
P( X > -2 ), P( XÎ]1-1/n, 1] ), P( XÎ] -1/n, 0] ), P ( X = 0 )
2- Variables aléatoires discrètes, variables aléatoires à densité
- Une variable aléatoire X qui prend ses valeurs dans un sous-ensemble fini ou dénombrable { x i , iÎI } de est dite discrète . Notons :
pi = P(X=xi).
Les pi sont des réels de [0, 1] et tels que å pi = 1. iÎI
La donnée des p i définit la loi de la variable aléatoire X, puisque pour tout sous-ensemble A de :
P(XÎA) = å pi .i / xiÎ A
La fonction de répartition F de X s'exprime, pour tout a réel, par :
F(a) = å pii / xi£ a
Nous avons vu sur un exemple (exercice 3-1) que, tout du moins quand il n'y a qu'un nombre fini de xi par intervalle borné, F est constante par morceaux, et que ses discontinuités sont situées aux points d'abscisse x i, la hauteur du saut correspondant étant pi.
- On dit qu'une variable aléatoire X est à densité s'il existe une fonction f de dans ,
positive ou nulle, et telle que, pour tout sous-ensemble B de :
P( X Î B ) = ò f(x) dx .B
On appelle cette fonction f la fonction de densité de probabilité de la variable aléatoire X.
Exercice 3-4 : On fait tourner une aiguille autour d'un axe et on repère la position sur laquelle elle s'arrête par un angle Q de [0, 2p[.
- Quelles valeurs proposer pour P( 0 £ Q < p ), P( p £ Q < 2p ), P( p/2 £ Q < 3p/2 ) ? Et pour P(QÎI) lorsque I est un sous-intervalle de [0, 2p[ ?
- Peut-on proposer une fonction f qui soit la densité de la loi de Q ?
Remarquons que si X est une variable aléatoire à densité, la densité f vérifie nécessairement :
+¥ò f(x) dx = 1.-¥
De plus, quels que soient a et b ( a < b ) :
P( X = a ) = 0
P( a < X < b) = P( a £ X < b) = P( a < X £ b) = P( a £ X £ b) =bò f(x) dxa
La fonction de répartition F de X est donnée par :
aF(a) = òf(x) dx-¥
et elle est continue.
Exercice 3-5 : Soit X une variable aléatoire à densité f définie par :
f(x) = c x si 1 £ x £ 4 = 0 sinon
- Calculer la valeur de c.
- Que vaut P( 1 £ X £ 2 ) ?
- Calculer et représenter graphiquement la fonction de répartition de X.
- Concluons ce paragraphe en signalant qu'une variable aléatoire peut n'être ni discrète, ni à densité, mais mixte :
Exercice 3-6 : Reprendre l'exemple de l'exercice 3-3, et montrer qu'on peut écrire :
…
3- Couples de variables aléatoires
Soit (W, P) un espace de probabilité, et soient X et Y deux variables aléatoires définies sur cet espace. Le couple (X, Y) définit ce que l'on peut appeler une variable aléatoire àvaleurs dans 2: à tout w de W, il associe en effet le vecteur (X(w), Y(w)).
La loi de (X, Y), souvent appelée loi conjointe de (X, Y), est déterminée par la donnée,
pour tout sous-ensemble C de 2, de la probabilité P({ (X, Y) Î C }).
On montre que la loi conjointe de (X, Y) est déterminée dès qu'on connaît P(XÎA et YÎB ) pour tout couple (A, B) de sous-ensembles de. On montre aussi qu'il suffit pour cela de connaître la fonction de répartition F du couple (X, Y) qui est définie par :
" (x, y)Î 2
F(x, y) = P({ X£x et Y£y }) .
Remarquons que si la loi conjointe de (X, Y) est connue, on en déduit les lois de X et de Y, appelées dans ce contexte lois marginales. En effet, pour tout sous-ensemble A de :
{ XÎA } = { XÎA et YÎ } = { (X, Y) ÎA } ,
et on tire :
P ( XÎA ) = P ( (X, Y) ÎA ) .
Exercice 3-7 : Soient (X, Y) un couple de variables aléatoires dont la loi est telle que, si i et j sont deux entiers tels que 0 £ i £ 2 et -i £ j £ i, P{ (X, Y) = (i, j) } = 19 .
- Représenter graphiquement les valeurs prises par le couple (X, Y).
- Quelle sont les lois marginales de X et Y ?
4- Variables aléatoires indépendantes
Définition 3-2 : Soient X et Y deux variables aléatoires définies sur un espace de probabilité ( W, P). On dit qu'elles sont indépendantes si pour tout couple (A, B) de sous-ensembles de , les évènements { X ÎA } et { YÎB }sont indépendants, c'est-à-dire si :
P ( XÎA et YÎB ) = P( XÎA ) P( YÎB ) ·
Exercice 3-8 : a) Soient (X, Y) un couple de variables aléatoires de loi donnée par :
P{ (X, Y) = (-1, 0) } = P{ (X, Y) = (1, 0) } =
1 = P{ (X, Y) = (0, -1) } = P{ (X, Y) = (0, 1) } = 4 .
X et Y sont-elles indépendantes ?
b) même question avec les données de l'exercice 3-7.
Exercice 3-9 : Supposons X et Y discrètes, et plus précisément que X prend ses valeurs dans le sous-ensemble fini ou dénombrable { x i , iÎI } de , et que Y prend ses valeurs dans le sous-ensemble fini ou dénombrable { y j , jÎJ }de . Montrer que X et Y sont indépendantes si et seulement si pour tout couple (i, j) de I J :
P(X=xi et Y=yj) = P(X=xi ) P(Y=yj).
Dans le cas général, on montre la proposition :
Proposition 3-1 : Soient X et Y deux variables aléatoires définies sur un espace de probabilité ( W, P), de fonctions de répartitions F X et FY. X et Y sont indépendantes si et seulement si, pour tout couple (x, y) de réels :
P( X £ x et Y £ y ) = FX(x) FY(y) ·
Le résultat suivant est utile :
Proposition 3-2 : Soient X et Y deux variables aléatoires définies sur un espace de probabilité ( W, P). Soient f et y deux applications de dans . Si X et Y sont indépendantes, alors, f(X) et y(Y) sont des variables aléatoires indépendantes. ·
Enonçons enfin une extension de la définition :
Considérons une famille (X i)iÎI de variables aléatoires définies sur un espace de probabilité ( W, P).
…
5-Exercices
Exercice 3-10 : On équipe un local souterrain de 5 ampoules électriques. On suppose que les durées de vie de ces ampoules sont des variables aléatoires indépendantes, et de même densité f donnée par :
f(x) | = | 200 | si x > 200 |
x2 | |||
= | sinon . |
On contrôle l'état des ampoules après 300 heures d'utilisation. Avec quelle probabilité deux (exactement) des ampoules sont-elles hors d'usage.
Exercice 3-11 : Une boîte contient 5 transistors, dont on sait que 3 sont défectueux. On teste l'un après l'autre les transistors et on les met de côté, jusqu'à avoir trouvé les défectueux. On note N 1 le nombre de tests effectués pour trouver le premier transistor défectueux, et N 2 le nombre de tests complémentaires effectués pour trouver le deuxième. Décrire la loi conjointe de N 1 et N2.
Exercice 3-12 : Soient X1,…, X n des variables aléatoires indépendantes et suivant toutes la loi uniforme sur [0, 1]. On pose :
M = max (X1,…, X n)
a) Quelle est la fonction de répartition de M ? Quelle est la densité de la loi de M ? b) Mêmes questions avec min (X 1,…, X n).
IV- Caractéristiques numériques des variables aléatoires
1- Espérance
Soit X une variable aléatoire sur un espace de probabilité ( W, P). L'espérance E(X) de X est la valeur moyenne des valeurs prises par X, pondérées par leur probabilité de réalisation. Les mathématiciens disposent d'une théorie, la théorie de la mesure , dans laquelle l'intégrale òX(w) dP(w) a un sens. Ils définissent E(X) par cette intégrale. Si W
W est fini ou dénombrable, cette intégrale est simplement la somme å X(w) P({w}), w Î W mais le cas général est plus complexe. Ici, nous nous restreignons aux deux cas particuliers des variables aléatoires discrètes ou à densité, et nous utiliserons comme définition de l'espérance les caractérisations suivantes :
- Si X est discrète et prend ses valeurs dans un sous-ensemble fini ou dénombrable
{ xi , iÎI } :
E(X) = å xi P ( X = xi ) iÎ I
- Si X est à densité f :
+¥
E(X) = òx f ( x ) d x
- ¥
Exercice 4-1 : Quelle est l'espérance de la variable aléatoire qui représente le nombre de points obtenus en lançant un dé ?
Exercice 4-2 : Quelle est l'espérance de la variable aléatoire de l'exercice 3-4 ?
Exercice 4-3 : Dans chacun des deux cas suivants, calculer E(X), décrire la loi de X 2 et calculer E(X2) :
a) P( X = -2 ) = 0,1 P( X = 1 ) = 0,6 P( X = 2 ) = 0,3 b) X à densité f définie par :
f(x) = 1/2 si -1 £ x £ 1
= 0 sinon .
Pour calculer l'espérance X2 ou plus généralement d'une fonction f(X) de X, on peut éviter la détermination de la loi de f(X) en utilisant le résultat suivant :
Proposition 4-1 : Soit X une variable aléatoire et soit f une fonction de dans .
- Si X est discrète et prend ses valeurs dans un sous-ensemble fini ou dénombrable
…
Exercice 4-4 : Reprendre les exemples de l'exercice 4-3 et calculer E(X2) en utilisant la proposition 4-1.
L'énoncé suivant sera très utilisé par la suite :
Proposition 4-2 : Soient X et Y deux variables aléatoires sur un espace de probabilité (W, P), et soient a et b deux réels. Alors :
E(aX+b) = aE(X) + b E(X+Y) = E(X) + E(Y) ·
Exercice 4-5 : Montrer la deuxième égalité de cette proposition dans le cas où les lois de X et Y sont discrètes.
Exercice 4-6 : On lance deux dés, et on note S la variable aléatoire qui représente la somme des points obtenus. Quelle est l'espérance de S ?
2- Variance, covariance
Exemple 4-2 : Considérons les quatre variables aléatoires :
X1 = 0, c'est-à-dire la variable "aléatoire" constante et nulle, X2 de loi uniforme sur [-1, 1]
X3 de loi uniforme sur [-100, +100]
X4 telle que P(T=-3000) = 1/2 P(T=2000) = P(T=4000) = 1/4
Elles ont toutes quatre pour espérance 0, mais leurs lois sont clairement différentes. Une caractéristique qui les distingue est l'étalement, la dispersion, des valeurs qu'elles prennent autour de leur valeur moyenne E(Xi) = 0. Une façon de mesurer cette dispersion est de regarder la valeur moyenne de la distance entre Xi et E(Xi). Pour des raisons pratiques, on préfère choisir la valeur moyenne du carré de la distance entre X i et E(Xi), qu'on appelle la variance. ·
Définition 4-1 : Soit X une variable aléatoire sur un espace de probabilité ( W, P). La variance n(X) de X est :
n(X) = E[ (X-E(X))2 ]
L'écart-type s(X) de X est :
s(X) = ```Ön(X) ·
(Remarquons que si l'unité de mesure dans laquelle X est exprimé est, par exemple, le mètre, n(X) est en m2 et s(X) en mètre).
De l'égalité :
[X-E(X)]2 = X2 - 2 E(X) X + [E(X)]2
on déduit :
n(X) = E[ X2 - 2 E(X) X + (E(X))2 ] = E( X2 ) -2 E(X) E(X) + [E(X)]2 et finalement :
n(X) = E( X2 ) - [E(X)]2
Cette égalité est souvent utile dans le calcul effectif de variances.
Exercice 4-7 : Calculer les variances des variables aléatoires X i de l'exemple 4-2.
Exercice 4-8 : On lance un dé, et on note X la variable aléatoire qui représente le nombre de points obtenus. Quelle est la variance de X ?
Proposition 4-3 : Soit X une variable aléatoire.
a) La variance de X est nulle si et seulement si il existe un réel c tel que P( X=c ) = 1. On
dit alors que X est presque sûrement constante.
b) Soient a et b deux réels. Alors :
n(aX+b) = a2 n(X) s(aX+b) = a s(X) ·
Dans le cas où X n'est pas presque sûrement constante, on remarquera que la variable aléatoire X - E(X)
a son espérance nulle, et un écart-type égal à 1. Elle est ce qu'on appelle la variable aléatoire centrée réduite associée à X. Le passage de l'une des variables à l'autre se fait tout simplement par un changement d'origine et d'unité dans l'ensemble des valeurs prises par X.
L'expression de la variance d'une variable aléatoire n'est manifestement pas linéaire. De fait, si X et Y sont deux variables aléatoires sur ( W, P), en général, la variance de la somme X+Y n'est pas égale à la somme des variances de X et de Y :
Exemple 4-3 : Soit par exemple X une variable aléatoire de variance non nulle, - c'est-à-dire qui n'est pas presque sûrement constante -. On a :
n(X + (-X)) = n(0) = 0 et n(X) + n(-X) = 2n(X) ¹ 0 . ·
Calculons dans le cas général n(X+Y). Comme :
(X+Y) - E(X+Y) = (X - E(X)) + (Y - E(Y)) ,
on a :
[ (X+Y) - E(X+Y) ]2 = [X - E(X)]2 + [Y - E(Y)]2 + 2 [X - E(X)] [Y - E(Y)]
d'où :
n(X+Y) = n(X) + n(Y) + 2 E[ (X - E(X)) (Y - E(Y)) ]
Introduisons la définition de la covariance de X et Y :
cov(X, Y) = E[ (X - E(X)) (Y - E(Y)) ] Ce terme n'est en général pas nul. Cependant :
Proposition 4-4 : Soient X et Y deux variables aléatoires sur ( W, P). Si X et Y sont indépendantes, alors :
cov(X, Y) = 0 n(X+Y) = n(X) + n(Y) .·
Pour montrer ce résultat, on commence par montrer que si X et Y sont indépendantes, E(XY) = E(X) E(Y), et conlut en remarquant que sous cette même hypothèse, les variables aléatoires (X - E(X)) et (Y - E(Y)) sont indépendantes, ou encore en montrant l'égalité cov(X, Y) = E(XY) - E(X) E(Y).
Exercice 4-9 : Démontrer la proposition dans le cas où les lois de X et Y sont discrètes.
Exercice 4-10 : On lance deux dés, et on note S la variable aléatoire qui représente la somme des points obtenus. Quelle est la variance de S ?
Une caractéristique souvent utilisée en statistiques est un coefficient appelé coefficient decorrélation de deux variables aléatoires X et Y. C'est par définition, - et si ni X ni Y n'est presque sûrement constante - :
r (X, Y) = cov(X, Y) . s(X) s(Y)
Remarquons que c'est un coefficient sans dimension.
On peut montrer par des méthodes classiques en analyse que :
-1 £ r (X, Y) £ 1
r (X, Y) = 1 si et seulement si il existe a > 0 et b réel tel que Y = aX + b
2) On suppose tu = tm =
r (X, Y) = -1 si et seulement si il existe a < 0 et b réel tel que Y = aX + b.
Méfions-nous cependant : le fait que le coefficient de corrélation de X et Y est nul ne signifie pas du tout que X et Y sont indépendantes (…qu'il n'y a pas de corrélation entre X et Y…). Prenons par exemple une variable X de loi symétrique par rapport à 0 (par exemple de loi uniforme sur [-1, 1]), et posons Y = X2 . La loi de XY = X3 est aussi symétrique par rapport à 0. Ainsi, E(XY) = 0 = E(X) E(Y), et donc r (X, Y) = 0. Pourtant, X et Y ne sont pas (du tout) indépendantes, puisqu'au contraire, la donnée de la valeur prise par X détermine complètement la valeur prise par Y.
3-Exercices
Exercice 4-11 : Calculer l'espérance et la variance de la variable aléatoire M de l'exercice 3-12.
Exercice 4-12 : Les transistors fournis par une usine sont défectueux dans la proportion p. On teste un transistor après l'autre jusqu'à en obtenir un bon. On note N le nombre de tests effectués. Quelle est la loi de N ? Calculer l'espérance de N.
Exercice 4-13 : Une machine est constituée de n sous-unités identiques. Elle fonctionne si toutes ses sous-unités fonctionnent. Le procédé de construction des sous-unités est tel qu'elles sont défectueuses dans la proportion p, et indépendamment les unes des autres. Pour construire une machine sans défaut, deux procédés sont envisagés :
- On construit une sous-unité, on la teste, si elle est bonne, on la monte, sinon, on la jette, etc… On continue jusqu'à avoir monté les n sous-unités de la machine. On suppose pour simplifier qu'il n'y a pas de problème de montage. La machine ainsi construite est donc bonne.
- On construit et monte sans les tester n sous-unités, et on teste la machine ainsi constituée. Si elle ne marche pas, on la jette, et on recommence jusqu'à obtenir une bonne machine.
On note : | cu | le coût de construction d'une sous-unité, |
tu | le coût du test d'une sous-unité, | |
tm | le coût du test d'une machine, |
et on suppose pour simplifier que le coût d'assemblage des unités est nul.
1) On note C le coût de construction d'une bonne machine. Calculer l'espérance de C dans les deux cas a) et b).
cu , et n = 10 (puis n = 100). Suivant la valeur de p, quel est le 2 procédé de fabrication qui est préférable ?
V- Variables aléatoires usuelles
Voici une liste de définitions et propriétés de quelques lois connues. On pourra trouver beaucoup d'autres lois classiques dans la "littérature" : les lois géométrique (exercice 4-12), hypergéométrique, multinomiale, gamma, etc…, et nous en introduirons d'autres dans la partie "statistiques" de ce cours.
1- Loi de Bernoulli (p)
Soit A un évènement de probabilité p. Introduisons la variable aléatoire X telle que :
X(w) = 1 | si w Î A, |