Statistique loi normale cours complet


Télécharger Statistique loi normale cours complet

★★★★★★★★★★3.5 étoiles sur 5 basé sur 1 votes.
Votez ce document:

Télécharger aussi :


Ce document de formation est destiné aux enseignants. Il se conforme aux instructions du programme de mathématiques des classes de Terminales (2011).

Sa lecture nécessite la connaissance des variables aléatoires discrètes, continues uniformes et exponentielles.

Introduction de la loi normale centrée réduite

Les lois de probabilité discrètes donnant lieu à des calculs fastidieux dans certaines situations (par exemple la détermination d'intervalles de confiance), on cherche à approcher les résultats par ceux de calculs effectués avec des variables aléatoires continues à densité. Dans le cadre des programmes de Terminales, ce problème est traité pour les lois binomiales approchées par des lois normales.

Pour les lois de probabilité discrètes, les probabilités sont représentées graphiquement par des hauteurs de bâtons alors que pour les lois de probabilité à densité, les probabilités sont représentées graphiquement par des aires de parties de plan comprises entre la courbe représentative de la densité et l'axe des abscisses. Il importe donc dans un premier temps de représenter les probabilités de chaque valeur non plus par une hauteur de bâton mais par une aire. 

Soit n un entier naturel non nul et p un réel de ]0,1[. Pour une variable aléatoire X suivant la loi binomiale de paramètres n et p, on a  P(X = k) =?? nk ?? pk (1? p)n? k, pour k entier naturel inférieur ou égal à n.

Pour représenter la loi de probabilité de X, on peut utiliser un diagramme en bâtons. On peut aussi, dans notre perspective, construire un histogramme sur les classes ??k? 21., k + 21?? d'amplitude 1, pour k entier naturel inférieur ou égal à n. Chaque classe ne contient qu'une seule valeur de probabilité non nulle et l'histogramme est formé des rectangles d'aire P??k ? 12 ? X < k + 12?? = P(X = k) = ?? nk ?? pk (1 ? p)n? k, pour k entier naturel inférieur ou égal à n. Comme l'amplitude des classes est 1, la hauteur des rectangles est

?? nk ?? pk (1 ? p)n ? k.

Représentations de la loi de probabilité binomiale B (46 ; 0,35)

                    avec un diagramme en bâtons                                        avec un histogramme

Quand n varie, on obtient des histogrammes qui diffèrent par leurs positions et par leurs dispersions. 

Histogrammes de lois de probabilité binomiales B (n ; 0,35)

 

Fichier GeoGebra   1-binomiale

Pour réduire la variabilité, stabilisons dans un premier temps la position de l'histogramme en considérant 

X? E(X). La variable aléatoire  X? E(X)  a pour espérance mathématique  E(X? E(X)) = E(X)? E(X) = 0.

Pour cette raison, on qualifie  X? E(X)  de variable centrée

Représentons par un histogramme la loi de probabilité de  X? E(X), c'est-à-dire de  X? np  sur les classes ??k ? np ? 12 ., k ? np + 12?? d'amplitude 1, pour k entier naturel inférieur ou égal à n. Chaque classe ne contient   

qu'une seule valeur de probabilité non nulle et l'histogramme est formé des rectangles d'aire

P??k ? np ? 21 ? X ? np < k ? np + 21?? = P(X = k) = ?? nk ?? pk (1 ? p)n? k, pour k entier naturel inférieur ou égal à n.

Comme l'amplitude des classes est 1, la hauteur des rectangles est ?? nk ?? pk (1? p)n? k.

Histogramme de la loi de probabilité de  X ? np pour p = 0,35

 

n = 400

Fichier GeoGebra   2-binomiale centrée

X ? E(X)

Reste la variabilité de la dispersion. Stabilisons-la en considérant la variable aléatoire       . ?(X)

Son espérance mathématique E??X ? E(X)?? = E(X ? E(X)) = E(X) ? E(X) = 0,  X ? E(X)  est encore centrée. 

                                                                       ? ?(X) ?          ?(X)              ?(X)                 ?(X)

Elle a pour écart-type3  ???X ? E(X)?? = ?(X ? E(X)) = ?(X) = 1. Pour cette raison, on qualifie  X ? E(X)  de ? ?(X) ?       |?(X)|    ?(X)     ?(X)

variable réduite

                                                                                                                                     X ? E(X)                                X ? np

Représentons par un histogramme la loi de probabilité de  , c'est-à-dire de   sur les ?(X)     np(1? p)

classes ???? k ? np ?? 21 ., k ? np ?+ 21 ???? d'amplitude np(11 ? p), pour k entier naturel inférieur ou égal à n. Chaque

                      np(1       p)     np(1       p)

classe ne contient qu'une seule valeur de probabilité non nulle et l'histogramme est formé des rectangles d'aire P??? k ? np ? 12 ? X ? np < k ? np + 12 ??? = P(X = k) = ? n ? pk (1 ? p)n ? k, pour k entier naturel inférieur

                ? np(1 ? p)       np(1? p)      np(1 ? p)?                  ? k ?

1 ou égal à n. Comme l'amplitude des classes est , la hauteur des rectangles est

np(1 ? p)

?? n ??pk (1 ? p)n ? k np(1 ? p). k

 

n = 50 k

3                                                                                                                                                                         2

 On utilise la propriété : pour tous a et b réels  V(aX + b) = a V(X)  ou encore  ?(aX + b) = |a| ?(X)  qui fait défaut dans le programme de Première.

 

n = 400

Fichier GeoGebra   3-binomiale centrée réduite On obtient des histogrammes dont les positions et les dispersions, lorsque n varie, sont beaucoup plus stables. 

On peut constater que plus n augmente, plus le graphique évoque une "cloche". L'histogramme est limité par l'axe des abscisses et une ligne brisée qui, lorsque n augmente, tend à se confondre avec la représentation graphique d'une fonction f. Le mathématicien Abraham de Moivre a découvert que cette

1 2

1 ? 2 x courbe est la courbe représentative de la fonction f définie par  f (x) =  e .

2?

 

n = 400 Ce qui précède illustre le théorème suivant :

Théorème de Moivre-Laplace (au programme de la classe de terminale S uniquement et admis)Soit p un réel de ]0 , 1[.

On suppose que, pour tout entier naturel non nul n, la variable aléatoire Xn suit la loi binomiale

B(n , p). On pose Zn =Xn?np , variable centrée et réduite associée à Xn. np(1? p)

                                                                                                                                                            ??b   1     ? 12 x 2

Alors, pour tous réels a et b tels que a? b, on a :  n lim? + ?P(a? Zn? b) = ??a 2? e      dx.

Propriétés

1 2

                                                                                       1     ? 2 x

La fonction f, définie sur IR, par  f (x) =  e               est positive.

2?

On admet que l'aire du domaine compris entre la courbe de f et l'axe des abscisses dans un repère orthonormé, vaut 1.

Ceci permet d'affirmer que f est une densité de probabilité.

Loi normale centrée réduite

Définition

                                                                                                                                                                                                         1   2



Toute variable aléatoire X continue dont la loi a pour densité f définie sur IR par  f (x) = 1 e? 2 x   est dite

2?

suivre la loi normale centrée réduite notée N(0 , 1).

Propriétés

Pour intervalle J de IR, P(X? J) est l'aire du domaine compris entre la courbe de f et l'axe des abscisses

dans un repère orthonormé.

                                                                                                                                                        ??b    1     ? 12 x 2

En particulier, pour tous réels a et b tels que a ? b, on a :  P(a ? X ? b) = ??a 2? e       dx.

Étude de f

f est paire donc sa représentation graphique est symétrique par rapport à l'axe des ordonnées dans un repère orthogonal. lim f (x) = 0  et donc du fait de la parité  lim f (x) = 0.

x ? +?                                                                            x ? ??

1 2

? x ? 2 x

f est dérivable sur IR et pour tout réel xf ’(x) =  e . On en déduit que f est décroissante sur IR+ et 2?

 

Représentation graphique de f

Remarque :

La courbe représentative de f présente deux points d'inflexion d'abscisses 1 et ? 1.

Calculs de probabilités

Soit X une variable aléatoire suivant la loi normale centrée réduite et soit a et b deux réels.

P(X ? IR) = 1, l'aire de la partie comprise entre l'axe des abscisses et la courbe représentative de f est égale à 1 unité d'aire.

La symétrie de la courbe impose : 

P(X ? 0) = P(X ? 0) = 0,5.

P(X ? ? a) = P(X ? a)

(X > a) et (X ? a) étant des événements contraires : P(X > a) = 1 ? P(X ? a) f étant continue, elle admet des primitives sur IR, qui ne peuvent pas être exprimées à l'aide de fonctions usuelles ; il n'y a pas de formule de calcul de P(a ? X ? b). Cependant, des techniques mathématiques permettent d'en évaluer des valeurs approchées qui sont accessibles dans des tables, dans les calculatrices ou les logiciels (tableurs ).

Attention ! ()

Pour une variable aléatoire X suivant la loi normale centrée réduite, les calculatrices ne fournissent pas de valeurs approchées de probabilités du type P(X? a)  ou  P(X? a)  mais seulement de celles du type  P(a? X? b)  où a et b sont des nombres réels. 

Pour le calcul de  P(X? a), on peut procéder la façon suivante :


•   Si  a ? 0, on utilise  

P(X ? a) = 0,5 + P(0 ? X ? a).

 

•   Si  a ? 0, on utilise  

P(X ? a) = 0,5 ? P(a ? X ? 0).

 


Pour le calcul de  P(X? a), on peut procéder la façon suivante :

Si a ? 0, on utilise 

P(X ? a) = 0,5 ? P(0 ? X ? a).

Si a ? 0, on utilise  

P(X ? a) = 0,5 + P(a ? X ? 0).

 

Espérance et variance de X

L'espérance mathématique de X est  E(X)) dt. Le programme donne comme définition :  

                           ??0    t                             ??y    t     ? 12 t 2

E(X) = x ?lim ????x 2? e dt + y?lim + ???02? e     dt.

??0    t     ? 12 t 2           ??    1   ? 12 t 2?? 0  ? 1       1     ? 12 x 2                                     ??0    t                     ? 1

??x   2? e     dt = ??? 2? e     ?? x =   2? +     2? e     ainsi limx? ? ???x     2? e dt =         2?.

??y    t     ? 12 t 2           ??    1   ? 12 t 2?? y         1     ? 12 y 2           1                      ??y    t         ?             1

??02? e     dt = ??? 2? e    ?? 0 =? 2? e       + 2? ainsi limy? + ???02? e dt =         2?.

                                                        ? 1       1

On en déduit que  E(X) =            +            = 0. Ce qui justifie la dénomination de centrée pour la loi de X.

                                                          2?       2?

Dans le cadre des programmes de Terminales, on admet que la variance de X est 1, ce qui justifie la dénomination de réduite pour la loi de X.

Démonstration : 

Le calcul de la variance ne figure pas dans les contenus des programmes de Terminales, elle est donnée ici à titre d'information pour l'enseignant.

                                                                                                   2                                                                                          +??? +? 2 f ( ) dt 

La variance de X est l'espérance de (X? E(X))  c'est l'intégrale  ??      (t  E(X))      ) dt, soit

                                                                                        ?0                                                                         

puisque  E(X) = 0.

                               ??? + ? ? t2 f (t) dt = x ?lim? ????x t2? e dt + y?lim + ?????0y t22? e?  dt

1 2

? t       ? 2t2?

Posons  u(t) =   et v(t) = e              . 

1 2

                                                                                                                                                                      ? 1                         ? 2 t

u et v sont deux fonctions dérivables, à dérivées continues sur IR avec  u’(t) =   et  v’(t) =? t e             .

2?

Par une intégration par parties : 

                                         ??0   t2     ? 12 t 2           ??    t    ? 12 t 2?? 0 ??0  1     ? 12 t 2                    x    ? 21 x 2

Pour x réel négatif, ??x2? e     dt = ??? 2? e    ?? x + ??x2? e      dt =     2?e       + P(x? X? 0).

                          ??0   t                           1    1

Ainsi  lim ??x 2? e dt = 0 + 2 = 2. x? ? ?

De même pour y réel positif : 

                         ??y   t2      ? 12 t 2           ??    t    ? 12 t 2?? y ??1     ? 12 t 2                          y    ? 12 y 2

                        ??02? e     dt = ??? 2? e   ?? 0 + ??02? e      dt =?     2?e       + P(0? X? y).

                          ??y    t2           ?                1    1



Ainsi  lim ??02? e dt = 0 + 2 = 2. y? + ?

On en déduit que  V(X) =  +  = 1.

Des valeurs remarquables pour la loi normale centrée réduite

Théorème (au programme de terminale S)

Si X est une variable aléatoire suivant la loi normale centrée réduite N(0 , 1) alors, pour tout ? ? ]0 , 1[, il existe un unique réel positif u? tel que  P( ? u? ? X ? u?) = 1 ? ?.

Démonstration (exigible en Terminale S) :

D’après la symétrie de la courbe représentative de f, on a pour tout réel positif u :

P( ? u ? X ? u) = 2P(0 ? X ? u) = 2 ??0uf (x) dx=2 H(u)

H est la primitive de f qui s'annule en 0 : H(0) = 0.

En tant que primitive de f, h est dérivable et donc continue sur IR.

Comme f est positive strictement sur IR, H est strictement croissante sur IR. lim H(u) = lim ??0u   f (x) dx  s'interprète comme l'aire de la partie de plan comprise entre l'axe des u ? + ? u ? + ?

1

abscisses, l'axe des ordonnées et la courbe représentative de f. On a donc  lim H(u) =.

                                                                                                                                                                     u?+?               2

La fonction 2H admet donc le tableau de variations suivant :

t

0

 

+?

2 H(t)

 

0

 

1

Pour tout réel ? compris strictement entre 0 et 1, le réel (1??) est également compris strictement entre 0 et 1 et donc, d’après le corollaire du théorème des valeurs intermédiaires, il existe un unique réel u? strictement positif tel que  2H(u?) = 1 ? ? c'est-à-dire tel que  P( ? u? ? X ? u?) = 1 ? ?.

 

Il y a quelques valeurs approchées très utilisées qu’il faut connaître :  

u0,1 ?– 1,65,  u0,05 ?– 1,96  et  u0,01 ?– 2,58  (à 10? 2 près).

On a donc  P( ? 1,65 ? X ? 1,65) ?– 0,9,  P( ? 1,96 ? X ? 1,96) ?– 0,95  et  P( ? 2,58 ? X ? 2,58) ?– 0,99. 

Les autres lois normales

Soit µ un nombre réel et ? un nombre réel strictement positif.

Définition

Une variable aléatoire X suit la loi normale N(µ ,?2)  si et seulement si la variable aléatoire  Y =X?µ 

?

suit la loi normale centrée réduite.

Propriété

X = ? Y + µ ainsi l'espérance mathématique de X est  E(X) = ? E(Y) + µ = µ car E(Y) = 0.

La variance de X est  V(X) =?2 V(Y) =?2  car  V(Y) = 1.

Les deux paramètres µ et ?2 de la loi normale N(µ ,?2) s'interprète comme l'espérance mathématique et la variance de X.

On admet que la loi normale N(µ ,?2)  est une loi à densité. Cette densité est la fonction g définie sur IR par  g(x) = 1 e?12 ??x??µ??2  (cette expression ne figure pas dans les programmes de Terminales).

                       ?   2?

L'interprétation de ? comme l'écart-type de X explique son influence sur la forme de la représentation

graphique de sa densité. Ci-dessous : 

•   en rouge, la densité de la loi normale N??0 ,14?? d'espérance 0 et d'écart-type 12

•   en bleu, la densité de la loi normale N (0 , 1) d'espérance 0 et d'écart-type 1 ;

•   en vert, la densité de la loi normale N (0 , 4) d'espérance 0 et d'écart-type 2.

 

Calculs de probabilités

Soit X une variable aléatoire suivant la loi normale N(µ ,?2) et soit a et b deux réels.

P(X ? IR) = 1.

P(X ? µ) = P???X ?? µ ? µ ?? µ??? = P(Y ? 0) = 0,5. P(X ? µ) = P??X ?? µ ? µ ?? µ??? = P(Y ? 0) = 0,5.

?

P(µ ? ? ? X ? µ + ?) = P???µ ? ?? ? µ ? X ?? µ ? µ + ?? ? µ??? = P(? 1 ? Y ? 1) ?– 0,68 (à 10 ?2 près)

P(µ ? 2 ? ? X ? µ + 2 ?) = P???µ ? 2?? ? µ ? X ?? µ ? µ + 2?? ? µ??? = P(? 2 ? Y ? 2) ?– 0,95 (à 10 ? 2 près)

P(µ ? 3 ? ? X ? µ + 3 ?) = P???µ ? 3?? ? µ ? X ?? µ ? µ + 3?? ? µ??? = P(? 3 ? Y ? 3) ?– 0,997 (à 10 ? 3 près)

Les résultats précédents peuvent s'illustrer sur les graphiques suivants à l'aide de la courbe représentative de la densité de la loi normale N(µ ,?2) : 

 

                                              ? ?                      ?

 

 

 

 

                             ? 2?                                           2?

 

 

 

 

 

               ? 3?                                                                   3?

 

     

Les calculatrices ou des logiciels (tableurs ) permettent seulement d'avoir des valeurs approchées des

probabilités du type  P(a? X? b) où a et b sont des nombres réels.()

Pour le calcul de P(X? a), on peut procéder la façon suivante :

•   Si a ? µ, on utilise P(X ? a) = 0,5 + P(µ ? X ? a).

•   Si a ? µ, on utilise P(X ? a) = 0,5 ? P(a ? X ? µ).

Pour le calcul de P(X? a), on peut procéder la façon suivante :

•   Si a ? µ, on utilise P(X ? a) = 0,5 ? P(µ ? X ? a).

•   Si a ? µ, on utilise P(X ? a) = 0,5 + P(a ? X ? µ).

On trouvera des compléments sur les lois normales dans les deux articles publiés dans l'ouvrage de la commission Inter-IREM Statistique et probabilités : Statistique au lycée, volume 1 : Les outils de la statistique, juillet 2005, brochure APMEP n° 156.

•   Phénomènes gaussiens et lois normales Michel HENRY, p. 211

•   Théorie des erreurs, courbes en cloche et normalité Jean-François PICHARD, p. 219



On utilise la propriété étudiée en classe de Premières : pour tous a et b réels  E(aX + b) = a E(X) + b.

  Voir note 1.

Voir note 3.



385