Initiation au statistique intervalle de confiance

MODULE 2 : Estimation par intervalle de confiance
Il s’agit dans ce module de trouver une estimation par intervalle de confiance d’un paramètre ?, c’est-à-dire de construire une « fourchette de valeurs numériques permettant de situer » ? avec une probabilité 1??
1??= Prob[?1 <?<?2]
La démarche comprend deux étapes :
• avant le tirage d’un échantillon de taille n, un estimateur ?ˆ a été choisi et la loi de probabilité de ?ˆ permet de construire un intervalle aléatoire noté [g1(?ˆ),g2(?ˆ)] susceptible de contenir la valeur du paramètre ? avec une probabilité 1-? fixée a priori ;
• après tirage, la valeur particulière t de ?ˆ calculée à partir des données de l’échantillon permet de déterminer les bornes g1(t) et g2(t) de l’intervalle de confiance recherché.
Les paramètres inconnus à estimer seront successivement la moyenne, la variance, la proportion d’une population. Trois autres cas seront considérés : la différence de moyennes, le rapport de variances et la différence de proportions relatives à deux populations. Rappel du module 1
Paramètres de la population | Estimateurs dans l’échantillon |
La moyenne : m | La moyenne dans un échantillon : X : estimateur x : valeur calculée |
La variance : ?2 | La variance dans un échantillon : S2 : estimateur s2 : valeur calculée Sˆ2 : estimateur sans biais Sˆ2 = n S2 n ?1 |
La proportion : p | La proportion dans un échantillon : F : estimateur f : valeur calculée |
M2Unité 1 : Principe de l’estimation par intervalle de confiance
Soit ?ˆ l’estimateur d’un paramètre ? inconnu.
?ˆ est une variable aléatoire dont la loi de probabilité notée (L(?ˆ) supposée connue dépend de
?. Il est possible de trouver deux valeurs particulieres t (1?) et t2(?) telles que :
1??= Prob[t1(?) <?ˆ < t2(?)]
S’il est possible de réécrire le système d’inégalités en isolant ?, on peut déterminer un intervalle ?
dont les limites dépendent de ˆ et tel que :
1??= Prob[g1(?ˆ) <?< g2(?ˆ)]
Ici, l’intervalle qui encadre ? est aléatoire et il possède la propriété de recouvrir la valeur ? dans
1?? des cas. La prise en compte d’un échantillon particulier, c’est-à-dire d’une valeur numérique particulière pour ?ˆ , et donc pour g1(?ˆ) et g2(?ˆ), permet d’obtenir une fourchette qui a de « grandes » chances de « contenir » la valeur inconnue ? si 1-? est élevé.
1??= Prob[g1(?ˆ) <?< g2(?ˆ)]= Prob[c1 <?< c2]
• [c1,c2] ou [g1(?ˆ),g2(?ˆ)] est appelé intervalle de confiance,
• c1,c2 sont les limites de confiance,
• 1?? : degré de confiance ou degré de certitude.
Le principe de l’estimation par intervalle de confiance est de proposer un encadrement d’un paramètre inconnu d’une population dont la loi, elle, est connue.
La probabilité ? se répartit selon les cas soit à droite d’un certain seuil, soit à gauche, soit à droite et à gauche simultanément.
On parlera :
• d’intervalle bilatéral symétrique si : ?1 =?2 =? / 2
• d’intervalle bilatéral si ?1 ? 0 et ?2 ? 0 avec ?1 +?2 =?
• d’intervalle unilatéral à gauche si ?2 = 0
• d’intervalle unilatéral à droite si ?1 = 0
Cette démarche appelle trois remarques :
• la probabilté 1?? est fixée conventionnellement a priori. Si 1??= 95% , cela signifie que l’intervalle que l’on est susceptible de construire « tombera à côté » de ? (à droite ou à gauche) dans 5% des cas. Si 1??= 99% , ce risque est moins important, mais l’intervalle est plus large ;
• lorsque l’estimateur ?ˆ est sans biais, il est naturel de construire un intervalle centré sur l’estimation ponctuelle obtenue pour ? ;
• la détermination de la surface correspondant à la probabilité (1?? ) fait intervenir les paramètres permettant de caractériser la distribution de probabilité (L(?ˆ). Si cette distribution est par exemple normale, deux paramètres interviennent : m et ?.
M2Unité 2 : Estimation par intervalle de confiance de paramètres d’une
population
2.1 Estimation par intervalle de confiance de la moyenne d’une population lorsque la variance de la population est connue
Le problème est le suivant : il faut encadrer m (moyenne de la population).
C'est-à-dire on recherche m1 et m2 telles que :
?m1,m2 ?? telles que 1??= prob[m1 < m < m2]
On suppose que X obéit à une loi normale X ? N(m,?) avec? connu
On prélève un échantillon IID de taille n
On sait que X ? N???m, ? ??? avec n la taille de l’échantillon (Cf module 1) n
Si on forme la variable aléatoire normale centrée réduite U
Cas d’un intervalle bilatéral
Représentons graphiquement cette loi :
u?1 et u1??2 sont des valeurs lues dans la table de la loi normale centrée réduite.
A gauche de u?1 nous avons une probabilité ?1 d’où u?1 , à gauche de u1??2 , on a une probabilité cumulée de 1??2 d’où u1??2
Ecrivons ce que représente graphiquement la probabilité :1??
1??= Prob[u?1 < U < u1??2 ]
Remplaçons U par sa valeur :
1? 1 Prob???u? < X ?m < u1??2 ? n???
? = Prob?????u < u1??2?????
?? =
= prob???u ? X < ?m < u1??2 ? n ? X???
= Prob?????X1?4 2u41?m?124 34 < m < 1X ?424um?1243?4n?????? ?
Nous obtenons donc l’encadrement de m ; m est compris entre m1 et m2.
Cas particulier : intervalle bilatéral symétrique
Intervalle bilatéral symétrique si : ?1 =?2 =? / 2
Graphique 1
u?/2 0 u1??/2
=? u1?? / 2 =? u?/2
1 Prob??X ? u1?? / 2 ? < m < X ? u? / 2 ? n???
?? = ?
Comme u1?? / 2 =?u? / 2 on peut écrire : 1 Prob??X ? u1?? / 2 ? < m < X + u1?? / 2 ? ??
?? = ?
Ou encore : 1 Prob??X + u? / 2 ? < m < X ? u? / 2 ? ??
?? = ?
Ce qui revient à écrire :
?? = ?
1 Prob??m ????X ± u?/ 2 ? ?????? ou 1?? = Pr ob???m ????X ± u1??/ 2 ? ??????
Application :
On cherche un intervalle de degré de confiance bilatéral symétrique à 95% de la moyenne (connu) est 2 : X ? N(m,2). On prélève dans cette population un échantillon de taille n=100. d’une population m. On sait que la variable aléatoire obéit à une loi normale dont l’écart type X ? N???m, ? n???
?1 =?2 =? / 2 = 2,5% (intervalle bilatéral symétrique) u?/2 =-1,96 u1??/2=1,96 95% Pr ob?????1,96 < X?? mn < 1,96?????
= ?
= Pr ob???m ????X ± u?/ 2 ? n??????
Supposons que dans l’échantillon la moyenne soit égale à 10 : x = 10
L’intervalle de confiance calculé est donc : (on le note : IC.95 )
IC.95= [10 ±1,962 ] = [9,61;10,39]
100
Il y a une probabilité de 95% que [9,61 ; 10,39] encadre la vraie valeur du paramètre m qui demeure inconnu.
Détermination d’une borne supérieure
On cherche ici m2 tel que : 1 Prob[m m2] Prob[ m m2]
?? = < = ? > ?
= Prob[X ? m > X ? m2]= Pr ob????X?? mn > X?? mn2 ????
= Prob????U > X?? mn2 ????
Comme U ? N(0,1) on a 1??= Prob[U > U?]
c'est-à-dire :
?? = ??X ?m > ??
Pour ?= 5% on a U0,05 =?1,6449
Donc dans note exemple on a la Borne Supérieure suivante :
BS = 10+1,64492 = 10,32898? 10,33 10
Détermination d’une borne inférieure
Le problème est similaire au précédent, c'est-à-dire que l’on cherche m1 tel que :
1?? = Prob[m > m1]= Prob[?m < ?m1]
= Prob????X??m < X??m1???? = Prob????X??m < U1??????
= [? <n ? n ? ] n
= Prob[ m> U?1?? ? n ]X
Probm X U1?? n
Application numérique : U1?? =U0,95= 1,6449
La borne inférieure est donc : BI = 10 ?1,64492 = 9,767
10
2.2 Estimation par intervalle de confiance de la moyenne d’une population lorsque la variance de la population est inconnue
Le problème est toujours le même : il faut encadrer m.
C'est-à-dire on recherche les m1 et m2 telles que :
?m1,m2 ?? telles que 1??= prob[m1 < m < m2]
X ? N(m,?) par hypothèse mais ici ? est inconnu
X ? N???m, ? ??? avec n la taille de l’échantillon n
Lorsque ? est inconnu, on utilise la loi de Student. (Cf module 1)
? T(n ?1) car Sˆ n S2
avec : S : estimateur biaisé de ?
S : estimateur sans biais de ?.
Cas d’un intervalle bilatéral
Représentons graphiquement cette loi :
t?1 et t1??2 sont des valeurs lues dans la table de Student. On met ici aussi en indice le seuil
de probabilité correspondant à la fonction de répartition.
Ecrivons ce que représente graphiquement la probabilité 1?? :
1??= Pr ob[t?1 < T(n ? 1) < t1??2]
Remplaçons T(n-1) par son expression :
???
1?? = Prob???t?1 1??2????
= Prob???t?1 < X ? m < t1??2 S ? ??? n 1
= Prob???? X + t < ?m < t1??2 S ? ? X???
n 1 ?? ?
1?? = Prob????X ? t1??2 S ? < m < X ? t?1 S ? ???
14 244 14 34n41 14 24 4 3n4 1?? m m2
Nous obtenons donc l’encadrement de m
Cas particulier : intervalle bilatéral symétrique
Graphique 2
1?? = Prob???m????X ± t1?? / 2 ?????? ou encore : 1?? = Prob???m????X ± t?/ 2 S ? ??????
n 1
Intervalle unilatéral à droite
Dans ce cas, ?1 = 0 et ?2 =?
?? = ? ? = Prob?????m > X1?4 2t41?4?m1S4 34n4?1???????
1 Prob????< t1??????
Intervalle unilatéral à gauche
Dans ce cas, ?1 =? et ?2 = 0
?? = ??
1 Prob???> t????? = Pr ob???m < X ? t? S n ?1???
? = Prob?????m < 1X +4 2t41?4?m2S4 34n4?1??????
?
2.3 Estimation par intervalle de confiance de la variance d’une population
Par hypothèse, X obéit toujours à une loi normale : X ? N(m,?)
Le problème est le suivant : il faut encadrer ?, l’écart-type de la population qui est inconnu. On recherche donc deux valeurs encadrant ?2
prob
nS
On sait que : 2 ?? (n ?1) avec n la taille de l’échantillon. (Cf module 1) ?
Cas d’un intervalle bilatéral
?2?1 et ?12??2 sont deux valeurs lues dans la table de la loi du ?2 . On met ici aussi en indice la probabilité correspondant à la fonction de répartition
Ecrivons ce que représente graphiquement la probabilité 1?? :
1?? = Pr ob?????21 <?2(n ?1) < ?12??2???
Remplaçons ?2(n ?1) par son expression :
1?? = Pr ob?????2?1 < nS?22 < ?12??2????
= Pr ob?????nS?2?12 < ?12 < nS2 ?????
= Pr ob?????nS?2?12 > ?2 > ?nS12??22 ????? ??nS12??22 <?2 < nS?2?12 ?????
1?? = Prob????
Nous obtenons ici l’encadrement de ?2
Cas particulier : intervalle bilatéral symétrique
NB : un ?2 est toujours positif, donc une seule écriture des seuils.
intervalle unilatéral à droite
1?? = Prob????nS?22 < ?12?????? = Prob?????nS12?2? <?2????
= Prob?????2 > ?nS12?2?????
intervalle unilatéral à gauche
1?? = Prob????nS?22 >?2????? = Prob????nS?2?2 > ?2????
= Prob?????2 < nS??22 ????
2.4 Estimation par intervalle de confiance d’une proportion d’une population
Le problème est le suivant : il faut trouver un encadrement de p, c'est-à-dire on recherche deux valeurs p1 et p telles que
?p1,p2 /1
? ???
Or sait (Cf module 1) que F N??p, pqn ??? avec n la taille de l’échantillon prélevé.
Donc si on forme la variable aléatoire normale centrée réduite, on obtient :
F ? p
? N(0,1) pq
Cas d’un intervalle bilatéral
Ecrivons ce que représente graphiquement la probabilité 1?? :
1??= Prob[u?1 < U < u1??2 ]
Remplaçons U par sa valeur :
?? ? 1 Prob???u?1 < F ?pqp < u1??2?????
?? = ?
= Prob????u?1 < F ? p < u1??2pqn ????
= Prob????u?1 ? F < ?p < u1??2 pqn ? F????
1?? = Prob??????F1?42u41?p?1432 4pqn < p < F1?424up?21434pqn ??????
Nous obtenons donc l’encadrement de p, p compris entre deux valeurs p1 et p2 .
Le problème ici est que p, la valeur que l’on encadre, se retrouve dans les bornes. Il existe trois méthodes pour donner une valeur aux bornes :
1) Remplacer dans les bornes p et q par leur estimation :
On l’appelle la méthode des estimateurs : p a pour estimateur sans biais F. E(p)ˆ = p
p ? pˆ = F q ? qˆ =1? F
Remplaçons :
1?? = Prob????F ? u1??2 F(1n? F) < p < F ? u?1 F(1n? F)????
Pour un intervalle bilatéral symétrique : 1 Prob???F ? u1??/2 < p < F ? u?/2 F(1n? F)????
?? = ?
= Prob????p?????F ± u????????
?? = ?
Ou encore : 1Prob???p?????F ± u?/2F(1n?F)????????
2) Remplacer dans les bornes pq par ¼ : méthode par excès :
Soit p l’estimation de F et q=1-p, le maximum de pq = , on considère donc que
pq
L’intervalle de confiance bilatéral qui était :
?? = ?
1 Prob???F ? u1??2 pqn < p < F ? u?1 pqn ????
Devient alors :
1?? = Prob???F ? u1??2 21n < p < F ? u?1 21n ???
Cas d’un intervalle bilatéral symétrique :
L’intervalle bilatéral symétrique devient alors :
Prob??p????F ± u1??/2 21n??????? 1?? ?
3) Méthode de l’ellipse :
Elle s’applique uniquement au cas d’un intervalle bilatéral symétrique et ne sera pas détaillée ici. Elle utilise des abaques (courbes dans lesquelles on lit les valeurs des bornes)
2.5 Taille d’un échantillon et précision de l’estimation
2.5.1 Détermination de la taille d’un échantillon en fonction de la précision sur la
moyenne
Prenons le cas de l’intervalle bilatéral symétrique de la moyenne lorsque l’écart_type est connu.
?? ?? = ?
On a 1 Pr ob???1X ?42u41?m?14 3/ 24? < m < 1X +4 2u41?m?24 3/ 24? ??????
Lorsque n augmente, la taille de l’intervalle [m1,m2] diminue. [m1,m2] dépend à la fois de 1-? et de n.
Réécrivons l’intervalle :
1?? = Pr ob???? u1??/2 ?n < ?X + m < u1??/2 ?n ???
= Pr ob??? X ? m < u1??/2 ?n ???
On cherche la valeur n telle que la précision sur la moyenne soit égale à C. Le précision sur la moyenne est l’écart qui existe entre la moyenne d’échantillon et la moyenne de la population.
Il existe deux façons de la calculer :
• Précision en valeur absolue
1??= Prob[X ? m ? C]
Le problème est le suivant :
?n* tel que 1??= Prob[X ? m < C]
Pour déterminer n*, il faut connaître u1??/2 , C et ?2 . Si ?2 n’est pas connu, on passe à la loi de Student (on prend s2 et t1?? / 2).
• Précision en valeur relative Le problème est le suivant :
?? = ???? X ? m ? ????
*
n tel que 1 Pr obC
m
? 1??= Pr ob[X ? m < Cm]
De plus on dispose de : 1?? = Prob???? X ? m < u1?? / 2 ? ???
?
D’où : X ? m ? u1?? / 2? Cm ? n ? u1?? / 2
? n* ? u12?? / 2????n?* ????2 C12 |
?2 2
Si est inconnu, on tire un échantillon auxiliaire et on calcule x et s . m2
2.5.2 Détermination de la taille d’un échantillon en fonction de la précision sur une proportion
Le principe est le même que précédement
• Précision en valeur absolue
On cherche n* tel que : Prob[F ?p < C]=1??
n est la taille nécessaire pour que l’erreur sur l’estimation soit inférieure à C, avec une probabilité égale à 1-?. De plus l’intervalle de confiance de la proportion est égal à : 1 Prob???? u1?? / 2 * < p ?F < u1?? / 2 * ????
?? = ? pq pq
n n
F p
?n* tel que1? =Pr ob???? ? < C????
p 1 Pr ob??F u1?? / 2 * < p < F + u1?? / 2 * ????
?? = ?? ? pq pq
n n
??
M2Unité 3 : Estimation par intervalle de confiance de la différence et du rapport de deux paramètres de deux populations tirées d’une loi normale : cas de deux populations, deux échantillons
Hypothèse : nous avons deux variables aléatoires X1 et X2 obéissant à deux lois normales. On prélève dans chacune des populations deux échantillons IID.
X1? N(m1,?1) taille de l’échantillon prélevé :n1
X2? N(m2,?2) taille de l’échantillon prélevé : n2
3.1 Intervalle de confiance de la différence de deux moyennes lorsque les variances des deux populations sont connues
On cherche deux valeurs c et d telles que :1??= Pr ob[c < m1? m2< d]
On a vu que : (X1 ? X2)? N?????m1 ? m2;???? ?i connus. (Cf module 1)
D’où la variable aléatoire normale centrée réduite :
U = (X1 ? X2)? (m1 ? m2) ? N(0,1)
?2 ?2 1 + 2 n1 n2
Comme dans le paragraphe précédent, on écrit ce que représente graphiquement la probabilité
1??
Plaçons-nous dans le cas d’un intervalle bilatéral : ?1 +?2 =?
1??= Prob[u?1 < U < u1??2]
Remplaçons U par sa valeur :
????
1?? = Prob???u?1 < (X1 ? X?n2112)?+(m?n1222?m2 ) < u1??2????????
?
= Prob?????u?1 ?n112 + ?n222 < (X1 ? X2 )?(m1 ?m2)< u1??2 ?n112 + ?n222 ????? = Prob???u?1 n112 + ?n222 ?(X1 ? X2 )< ?(m1 ?m2 )< u1??2 ?n112 + ?n222 ?(X1 ? X2)?????
?? ?
2 2 2 2
1 = Prob????(X1 ? X2 )? u1??2 ?1 + ?2 < m1 ? m2 < (X1 ? X2)? u?1 ?1 + ?2 ?????
? n1 n2 n1 n2
Cas d’un intervalle bilatéral symétrique :?1 =?2 =? / 2
Graphique 1
u?/2 0 u1??/2
=? u1?? / 2 =? u?/2
?? = ????( ? )?????( ? )± ?2 + ?2 ????????
1 Prob m1 m2 X1 X2 u1??/2 1 2
n1 n2
avec ± u1?? / 2 =±u? / 2 et u1?? / 2 =?u? / 2
3.2 Intervalle de confiance de la différence de deux moyennes lorsque les variances des deux populations sont inconnues
On cherche toujours c et d telles que 1??= Prob[c < m1? m2< d]
(X1?X2)?(m1?m2) ? N(0,1) avec?1et?2 inconnus ici. On utilise donc la loi de Student ?2 ?2 1 + 2 n1 n2
Par hypothèse : ?1 =?2 =?
On a vu que (Cf Module 1)
(X1 ? X2)?(m1 ? m2) ? T(n1 + n2 ? 2)
1 + 1 n1S12 + n2S22 n1 n2 n1 + n2 ? 2
Ecrivons ce que représente graphiquement la probabilité 1?? et plaçons-nous dans le casd’un intervalle bilatéral : ?1 +?2 =?
1??= Prob[t?1 < T(n1 + n2 ? 2) < t1??2 ]
??? ?
1?? = Prob???t?1 < (X1 ? X2)? (m1+? m2) < t1??2??????
? 1 + 1 n1S12+ n2?S22 n1 n2 n1 n2 2
1 1 n1S12 n2S22 2 n1 n2 n1 n2 2
1?? = Prob????t?1 + ++ ? < (X1 ? X2)?(m1 ? m2)< t 2 ???
1 Prob???t?1 n11 + n12 nn1S112+n+2n2?S222 ?(X1? X2)<?(m1?m2)< t1??2 2 ????
??= ?
1??=Prob????(X1? X2)? t1??2 n11 + n12 nn1S112+n+2n2?S222 < (m1?m2)< (X1? X2)?t?1 n11 + n12 nn1S112+n+2n2?S222 ????
Cas d’un intervalle bilatéral symétrique :?1 =?2 =? / 2
1 Prob????(m1 ?m2 )??????(X1 ? X2 )± t1??/2 n11 + n12 nn1S112+ n+2n2?S222 ??????????
?? = ?
avec t?/2 =?t1??/2 et t1?? / 2 =?t? / 2
3.3 Intervalle de confiance du rapport des variances de deux populations normales
???? < ??2 < ???? ?? = ???? < ??2 < ????
On cherche b et c telles que : 1= Pr ob b 1 c ou 1 Pr ob b 2 c
2 2
2 1
Rappels :
X1? N(m1,?1) taille de l’échantillon n (Cf Module 1)
X2? N(m2,?2) taille de l’échantillon n (Cf Module 1)
Comme Sˆ 2 = n S2 ? F
n ?1
Plaçons nous dans le cas d’un intervalle bilatéral?1 +?2 =? et écrivons ce que représente graphiquement la probabilité 1?? :
1??= Prob[F? < F(n1 ?1;n2 ?1)< F1?? ]
? 1 ? 2
Sˆ 2 ?2
1?? = Prob???F?1 < 1 ?2
Sˆ 22 12
?? = ???? Sˆ 22 < ??22
1 Prob F?
1 Sˆ 12 12
?
ˆ 2
< F1??2??
?2 si on encadre
< F1??2 Sˆˆ 222 ??? 1
S1
?2 ˆ 2 ?
ou 1?? = Prob????SSˆ 12 (n1?11,n2?1) < ?12 < SSˆ122 F?(n11?11,n2?1) ???? si on encadre ??22
2 F1??2 2
1
Rappel : F?1(n1,n2)= F1??1(n2,n1)
Autre méthode : on forme
Sˆ 2 ?2 ?2
F(n2 ?1,n1 ?1) = S122 .?122 et on encadre directement ?122
ˆ
?1 =?2 =? / 2
Cas d’un intervalle bilatéral symétrique :
Sˆ 2 2 1?? = Prob???SSˆˆ 1222 F1(n?1??/112,n2?1) < ??1222 < Sˆˆ122 F?(n/12?11,n2?1) ???? ?
1?? = Pr ob????F?/2 Sˆ122 < ??122 < F1??/2 SSˆˆ1222 ????
ou
S2
3.4 Estimation par intervalle de confiance de la différence de deux proportions
On cherche à déterminer deux valeurs c et d telles que : 1??= Prob[c < p1? p2< d]
Nous avons deux populations dans lesquelles ont peut définir deux modalités A et A ayant pour probabilités respectives p1 et q1 dans la population 1 (p2 et q2 dans la population 2)
Population 1 | Population 2 | |
Modalité A | p1 | p2 |
Modalité A | 1? p1 = q1 | 1? p2 = q2 |
p1 + q1 = 1 | p2 + q2 = 1 |
p1 et p2 inconnus.
On tire un échantillon dans chacune des populations : on définit alors deux variables aléatoires F1 et F2.
Y1 pˆ1 = F1 F1 =
n1
Y2 pˆ2 = F2 F2 =
n2
Rappels du module 1 :
Y1? B(n1,p1)? Nn p , n p q ) F1 ? N????p1, p1q1 ????
n1
Y2 ? B(n2,p2)? Nn p , n2p2q2 ) F2 ? N????p2, p2q2 ????
n2
F1 ? F2 ? N????p1 ? p2;????
Ecrivons ce que représente la probabilité 1?? et plaçons nous dans le cadre d’un intervalle bilatéral ?1 +?2 =? :
1??= Prob[u?1 <U< u1??2 ] U ? N(0,1)
?? ?
1?? = Prob???u?1 < (F1 ? F2) (? p1 ? p2) < u1??2??????
??
1?? = Prob????u?1 p1q1 + p2q2 < (F1 ?F2) (? p1 ? p2)< u1??2 p1q1 + p2q2 ????
n1 n2 n1 n2
1? = Prob????u?1 p1q1 + p2q2 ?(F1 ?F2)< ?(p1 ? p2)< u1??2 p1q1 + p2q2 ?(F1 ?F2)????
n1 n2 n1 n2
1? = Prob????(F1 ?F2)? u1??2 p1q1 + p2q2 < p1 ? p2 < (F1 ?F2)? u?1 p1q1 + p2q2 ?????
n1 n2 n1 n2
Il est possible d’utiliser les méthodes vues dans le paragraphe 2.4.
1) Remplacer dans les bornes p et q par leur estimation :
p1 ? pˆ1 = F1 p2 ? pˆ 2 = F2
?? = ????( ? )? 2 F1(1?F1) + F2(1? F2 ) < ? < ( ? )? 1 F1(1?F1) + F2(1? F2 ) ????
1 Prob F1 F2 u1??p1 p2 F1 F2 u?
n1 n2 n1 n2
2) Remplacer dans les bornes pq par ¼ : méthode par excès :
1?? =Pr ob????(F1 ?F2)?u1??2 21 n11 + n12 < p1 ?p2 <(F1 ?F2)?u?1 21 n11 + n12 ????
Pour un intervalle bilatéral symétrique :
1?? = Pr ob????(p1 ? p2 )?????(F1 ? F2 )± u1??/2 F1(1n?1 F1) + F2(1n?2 F2)???????? : première méthode
1?? = Pr ob????(p1 ?p2 )?????(F1 ?F2 )± u?/221n11 +n12 ???????? : deuxième méthode
Note : on met en indice la valeur de la probabilité correspondant à la fonction de répartition
On ne peut pas utiliser la cas de l’intervalle bilatéral pour la recherche de la taille d’un échantillon en fonction de la précision. Il faut obligatoirement un intervalle bilatéral symétrique.