Exercices en statistique appliquee

Statistiques appliquØes (L3 d’Øconomie) - Cours de
Patrick Sevestre - TD 5 - CorrigØ
Marc Sangnier -
6 janvier 2008
Exercice 1
Question 1 - Test bilatØral
L’estimateur du loyer moyen calculØ est sur le premier Øchantillon (de taille n1 = 6) est mˆ1 = 493. On veut tester au seuil de 5% l’hypoth?se selon laquelle la vraie moyenne de cet Øchantilon est Øgale 500. Soit m1 cette vraie valeur. Soit ? = 0,05 le risque de premi?re esp?ce.
Hypoth?ses du test
L’hypoth?se nulle est la suivante : le vrai loyer moyen est Øgal 500 euros :
H0 : m1 = 500
L’hypoth?se alternative est la suivante : le vrai loyer moyen n’est pas Øgal 500 euros :
H1 : m1 = 5006 ?? m1< 500 ? m1> 500
Risques du test
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que m1 n’est pas Øgal 500 alors qu’il l’est.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : consid?rer que m1est Øgal 500 alors qu’il ne l’est pas.
RØgion critique
La rØgion critique correspondant ce cet test sØcrit :
Comment lire cette expression? La rØgion critique dØ nit l’ensemble des rØalisation observØes ( partir desquelles on cacule notre estimateur mˆ1) pour lesquelles on va rejeter l’hypoth?se nulle faite sur m1.
Dans l’expression prØcØdente, on appelle F?1(.) l’inverse de la fonction de rØpartition de la loi Normale centrØe-rØduite.
Application
?? W = {(x1; ;xn1)/0,09 ? 1,96}
Notre estimateur mˆ1 ne vØri e donc pas cette inØgalitØ, il ne se trouve donc pas dans la rØgion critique, il ne nous permet pas de rejeter l’hypoth?se nulle, nous l’acceptons.
Question 2 - Test bilatØral (2)
L’estimateur du loyer moyen calculØ est sur le premier Øchantillon (de taille n2 = 300) est mˆ2 = 550. On veut tester au seuil de 5% l’hypoth?se selon laquelle la vraie moyenne de cet Øchantilon est Øgale 500. Soit m2 cette vraie valeur. Soit ? = 0,05 le risque de premi?re esp?ce.
Hypoth?ses du test
L’hypoth?se nulle est la suivante : le vrai loyer moyen est Øgal 500 euros :
H0 : m2 = 500
L’hypoth?se alternative est la suivante : le vrai loyer moyen n’est pas Øgal 500 euros :
H1 : m2 = 5006
Risques du test
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que m2 n’est pas Øgal 500 alors qu’il l’est.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : consid?rer que m2 est Øgal 500 alors qu’il ne l’est pas.
RØgion critique
La rØgion critique correspondant ce cet test sØcrit :
Comment lire cette expression? La rØgion critique dØ nit l’ensemble des rØalisation observØes ( partir desquelles on cacule notre estimateur mˆ2) pour lesquelles on va rejeter l’hypoth?se nulle faite sur m2.
Dans l’expression prØcØdente, on appelle F?1(.) l’inverse de la fonction de rØpartition de la loi Normale centrØe-rØduite.
Application
?? W = {(x1; ;xn2)/2,89 ? 1,96}
Notre estimateur mˆ2 vØri e donc cette inØgalitØ, il se trouve donc dans la rØgion critique, il nous permet de rejeter l’hypoth?se nulle. Nous retenons donc provosoirement (avant un autre test) l’hypoth?se alternative.
Question 3 - Tests unilatØraux
On veut tester au seuil de 5% l’hypoth?se selon laquelle la vraie moyenne est supØrieure ou Øgale 580 (test A); infØrieure ou Øgale 580 (test B). Soit m la vraie valeur moyenne des loyers.
Hypoth?ses du test A
L’hypoth?se nulle est la suivante : le vrai loyer moyen est supØrieur ou Øgal 580 euros :
H0 : m ? 580
L’hypoth?se alternative est la suivante : le vrai loyer moyen est strictement infØrieur 580 euros :
H1 : m < 580
Risques du test A
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que m n’est pas supØrieur ou Øgal 580 alors qu’il l’est.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : consid?rer que m est supØrieur ou Øgal 580 alors qu’il ne l’est pas.
RØgion critique pour l’Øchantillon 1, test A
W = {(x1; ;xn2)/mˆ1 ? m ? ?mˆ1 ? F?1(1 ? ?)} = {(x1; ;xn2)/mˆ1 ? 580 ? 76,4 ? 1,64}
?? W = {(x1; ;xn2)/493 ? 454,7}
Cette ingalitØ n’est pas vØri Øe, l’hypoth?se nulle n’est donc pas rejetØe, elle est acceptØe.
RØgion critique pour l’Øchantillon 2, test A
W = {(x1; ;xn2)/mˆ2 ? m ? ?mˆ2 ? F?1(1 ? ?)} = {(x1; ;xn2)/mˆ2 ? 580 ? 17,3 ? 1,64}
?? W = {(x1; ;xn2)/550 ? 551,6}
Cette ingalitØ est vØri Øe, l’hypoth?se nulle est donc rejetØe. On retient donc l’hypoth?se alternative.
Hypoth?ses du test B
L’hypoth?se nulle est la suivante : le vrai loyer moyen est infØrieur ou Øgal 580 euros :
H0 : m ? 580
L’hypoth?se alternative est la suivante : le vrai loyer moyen est strictement supØrieur 580 euros :
H1 : m > 580
Risques du test B
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que m n’est pas infØrieurr ou Øgal 580 alors qu’il l’est.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : consid?rer que m est infØrieur ou Øgal 580 alors qu’il ne l’est pas.
RØgion critique pour l’Øchantillon 1, test B
W = {(x1; ;xn2)/mˆ1 ? m + ?mˆ1 ? F?1(1 ? ?)} = {(x1; ;xn2)/mˆ1 ? 580 + 76,4 ? 1,64}
?? W = {(x1; ;xn2)/493 ? 705,3}
Cette ingalitØ n’est pas vØri Øe, l’hypoth?se nulle n’est donc pas rejetØe, elle est acceptØe.
RØgion critique pour l’Øchantillon 2, test B
W = {(x1; ;xn2)/mˆ2 ? m + ?mˆ2 ? F?1(1 ? ?)} = {(x1; ;xn2)/mˆ2 ? 580 + 17,3 ? 1,64}
?? W = {(x1; ;xn2)/550 ? 608,4}
Cette ingalitØ n’est pas vØri Øe, l’hypoth?se nulle n’est donc pas rejetØe, elle est acceptØe.
Question 4 - Test d’ØgalitØ des moyennes
On veut tester au seuil de 5% l’hypoth?se d’ØgalitØ des moyennes caculØes sur les deux Øchantillons.
Hypoth?ses
L’hypoth?se nulle est la suivante : les loyers moyens des deux Øchantillons sont Øgaux :
H0 : m1 = m2
L’hypoth?se alternative est la suivante : les loyers moyens des deux Øchantillons ne sont pas Øgaux :
H1 : m1 =6 m2
Risques du test
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que les loyers moyens sont di Ørents alors que ce n’est pas le cas.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : considØrer que les loyers moyens sont Øgaux alors que ce n’est pas le cas.
RØgion critique
Rappelons que (voir les corrigØs des sØances prØcØdentes pour le calcul de la variance d’une somme) :
?mˆ1?mˆ2 = ?V (mˆ1 ? mˆ2) Il vient alors :
Cette inØgalitØ n’est donc pas vØri Øe, on accepte donc l’hypoth?se nulle : les deux populations envisagØes ont la mŒme moyenne.
Question 5 - Test d’ØgalitØ des variances
On veut tester au seuil de 5% l’hypoth?se d’ØgalitØ des variances caculØes sur les deux Øchantillons.
Hypoth?ses
L’hypoth?se nulle est la suivante : les variances des deux Øchantillons sont Øgales :
H0 : ?1 = ?2
L’hypoth?se alternative est la suivante : les variances des deux Øchantillons ne sont pas Øgales :
H1 : ?1 =6 ?2
Risques du test
Le risque de premier esp?ce est celui de refuser tort l’hypoth?se nulle : consid?rer que les loyers des deux Øchantillons n’ont pas la mŒme variance alors que c’est le cas.
Le risque de seconde esp?ce est celui d’accepter tort l’hypoth?se nulle : considØrer que les loyers des deux Øchantillons ont la mŒme variance alors que ce n’est pas le cas.
RØgion critique
Avec F(?dlmax1 ;dlmin)(.) l’inverse de la fonction de rØpartition de la loi de Fisher dlmax et dlmin degrØs de libertØ oø dlmax est le plus grand degrØ de libertØ et dlmin le plus petit degrØ de libertØ parmi les deux Øchantillons (n1 ? 1 et n2 ? 1). Ici on a dlmax = n2 ? 1 = 299 et dlmin = n1 ? 1 = 5
Application
Cette inØgalitØ n’est donc pas vØri Øe, on accepte donc l’hypoth?se nulle : les deux populations envisagØes ont la mŒme variance.
Question 6 - Modi cation du seuil critique
Plus le seuil critique est faible, plus on rØduit la taille de la rØgion de rejet, plus on Øvite de se tromper en refusant tort l’hypoth?se nulle.
Exercice 2
Question 1 - La distribution des loyers suit-elle une loi normale?
Dans un premier temps, on calcule les frØquences empiriques : est le nombre d’observation de la classe i et N = 306.
Centre de classe xi | 250 | 350 | 450 | 550 | 800 |
FrØquence empirique | 0,075 | 0,203 | 0,464 | 0,203 | 0,056 |
Calculons la moyenne empirique X¯ de la distribution :? i Au passage on remarque qu’on a bien : f = 1
On peut retrouver ce rØsultat en faisant :
Calculons maintenant la variance empirique ?¯2 de la distribution :
On en dØduit l’Øcart-type ?¯ :
?¯ = ??¯2 = 117,66
Calculons maintenant la distribution thØorique des loyers en renant compte de la moyenne et de l’Øcart type :
Soit X la variable alØatoire reprØsentant le loyer.
Pour tout t, P(X??¯X¯ ? t) est lu dans la table de la loi Normale centrØe rØduite.
X ? x?i | X ? 200 | X ? 300 | X ? 400 | X ? 500 | X ? 600 | 600 ? X |
-2,16 | -1,31 | -0,46 | 0,38 | 1,23 | ||
0,0154 | 0,0951 | 0,323 | 0,652 | 0,892 | 0,108 |
?
On peut en dØduire les frØquences f˜i et e ectifs n˜i thØoriques de la fa on suivante :
n˜i = f˜i ? N
X ?x?i | X ?200 | 200?X ?300 | 300?X ?400 | 400?X ?500 | 500?X ?600 | 600?X |
f˜i | 0,0154 | 0,0797 | 0,2279 | 0,329 | 0,24 | 0,108 |
n˜i | 4,71 | 24,38 | 69,73 | 100,67 | 73,44 | 33,04 |
Calculons maintenant la statistique du ?2 qui nous intØresse :
X x?i | X 200 | 200 X 300 | 300 X 400 | 400 X 500 | 500 X 600 | 600 X |
? ? ? ? ? ? ? ? ? ? ?
E ectif observØ ni | 23 | 62 | 142 | 62 | 17 | |
(ni ?n˜i)2 | 22,20 | 1,92 | 59,86 | 1707,83 | 130,87 | 257,53 |
4,71 | 0,079 | 0,858 | 16,96 | 1,782 | 7,792 |
On compare cette statitique la loi du Khi ? deux m ? k ? 1 degrØs de libertØ oø m est le nombre de classes de l’Øchantillon et k le nombre de param?tres qui ont ØtØ estimØs.
Ici m = 6 et k = 2, donc m ? k ? 1 = 3.
La valeur limite lue dans la table du Khi ? deux est 7,82.
L’hypoth?se nulle est : la distribution suit une loi Normale.
La rØgion critique est W = {?2 ? 7,82}
On se trouve donc dans la rØgion critique. On peut donc rejeter l’hypoth?se de la loi Normale au seuil de 5%.
Question 2 - Test d’indØpendance
Soit nijle nombre d’observations possØdant le caract?re X avec la modalitØ i et le caract?re Y avec la modalitØ j. Soit nile nombre d’observations possØdant le caract?re X avec la modalitØ i. Soit njle nombre d’observations possØdant le caract?re Y avec la modalitØ j. N est le nombre total d’observations. Ici le caract?re X est le loyer et le caract?re Y la surface.
On calcule l’e ectif thØorique n˜ij de chaque groupe (modalitØs i et j) de la fa on suivante :
Sous l’hypoth?se d’indØpendance, la satistique D suit une loi du Khi ? deux d degrØs de libertØ.
d = (r ? 1)(s ? 1)
Avec r et s les nombres de modalitØs des caract?res X et Y .
Ici, D = 37,46 et d = 12.
La valeur limite lue dans la table du Khi ? deux est 21,03. La rØgion critique est
W = {D ? 21,03}.
On se trouve donc dans la rØgion critique, on peut donc refuser l’hytpoth?se d’indØpendance entre la surface et le loyer.
Exercice 3
Question 1 - Tests bilatØraux
On a estimØ pˆ = 0,78 lors des sØances prØc?dentes. On souhaite tester au seuil de 5% l’hypoth?se selon laquelle la probabilitØ de rØussite est de 0,75.
Hypoth?ses du test
Hypoth?se nulle : la probabilitØ p dobtenir un CDI moins d’un an apr?s l’obtention d’un master est de 0,75 :
H0 : p = 0,75
Hypoth?se alternative : la probabilitØ p dobtenir un CDI moins d’un an apr?s l’obtention d’un master n’est pas Øgale 0,75 :
H1 : p = 06 ,75 RØgion critique et application
Avec F?1(.) l’inverse de la fonction de rØpartition de la loi Normale centrØe-rØduite. Il vient, sous l’hypoth?se nulle : ?p(1 ? p)/n = ?0,75(0,25)/300 = 0,025
Cette inØgalitØ n’est pas vØri Øe, on ne rejette donc pas l’hypoth?se nulle, on l’accepte.
Autres tests
On souhaite tester l’hypoth?se selon laquelle la probabilitØ de rØussite est de 0,80. Il vient alors : ?p(1 ? p)/n = ?0,80(0,20)/300 = 0,023
Cette inØgalitØ n’est pas vØri Øe, on ne rejette donc pas l’hypoth?se nulle, on l’accepte.
On souhaite tester l’hypoth?se selon laquelle la probabilitØ de rØussite est de 0,85. Il vient alors : ?p(1 ? p)/n = ?0,85(0,15)/300 = 0,021
Cette inØgalitØ est vØri Øe, on peut donc rejeter l’hypoth?se selon laquelle la probabilitØ de trouver un CDI mions d’un an apr?s l’obtention du master est Øgale 0,85.
Question 2 - Lien avec l’intervalle de con ance
Lors des sØances prØcØdentes, on a construit pour p l’intervalle de con ance 95% suivant :
[0,736;0,830]
On remarque qu’on a acceptØ l’hypoth?se nulle des les tests pour lesquels la valeur se trouvait l’intØrieur de cet intervalle et qu’on a rejetØ l’hypoth?se nulle sinon. Attention cependant ne pas trop gØnØraliser ce rØsultat, l’intervalle ayant ØtØ construit en utilisant la valeur de pˆ pour estimer l’Øcart-type alors que dans les tests on utilise l’hypoth?se nulle la place.
Question 3 - Tests unilatØraux
On veut tester au seuil de 5% l’hypoth?se selon laquelle la probabilitØ de rØussite est infØrieure ou Øgale 0,80.
H0 : p ? 0,80
?? W == {(x1; ;xn2)/0,78 ? 0,837}
Cette inØgalitØ n’est pas vØri Øe, on accepte donc l’hypoth?se nulle.
On veut tester au seuil de 5% l’hypoth?se selon laquelle la probabilitØ de rØussite est suprieure ou Øgale 0,80.
H0 : p ? 0,80
H1 : p < 0,80
W = {(x1; ;xn2)/pˆ ? p ? ?p(1 ? p)/n ? F?1(1 ? ?)} = {(x1; ;xn2)/0,78 ? 0,80 ? 0,023 ? 1,64}
?? W == {(x1; ;xn2)/0,78 ? 0,762}
Cette inØgalitØ n’est pas vØri Øe, on accepte donc l’hypoth?se nulle.
On ne peut donc pas trancher alors que les deux hypoth?ses faites ici sont opposØes. Ceci se produit lorsque les hypoth?ses sont trop proches de l’estimation et/ou que l’estimation n’est pas assez prØcise.