Manuel d’exercices avec corriges en statistique descriptive

Manuel d’exercices avec corrigés en statistique descriptive
Chapitre 1
Les outils
Nous présentons dans ce chapitre des exercices sur quatre thèmes : les nomen-clatures et les types de variable, les tableaux statistiques, les représentations gra-phiques, l’utilisation des pourcentages et des taux.
1. TYPES DE VARIABLE, VARIABLE OU CARACTÈRE
Mots-clefs
Variable discrète, variable continue, caractère qualitatif
Énoncé
Quelle est la nature des caractères ci-dessous ?
Nombre d’actions vendues chaque jour à la bourse
Rémunérations des enseignants d’un lycée
Indicateur du moral des ménages
Écart de rémunération entre hommes et femmes
Les pays de l’Union européenne
Les niveaux de formation des salariés
Les formes de contrat de travail
Taux de croissance du PIB
Prix à la consommation
Solde commercial
Nombre de personnes par ménages
Corrigé
Nombre d’actions vendues chaque jour à la bourse | variable discrète |
Rémunérations des enseignants d’un lycée | variable quantitative continue |
Indicateur du moral des ménages | variable qualitative ordonnée |
Écart de rémunération entre hommes et femmes | variable continue |
Les pays de l’Union européenne | caractère qualitatif |
Les niveaux de formation des salariés | variable ordonnée |
Les formes de contrat de travail | caractère qualitatif |
Taux de croissance du PIB | variable quantitative |
Prix à la consommation | variable quantitative |
Solde commercial | variable quantitative |
Nombre de personnes par ménage | variable statistique discrète. |
2. UTILISATION DE LA NAF
Mots-clefs
Caractère qualitatif, nomenclature
Énoncé
1. Quel est le code de la nomenclature NAF 31 correspondant à la « Fabrication d’équipements électriques et électroniques » ?
2. Quelle est l’activité codée LL ?
Vous trouverez la nomenclature nécessaire p. 125 du livre de cours.
Corrigé
1. Le code de la nomenclature NAF correspondant à la « Fabrication d’équipe-ments électriques et électroniques » est obtenu par lecture de la nomenclature. Le code est DL.
2. Le code LL correspond à l’activité « Administration publique ».
- UTILISATION D’UNE NOMENCLATURE DE L’UNION EUROPÉENNE
Mots-clefs
Caractère qualitatif
Énoncé
Quelle est l’activité correspondant au E de la NACE-CE ?
Vous trouverez la nomenclature nécessaire p. 126 du livre de cours.
Corrigé
L’activité correspondant au code E est la « Production et distribution d’électri-cité, de gaz et d’eau ».
4. NIVEAUX DE FORMATION
Mots-clefs
Caractère qualitatif ordonné
Énoncé
Quel est le niveau de formation d’un étudiant qui, ayant suivi les cours de pre-mière année du DEUG de sociologie, n’a pas obtenu son passage en seconde année et quitte l’université ?
Vous trouverez la nomenclature nécessaire page 126 du livre de cours.
Corrigé
Le niveau de formation de cet étudiant sera IV, plus précisément IV sup. La nomenclature des formations est un caractère qualitatif ordonné.
5. NOMBRE DE PERSONNES DANS LES MÉNAGES
Mots-clefs
Variable discrète, tableau statistique
Énoncé
Nous disposons de la distribution des ménages selon leur composition.
Ménages suivant le nombre de personnes du ménage en France en 1995
Soit en pourcentage, suivant le nombre de personnes dans le ménage
…
- Construisez le tableau statistique en calculant les effectifs pour chacune des catégories de ménages.
- Combien de personnes ont été comptées dans cette étude ?
Corrigé
Un ménage est constitué des personnes occupant une même unité d’habitation.
1. La construction du tableau statistique nécessite de calculer l’effectif de chaque catégorie de ménages. Il est obtenu en multipliant le nombre total des ménages par son importance relative. Les résultats ont été arrondis au millier d’unité près.
Par exemple, le calcul du nombre de ménages comprenant trois personnes est le sui-vant :
…
Valeurs de la variable | Fréquences | Pourcentages | Effectifs (milliers) | |
xi | fi | pi | ni | |
1 personne | 0,292 | 29,2 | 6 753 | |
2 personnes | 0,318 | 31,8 | 7 354 | |
3 personnes | 0,168 | 16,8 | 3 885 | |
4 personnes | 0,142 | 14,2 | 3 284 | |
5 personnes et plus | 0,080 | 8,0 | 1 850 | |
Total | 1,000 | 100,0 | 23 126 |
- Pour calculer le nombre de personnes concernées par l’étude, nous devons faire une hypothèse sur la taille des ménages de la classe « 5 personnes et plus ». Dans le cas où nous considérerions que la taille moyenne de cette catégorie de ménages est de 6, nous obtiendrions une population de 57 352 milliers de per-sonnes. Si nous retenons l’hypothèse de 7 personnes par ménage dans cette classe, nous avons une population de 59 202 milliers de personnes.
Si nous retenons la première hypothèse, le détail du calcul est :
1 · 6 753 + 2 · 7 354 + 3 · 3 885 + 4 · 3 284 + 6 · 1 850 = 57 352
Si nous retenons la seconde hypothèse, le détail du calcul est :
1 · 6 753 + 2 · 7 354 + 3 · 3 885 + 4 · 3 284 + 7 · 1 850 = 59 202 .
6. APPELS TÉLÉPHONIQUES
Mots-clefs
Tableau statistique, variable continue
Énoncé
Vous disposez d’une facture détaillée des appels d’un abonné à France Télécom sur la période 09/03/05-05/05/05.
Effectuez le regroupement en classes de ces données selon les trois variables continues. Vous veillerez à ce que les classes que vous avez choisies respectent les conditions qu’on attend d’un regroupement en classes.
- Plage horaire de l’appel
- Durée des appels
- Montant des appels.
Détail des appels
Date | Heure | Durée | Montant |
jj.mm | mm:ss | Hors taxe | |
en centime d’euro | |||
09.03 | 11:12 | 11:25 | 2,570 |
11.03 | 21:16 | 06:38 | 1,040 |
14.03 | 09:40 | 01:29 | 3,070 |
15.03 | 17:04 | 00:19 | 0,610 |
15.03 | 17:28 | 02:17 | 1,970 |
15.03 | 18:31 | 02:24 | 2,070 |
15.03 | 20:27 | 07:10 | 1,100 |
15.03 | 20:53 | 06:47 | 3,160 |
16.03 | 16:15 | 14:38 | 3,310 |
16.03 | 20:05 | 04:27 | 2,190 |
17.03 | 10:41 | 05:25 | 1,180 |
17.03 | 14:36 | 00:34 | 2,460 |
17.03 | 15:17 | 10:21 ![]() | 2,320 |
17.03 | 16:06 | 07:39 | 1,690 |
17.03 | 21:05 | 12:17 | 1,690 |
23.03 | 11:31 | 00:35 | 2,460 |
24.03 | 13:30 | 21:14 | 4,850 |
24.03 | 21:22 | 27:02 | 3,400 |
25.03 | 16:34 | 00:10 | 2,460 |
25.03 | 21:19 | 00:37 | 2,460 |
26.03 | 18:58 | 01:44 | 4,280 |
27.03 | 16:31 | 03:44 | 0,700 |
27.03 | 22:51 | 03:47 | 0,710 |
30.03 | 15:34 | 00:37 | 2,460 |
01.04 | 18:48 | 05:45 | 1,250 |
01.04 | 21:55 | 10:52 | 1,530 |
03.04 | 10:09 | 00:44 | 3,070 |
04.04 | 20:55 | 03:18 | 0,650 |
05.04 | 20:47 | 06:35 | 3,080 |
06.04 | 20:56 | 08:00 | 1,190 |
07.04 | 20:20 | 07:41 | 1,160 |
10.04 | 17:14 | 00:42 | 1,840 |
21.04 | 08:58 | 05:23 | 1,170 |
21.04 | 09:28 | 04:04 | 0,860 |
21.04 | 09:34 | 06:35 | 1,450 |
Date | Heure | Durée | Montant | |
jj.mm | mm:ss | Hors taxe | ||
en centime d’euro | ||||
24.04 | 14:21 | 00:26 | 2,460 | |
26.04 | 09:05 | 00:31 | 3,070 | |
26.04 | 20:50 | 14:01 | 1,890 | |
26.04 | 21:40 | 03:33 | 0,680 | |
26.04 | 21:44 | 10:29 | 1,480 | |
27.04 | 20:42 | 03:03 | 0,620 | |
27.04 | 20:48 | 08:19 | 1,230 | |
27.04 | 20:57 | 08:49 | 1,290 | |
27.04 | 21:11 | 04:49 | 0,830 | |
27.04 | 21:17 | 05:10 | 0,870 | |
27.04 | 21:22 | 03:16 | 0,650 | |
29.04 | 20:29 | 05:46 | 0,940 | |
01.05 | 14:01 | 01:33 | 3,070 | |
01.05 | 17:11 | 03:17 | 0,650 | |
03.05 | 20:38 | 09:40 | 1,390 | |
03.05 | 20:57 | 12:22 | 1,700 | |
04.05 | 16:13 | 20:31 | 4,680 | |
04.05 | 20:28 | 03:04 | 0,620 | |
05.05 | 14:19 | 08:36 | 1,910 | |
05.05 | 14:49 | 26:28 | 6,060 | |
05.05 | 19:54 | 05:48 | 14,400 |
Corrigé
- Pour effectuer le dépouillement sur la plage horaire de l’appel, nous consta-tons qu’aucun appel n’a lieu avant 8h et aucun après 23h. Nous choisissons des plages de deux heures démarrant à 8h, la dernière plage sera une plage d’une heure.
Plage horaire de l’appel

Classes | Centres des | Effectifs | Fréquences | Pourcentages | Fréquences |
classes | cumulées | ||||
ci | ni | fi | pi% | Fi | |
[8 ; 10[ | 5 | ||||
[10 ; 12[ | 4 | ||||
[12 ; 14[ | 1 | ||||
[14 ; 16[ | 7 | ||||
[16 ; 18[ | 9 | ||||
[18 ; 20[ | 4 | ||||
[20 ; 22[ | 25 | ||||
[22 ; 23] | 1 | ||||
Total | 56 |
Avant d’aller plus loin dans le tableau, nous constatons un déséquilibre au niveau de la plage entre 20h et 22h. La perte d’information est importante et peut faci-lement être réduite en utilisant des plages d’une heure pour ce créneau horaire.
Plage horaire de l’appel
Classes | Centres des | Effectifs | Fréquences | Pourcentages | Fréquences |
classes | cumulées | ||||
ci | ni | fi | pi% | Fi | |
[8 ; 10[ | 9 | 5 | 0,089 | 8,9 | 0,089 |
[10 ; 12[ | 11 | 4 | 0,071 | 7,1 | 0,161 |
[12 ; 14[ | 13 | 1 | 0,018 | 1,8 | 0,179 |
[14 ; 16[ | 15 | 7 | 0,125 | 12,5 | 0,304 |
[16 ; 18[ | 17 | 9 | 0,161 | 16,1 | 0,464 |
[18 ; 20[ | 19 | 4 | 0,071 | 7,1 | 0,536 |
[20 ; 21[ | 20,5 | 15 | 0,268 | 26,8 | 0,804 |
[21 ; 22] | 21,5 | 10 | 0,179 | 17,9 | 0,982 |
[22 ; 23] | 22,5 | 1 | 0,018 | 1,8 | 1,000 |
Total | 56 | 1,000 | 100,0 |
2.
Durée des appels
Classes | Centres des | Effectifs | Fréquences | Pourcentages | Fréquences |
classes | cumulées | ||||
ci | ni | fi | pi% | Fi | |
[0 ; 5[ | 26 | ||||
[5 ; 10[ | 16 | ||||
[10 ; 15[ | 10 | ||||
[15 ; 20[ | |||||
[20 ; 25[ | 2 | ||||
[25 ; 30] | 2 | ||||
Total | 56 |
Avant d’aller plus loin, constatons que les premières classes sont disproportion-nées par rapport aux autres et qu’il y a une classe vide. Un autre découpage pos-sible est explicité dans le tableau suivant.
Durée des appels (regroupement plus judicieux)
Classes | Centres des classes ci | Effectifs | Fréquences | Pourcentages | Fréquences cumulées |
ni | fi | pi% | Fi | ||
[0 ; 2[ | 1 | 13 | 0,232 | 23,2 | 0,232 |
[2 ; 4[ | 3 | 10 | 0,179 | 17,9 | 0,411 |
[4 ; 6[ | 5 | 9 | 0,161 | 16,1 | 0,571 |
[6 ; 8[ | 7 | 7 | 0,125 | 12,5 | 0,696 |
[8 ; 10[ | 9 | 5 | 0,089 | 8,9 | 0,786 |
[10 ; 12[ | 11 | 4 | 0,071 | 7,1 | 0,857 |
[12 ; 14[ | 13 ![]() | 2 | 0,036 | 3,6 | 0,893 |
[14 ; 16[ | 15 | 2 | 0,036 | 3,6 | 0,929 |
[16 ; 30[ | 23 | 4 | 0,071 | 7,1 | 1,000 |
Total | 56 | 1,000 | 100,0 |
3.Montants des appels
Classes | Centres des | Effectifs | Fréquences | Pourcentages | Fréquences |
classes | cumulées | ||||
ci | ni | fi | pi% | Fi | |
[0 ; 1[ | 0,5 | 13 | 0,232 | 23,2 | 0,232 |
[1 ; 2[ | 1,5 | 20 | 0,357 | 35,7 | 0,589 |
[2 ; 3[ | 2,5 | 10 | 0,179 | 17,9 | 0,768 |
[3 ; 4[ | 3,5 | 8 | 0,143 | 14,3 | 0,911 |
[4 ; 5[ | 4,5 | 3 | 0,054 | 5,4 | 0,964 |
[5 ; 10[ | 7,5 | 1 | 0,018 | 1,8 | 0,982 |
[10 ; 15[ | 12,5 | 1 | 0,018 | 1,8 | 1,000 |
Total | 56 | 1 | 100,0 |
7. TABLE DE MORTALITÉ
Mots-clefs
Variable continue, tableau statistique
Énoncé
Extrait de la table de mortalité de la génération féminine française de 1899
Age exact | Survivants à l’âge exact |
100 000 | |
1 | 84 883 |
2 | 82 247 |
3 | 80 843 |
4 | 79 995 |
5 | 79 186 |
6 | 78 763 |
7 | 78 411 |
Source : « La mortalité par génération en France depuis 1899 »,
Travaux et documents, Cahier INED n°63, 1973
- Présentez le tableau statistique de la variable « âge du décès » sous sa forme habituelle.
- Donnez la signification concrète de chacune des colonnes du tableau statis-tique obtenu.
Corrigé
- L’étude porte sur 100 000 filles nées en 1899 dont le décès est survenu avant l’âge de 7 ans.
Comment obtient-on les effectifs du tableau ? Nous allons prendre comme exemple le cas de la première classe. Nous savons qu’il y a eu 100 000 naissan-ces ; un an plus tard seules 84 883 femmes sont encore vivantes, le nombre de décès est donc de 100 000 − 84 883 = 15 117. Nous répétons le raisonnement pour tous les âges, ce qui nous permet de construire le tableau statistique.
Répartition de la génération féminine française de 1899 suivant l’âge du décès
Classes | Centres des classes ci | Effectifs ni | Fréquences fi | Pourcentages pi% | Fréquences cumulées Fi |
[0 ; 1[ | 0,5 | 15117 | 0,700 | 70,0 | 0,700 |
[1 ; 2[ | 1,5 | 2636 | 0,122 | 12,2 | 0,822 |
[2 ; 3[ | 2,5 | 1404 | 0,065 | 6,5 | 0,887 |
[3 ; 4[ | 3,5 | 848 | 0,039 | 3,9 | 0,927 |
[4 ; 5[ | 4,5 | 809 | 0,037 | 3,7 | 0,964 |
[5 ; 6[ | 5,5 | 423 | 0,020 | 2,0 | 0,984 |
[6 ; 7] | 6,5 | 352 | 0,016 | 1,6 | 1,000 |
21589 | 1,000 | 100,0 |
La première colonne reprend la tranche d’âge des décès. La deuxième repré-sente l’âge moyen du décès par classe annuelle. La colonne des effectifs donne le nombre de femmes décédées dans la tranche d’âge considérée. Au total 21589 filles sont décédées avant l’âge de 7 ans. La colonne suivante donne la fréquence des femmes décédées dans la tranche d’âge, ainsi que la troisième qui exprime la même chose en pourcentage. La dernière colonne donne la fréquence des femmes décédées avant la borne supérieure de la tran-che d’âge. La fréquence signifie que 92,7 % des femmes mortes avant l’âge de 7 ans sont mortes avant l’âge de 4 ans. Le tableau montre que la mortalité féminine est très forte au cours de la première année (70 % des décès).
8. BILAN DES APPORTS ET DES USAGES DE L’EAU
Mots-clefs
Analyse de graphique
Énoncé
L’exercice consiste à commenter un pictogramme
Bilan des apports et des usages des eaux continentales (en milliards de m3/an)
Source : TEF 1998/1999, Paris : INSEE
- Quelle est la quantité nette d’eau consommée par les centrales électriques ?
- Quel est le bilan des échanges d’eau avec les pays voisins ?
- Quelle est l’équation d’équilibre des usages humains de l’eau ?
- Quelle est l’équation d’équilibre des eaux continentales ?
Corrigé
- Pour calculer la part des centrales électriques dans la quantité nette d’eau consommée, nous supposons que la « consommation » nette, en fait l’évapo-ration, est proportionnelle à la quantité utilisée. Cette hypothèse est sans doute une sous-estimation dans le cas des centrales électriques. Pour un usage total
de 41 milliards de m3 par an, 35 provenant des précipitations et 6 des nappes phréatiques, nous obtenons une consommation de :
6 ·26= 3,8 milliards de m3 41
- La France reçoit 11 milliards de m3 par écoulement, les écoulements vers les pays voisins s’élèvent à 18 milliards de m3, donc le solde des échanges exté-rieurs est de – 7 milliards de m3.
- Les activités humaines prélèvent 35 milliards de m3 dans « les rivières, lacs et retenues » et 6 milliards de m3 dans les nappes phréatiques soit 41 milliards de m3.
Les usages humains se traduisent par une évapotranspiration de 6 milliards de m3, un écoulement de 4 milliards de m3 vers la mer et de 31 milliards de m3 dans les « rivières, lacs et retenues », soit également 41 milliards de m3.
Emplois – ressources des usages humains (milliards de m3)
Emplois | Ressources | ||
Consommations nettes (évaporation) | 6 | Prélèvements dans les « rivières, lacs et retenues » | 35 |
Écoulement vers la mer |