Support de cours sur la statistique 3eme
Support de cours sur la statistique 3eme
...
III. Les limites de la méthode statistique :
Pour éviter des erreurs d’interprétation due à une mauvaise utilisation statistique, il faut savoir :
- La statistique s’intéresse au grand nombre, elle ignore les cas particuliers.
- La résultante d’un grand nombre d’informations peut être différente de la sommation de ces différentes informations. *comportement collectif # sommation des comportements individuels
- Quand on étudie un phénomène on n’est jamais certain que l’on dispose de toues les informations le concernant.
- Il ne faut pas oublier que la statistique n’est qu’un outil au service de l’économiste, ce qui nous oblige de ne jamais, oublier de faire une analyse économique des résultats.
- Les mêmes causes # les mêmes effets.
- Les corrélations mêmes très parfaites ne signifient pas toujours qu’il y a interdépendance entre les phénomènes étudiés.
- Le vocabulaire utilisé en statistique :
- Population statistique : Ensemble sur lequel porte l’étude
Ex : Age des étudiants de 1éreannée : l’ensemble étudié c’est l’âge.
- Unité statistique :
Une population se compose d’éléments chaque élément est appelé unité statistique.
EX : la population d’étudiants : l’unité statistique est un étudiant.
- Caractère statistique :
C’est le critère retenu pour étudier une population
Continu
Il peut être quantitatif discontinu, discret
Qualitatif
9 Un caractère est dit quantitatif lorsqu’il est mesurable
n Continu : c’est un caractère qui peut prendre toutes les valeurs d’un intervalle donné. EX : « âge »
n Discontinu : c’est un caractère qui ne peut prendre que quelques valeurs dans un intervalle donné EX : « le nombre des frères, Ménage »
9 Un caractère est dit qualitatif lorsqu’il n’est pas mesurable
EX : la nationalité, les catégories sociales professionnelles.
- Modalité statistique : K de caractère» :
On appelle une modalité les différentes situations possibles d’un caractère. EX : caractère « sexe » : modalités possibles : M/F
Caractère « état matrimonial » : 4 modalités possibles : célibataire/marié/divorcé/veuf.
- Effectifs (fréquences absolues) :
C’est le nombre d’unités statistiques relatif à une modalité donnée :
45Age
Effectifs
17 -18 200
18 -19 350
19 -20 50
total 600
- Fréquence relative : C’est la part des effectifs d’une modalité. EX : 200/600=33/100 est la fréquence relative de première modalité
- Série statistique :
Distribution de fréquences, distribution de statistiques ou tableau statistique, c’est un tableau qui nous donne l’ensemble des valeurs mesurant le caractère. EX :
On appelle classe un groupement de valeurs du caractère selon des intervalles qui peuvent être égaux ou inégaux.
Pour chaque classe on peut définir :
Une limite inférieure
Une limite supérieure
Intervalle de classe (amplitude)= limite (sup)- limite (inf)
Centre de classe = [limite (sup) + limite (inf)]/2
NB : « [40-60[« signifie qu’on comptabilise les salariés qui gagnent entre 40 et 60DH, en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.
- Quelque symboles mathématiques utilisés : 1. Les valeurs du caractère = x1, x2,..., xi,..., xn
Notes Nbre d’étudiants
x1
x2
x3
x4 10 x1 25 x2 12 x3 4 x4
- Les effectifs sont symbolisés par : x1, x2,..., xi,..., xn
x1, x2,..., xi,..., xn= N =effectif total
- Fréquence relative :
Fi = effectif de la modalité i / effectif total
- L’opérateur somme ( ∑ )
n Notation : n variables
n
x1+ x2+...+ xi+....+ xn=∑=
i 1 xi
n Propriétés :
n n
∑ axi a xi
= ∑
i = 1 i = 1
n n
∑ a+xi=∑a∑xi=n.a+∑xi
i i = 1
- L’opération de produit : ( ∏ )
n Notation : le produit de x variable s’écrit :
n
X1.x2.x3....xn = ∏ xi
i = 1
n Propriété :
n n n
CHAPITRE I : LA REPRESENTATION GRAPHIQUE
L’intérêt d’un graphique c’est de synthétiser des informations statistiques d’une maniéré imagée, c’est à dire globale.
- Le diagramme en bâtons :
On s’en sert pour représenter des séries à caractère discret.
Nombre d’enfants Nombre de ménage
0 25
1 42
2 38
3 15
4 6
5
Total 128
- Le tuyau d’orgue :
On se sert de ce graphique pour représenter des séries à caractère qualitatif
EX : La population à une station balnéaire est composée de :
Allemands : 45%
Français : 30%
Espagnoles : 15%
Autres : 10%
Allemands Français Espagnoles Autres
III. Le diagramme :
Il permet de représenter des séries de caractères ou les observations sont regroupées en classe.
- Cas ou les intervalles de classe sont égaux :
Allemands Français Espagnoles Autres
Remarque :
1) Lorsque une des limites de classe n’est pas précisée dans un tableau il convient de prendre comme intervalle de classe le même que celui de la classe suivante ou précédente.
2) La surface des rectangles est proportionnelle à leur effectif.
- Cas ou les intervalles de classe ne sont pas égaux :
EX : Répartition de population selon leurs salaires.
Pour tracer l’histogramme, on commence par corriger les effectifs.
- Le polygone des fréquences :
Il permet de donner une image plus lisse du phénomène que l’histogramme. On l’obtient en joignant les milieux des sommes des rectangles de l’histogramme.
0 10 20 30 40 50 60
Remarque :
1) La surface sous le polygone = la surface de l’histogramme.
2) Lorsqu’il y a un très grand nombre de classe, l’intervalle de classe devient de plus en plus petit et le polygone de fréquences se transforme en cours de fréquence.
Courbe de fréquences
- La courbe de cumulation (courbe des f cumulés) :
Elle permet de connaître le nombre d’observations supérieures ou inférieures à une valeur donnée.
Les 2 types de courbes de cumulation :
n Courbe cumulative croissante : permet de connaître le nombre d’observations inférieures à une valeur donnée.
n Courbe cumulative décroissante : il permet de connaître le nombre d’observations supérieures à une valeur donnée.
- a) Cas d’une variable continue :
Salaire
xi Xi cumulés Xi cumulés
[10-20[ 9 9 65
[20-30[ 13 22 56
[30-40[ 22 44 43
[40-50[ 10 54 21
[50-60[ 7 61 11
[60-70[ 4 65 4
Total 65 Moins de la borne supérieure Plus de la borne inférieure
Remarque :
On obtiendrait le même graphique si on remplace les fréquences absolues par les fréquences relatives (les pourcentages)
Courbe cumulée décroissante
Courbe cumulée croissante
70 60 50 40 30 20 10 0
1 2 3 4 5 6 7
- b) Cas d’une variable discrète (discontinue)
NB d’enfants (xi) NB de ménage Xi cumulés Xi cumulés
1 5 5 65
2 10 15 60
3 30 45 50
4 20 65 20
Total 65 <=xi >=xi
- Le diagramme polaire :
On l’utilise pour représenter des séries chronologiques c’est à dire des séries ou les observations seront à des temps réguliers.
- a) Les principes des coordonnées polaires : un point M dans l’espace est parfaitement repéré :
n Si on connaît ses coordonnées cartésiennes (x, y).
n Si on connaît ses coordonnées polaires (e, o).
- b) Le diagramme polaire :
Soit la série chronologique suivante : chiffre d’affaire mensuel
Année
1999 2000
Janvier 55 65
Février 53 75
Mars 65 72
Avril 50 40
Mai 43 42
Juin 41 38
Juillet 35 32
Août 30 34
Septembre 34 38
Octobre 40 40
Novembre 45 33
décembre 55 45
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80 10 . 20 . 30 .
Oct.
VII. Les graphiques à secteurs :
On les utilise pour représenter une série exprimée en pourcentages. EX : Pourcentage de touristes.
CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES
D’UN SERIE
INTRODUCTION
Avec la représentation graphique nous avons vu comment synthétiser une série avec image.
Dans ce chapitre nous allons voir comment synthétiser une série par quelques chiffres. Ces nombres sont appelés caractéristiques d’une série.
Soit les série suivantes :
Serie1 : 78-79-80-83
Série2 : 60-70-80-90-100 Série3 : 1-1-1-1-396
Les séries ont toutes la moyenne 80 même si elles sont très différentes les unes que les autres. Les valeurs de la 1ére série sont proches de la moyenne alors que celles de la 3éme sont éloignées de la moyenne.
Il y a donc nécessité, pour résumer une série de données de la présenter en 2 types de caractéristiques :
- les caractéristiques de valeurs centrales.
- les caractéristiques de dispersion.
SECTION 1 : Les Caractéristiques de Valeur Centrale :
- LES MOYENNES
A- La moyenne arithmétique : A-1 Définition
Etant donnée n observations qu’on va appeler X1,X2 ,X3, Xi,...Xn on appelle une moyenne arithmétique simple le nombre ×
Somme de toutes les observations
Χ =
Le nombre d’observations
x x
+ + + i + + n
2 x x
Χ = 1
n
: Une moyenne arithmétique simple
Lorsque les observations sont groupées c'est-à-dire que l’on observe
N1 fois X1
N2 fois X2
La moyenne arithmétique s’écrit :
Χ x1 + x1 + ..... + x2 + + x2
n1 + n2 + + .... nn
Une moyenne arithmétique pondérée
A-2 Application
Exercice1 : soit la série de notes suivante : 2-6-12-10-12-10-10-6
Χ 2+6+12+10+12+10+10+
8 8
Χ 8,5
Exercice2 : soit la série des notes de l’exercice qui peut être présentée de la manière suivante :
... ...
S’il veut mettre de l’engrais à son jardin, il a intérêt à se souvenir de la moyenne géométrique
X=9+449+4=6,5;G = 9* 4=6 moyenne arithmétique du périmètre =26 =6,5 * 4 # 6 * 4 moyenne géométrique : surface =36 =6*6 # 6,5 * 6,5
Généralités :
D’une manière générale, on retient la moyenne arithmétique quand les variables s’additionnent, et on utilise la moyenne géométrique lorsque les variables se multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h à 80Km/h.
Vitessemoy distoncetotale 100 +160 100 +160
tempstotal 100 160
La vitesse moyenne est égale à la moyenne harmonique des vitesses pondérées par les distances.
Ex3 : Une voiture roule pendant une heure à 50 Km/h puis 3hà 80Km/h.
Vitesse.moy distoncetotal (1x 50)+ (3x 80)
tempstotal 1+3
E n xi iE
La vitesse moyenne est égale donc à la moyenne arithmétique des vitesses pondérées par le temps.
Ex 4 : Une grandeur S0 a augmenté sur 3 années, d’abord de 10% puis de 15% et 30% pour le 3éme année.
Quel est le taux moyenne de croissance ?
1ère année : S0 devient S1=S0 + (S0*10/100) + S1 =S0(1+0,10 ) = 1,10S0 2éme année S1 devient S2 = S1 +0,15S1 +S1*1,15+ (S1*(1+0,15)) 3éme année S2 devient S3 = S2 +0,3S2 = 1,3S2+ (S2*(1+0,3))
S3 = S01,1 x 1,15 x 1,3
Moyenne géométrique G= 3 1,1x 1,1 5 x 1,3 =1,1804 Remarque: le taux de croissance moyenne est 18,04%
Ex 5 : Un étudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la moyenne des écarts entre les notes et la moyenne arithmétique.
Χ 8+10+12 10
Ecart type à la moyenne moyenne arithmétique des écarts = (-2+0+2)/3
8-10 = -2
10-10 =0
12-10 =2 moyenne arithmétique des écarts = 0
On retrouve ici une des propriétés des moyennes arithmétiques : ∑ ( xi − Χ ) = 0
…
Si on veut calculer la moyenne des écarts, il vaut mieux calculer la moyenne quadratique
- La médiane (Me)
b-1- Définition :
On appelle médiane d’une série classée par ordre croissant ou décroissant, la valeur du caractère qui partage en deux parties égales les effectifs.
C’est la valeur du caractère telle que la moitié des effectifs lui est supérieure et l’autre lui est inférieure.
b-2- Calcul de ME :
Cas d’une variable discrète
Si la série a un nombre impair de terme
75 62 57 12 18 a Me =57
Si la série a un nombre pair
12 25 32 44 52 69 a Intervalle Médian [32-44]
On prend le centre de l’intervalle comme la médiane : Cas d’une série de classes :
Salaires Effectifs Effectifs cumulés
10-15 9 9
15-20 25 34
20-25 32 66
25-30 16 82
Total 82
Le calcul de la médiane se fait en 3 étapes :
1ére étape : on repère le rang de la médiane. Rang = 82/2 = 41
∑ni
Rang =2
2éme étape : on repère la classe de Me :
Il s’agit de trouver la classe à laquelle appartient le 41éme individu, pour cela on classe les individus par ordre croissant des salaires, ce qui revient à construire la colonne des effectifs cumulés.
Me E [20-25], on peut calculer avec plus de précision Me en faisant une interpolation linéaire.
3éme étape : l’interpolation linéaire :
On connaît les salaires des 34 individus 20 On connaît les salaires des 66 individus 25
Le 41éme individus c’est le 7éme individus que je rencontre dans la classe 20 -25, son salaire sera obligatoirement égal à 20 + supplément que l’on calcule par interpolation.
En supposant que les 32 individus de la classe 20-25 sont répartis d’une manière uniforme dans la classe
20-25 puis sont séparés par la même quantité de salaire
On raisonne alors de la manière suivante :
Si pour 32 individus nous avons un écart de salaire de 5 DH
Pour 1 individu 5/32
Pour 7 individus 5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moitié des effectifs gagnent plus de 21,09 DH et l’autre moitié gagne (moins de 21,09 DH)
b-3- Détermination graphique de la médiane : Courbe cumulative
b-4-Remarque :
Salaire
Xi Xi
10 – 15 9 9
15 - 20 25 34
20 - 25 32 66
25 - 30 16 82
Méthode rapide d’interpolation :
20 41 34
− q Me 7 x 5 ~ 20 21
− 66 34
− 32
- le 41 éme individu normalement la médiane devrait se situer entre le 41 éme et le 42 éme, mais on convient lorsque les effectifs sont nombreux de prendre (N / 2)
III. Le Mode :
C’est la valeur du caractère le plus fréquent. A- Calcul Mode :
1- Cas d’une variable discrète :
Xi ni Xi Ni
3 3 2 4
14 18 17 16
21 7 33 15
42 4 39 16 51 8
Mo =14 Mo = 17
Série
Uni modal Mo = 39
Série bimodale
Série plurimodale (série à plusieurs modes)
2-Cas d’une série de classe :
Salaires ni
10 – 15 9
15 – 20 25
20 – 25 32
25 - 30 16
Total 82
-Nous avons une classe modale : 20 – 25
- On peut prendre comme mode le centre de classe 22,5
- On peut chercher à obtenir le mode avec plus de précision :
1/ Par Méthode graphique : Elle consiste d’abord à construire l’histogramme
N.B : Ne pas oublier, lorsqu’ on construit l’histogramme de corriger les effectifs.
2/ Par la méthode algébrique :
Mo = L1 + [d1. I / (d1 + d2)]
Mo = 20 + ( 3 2 − 25 ) * 5
(32-25) + (32 - 16)
L1 : Limite Inférieure de classe modale
d1 : La différence entre les effectifs de la classe modale et les effectifs de classe précédente
d2 : La différence entre les effectifs de classe modale et les effectifs de classe suivante
i : L’intervalle de la classe modale
- VI- Le choix d’une caractéristique de tendance centrale :
A : Les conditions de Yule :
1 ér conditions : Une modalité caractéristique doit être : définie de façon objective. (2 personnes différentes doivent trouver le même résultat)
2 éme conditions : Tenir compte de toutes les observations
3 éme conditions : être facile à comprendre
4 éme conditions : être facile à calculer
5 éme conditions : Doit se prêter au calcul algébrique
B : Comparaison des différentes caractéristiques de tendance centrale : 1-La moyenne :
Elle répond parfaitement aux conditions de Yule ; c’est pour cela qu’elle est la caractéristique la plus utilisée, mais il y a des cas ou il faut lui préférer la médiane quand elle risque d’être influencé des valeurs extrêmes.
EX:
Notes
Xi Ni * Xi
1 1 1
16 2 32
17 5 85
18 2 36
10 154
2-La médiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la médiane ne change pas quand on augmente la valeur d’une observation qui lui est inférieure
15 22 34 41 60 122 34 41 110
1 2 34 41 60
STATISTIQUE DESCRIPTIVE
3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est utile, en particulier quand on cherche la valeur la plus typique d’une série : Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure moyenne, mais va stocker les chaussures les plus vendues.
SECTION 2 : Les Caractéristiques de Dispersion: Partons de 3 séries _
Série 1 : 9 11 X = 10
_
Série 2 : 5 15 X = 10
_
Série 3 : 1 19 X = 10
Les 3 séries ont la même moyenne : 10 et portant ils sont différents l’unes des autres.
Dans la 1ère série ; les valeurs du caractère sont proches de la moyenne. La moyenne est représentative.
Dans la 3 éme Série les valeurs du caractère sont éloignées de la moyenne. Il faut donc lorsqu’on résume une série, indiquer par un nombre si les valeurs sont proches ou éloignées de la valeur centrale.
Ce nombre est appelé caractéristiques de dispersion.
- L’intervalle de variation ou l’étendue :
C’est la différence entre la plus grande valeur du caractère et la plus petite. L’intervalle de variation = Val MAX – Val MIN
∆= 2 Série 1 ∆= 1 0 série 2 ∆= 1 8 Série 3
Etendu ou intervalle de variation n’est pas un indicateur toujours fiable, car il dépend des valeurs extrêmes qui prouvent être fausses ou aberrantes.
EX :
17 18 20 60 Age
1000 étudiants
∆= 3
∆=60−17=43
STATISTIQUE DESCRIPTIVE
- L’intervalle inter quartile :
A- Définition des quartiles :
On appelle 1ér quartile Q1 la valeur du caractère tel que : 25% des observations lui sont inférieurs et 75% lui sont supérieurs. 25% < ; 75%> 2éme quartile Q2= Me 50% < 50%>
3émé quartile Q3= 75%< 25%>
B- Définition inter quartile :
On appelle inter quartile : Q3 – Q1 différence entre 1ér quartile et 3éme quartile.
N.B : Intervalle Inter quartile contient 50% des observations
C- Application :
N= 82
Rang : 82/4 =20 ,5 Classe : [15-20]
Interpolation : 15+∆
Salaires
Effectifs
10 -15 9
15 -20 25
20 -25 32
25 -30 16
Total 82
Ecart I. Inter quartile
Q3 – Q1
=24,3 - 17,3 = 7DH
Interprétation : Si 25 individus Augmentation de 5 DH
Si 01 Individu Augmentation 5/25 DH
(20,5 - 9) = 11,5 5/25 * 11,5
Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH 2éme Méthode :
Calcul de Q3
Rang : 82*3/4 =61,5 Classe = [20-25]
Interpolation : si 32 individus augmentation de 5 DH
01 Individu Augmentation de 5/32
(61,5 – 34) = 27,5 individus Augmentation 5/32 *27,5
Donc Q3 = 20+ [(5/32) *27,5]
Signification : 24,3dh c’est le salaire tel que 75% gagnent plus de 24,3 et 25% gagnent moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs l’écart Maximum de salaire est de 7 DH
D – Remarque :
1- Les déciles : valeur du caractère que 10 % des observations ont une valeur qui est inférieure à D1 et 90% des observations ont une valeur qui est supérieure à D1.
On appelle 9 éme décile de 9 la valeur du caractère tel que 90% des observations lui sont inférieures, et 10% des observations lui sont supérieures. L’intervalle inter décile D9 - D1 contient 80% des observations
2- Les percentiles :
On appelle percentiles P1 la valeur du caractère telle que un pourcent (1%) des observations ont une valeur inférieure à P1 et 98% ont une valeur supérieure à P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de calculer l’intervalle inter percentile P93 –P07 qui contient 86% des observations.
STATISTIQUE DESCRIPTIVE
L’écart absolu moyen :
A- Définition : On appelle écart absolu moyen que l’on désigne par la moyenne arithmétique des écarts absolus entre les valeurs du caractère et la moyenne arithmétique.
B- Application : soit le tableau suivant :
Poids ni xi ni * xi _
xi − x ni _
xi − x
55-60 12 57,5 690 10,25 123
60-65 17 62,5 1062,50 5,25 89,25
65-70 36 67,5 2430 0,25 9
70-75 24 72,5 1740 4,75 114
75-80 11 77,5 852,50 9,75 107,25
100 6775 442,5
Ca= 442.5 / 100 = 4.42 Kg × = 67.75 Kg
Signification : Ca = 4.42 Kg signifie qu’en moyenne, chaque individu s’éloigne de la moyenne (67.75 Kg) de 4.42 Kg.
Remarque : Pour dire si une dispersion est grande ou non, pour comparer deux séries entre elles, on se sert de l’indice de dispersion relatif = Ca / X *100 Exemple :
Poids de filles Poids des garçons
Χ =52 Kg × =68 Kg
Ca= 2 Kg Ca = 17 Kg
2/52 *100= 3.8% 17/68 * 100 = 25%
Dispersion Faible dispersion plus importante
IV- La variance et l’écart type :
A- Définition :
On appelle une variance la moyenne arithmétique des carrés des écarts entre les valeurs du caractère et la moyenne arithmétique.
σ 2 =∑ ni(xi − x) 2 / ∑ ni
STATISTIQUE DESCRIPTIVE
On appelle écart-type (ou écart quadratique moyen) la racine carré de 62
B- Application :
Le même tableau précédent
Signification : En moyenne chaque individu s’écarte du poids moyen (67.5 kg) de 5.76 kg.
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cœfficient de variation = σ/ ×
Ex :
Χ =67.75 Kg σ/ × =(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modèles d’ampoules électrique dont on a relevé les durées de vie.
Modèle 1 : Durée de vie moyenne 1400 H. Modèle 1 : Durée écart-type =100 H Modèle 2 : Durée de vie moyenne 1800 H. Modèle 2 : Durée écart-type = 250 H
STATISTIQUE DESCRIPTIVE
Modèle I Modèle II
6/x=100/1400 = 7% 250/1800 *100 = 14%
Le modèle I est plus faible que le modèle II
Formule développée :
Donc 6 = Eni xi2 x 2
Eni
Poids ni xi xi2 ni * xi2
55-60 12 57,5 330625 39675
60-65 17 62,5 390625 66406,25
65-70 36 67,5 455625 164025
70-75 24 72,5 525625 126150
75-80 11 77,5 600625 66068,75
100 462325
6 = 462325 - (67.75)2 33.19 100
6 = 3 3. 1 9 =5.76
SECTION III : Les Caractéristiques de Concentration
La concentration ne s’applique qu’à des séries statistiques ou la concentration de la variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncière Autres EX : on ne peut pas parler de concentration d’âge
On peut déterminer la concentration soit algébriquement soit graphiquement
- La détermination algébrique de la concentration
Cette détermination nécessite la connaissance de la « médiale » Notion de la médiale (Ml)
A- La médiale
Si dans une série on désigne par xi la valeur du caractère, par ni les effectifs, la médiale est la valeur du caractère qui partage en deux parties égales le produit cumulé de ni xi.
Si xi désigne un salaire
Ni désigne le nombre de salariés
STATISTIQUE DESCRIPTIVE
Le produit cumulé des ni xi représente la totalité des salaires Versés E nixi
C’est-à-dire la masse salariale.
La médiale, c’est le salaire tel que la moitié de la masse salariale a servi à payer une partie qui touche moins de cette Médiale et l’autre moitié de la masse s a servi à payer les gens qui touchent plus de cette Médiale.
B- Mesure de la concentration
∆M sert à mesurer la différence entre ML et ME :
∆M=ML– ME
* Si∆M = 0 cela veut dire que ML =ME
C'est-à-dire l’individu qui est au milieu l’effectif est en même temps celui qui est placé tel que la moitié de la masse salariale a été versée à des gens qui touchent moins que lui, et l’autre moitié à des gens qui reçoivent plus que lui, on a donc une distribution égalitaire concentration est nulle
* Si ∆m # 0 cela indique qu’il y a une concentration
* Si ∆m est faible par rapport à l’intervalle de variation la concentration est faible
* Si ∆m est important, la concentration est forte
Inter variation
C- application
salaire ni xi nixi nixi
10-15 8 12.5 112.5 112.5
15-20 25 17.5 437.5 550
20-25 32 22.5 720 1270
25-30 16 27.5 440 1710
total 82 1710
∆M= ML – ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linéaire
720→5dh
1dh→ 5/720dh
(855-550) =3055→ 5/720*305dh
Donc ML= 20+5/720*350
ML = 22.12dh } ∆M = ML - ME
= 22 ,12 - 21,09~1dh
STATISTIQUE DESCRIPTIVE
∆M/inter varia = 1/20=5% concentration faible L’intervalle de variation
«Étant égale à : (30-10)=20 Signification ML = 22.12 dh
C’est le salaire tel que la moitié de la masse salariale a servi à payer des gens qui gagnent moins que 22.12 dh et l’autre moitié de la masse salariale a servi à payer les gens qui gagnent plus que 22.12 dh
- La détermination graphique de la concentration la courbe de Lorentz GINI
A- la graphique de GINI
GINI propose de mesurer la concentration en mettant en abssices les fréquences cumulées en%, et en ordonnées ni xi cumulés en %
salaire ni Fi% Fi% *n xi nixi Nixi% Nixi%cum
10-15 9 11 11 12.5 112.5 6.6 6.6
15-20 25 30.5 41.5 17.5 437.5 25.6 32.2
20-25 32 39 80.5 22.5 720 24.1 74.3
25-30 16 13.5 100 27.5 440 25.7 100
total 82 100 1710
1) si 10% de la population touchent 10% du revenu, 20% de la population touchent 20% du revenu. Dans le cas d’une répartition égalitaire du salaire, l’aire de concentration serait confondue avec diagonal.
2) Dans le cas d’une repartions illégalitaire parfaite des salaires, (comme dans le cas théorique ou 0.1% de la population toucherait 99.99% de la masse salariale : la courbe
STATISTIQUE DESCRIPTIVE
B)-Le coefficient de Gini :