Formation sur la série statistique a deux variables
...
Est-ce que je sais… ?
Dans un repère orthogonal, placer les points A(– 0,5 ; – 1) ; B(1 ; 2,5) et C(3 ; 1).
– 1 ; 2,5 ; 1.
Calculer le nombre b pour que la droite d’équation y = 1 2x + b passe par le point de coordonnées 7
Activité Représenter une série et calculer son point moyen
Vendre plus pour gagner plus
Une enquête a été menée auprès de huit représentants d’entreprises différentes de vente de photocopieurs. Le tableau suivant donne, pour chaque représentant, le chiffre d’affaires annuel et le revenu annuel, en milliers d’euros.
Chiffre d’affaires annuel (en milliers d’euros) 340 390 440 620 470 360 460 520
Revenu annuel (en milliers d’euros) 25 26 33 41 36 28 35 38
1 Ce que montre un graphique
Les points obtenus forment le nuage de points.
2 En moyenne…
Le point G se nomme le point moyen.
Activité 2 Exploiter une droite d’ajustement
Une utilisation électrique de la statistique !
La tension U aux bornes d’une batterie de force électromotrice e et de résistance interne R s’écrit théoriquement U = – Ri + e. On a procédé à différentes mesures :
Intensité i (A) 0 0,1 0,4 1
Tension U (V) 12 11 7 1
Cette droite se nomme droite d’ajustement.
Activité 3 Déterminer un ajustement affi ne
Quelle tendance pour les gaz a effet de serre ? `
Le tableau suivant correspond aux émissions de gaz à effet de serre (en millions de tonnes équivalent CO2) relevées en France (source : Ifen).
Année 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Émissions GES 565 561 563 554 558 557 561 545 535 532
1 Recherche du point moyen
Calculer les coordonnées x (moyenne de la première ligne du tableau) et y (moyenne de la seconde ligne) du point moyen G.
2 Détermination d’une droite d’ajustement
On admet que D a pour coefficient directeur – 3,33.
On note y = – 3,33x + b une équation de D.
Calculer le nombre b.
Nuage de points et point moyen
Une série statistique à deux variables est donnée sous forme d’un tableau :
Variable 1 : xi x1 x2 x3 … xn
Variable 2 : yi y1 y2 y3 … yn
Dans un repère, les points de coordonnées (xi ; yi ) constituent le nuage de points représentant la série statistique.
Le point moyen du nuage a pour coordonnées (x ; y ) où x est la moyenne des xi et y la moyenne des yi
. Il est situé au « centre » du nuage.
Exemple
La série suivante correspond aux poids (en physique on parle de masse) et aux tailles de 9 nouveau-nés d’une maternité.
Poids xi en kg 2,76 3,56 3,38 2,92 3,22 2,84 2,93 4,28 3,72
Tailles yi en cm 49 50 51 47 50 48 49 54 52
Le point moyen G a pour coordonnées : le poids moyen des 9 bébés, x = 3,29 kg, et la taille moyenne y = 50 cm.
Il semble que plus un bébé est lourd, plus sa taille a tendance à être grande.
Ajustement affine
Lorsque le nuage a une forme « allongée », on peut rechercher une droite passant par le point moyen et au plus près des autres points : c’est un ajustement affine du nuage.
L’équation y = ax + b de la droite d’ajustement donne la « tendance » de l’évolution de y en fonction de x.
Exemple
Le tableur fournit la droite d’équation
y = 3,903 4x + 37,158 comme ajustement affine du nuage précédent.
Cette équation indique comment la taille des bébés à la naissance a tendance à augmenter lorsque leur poids de naissance augmente.
1 Comment déterminer le point moyen ?
Énoncé
Le tableau suivant donne le prix de vente d’un article en fonction de la quantité commandée.
Quantité commandée xi
50 100 150 200 250 300
Prix en milliers d’euros yi
2,8 2,4 2,3 2 1,65 1,6
Calculer les coordonnées du point moyen G du nuage de points correspondant.
Solution
La moyenne des quantités commandées est :
x = 50 100 150 200 250 300
= 175.
La moyenne des prix est :
y = 2 8 2 4 2 3 2 1 65 1 6
, , , , , = 2,125.
Le point G a pour coordonnées (175 ; 2,125).
2 Comment représenter un nuage de points puis l’ajuster avec un tableur ?
Énoncé
Avec les données de l’exercice précédent, représenter à l’aide d’un tableur le nuage de points correspondant, puis en effectuer un ajustement affine.
... ....
Solution
Sélectionner les données puis :
– avec Excel 2003, cliquer sur l’icône Assistant graphique et choisir Nuage de points ;
– avec Excel 2007, choisir Insertion/Nuage de points ;
– avec OpenOffice Calc, cliquer sur l’icône
Diagramme puis choisir XY (dispersion).
Cliquer avec le bouton droit sur l’un des points du nuage et choisir Ajouter une courbe de tendance… avec Excel ou Insérer une courbe de tendance… avec OpenOffice.
Choisir Linéaire et cocher Afficher l’équation sur le graphique.
3 Comment ajuster une série avec une calculatrice, puis extrapoler ?
Énoncé
Une enquête du service commercial d’une chaîne d’hôtels « quatre étoiles » a permis de connaître l’évolution de la demande mensuelle yi de nuitées, selon le prix xi proposé en « période creuse ».
y = ax + b de la demande mensuelle en fonction du prix de la chambre.
Solution avec une calculatrice de marque Casio
Faire MENU STAT EXE , puis effacer les données présentes en se plaçant dans une colonne, puis DEL A YES EXE
Entrer les valeurs xi en colonne List 1 et les valeurs yi en colonne List 2.
Régler les listes par CALC SET
2Var X List : List 1
2Var Y List : List 2
2Var Freq : 1 EXE .
Afficher les résultats
par REG X .
Solution avec une calculatrice de marque Texas Instruments
Faire STAT ou stats , puis effacer les
données présentes par EDIT 4:ClrList
ENTER L1, L2 ou 4:EffListe entrer L1, L2 (on obtient L1 et L2 au clavier par la touche 2nd ou 2nde ).
Entrer les données par STAT EDIT
1:Edit ENTER ou 1:Edite entrer , puis entrer les valeurs xi en colonne L1 et les valeurs yi en colonne L2.
Afficher les résultats par STAT CALC
4:LinReg(ax +b) ENTER L1, L2 ou stats
CALC 4:RegLin(ax +b) entrer L1, L2.
y = – 4,55x + 883,11.
Ajuster un grand nombre de données
Capacité de production éolienne
Ouvrir le fichier « 01_prod_eolienne.xls » ou « 01_prod_ eolienne.ods » fournissant la capacité de production éolienne de 76 pays de 2001 à 2010 (source : EWEA).
1 Étude de la capacité de production française
Pourquoi un ajustement affine a-t-il ici peu de sens ?
2 Comparaison de l’Europe et de l’Asie
2012 (rang x = 12).
Comprendre le principe des « moindres carrés »
Chiffre d’affaires d’un constructeur d’automobiles
1 Principe des « moindres carrés »
Ouvrir le fichier « 01_moindres_carres.xls » ou « 01_moindres_carres.ods », donnant le chiffre d’affaires, en milliards d’euros, d’un constructeur d’automobiles.
On recherche une droite d’équation y = ax + b, passant par le point moyen et ajustant « au mieux » le nuage des quatre années données.
Pourquoi la somme des écarts contenus en colonne E ne permet-elle pas de savoir si la droite est proche des points du nuage et quel est l’avantage de considérer la somme des écarts au carré ?
Quel est, à 10 – 1 près, le coefficient a optimal ?
Appelez le professeur pour exposer votre résultat.
2 Comparaison avec l’ajustement du tableur
Le tableur peut afficher directement la droite d’ajustement obtenue selon le principe précédent des « moindres carrés ». Sur le graphique, cliquer sur un point du nuage situé à l’écart de la droite à l’aide du bouton droit de la souris et choisir Courbe–de– tendance… Dans la boîte de dialogue, choisir Linéaire et cocher Afficher–l’équation.
Appelez le professeur pour exposer vos commentaires.
Exercice
Déterminer le point moyen
1 Le tableau suivant donne, pour sept années consécutives, l’évolution de la production d’un certain type de pièces et des frais de publicité correspondants, dans une entreprise du secteur industriel.
Production xi (en milliers)
Frais de publicité yi (en milliers d’euros)
260 17
280 16
260 17
310 19
300 22
350 23
340 26
y = 0,084x – 5,2.
Vérifier que G appartient à D.
Exploiter un ajustement affine donné
2 Fonte des glaciers
Le graphique suivant correspond à l’altitude, en mètres, de la surface du glacier de la Mer de glace au niveau du Montenvers (source : service d’observation Glacioclim).
1 650
1 660
1 670
1 680
1 690
1 720
1 710
1 700
Altitude
1992 1994 1996 1998 2000 2002
y = – 3,8857x + 9461,3
2004 2006 2008 2010
En exploitant l’équation affichée, estimer l’altitude en
2020 si la tendance observée se maintient.
La Mer de glace.
3 Le tableau suivant donne la consommation d’eau, en millions de m3, des canons à neige des stations de ski françaises.
Saison Rang xi Consommation yi
2002 1 11,6
2003 2 13,1
2004 3 15,1
2005 4 16
2006 5 16
2007 6 18,3
y = 1,2x + 11 constitue un bon ajustement affine du nuage de points.
Déterminer un ajustement affine
4 Le tableau suivant donne le chiffre d’affaires, exprimé en millions d’euros, de l’entreprise Mecanix de 2005 à 2010.
Année 2005 2006 2007 2008 2009 2010
Rang xi 0 1 2 3 4 5
Chiffre d’affaires yi 7,85 8,23 8,19 8,62 8,98 9,46
y = 0,3x + 7,8.
5 Salaire minimum
Le tableau suivant donne le SMIC (salaire minimum) horaire brut en euros de 2005 à 2010.
Année xi 2005 2006 2007 2008 2009 2010
SMIC yi 8,03 8,27 8,44 8,71 8,82 8,86
6 Dans le circuit électrique ci-dessous, un générateur de tension réglable permet d’obtenir les mesures résumées dans le tableau suivant, où U est la tension aux bornes du résistor (en V) et I l’intensité du courant dans le circuit (en A).
M G R V U (xi) 0 1 2 3 4
I (yi) 0 0,039 0,079 0,118 0,160
U (xi) 5 6 7 8 9 I (yi) 0,198 0,238 0,277 0,316 0,355
Ouvrir le fichier « 01_CO2_monde.xls » ou « 01_CO2_
monde.ods » du CD-Rom, qui fournit la quantité de gaz carbonique émise chaque année dans le monde de 1751 à 2007 (source : Carbon Dioxide Information
Analysis Center).
...
Cette affirmation est-elle exacte ?
Exploiter un ajustement non affine 8 *
Ouvrir le fichier « 01_temp_globale.xls » ou
« 01_temp_globale.ods » du CD-Rom qui fournit, de 1880 à 2009, la différence en °C de la température moyenne annuelle globale sur Terre par rapport à la moyenne de la période 1951-1980 (Source : Goddard
Institute for Space Studies, NASA).
Quelle est l’équation affichée par le tableur ?
y = 0,000 054 5 x2 – 0,205 88 x + 194,19.
(Avec Excel, choisir « Polynomiale Ordre 2, avec OpenOffice, tracer la parabole à l’aide de sa formule.)
Quel est, de l’ajustement affine ou de l’ajustement parabolique, celui qui semble préférable ?
– en utilisant l’ajustement affine ;
– en utilisant l’ajustement parabolique.
Problème 1
Dérive d’une machine
Dans une entreprise, une machine produit des axes de moteurs électriques. La machine se déréglant au cours du temps, on décide de noter chaque jour le pourcentage des axes défectueux produits. On obtient alors le tableau suivant.
Jours Xi 1 2 3 4 5 6 7 8
Défectueux (%) yi 0,8 1,1 1,9 2,3 2,1 2,4 2,8 2,9
Problème 2
Vitesse et sécurité routière
Le tableau suivant fournit la vitesse moyenne en km/h des véhicules légers et le nombre de morts sur les routes françaises de 1998 à 2009
...
On peut obtenir ces données sur le fichier
« 01_vitesse_securite.xls » ou « 01_vitesse_securite.ods » du CD-Rom.
Quelle hypothèse peut-on en déduire entre la vitesse moyenne et le nombre de morts ?