Formation sur la serie statistique a deux variables

Formation sur la série statistique a deux variables
...
Est-ce que je sais… ?
- Placer des points dans un repère
Dans un repère orthogonal, placer les points A(– 0,5 ; – 1) ; B(1 ; 2,5) et C(3 ; 1).
- Calculer une moyenne
- a) Calculer la moyenne x des nombres – 0,5 ; 1 ; 3, puis la moyenne y des nombres
– 1 ; 2,5 ; 1.
- b) Placer dans le repère précédent le point G(x ; y ).
- Déterminer une équation de droite
Calculer le nombre b pour que la droite d’équation y = 1 2x + b passe par le point de coordonnées 7
Activité Représenter une série et calculer son point moyen
Vendre plus pour gagner plus
Une enquête a été menée auprès de huit représentants d’entreprises différentes de vente de photocopieurs. Le tableau suivant donne, pour chaque représentant, le chiffre d’affaires annuel et le revenu annuel, en milliers d’euros.
Chiffre d’affaires annuel (en milliers d’euros) 340 390 440 620 470 360 460 520
Revenu annuel (en milliers d’euros) 25 26 33 41 36 28 35 38
1 Ce que montre un graphique
- a) Dans un repère orthogonal, représenter les huit points correspondant à ces représentants de commerce. Placer en abscisses le chiffre d’affaires, en graduant l’axe à partir de 320 avec comme unité 1 cm pour 20 milliers d’euros. Placer en ordonnées le revenu annuel, en graduant l’axe à partir de 24 avec comme unité 1 cm pour 1 millier d’euros.
Les points obtenus forment le nuage de points.

- b) Il y a deux parties dans le salaire d’un représentant : un fixe et une commission proportionnelle au chiffre d’affaires réalisé. Pourquoi le nuage de points montre-t-il que la rémunération est approximativement la même dans les huit entreprises ?
2 En moyenne…
- a) Calculer la moyenne x des huit chiffres d’affaires, puis la moyenne y des huit revenus.
- b) Placer le point G de coordonnées (x ; y ). Comment se situe-t-il par rapport au nuage ?
Le point G se nomme le point moyen.
Activité 2 Exploiter une droite d’ajustement
Une utilisation électrique de la statistique !
La tension U aux bornes d’une batterie de force électromotrice e et de résistance interne R s’écrit théoriquement U = – Ri + e. On a procédé à différentes mesures :
Intensité i (A) 0 0,1 0,4 1
Tension U (V) 12 11 7 1
- a) Placer dans un repère orthogonal les quatre points correspondant à ces mesures.
- b) Tracer, dans ce même repère, la droite d’équation y = – 11x + 12 et vérifier qu’elle passe à proximité des quatre points.
Cette droite se nomme droite d’ajustement.
- c) Exploiter cette droite d’ajustement pour déterminer la force électromotrice e et la résistance interne R.
Activité 3 Déterminer un ajustement affi ne
Quelle tendance pour les gaz a effet de serre ? `
Le tableau suivant correspond aux émissions de gaz à effet de serre (en millions de tonnes équivalent CO2) relevées en France (source : Ifen).
Année 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Émissions GES 565 561 563 554 558 557 561 545 535 532

1 Recherche du point moyen
Calculer les coordonnées x (moyenne de la première ligne du tableau) et y (moyenne de la seconde ligne) du point moyen G.
2 Détermination d’une droite d’ajustement
- a) On souhaite ajuster le nuage de points par une droite D passant par le point G.
On admet que D a pour coefficient directeur – 3,33.
On note y = – 3,33x + b une équation de D.
Calculer le nombre b.
- b) En supposant que la tendance observée sur ces dix années se poursuive, estimer la quantité d’émissions de gaz à effet de serre en France en 2015.
Nuage de points et point moyen
Une série statistique à deux variables est donnée sous forme d’un tableau :
Variable 1 : xi x1 x2 x3 … xn
Variable 2 : yi y1 y2 y3 … yn
Dans un repère, les points de coordonnées (xi ; yi ) constituent le nuage de points représentant la série statistique.
Le point moyen du nuage a pour coordonnées (x ; y ) où x est la moyenne des xi et y la moyenne des yi
. Il est situé au « centre » du nuage.

Exemple
La série suivante correspond aux poids (en physique on parle de masse) et aux tailles de 9 nouveau-nés d’une maternité.
Poids xi en kg 2,76 3,56 3,38 2,92 3,22 2,84 2,93 4,28 3,72
Tailles yi en cm 49 50 51 47 50 48 49 54 52
Le point moyen G a pour coordonnées : le poids moyen des 9 bébés, x = 3,29 kg, et la taille moyenne y = 50 cm.
Il semble que plus un bébé est lourd, plus sa taille a tendance à être grande.
Ajustement affine
Lorsque le nuage a une forme « allongée », on peut rechercher une droite passant par le point moyen et au plus près des autres points : c’est un ajustement affine du nuage.
L’équation y = ax + b de la droite d’ajustement donne la « tendance » de l’évolution de y en fonction de x.
Exemple
Le tableur fournit la droite d’équation
y = 3,903 4x + 37,158 comme ajustement affine du nuage précédent.
Cette équation indique comment la taille des bébés à la naissance a tendance à augmenter lorsque leur poids de naissance augmente.

1 Comment déterminer le point moyen ?
Énoncé
Le tableau suivant donne le prix de vente d’un article en fonction de la quantité commandée.
Quantité commandée xi
50 100 150 200 250 300
Prix en milliers d’euros yi
2,8 2,4 2,3 2 1,65 1,6
Calculer les coordonnées du point moyen G du nuage de points correspondant.
Solution
La moyenne des quantités commandées est :
x = 50 100 150 200 250 300
= 175.
La moyenne des prix est :

y = 2 8 2 4 2 3 2 1 65 1 6
, , , , , = 2,125.
Le point G a pour coordonnées (175 ; 2,125).
2 Comment représenter un nuage de points puis l’ajuster avec un tableur ?
Énoncé
Avec les données de l’exercice précédent, représenter à l’aide d’un tableur le nuage de points correspondant, puis en effectuer un ajustement affine.
... ....
Solution
Sélectionner les données puis :
– avec Excel 2003, cliquer sur l’icône Assistant graphique et choisir Nuage de points ;
– avec Excel 2007, choisir Insertion/Nuage de points ;
– avec OpenOffice Calc, cliquer sur l’icône
Diagramme puis choisir XY (dispersion).

Cliquer avec le bouton droit sur l’un des points du nuage et choisir Ajouter une courbe de tendance… avec Excel ou Insérer une courbe de tendance… avec OpenOffice.
Choisir Linéaire et cocher Afficher l’équation sur le graphique.
3 Comment ajuster une série avec une calculatrice, puis extrapoler ?
Énoncé
Une enquête du service commercial d’une chaîne d’hôtels « quatre étoiles » a permis de connaître l’évolution de la demande mensuelle yi de nuitées, selon le prix xi proposé en « période creuse ».
- a) Utiliser les résultats de la calculatrice pour donner une expression du type
y = ax + b de la demande mensuelle en fonction du prix de la chambre.
- b) Utiliser la question a) pour évaluer la demande lorsque le prix est 130 €.
Solution avec une calculatrice de marque Casio
Faire MENU STAT EXE , puis effacer les données présentes en se plaçant dans une colonne, puis DEL A YES EXE
Entrer les valeurs xi en colonne List 1 et les valeurs yi en colonne List 2.
Régler les listes par CALC SET
2Var X List : List 1
2Var Y List : List 2
2Var Freq : 1 EXE .

Afficher les résultats
par REG X .
Solution avec une calculatrice de marque Texas Instruments
Faire STAT ou stats , puis effacer les
données présentes par EDIT 4:ClrList
ENTER L1, L2 ou 4:EffListe entrer L1, L2 (on obtient L1 et L2 au clavier par la touche 2nd ou 2nde ).
Entrer les données par STAT EDIT
1:Edit ENTER ou 1:Edite entrer , puis entrer les valeurs xi en colonne L1 et les valeurs yi en colonne L2.
Afficher les résultats par STAT CALC
4:LinReg(ax +b) ENTER L1, L2 ou stats
CALC 4:RegLin(ax +b) entrer L1, L2.
- a) En arrondissant les coefficients à 10–2, la droite d’ajustement donnée par la calculatrice a pour équation
y = – 4,55x + 883,11.
- b) – 4,55 ¥ 130 + 883,11 ª 292 nuitées.
Ajuster un grand nombre de données

Capacité de production éolienne
Ouvrir le fichier « 01_prod_eolienne.xls » ou « 01_prod_ eolienne.ods » fournissant la capacité de production éolienne de 76 pays de 2001 à 2010 (source : EWEA).
1 Étude de la capacité de production française
- a) Sélectionner les données de la France (ou utiliser le filtre « Pays »), puis représenter le nuage de points correspondant.
Pourquoi un ajustement affine a-t-il ici peu de sens ?
- b) Montrer à l’aide du tableur, qu’en ne retenant que les années de 2005 à 2010 (rangs 5 à 10), on peut ajuster la production française par la droite d’équation y = 839x – 4 114.
- c) En supposant que cette tendance se maintienne, estimer la production française en 2012 (rang x = 12).
2 Comparaison de l’Europe et de l’Asie
- À l’aide du filtre, sélectionner les données des pays d’Europe, les copier, puis les coller sur une nouvelle feuille.
- a) Calculer, pour chaque année, la production totale des pays européens.
- b) Effectuer un ajustement affine de la production en Europe de 2001 à 2010 (afficher l’équation).
- c) À l’aide de l’équation y = 6 815x + 3 391, estimer la production européenne en
2012 (rang x = 12).
- À l’aide du filtre, copier les données des pays d’Asie, puis les coller sur une nouvelle feuille.
- d) Calculer, pour chaque année, la production totale des pays asiatiques.
- e) Un ajustement affine de la production en Asie de 2001 à 2010 est-il justifié ?
- f) Le tableur permet d’ajuster le nuage à l’aide d’une « courbe de tendance exponentielle ». En utilisant la formule 973,77 ¥ 1,42 ^ x (le symbole ^ indique la puissance), estimer la production asiatique en 2012 (rang x = 12).
Comprendre le principe des « moindres carrés »
Chiffre d’affaires d’un constructeur d’automobiles
1 Principe des « moindres carrés »
Ouvrir le fichier « 01_moindres_carres.xls » ou « 01_moindres_carres.ods », donnant le chiffre d’affaires, en milliards d’euros, d’un constructeur d’automobiles.
On recherche une droite d’équation y = ax + b, passant par le point moyen et ajustant « au mieux » le nuage des quatre années données.
- a) Dans quelles cellules sont calculées les coordonnées (x ; y ) du point moyen ?
- b) Puisque la droite passe par le point moyen, on a b = y – ax. Expliquer la formule entrée en B9.
- c) La colonne E contient les écarts verticaux entre les points du nuage et les points correspondants de la droite. La colonne F contient les carrés de ces écarts.
Pourquoi la somme des écarts contenus en colonne E ne permet-elle pas de savoir si la droite est proche des points du nuage et quel est l’avantage de considérer la somme des écarts au carré ?
- d) Modifier en B8 la première décimale du coefficient directeur a de la droite (prendre 1,1 ; 1,2 ; 1,3…) de sorte à obtenir en F6 une somme des écarts au carré minimale (observer en même temps la droite sur le graphique).
Quel est, à 10 – 1 près, le coefficient a optimal ?

Appelez le professeur pour exposer votre résultat.
2 Comparaison avec l’ajustement du tableur
Le tableur peut afficher directement la droite d’ajustement obtenue selon le principe précédent des « moindres carrés ». Sur le graphique, cliquer sur un point du nuage situé à l’écart de la droite à l’aide du bouton droit de la souris et choisir Courbe–de– tendance… Dans la boîte de dialogue, choisir Linéaire et cocher Afficher–l’équation.
- a) Quelle est l’équation de la droite d’ajustement donnée par le tableur ?
- b) Comparer au résultat obtenu à la question 1.d.
Appelez le professeur pour exposer vos commentaires.
Exercice
Déterminer le point moyen
1 Le tableau suivant donne, pour sept années consécutives, l’évolution de la production d’un certain type de pièces et des frais de publicité correspondants, dans une entreprise du secteur industriel.
Production xi (en milliers)
Frais de publicité yi (en milliers d’euros)
260 17
280 16
260 17
310 19

300 22
350 23
340 26
- a) Calculer les coordonnées du point moyen G du nuage correspondant à cette série.
- b) On ajuste ce nuage par la droite D d’équation
y = 0,084x – 5,2.
Vérifier que G appartient à D.
Exploiter un ajustement affine donné
2 Fonte des glaciers
Le graphique suivant correspond à l’altitude, en mètres, de la surface du glacier de la Mer de glace au niveau du Montenvers (source : service d’observation Glacioclim).
1 650
1 660
1 670
1 680
1 690

1 720
1 710
1 700
Altitude
1992 1994 1996 1998 2000 2002
y = – 3,8857x + 9461,3
2004 2006 2008 2010
En exploitant l’équation affichée, estimer l’altitude en
2020 si la tendance observée se maintient.
La Mer de glace.
3 Le tableau suivant donne la consommation d’eau, en millions de m3, des canons à neige des stations de ski françaises.
Saison Rang xi Consommation yi
2002 1 11,6

2003 2 13,1
2004 3 15,1
2005 4 16
2006 5 16
2007 6 18,3
- a) Représenter le nuage de points Mi (xi ; yi).
- b) Vérifier, en la traçant, que la droite D d’équation
y = 1,2x + 11 constitue un bon ajustement affine du nuage de points.
- c) En utilisant la droite D, estimer la consommation d’eau de la saison 2011.
Déterminer un ajustement affine
4 Le tableau suivant donne le chiffre d’affaires, exprimé en millions d’euros, de l’entreprise Mecanix de 2005 à 2010.
Année 2005 2006 2007 2008 2009 2010
Rang xi 0 1 2 3 4 5
Chiffre d’affaires yi 7,85 8,23 8,19 8,62 8,98 9,46
- a) Représenter le nuage de points Mi (xi ; yi).
- b) Déterminer, à l’aide de la calculatrice, une équation d’une droite d’ajustement du nuage de points Mi (xi ; yi) (arrondir au centième).
- c) Tracer sur le graphique la droite D d’équation
y = 0,3x + 7,8.
- d) À l’aide de l’équation précédente, donner une estimation du chiffre d’affaires en 2011.
5 Salaire minimum

Le tableau suivant donne le SMIC (salaire minimum) horaire brut en euros de 2005 à 2010.
Année xi 2005 2006 2007 2008 2009 2010
SMIC yi 8,03 8,27 8,44 8,71 8,82 8,86
- a) Déterminer, à l’aide de la calculatrice, une équation d’une droite d’ajustement du nuage de points Mi (xi ; yi).
- b) On admet que l’ajustement affine réalisé reste valable jusqu’en 2012. Proposer une estimation du SMIC en 2012.
6 Dans le circuit électrique ci-dessous, un générateur de tension réglable permet d’obtenir les mesures résumées dans le tableau suivant, où U est la tension aux bornes du résistor (en V) et I l’intensité du courant dans le circuit (en A).
M G R V U (xi) 0 1 2 3 4
I (yi) 0 0,039 0,079 0,118 0,160
U (xi) 5 6 7 8 9 I (yi) 0,198 0,238 0,277 0,316 0,355
- a) Déterminer, à l’aide de la calculatrice, une équation d’une droite d’ajustement du nuage de points Mi (xi ; yi) (les résultats seront arrondis à 10–1).
- b) La loi d’Ohm s’écrit U = RI avec U en V, R en W et I en A. En déduire la valeur de la résistance R du résistor.
Ouvrir le fichier « 01_CO2_monde.xls » ou « 01_CO2_
monde.ods » du CD-Rom, qui fournit la quantité de gaz carbonique émise chaque année dans le monde de 1751 à 2007 (source : Carbon Dioxide Information
Analysis Center).
...
- a) Un ajustement affine du nuage de points est-il justifié ?
- b) Sélectionner les points correspondant aux années 1900 à 1950, puis déterminer à l’aide du tableur un ajustement affine. Quelle est l’équation affichée ?
- c) Procéder de même pour la période de 1950 à 2007.
- d) On lit dans la presse que « de 1900 à 1950, les émissions annuelles mondiales de CO2 ont augmenté en moyenne d’environ 16 millions de tonnes par an, alors que cette augmentation sur la période de 1950 à 2007 a été d’environ 111 millions de tonnes par an ».
Cette affirmation est-elle exacte ?
Exploiter un ajustement non affine 8 *

Ouvrir le fichier « 01_temp_globale.xls » ou
« 01_temp_globale.ods » du CD-Rom qui fournit, de 1880 à 2009, la différence en °C de la température moyenne annuelle globale sur Terre par rapport à la moyenne de la période 1951-1980 (Source : Goddard
Institute for Space Studies, NASA).
- a) Effectuer un ajustement affine du nuage de points.
Quelle est l’équation affichée par le tableur ?
- b) Le tableur Excel fournit un ajustement par une parabole d’équation :
y = 0,000 054 5 x2 – 0,205 88 x + 194,19.
(Avec Excel, choisir « Polynomiale Ordre 2, avec OpenOffice, tracer la parabole à l’aide de sa formule.)
Quel est, de l’ajustement affine ou de l’ajustement parabolique, celui qui semble préférable ?
- c) Donner une estimation de l’écart de la température globale en 2040 par rapport à la période 1951-1980 :
– en utilisant l’ajustement affine ;
– en utilisant l’ajustement parabolique.
Problème 1
Dérive d’une machine
Dans une entreprise, une machine produit des axes de moteurs électriques. La machine se déréglant au cours du temps, on décide de noter chaque jour le pourcentage des axes défectueux produits. On obtient alors le tableau suivant.
Jours Xi 1 2 3 4 5 6 7 8

Défectueux (%) yi 0,8 1,1 1,9 2,3 2,1 2,4 2,8 2,9
- Représenter dans un repère le nuage de points Mi(xi ; yi).
- Calculer les coordonnées du point moyen G du nuage, puis placer ce point sur le graphique.
- Déterminer, à l’aide de la calculatrice, une équation d’une droite D d’ajustement du nuage de points Mi(xi ; yi). (Les résultats seront arrondis à 10–3.)
- Tracer la droite D sur le graphique.
- En admettant que l’évolution du pourcentage d’axes défectueux constatée pendant huit jours se poursuive les jours suivants, quel est le pourcentage prévisible, arrondi à 0,1 %, d’axes défectueux produits le onzième jour par cette machine ?
Problème 2
Vitesse et sécurité routière
Le tableau suivant fournit la vitesse moyenne en km/h des véhicules légers et le nombre de morts sur les routes françaises de 1998 à 2009
...
On peut obtenir ces données sur le fichier
« 01_vitesse_securite.xls » ou « 01_vitesse_securite.ods » du CD-Rom.
- Comparer les graphiques ci-dessous, illustrant l’évolution de la vitesse moyenne et du nombre de morts.
Quelle hypothèse peut-on en déduire entre la vitesse moyenne et le nombre de morts ?