Formation sur l’utilisation pratique des traitements statistiques sous excel

Formation sur l’utilisation pratique des traitements statistiques sous excel
1.Généralités:
Un travail de recherche permet d’analyser et interpréter nos données, pour vérifier nos hypothèses. Et cette validation des conclusions expérimentales est intimement liée à l'emploi de la statistique. Mais le choix des tests appropriés est souvent délicat.
Le document proposé n’est pas un abrégé de statistiques, mais simplement une aide concrète vous permettant d’acquérir un « savoir-faire » des principaux tests statistiques.
Toutefois il est utile de vous souvenir de vos cours de statistiques, ou au besoin d’avoir sous la main un ouvrage de statistiques pour suivre ces exercices.
On parle souvent en Sciences Humaines, de "variable dépendante" et de "variables indépendantes"... Rappelons que la variable définitles caractéristiques de la mesure que l'on utilise pour prélever l'information.
La variable dépendante = les données : se poser unequestion-problème, et décrire la conduite étudiée.
La variable indépendante = source de variations, conditions manipulées par l’observateur.
Petit rappel (avec un exemple tout à fait absurde, je le précise !):
Supposons que je veux étudier la consommation de chocolat chez les étudiants (= Variabledépendante), et plus précisément, je veux savoir si les Littéraires mangent plus (ou moins) dechocolat que les Scientifiques (Variable indépendante).
Première difficulté: la typologie des variables.
Pour évaluer un traitement à partie des données opérées, il faut déterminer le type d’échelle de mesure utilisé.
Généralement, il existe trois niveaux de mesure. Mavariable dépendante est-elle: ordinale? nominale? d’intervalle ?
Nominal = classe d'équivalence, ordinal = plus grand que..., et intervalle = grandeur des intervalles entre les objets d'une échelle ordinale.
Si je décide de noter simplement l’existence ou l’absence de chocolat selon les individus (jenote « oui », ou « non », sans considérer la quantité) alors la variable dépendante est devenue«nominale ».
Par contre, si je décide de comptabiliser le poidsconsommé de chocolat (en gramme) par jour, et par individus, dans ce cas nous avons affaire à une variable ordinale (continue). De même si l’on demande à notre consommateur de chocolat d’ estimer de façon numérique sa dépendance (par ex . en utilisant une échelle de type « Likert » : 0= pas du tout, 1= un peu, 2 = assez souvent, etc.), c’est encore une échelle ordinale. Toutefois certains auteurs préfèrent parler d’échelle d’intervalle… Et j’avoue ne pas sa isir toutes ces subtilités !
Disons qu’il existe des échelles « d’intervalles », c’est à dire sous forme de valeurs numériques particulières.
Par exemple on peut estimer le temps mis pour manger toute une tablette de chocolat.
Ou encore on obtient un score après épreuve qui indique l’état du consommateur, après ingestion de toute la tablette. (calcul par cumul des événements psychophysiologiques – nausée, anxiété, etc.-cités dans un questionnaire).
En tout cas selon les différentes échelles, on utilsera des tests appropriés.
Mais il existe un autre problème. Certains tests peuvent être « paramétriques », et d’autres « non-paramétrique ».
Que signifie cette différence entre tests ?
Si ma variable est ordinale, et si la population des étudiants est importante, on peut supposer que la distribution suit la loi normale (loi de Gauss).
En effet la consommation de chocolat varie selon les individus : quelques personnes ont une consommation nulle, ou très faible et au contraire quelques personnes trop gourmandes mangent toute une plaquette, et la majorité des individus auront une consommation plus raisonnable… Donc les échantillons suivent une dist ribution normale, c’est à dire un distribution « en forme de cloche ».
Si ma variable suit la loi de probabilité de Gauss, j’ai "le droit" d'utiliser les tests paramétriques. Je pourrai par exemple utiliser un «test de moyennes », tel que le « t de Student »
Cependant pour compliquer encore, on peut avoir des variables qui ne suivent pas vraiment la loi normale… Dans ce cas, on préférera les tests « non-paramétriques ».
En réalité, c'est parfois difficile de choisir lestests employés...
En effet, en particulier dans le cas des petits échantillons, certains histogrammes obtenus sont plus "ordinales" que "nominales", mais pourtant sont très loin d’une distribution dite « normale ».
Dans certains cas, les tests non-paramétriques sont plus adaptés. Et de fait, il existe des méthodes non-paramétriques qui traitent aussi des ariablesv ordinales, et qui sont très adaptables à des cas particuliers.
Cependant beaucoup de chercheurs en Sciences humaines préfèrent utiliser les tests "paramétriques"… C’est une affaire de choix ! ( ou de flemme ?).
Je vous signale néanmoins que certains nostalgiquesdes tests non-paramétriques ont réalisé des logiciels « free » permettant de calculer ces tests.
Dans tous les cas, le logiciel Excel (ainsi que ce logicien « free » trouvé par Internet) va vous permettre de réaliser très facilement la plupart des traitements statistiques, paramétriques ou non-paramétriques.
Mais auparavant, quelques « astuces » pour traiter facilement vos données sous Excel
A. Une première astuce: le « collage spécial »
Mes données que je vais tester sont en « ligne », et je veux qu’ils soient en « colonne »… Que faire ? Réponse : si vous devez changer vos données de « ligne» en « colonne »-ou inversement-: copiez vos données, et sélectionnez nu emplacement, puis dans « Edition », choisir « Collage spécial», puis « Transposé», et cliquez OK.
B.Une deuxième astuce: « le filtrage »
Un exemple: vous venez de saisir les résultats d’un questionnaire…
SUJET |
AGE |
TEST 1 |
TEST 2 |
SEXE |
1 |
enfant |
25 |
10 |
homme |
2 |
adulte |
26 |
11 |
femme |
3 |
adolescent |
42 |
14 |
homme |
4 |
adolescent |
36 |
10 |
homme |
5 |
adulte |
21 |
9 |
homme |
6 |
adulte |
20 |
8 |
femme |
7 |
enfant |
32 |
12 |
femme |
8 |
adulte |
31 |
14 |
homme |
// |
… |
... |
femme |
|
268 |
…etc. |
… |
… |
….. |
Vous possédez une foule d’informations, mais si vous devez comparer manuellement vos résultats aux différentes modalités (homme ou femme, grand moyenou petit, enfant ou adulte etc…), votre analyse se ra bien complexe !
Mais Excel possède un outil très efficace : le « filtrage », très pratique pour traiter vos données .
Procédure: dans « Données», cherchez « filtre ». Sélectionnez une cellule (par exemple dans « sujet », ou « sexe », ou « âge » etc.), et clique z sur la commande « filtrage automatique ». Ensuite vous pouvez très facilement séparer vos groupes soit en « hommes », soit en « femmes », ou encore vous pouvez analyser uniquement les « hommes-adultes », etc.
C. Où trouver les analyses statistiques intéressantes, sous Excel ?
C’est paradoxal, mais vous ne trouverez pas beaucoup de tests statistiques intéressants dans la fonction « statistiques » d’Excel !
Il faut plutôt chercher dans les « macros », et plu s précisément dans «Utilitaire analyse ». Comment peut-on trouver ce précieux « macro » ? Dans « Outils », cherchez « Utilitaired’analyse », (et si vous ne le trouvez pas, cherchez dans « macros complémentaire», etcochez « Utilitaire d’analyse »…)
Dans le cas des tests non-paramétriques, nous avonsutilisé le logiciel "Astro Research" de Mr H. Delboy, médecin, statisticien, astrologue, musicologue, etc… Ce scientifique passionné d’astrologie, alchimie et d’autres bizarreries ésotériques a réalisé un logiciel remarquable et gratuit, qui fonctionne sous Excel. (adresse :hdelboy.club.fr/Nonparam.htm)
2. Calculs statistiques paramétriques:
Ces quelques pages vous expliquent la marche à suiv re des calculs les plus utilisés, en donnant des exemples.
A. L’enregistrement des observations:

1- Calculer la moyenne, l’écart-type, analyser la dispersion, etc…(Visitez vos anciens cours de statistiques, SVP…)
Procédure: dans « Utilitaire d’analyse », cliquez « Statistiques descriptives », et cochez « Rapport détaillé».
Entrez vos données dans « plage d’entrée » (en sélectionnant avec la souris la zone choisie), précisez si les données sont en colonnes, ou en lignes, et faites OK.
…
Cet enseignant décide d’utiliser des intervalles de notes pour réaliser un graphique plus représentatif. Il détermine 9 classes, correspondant à l’intervalle de partition :
(1à 3), (3-5), (5-8), … (18-20)
Tableau de 9 classes :
1 |
3 |
5 |
8 |
10 |
12 |
14 |
16 |
18 |
Procédure: dans « Utilitaire d’analyse », cliquez « Histogramme ».
Rentrez les notes dans « plage d’entrée», et les 9 classes dans « plage des classes». Vous pouvez cocher également «représentation graphique», puis « OK »… Et vous
aurez aussitôt un résultat indiquant les classes, la fréquence des résultats, et( en prime, unjoli histogramme...) Vous pouvez d’ailleurs transformer cet histogramme tout à loisirdans l’ « Assistant graphique » d’Excel.
Remarque : si vous souhaitez créer une distribution de fréquence avec des données« non-groupées », il ne faut plus utiliser l’outil « histogramme » de l’Utilitaire d’analyse, mais à l’aide du « Tableau croisé dynamique» qui se trouve dans le menu « Données». Dans notre cas, cliquez sur « suivant », indiquez vos notes dans « plage », et cliquez sur
« disposition »…
Ensuite glissez simplement le champ des « notes » sur le rectangle « ligne », puis glissez à nouveau s ur « données ». Ensuite, cliquez « Terminer »… Là, vou s allez vous sentir un peu bête car vous n’obtenezpas de « Fréquence », mais une banale « Somme » ! C’est normal, ne paniquez pas… Cliquez deux fois sur
« somme », et vous tombez dans un « Champ dynamique », plein de merveilles : somme, moyenne, écart-type, produit, etc. Ici, choisissez « Nb » (qui signifie le nombre d’occurrence, ce qui correspond tout à fait !)
Le tableau croisé dynamique est également très intéressant pour réaliser un questionnaire, des tableaux, des analyses croisées, etc. Amusez-vous à vous exercer en glissant les différents boutons proposés, et bientô vous allez devenir un « accro » d’Excel…
LES TESTS STATISTIQUES POUR UN, DEUX, OU K ECHANTILLONS
La plupart des tests sera un comparaison de moyennes ou de fréquences…
Mais il faut tout d’abord identifier la (ou les) variables. Comment est formée ma variable dépendante ? Quel type d'échelle faut-il employer?La variable est-elle « ordinale », ou alors « nominale »?
Trois possibilités : nous voulons analyser -un seul échantillon à tester,
-deux échantillons, -ou k échantillons…
Par exemple, si je compare simplement les étudiantsqui consomment (ou non) du chocolat, c'est une variable à 1 échantillon. Si je veux analyser la comparaison Littéraire/Scientifique, et la consommation du chocolat, alors c' est une variable indépendante à 2 échantillons…
Et si je veux analyser la comparaison Littéraire/Scientifique des accros du chocolat, en considérant le sexe des individus, alors c'est unevariable indépendante à 4 échantillons... Je vous conseille de regarder le tableau récapitulatif qui se trouve à la dernière page de ce document.
B. Les tests statistiques pour un, ou deux échantillons
Il faut d’abord préciser ce qu’on cherche: soit mon hypothèse suppose une indépendance (c’est à dire une absence de relation), ou au contr aire mon hypothèse suppose une liaison (c’est à dire une association « corrélée »)?
B.1 : Les tests d’indépendance:
1-le test de Student, comparaison d’une moyenne :
X - m
Formule t =
s / n -1
Exemple : d’après un rapport, on trouve que les hommes de plus de 30 ans regardent la télévision en moyenne25 h par semaine. Nous voulons comparer cette moyenne à une population d’étudiants. Onze étudiants ont comptabilisé leur temps passé devant la télévision,par semaine :
Résultats
Etudiants |
10 |
8 |
15 |
28 |
20 |
19 |
13 |
20 |
9 |
14 |
38 |
Procédure: dans « Utilitaire d’analyse », cliquez « Test d’égalité des espérances :observations pairées » .Par un copier-coller (en colonnes, SVP 1), rentrez les échantillonsobservés dans « plage pour la variable 1 », et dans « plage pour la variable 2 » répétez simplement n.fois la moyenne théorique (ici, 25) :
Etudiants |
10 |
8 |
15 |
28 |
20 |
19 |
13 |
20 |
9 |
14 |
38 |
théorique |
25 |
25 |
25 |
25 |
25 |
25 |
25 |
25 |
25 |
25 |
25 |
Puis, faites OK : nous obtenons un tableau tout à fait clair, avec plusieurs informations:
Test d'égalité des espérances: observations pairées
…
Notez la moyenne des échantillons (17,63..), leur variance (80,25) probabilité (uni, ou bilatéral)etc.
Vous constatez que la moyenne des échantillons-étudiants est plus faible que celle de la population générale. Il y a une différence significative (p = .01).
Nous rejetons donc l’hypothèse nulle : les étudiants regardent moins la télévision que les adultes de plus de 30 ans.
1 Pour passer de « ligne» en « colonne » sous Excel, copiez vos données, et sélectionnez un emplacement, puis dans « Edition », choisir « Collage spécial », puis« Transposé », et cliquez OK.
2- Le rapport de variance : test de F de Fischer-Snedecor. Ce test permet de vérifier l’existence significative de différences entre les moyennes de 2 groupes. Et plus exactement, il permet de tester l’hypothèse de l’égalité des variances des 2 populations. On va estimer la dispersion des valeurs entre les deux distributions, en définissant les valeurs du rapport des deux variances.
(Formule: F = S1²/S2²) C’est à dire : rapport des 2 variances observées (en pratique, rapport de la plus grande valeur à la plus petite) . Selon les tables de Snedecor, si F est supérieur à 2,27, il y a 5 chances sur 100 pour que la différence observée soit significative.
Procédure: dans « Utilitaire d’analyse », cliquez « Test d’égalité des variances »Rentrez.
les deux échantillons dans « plage pour la variable 1 », et « plage pour la variable 2 », et faites « OK».
Et bien sûr, si vous constatez que la valeur du F est non-significative (cela veut dire que les deux distributions ne diffèrent pas du point de vue de la dispersion de leurs valeurs), alors dans ce cas, vous pouvez comparer les deux moyennes.
3- le test de Student: test de deux moyennes d’échantillons appariés. (ou échantillons
dépendants): Formule dutde Student: t =
Sd / n-1
Avec D = moyenne de la différence des 2 moyennes
Sd = écart-type (de la différence … etc.) N = tail le de l’échantillon
Exemple : nos 11 étudiants, (apparemment passionnés par les expériences)!passent un test d’anxiété, puis sontinvité à participer à un entraînement à la relaxati on. Ensuite, ils repassent le test d’anxiété… On ve ut évidemment estimer l’efficacité d’une formation à la relaxation.
Résultats
avant |
30 |
38 |
45 |
28 ![]() |
20 |
19 |
23 |
40 |
29 |
34 |
38 |
après |
10 |
21 |
16 |
16 |
11 |
22 |
23 |
26 |
18 |
32 |
28 |
Procédure: dans « Utilitaire d’analyse », cliquez « Test d’égalité des espérances :observations pairées ». Par un coller-copier (en colonnes, SVP), rentrez les deuxéchantillons dans « plage pour la variable 1 », et« plage pour la variable 2 », et faites « OK »
Un tableau s’affiche aussitôt :
Test d'égalité des espérances: observations pairées
Variable 1 |
Variable 2 |
|
Moyenne |
31,2727273 |
20,2727273 |
Variance |
72,6181818 |
47,4181818 |
Observations |
11 |
11 |
Coefficient de corrélation de Pearson |
0,29512579 |
|
Différence hypothétique des moyennes0 |
||
Degré de liberté |
10 |
|
Statistique t |
3,94784499 |
|
P(T<=t) unilatéral |
0,00136992 |
|
Valeur critique de t (unilatéral) |
1,81246151 |
|
P(T<=t) bilatéral |
0,00273983 |
|
Valeur critique de t (bilatéral) |
2,22813924 |
Il indique plusieurs informations : moyenne, variance, etc., et même le coefficient r de Pearson (qui indique s’il y a une corrélation, ou non, entre les deux variables…)
Dans notre cas, nous allons nous s’intéresser à la valeur du t de Student, qui est indiqué dans la ligne « Statistique t » = 3,94. Le résultat est hautement significatif (probabilité unilatérale alpha de .001) (Mais quel dommage, ce ne sont ici que des chiffres totalement inventés…)
4- le test de Studentpour des échantillonsindépendant:s il faut dans ce cas prendre le « test d’égalité des espérances» (vous avez le choix entre « variances égales », ou« variances différentes »)…
En théorie, le test t sur des échantillons indépendant suppose que les variances sont inconnues, mais égales. Mais parfois lorsqu’on suppose que les variances sont inégales –par exemple dans le cas des tailles d’échantillons trop réduites-, Excel utilise un autre calcul appelé la procédure de Welch-Aspin… (Personnellement, je préfère utiliser dans ce casuntest non-paramétrique … )
En tout cas, dans une situation « normale » d’un test de Student à variances égales, la formule
= m1 - m2
du t de Student, comparaison de deux moyennes est: t
s²+ s² N1 N 2
(avec s² =variance commune aux deux échantillons).
Un exemple: nous avons choisi au hasard 8 garçons et 9 filles q ui ont passé un concours de mathématiques. Lesrésultats sont indiqués dans ce tableau.
HOMMES |
FEMMES |
56 |
40 |
54 |
30 |
25 |
60 |
65 |
65 |
45 |
24 |
58 |
52 |
45 |
50 |
48 |
36 |
30 |
En utilisant ce « testd’égalitédesespérances», vous n’avez qu’à placer (dans les Paramètres d’entrée » les résultats des garçons («plage pour la variable 1 »), et le résultat des filles (« plage pour la variable 2 ») et vous faites « OK ». On obtient aussitôt ce tabl eau :
Test d'égalité des espérances: deux observations de variances égales
Variable 1 |
Variable 2 |
|
Moyenne |
49,5 |
43 |
Variance |
145,428571 |
207,5 |
Observations |
8 |
9 |
Variance pondérée |
178,533333 |
|
Différence hypothétique des moyennes0 |
||
Degré de liberté |
15 |
|
Statistique t |
1,00114155 |
|
P(T<=t) unilatéral |
0,16631795 |
Valeur critique de t (unilatéral) |
1,75305104 ![]() |
|
P(T<=t) bilatéral |
0,33263591 |
|
Valeur critique de t (bilatéral) |
2,13145086 |
Vous avez ici un résultat qui n’est pas significatif (t = 1,001 inférieur à la valeur critique de t, avec ddl :15, et un probabilité alpha de 0,166). Les garçons ne sont pas meilleurs en Maths que les filles.
5- le test « z » de deux moyennes (dans le cas des grands échantillons).
Procédure: dans « Utilitaire d’analyse », cliquez « test |
de la différence |
significative |
minimale ». Attention: il faut d’abordcalculer les 2 |
variances (voir |
« statistiques |
descriptives », par exemple)… Puis, rentrez les données, et faites OK. |
B.2 :Les tests de corrélation: ou la « force » d’une liaison entre deux, ou plusieurs séries dedonnées.
1. Le test « r » de Bravais-Pearson
…
(avec xi= valeurs échantillon 1, yi= valeurs échantillon 2, et m= moyenne échantillon)
On peut calculer très facilement le « r » de Bravais-Pearson sous Excel:
Procédure1: dans « Utilitaire d’analyse », cliquez « analyse de corrélation »… Non seulement vous aurez un tableau dans lequel se trouve la corrélation, mais vous pouvez également calculer plusieurs corrélations en fonction des séries d’observations testées… (cf coefficient de corrélation partielle entre X et Z pour y1z1, y1z2, y3z2, etc… )
Procédure2 : chercher (sur les boutons d’Excel) l’icônefx (= « Coller une fonction »), puis
cherchezla fonction statistiques, puis « coefficient.corrélation », (ou encore « Pearson »,
c’est le-même calcul…). Collez vos données dans « matrice 1 », puis dans « matrice 2 », et faites OK : la corrélation est aussitôt indiquée
Procédure 3 : ou éventuellement en cliquant «Test d’égalité des espérances : observationspairées » ! En effet nous avons vu que ce test de deux moyennes va calculer non seulementles moyennes et variances, mais également l’analyse de corrélation entre les deux variables.
Attention, l’utilisation des corrélations reste délicate carcertaines variables peuvent influencer les autres, et onpeut parfois trouver des résultats absurdes.
Par exemple, en testant une population de lycéens, des étudiants ont obtenu une corrélation surprenant : en croisant les résultats du saut en hauteur, et le poids des sujets, ils ont trouvé une corrélation significative (r =.60) : conclusion, plus vous êtes gros, plus voussautez haut !
Bien évidemment ces étudiants avaient oublié une variable importante : celle de l’âge… Bien sûr, les p etits collégiens de 12 ans sautent généralement moins haut que les grands lycéens de Terminale, et donc la corrélation apparente entre test et poids disparaît si l’on con sidère l’âge constant !
Dans ce cas, il faut alors réaliser unecorrélation partielleen éliminant l’effet de certaines variables.
Revenons à notre exemple : nous trouvons r =.60 pou r la corrélation A : saut/poids, mais il faut également calculer la corrélation B: saut/âge (ici, r = .69), et bien sûr la corrélation C : poids/âge ( r = .88).
Test saut |
Poids |
Age |
|
Test saut |
- |
- |
- |
Poids |
rA = .60 |
- |
- |
Age |
rB = .69 |
rC =.88 |
- |
rA -(rB.rC)
Le calcul de corrélation partielle est .
(1 - r ²B).(1 - r ²C)
Ce qui correspond (en « traduction Excel») à cette formule un peu bizarre :
=(A1-(B1*C1))/((1-B1^2)*(1-C1^2))^0,5
Vous n’avez qu’à copier cette formule, et la coller sous Excel.
Il faut au préalable placer les chiffres dans lescases indiqués (A1, B1, C1).
Ainsi dans notre exemple on écrit 0,60 dans A1, 0,69 dans B1, et 0,88 dans C1, puis vous collez la formule dans une case quelconque : le calcul est aussitôt réalisé. La corrélation partielle donne r = -.02, c’est--àdire une corrélation parfaitement nulle !
C. Les tests statistiques pour k échantillons:
La comparaison de plusieurs moyennes : La VD est ordinale, et nous voulons analyser k échantillons.
C.1 - les tests d’indépendance:
Il faut utiliser les analyses de variances (ANOVA), en analysant le croisement d’une, deux variables (ou même plusieurs variables, avec le risque de devenir fou ! ). Il existe des logiciels très adaptés (SPSS, Var3, Sphinx ou autres...) Mais attention à la "pêche à la ligne" des comparaisons multiples ! Les ANOVA multiples sont évidemment intéressantes, mais en comparer sans discernement plusieurs échantillons, on peut trouver des résultats totalement absurdes!
En tout cas, l’utilitaire d’analyse d’Excel permet aussi de calculer des ANOVA.
Sans être aussi performant que certains logiciels tatistiques, il est suffisant pour la plupart des cas...
Plus exactement, Excel propose d’effectuer :
- une analyse de variance entre groupes pour 1 facteur
- une analyse de variance entre groupes pour un facteur, avec des mesures répétitives
- une analyse de variance entre groupes pour deux facteurs.
1- Analyse de variance à un facteur, constitué de k modalitésPlan(: Sn)
Exemple : un chercheur veut savoir si la musique peut jouer sur l’apprentissage… Pour cela, notre cher cheur fait apprendre des listes de mots à 4 groupes d’étudiants qui entendent des styles de musiques nettement différents : de l’opéra, du flamenco, du piano clasique, et du free-jazz…On note le nombre de mots mé morisés après apprentissage…
opéra |
flamenco |
piano |
jazz |
13 |
15 |
12 |
16 |
15 |
12 |
13 |
12 |
13 |
12 |
10 |
13 |
14 |
15 |
12 |
14 |
15 |
14 |
14 |
10 |
10 |
11 |
12 |
11 |
16 |
15 |
16 |
15 |
14 |
15 |
15 |
12 |
15 |
14 ![]() |
12 |
12 |
13 |
15 |
16 |
|
14 |
17 |
Procédure: dans « Utilitaire d’analyse », cliquez « analyse de variance : un facteur », et comparez (en précisant colonnes, ou lignes) ces résultats en faisant OK.
Résultats :on trouve sur Excel ce tableau :
Analyse de variance: un facteur |
|||||
RAPPORT DÉTAILLÉ |
|||||
Groupes |
Nombre d'échantillons |
Somme |
Moyenne |
Variance |
|
Colonne 1 |
11 |
152 |
13,8181818 |
2,56363636 |
|
Colonne 2 |
10 |
138 |
13,8 |
2,4 |
|
Colonne 3 |
9 |
116 |
12,8888889 |
3,36111111 |
|
Colonne 4 |
11 |
148 |
13,4545455 |
5,27272727 |
|
ANALYSE DE VARIANCE |
|||||
Source des variations |
Somme des carrés |
Degré de liberté |
Moyenne des carrés |
F |
Probabilité |
Entre Groupes |
5,39137719 |
3 |
1,79712573 |
0,52418075 |
0,66836743 |
A l'intérieur des groupes |
126,852525 |
37 |
3,42844663 |
||
Total |
132,243902 |
40 |
Vous constatez que dans notre expérience, la musique ne semble pas affecter l’apprentissage, car les moyennes sont très proches, et l’analyse de variance (F=0,524) n’est pas significative…(p = .669)
Explication et calcul de cette analyse de la variance entre groupes, pour un facteur :
F = MC « entre » / MC « inter » : soit le rapport entrela moyenne des carrés entre lesgroupes, et la moyenne des carrés à l’intérieur des groupes
Moyenne des carrés « entre groupes » = ( somme des carrés / degré de liberté) entre les groupes
Moyenne des carrés « à l’intérieur » = (somme des carrés / degré de liberté) à l’intérieur des groupes
2- Analyse de variance sur des moyennes d’échantillonsappariés(Plan : Sn*Ap)
Exemple : 11 sujets ont des troubles du sommeil importants, et acceptent de tester 3 traitements pharmacologiques différents. Chaque individu va utiliser un médicament durant une semaine. On comptabilise le nombre d’heures de sommeil, par nuit :
sujets |
Médicament 1 |
Médicament 2 |
Médicament 3 |
1 |
2 |
3 |
|
2 |
4 |
1 |
4 |
3 |
2 |
1 |
3 |
4 |
2 |
2 |
4 |
5 |
1 |
1 |
|
6 |
3 |
2 |
5 |
7 |
4 |
2 |
11 |
8 |
4 |
2 |
10 |
9 |
10 ![]() |
3 |
9 |
10 |
8 |
6 |
14 |
11 |
2 |
2 |
5 |
Procédure: dans « Utilitaire d’analyse », cliquez «analyse de variance : deux facteurs,sansrépétition d’expérience», et comparez…
Tableau affiché :
Analyse de variance: deux facteurs sans répétition d'expérience
RAPPORT DÉTAILLÉ |
Nombre d'échantillonsSomme |
Moyenne |
Variance |
|
Ligne 1 |
4 |
6 |
1,5 |
1,66666667 |
Ligne 2 |
4 |
11 |
2,75 |
2,25 |
Ligne 3 |
4 |
9 |
2,25 |
0,91666667 |
Ligne 4 |
4 |
12 |
3 |
1,33333333 |
Ligne 5 |
4 |
7 |
1,75 |
4,91666667 |
Ligne 6 |
4 |
16 |
4 |
3,33333333 |
Ligne 7 |
4 |
24 |
6 |
15,3333333 |
Ligne 8 |
4 |
24 |
6 |
13,3333333 |
Ligne 9 |
4 |
31 |
7,75 |
10,25 |
Ligne 10 |
4 |
38 |
9,5 |
11,6666667 |
Ligne 11 |
4 |
20 |
5 |
18 |
Colonne 1 |
11 |
66 |
6 |
11 |
Colonne 2 |
11 |
42 |
3,81818182 |
7,76363636 |
Colonne 3 |
11 |
21 |
1,90909091 |
2,69090909 |
Colonne 4 |
11 |
69 |
6,27272727 |
16,6181818 |
Vous constatez qu’il y a bien une différences entre les 3 médicaments et le F et très significatif (12,48)… ( et à mon avis, le médicament 2 était probablement un placebo !)
12
Explication et calcul de cette analyse de variance pour deux facteurs, avec des mesuresrépétitives :
F= MC « traitement » / MC « erreur »
Dans cette situation « pairée », il y a trois calculs de sommes des carrés : la SC « sujets »(= « lignes »), la SC « traitements » (= « colonnes »), et la SC « interactions » (= « erreurs » dans l’interaction sujets x traitements)
Moyenne des carrés « traitement » = ( somme des carés / degré de liberté) des