Support de cours en statistique psychologie


Télécharger Support de cours en statistique psychologie

★★★★★★★★★★3.5 étoiles sur 5 basé sur 1 votes.
Votez ce document:

Télécharger aussi :


Support de cours en statistique psychologie

La statistique : voilà un mot qui, dès qu’il est évoqué, doit bien faire prendre, de manière significative, quelques points supplémentaires de tension artérielle à de nombreux étudiants en psychologie. Il est vrai que l’on a parfois l’impression que cette discipline, obligatoire, enseignée dans le cadre de leur cursus universitaire, réactualise chez eux d’effroyables souvenirs des difficultés que certains ont eu avec les mathématiques. Sans vouloir nier la filiation directe entre la statistique et les mathématiques, nous avons opté pour un mode de démonstration différent. Plutôt que d’emprunter à des modèles de démonstration mathématique, nous avons essayé, dans la mesure du possible, d’illustrer certains concepts et méthodes de manière empirique. La simulation de lancers de pièces par ordinateur constitue une de ces illustrations de même que la sélection d’échantillons de sujets dans une population. Nous avons même poussé le vice à ne pas employer la syntaxe habi-tuelle de la statistique pour désigner certains indicateurs ou paramètres. Aussi, que l’on ne s’étonne pas de voir écrit « Nombre de degrés de liberté = Nombre de modalités de la variable – 1 » plutôt que « v = k – 1 ». Il apparaissait en effet important d’appeler les choses par leur nom et d’employer le plus simple des lan-gages : un langage, en tout cas, que les étudiants de psychologie, comme les psy-chologues, connaissent parfaitement.

L’objectif principal de ce livre est de faire connaître les premiers principes et les premières méthodes d’une discipline dont l’objet essentiel est d’extraire et de séparer des faits numériques, issus d’observations, les informations essentielles et la part de hasard qui pourrait les expliquer.

Deux aspects importants de la démarche statistique vont être étudiés ici : la sta-tistique descriptive et la statistique inférentielle. La première présente les méthodes destinées à résumer le mieux possible une masse d’informations numéri-ques qui, laissées en l’état, ne pourraient être interprétées, en raison, principale-ment, de leur nombre et de leur hétérogénéité. La seconde présente les outils qui permettent d’extrapoler ces résultats. On verra en effet que l’on part, souvent, d’un nombre restreint d’informations obtenues auprès d’un nombre restreint d’individus pour extrapoler ces résultats. Par extrapoler, on entend considérer que l’informa-tion obtenue auprès d’un nombre restreint de personnes est l’expression de tous et, de fait, permet de tirer des conclusions générales.

L’utilisation d’un outil statistique est étroitement liée à ce que l’on veut montrer. Pour cette raison, on a essayé, autant que faire se peut, d’appliquer chacune des méthodes statistiques étudiées ici à des données issues de recherches propres à la psy-chologie. Bien sûr, certains auteurs vous diront que les principes et les méthodes de la statistique moderne s’appliquent au traitement de nombreux phénomènes numé-riques et qu’il importe peu que les données proviennent de mesures correspondant au public auquel l’ouvrage s’adresse. Pourtant il est fréquent, pour ne pas dire systé-matique, que les statisticiens en sciences économiques proposent, dans leurs ouvrages, des analyses de données... économiques, que les statisticiens des sciences agronomiques présentent des données issues de... l’agronomie, que les statisticiens des sciences médicales, quant à eux, s’appuient sur des exemples de médecine ou de biologie. Il en va de même pour de nombreuses disciplines qui utilisent la statistique comme moyen d’étude et d’approfondissement théorique et méthodologique (socio-logie, sciences de l’éducation...). On peut donc penser qu’un ouvrage de statistique destiné aux étudiants de psychologie et aux psychologues contient des exemples et des exercices d’application issus de recherches et d’études effectuées en psychologie. Aussi, dans ce manuel, les « cas » analysés statistiquement proviennent, la plupart du temps, de recherches fondamentales et appliquées issues des revues et ouvrages de psychologie (psychologie clinique, cognitive, développementale, sociale, étho-logie...) mais aussi, pour certains, de mémoires, de thèses ainsi que de rapports d’acti-vité rédigés par des praticiens (psychologues du marketing, de la publicité, de la Sécurité sociale, de l’évaluation, de l’enfance inadaptée, de la petite enfance, du nourrisson, des hôpitaux spécialisés, de la psychopathologie libérale et institution-nelle...). Si les distributions de données auxquelles les méthodes statistiques présen-tées ici sont appliquées, ont été reconstituées et inventées1, on a fait en sorte – par souci de transparence scientifique et parce que cet ouvrage s’adresse à des psycholo-gues – que les résumés de ces distributions et les résultats des différents tests pratiqués soient conformes à ceux des recherches précitées.

On a essayé, dans la mesure du possible, de détailler ces diverses recherches afin que le lecteur puisse évaluer leurs enjeux théoriques et pratiques, les intentions expérimentales de ceux et celles qui les ont menées, et d’identifier, clairement, les raisons qui ont conduit à utiliser tel test, tel mode de résumé, à produire telle infé-rence... Nous pensons réellement que bien connaître des recherches ayant abouti au prélèvement de données numériques et notamment le détail des procédures sta-tistiques utilisées permet d’acquérir un réel savoir-faire méthodologique et de trans-férer ces connaissances lorsque, un jour ou l’autre, on est mis en situation d’explorer, par soi-même, des données que l’on a obtenues.

Enfin, nous n’avons pas oublié que nous sommes résolument à l’ère du traite-ment informatique des données. Aussi avons-nous présenté les solutions aux diffé-rents exercices d’application donnés à la fin de chacun des chapitres, sous la forme des éditions de résultats tels que les fournissent, aujourd’hui, les logiciels de traite-ment statistique disponibles sur micro-ordinateur. Le développement de la micro-informatique ne fait plus du traitement statistique des données un espace réservé à certaines grandes structures organisationnelles ou à des laboratoires de recherche disposant de confortables moyens. Il est aujourd’hui possible d’acquérir, parfois pour quelques dizaines de francs, un logiciel de traitement statistique qui permet de traiter les données de la plupart des études de cas présentées dans cet ouvrage. Vous verrez par vous-même que la fastidieuse tâche de calcul est laissée à la machine mais que les conclusions et l’interprétation relèvent exclusivement de la responsa-bilité de celui qui fait la demande de traitement. La difficulté de la statistique réside, aujourd’hui, plus dans la compréhension des concepts qu’elle manipule que dans la mise en œuvre des méthodes dont elle dispose.

En psychologie, comme dans de nombreuses autres disciplines scientifiques, il n’y a pas d’instrument à partir duquel on peut tout mesurer et une condition et une seule où tout se mesure. La complexité des faits psychologiques ne saurait s’appré-hender par le biais d’un ou de quelques instruments de mesure et d’une ou de quel-ques conditions de prélèvement. Dans ce domaine, force est de constater que l’imagination des psychologues semble sans limite, et les subtilités et stratagèmes qu’ils emploient pour faire émerger les phénomènes psychologiques montrent bien que leur ingéniosité n’a d’égale que la pluralité des phénomènes psychologiques qu’ils désirent observer2. Toutefois, la multitude des instruments de mesure de ces phénomènes – on pourrait même dire ces faits psychologiques – ne rend pas la tâche de description de ceux-ci surréaliste. En effet, si l’instrument de mesure est varié, les caractéristiques idiosyncrasiques des mesures le sont moins et, dans les faits, il n’existe guère plus de trois, voire quatre catégories différentes de mesures. Si ces catégories – que l’on appelle, en statistique, des échelles de mesures – sont peu nombreuses, il est important de pouvoir toujours situer la catégorie à laquelle appartient la mesure que l’on a utilisée pour «capter» le ou les phénomènes psy-chologiques recherchés. Le degré de précision statistique d’une mesure – le statis-ticien entend par précision le type d’opérations mathématiques que l’on pourra faire sur ces mesures – est dépendant du type d’échelle utilisé et les tests statistiques (cf. chapitres 3, 4 et 5) que l’on pourra employer ne portent, la plupart du temps, que sur des échelles bien déterminées. Toutes les mesures n’ont pas le même poids informatif et il est essentiel de pouvoir situer avec précision le niveau atteint par celles-ci. Cette étape d’évaluation effectuée, on pourra accéder à la phase de description proprement dite des informations (les données) que l’on a recueillies. La statistique descriptive offre un éventail de méthodes graphiques et numériques dont l’emploi est aujourd’hui facilité par la micro-informatique, et qui permettent de présenter ces données sous une forme lisible, synthétique et surtout, signifiante.

1. Typologie des variables et représentation graphique des données

Comme on vient de le dire, situer le niveau de mesure du phénomène que l’on étudie constitue une étape fondamentale, peut-être la plus importante, dans le pro-cessus d’analyse et d’inférence statistique des données dont on dispose. Pour cette raison, il convient de déterminer le type d’échelle de mesure utilisée afin d’évaluer les possibilités de traitement et de description qui seront susceptibles d’être opérées à partir des données obtenues.

1.1. Les échelles de mesure nominale

 1.1.1. Définition et exemples

Les échelles de mesure nominale – appelées plus généralement échelles nominales – caractérisent les variables dont les modalités n’ont qu’une visée descriptive des phé-nomènes sur lesquels elles portent. On cherche ici, tout simplement, à donner un nom et non une valeur numérique aux phénomènes que l’on observe. Les modalités de la variable sont de simples catégories non hiérarchisées. Ces catégories peuvent être des valeurs (codes) mais, dans ce cas, il n’y a pas de modalité qui puisse être considérée comme inférieure ou supérieure à une autre modalité.



La plus petite variable permettant de rendre compte d’un phénomène, ou, comme on le dit parfois, d’un observable, doit impérativement comprendre deux modalités, c’est-à-dire permettre de qualifier deux états possibles. En dessous de deux modalités il n’y a plus de variable puisque rien ne peut varier. Ces variables sont dites dichotomiques – on dit aussi parfois qu’elles sont binaires – et sont fréquemment employées en psychologie.

Table des matières :

AVANT-PROPOS ......... . . . . . . . XI

COURS

CHAPITRE 1 DE L’OBSERVATION DES FAITS

PSYCHOLOGIQUES

À LEUR RÉSUMÉ STATISTIQUE ... . . . . 1

1. Typologie des variables et représentation graphique des données ......... . . . . . 4

1.1. Les échelles de mesure nominale..... . . . . . . . . 4

1.1.1. Définition et exemples ....... . 4

1.1.2. Présentation et représentation graphique de distributions de mesures nominales ....... . 6

1.2. Les échelles de mesure ordinale......8

1.2.1. Définition et exemples ....... . 8

1.2.2. Des rangs ordonnés ....... . . . 9

1.2.3. Présentation et représentation graphique de distributions de mesures ordinales ....... . . 9

1.3. Les échelles de mesure d’intervalles ..... . . . . 11

1.3.1. Définition et exemples ....... 11

1.3.2. Présentation et représentation graphique de distributions de mesures d’intervalles ......12

1.4. Les échelles de mesure de rapports ..... . . . . . 17

1.5. La combinaison de variables ....... 17

1.5.1. La combinaison d’échelles d’intervalles ... . . . . . . . . 17

1.5.2. La combinaison d’échelles ordinales ..... 18

1.5.3. La combinaison d’échelles nominales..... 20

1.5.4. La représentation graphique: un puissant instrument d’analyse 21

1.6. La difficile distinction des variables: comment s’y retrouver? . . . . . 21

1.7. Les changements d’échelles ....... . 23

1.8. Les emboîtements d’échelles ....... 24

2. Résumé et description numérique des données. . . . . . . . . 25

2.1. Valeur centrale et dispersion dans le cas d’échelles d’intervalles . . . 26

2.1.1. L’indicateur de tendance centrale ..... . . 26

2.1.2. Mesure de la dispersion. Exemple d’une évaluation contrastée. . 26

2.1.3. L’estimation sans biais de la variation: approche de la notion de degrés de liberté ....... . . . 29

2.1.4. Le coefficient de variation: un indicateur de comparaison de dispersion ....... . . . . . . . 31

2.1.5. Mesure de l’aplatissement d’une courbe: le coefficient « Kurtosis » ..... . . . . . . . 32

2.2. Valeur centrale et dispersion dans le cas d’échelles ordinaires . . . . . 35

2.2.1. L’indicateur de tendance centrale ..... . . 35

2.2.2. La dispersion des échelles ordinales ..... . 37

2.3. Valeur centrale et dispersion dans le cas d’échelles nominales . . . . . 41

2.3.1. L’indicateur de tendance centrale ..... . . 41

2.3.2. Mode et échelles de mesure d’intervalle ... . . . . . . . . 42

2.3.3. La comparaison de fréquences modales ... . . . . . . . . 43

2.3.4. L’indicateur de dispersion ..... . . . . . . . . 43

2.4. Moyenne, médiane, mode: quand les utiliser ?... . . . . . . 44

2.5. Analyse complémentaire de la dispersion : analyse de l’asymétrie d’une distribution de données ... . 46

2.5.1. Le coefficient « Skweness » pour une échelle d’intervalles. . . . . 46

2.5.2. Le coefficient d’asymétrie pour échelle de mesure ordinale . . . . . 49

3. Applications avec traitement informatique ... . 49

CHAPITRE 2 DE L’ÉCHANTILLON À LA POPULATION :

L’INFÉRENCE STATISTIQUE... . . . . . . . 57

1. Approche conceptuelle de la notion d’échantillon et de population en statistique ..... . . . . 59

1.1. Une population en statistique ......59

1.2. Échantillon et population ....... . . 61

1.2.1. Les échantillons indépendants ..... . . . . . 61

1.2.2. Les échantillons appariés......62

1.3. Le prélèvement d’échantillons......63

1.3.1. Les méthodes d’échantillonnage probabiliste ... . . . . 63

1.3.2. Les méthodes d’échantillonnage empirique ... . . . . . 65

2. Probabilités et distribution de probabilités : approche empirique....... . . . . . . 67

2.1. Pile ou face: l’implacable distribution des probabilités ..67

2.2. Et si tous les échantillons du monde faisaient une loi normale : le principe de l’urne ....... . . . . . . . 70

2.3. Distribution d’un caractère continu: principe de distribution de la loi normale ..... 74

2.4. Principe de l’urne sur des mesures d’intervalles continus ou discontinus ......... . 74

2.5. Lecture de la loi normale centrée-réduite : détermination des diverses probabilités..... . . 76

2.6. Une même loi pour plusieurs lois: principe de l’écart centré-réduit 79

2.6.1. Évaluation de la probabilité d’apparition d’une valeur dans une distribution ....... . 81

3. Les fluctuations de moyennes et de proportions . . . . . . . 84

3.1. Les intervalles de fluctuation de moyennes et de proportions provenant d’une population ... . . . . . . 85

3.1.1. Intervalle de fluctuation d’une moyenne de population . . . . . . . 87

3.1.2. Intervalle de confiance d’une proportion ... . . . . . . . 93

3.2. Les intervalles de fluctuation de moyenne et de proportions provenant d’un échantillon: approche de l’inférence statistique. . . 96

3.2.1. Inférence sur les moyennes..... . . . . . . . 97

3.2.2. Inférence sur les proportions..... . . . . . 100

3.3. Population finie et infinie ....... . 102

3.3.1. Population finie....... . . . . 102

3.3.2. Population infinie ....... . . 103

3.3.3. Correction de l’erreur-type dans le cas d’une population finie 103

3.3.4. Détermination et contrôle des paramètres de fluctuation . . . . . 106

3.3.5. Limite du facteur de correction pour une population finie . . . . 107

4. Théorie des tests en statistique..... . . . 107

4.1. Hypothèses et tests d’hypothèses..... . . . . . . 108

4.2. Tests paramétriques et non paramétriques ... . . . . . . . . 109

5. Applications avec traitement informatique ... 111

CHAPITRE 3 LA COMPARAISON DE MOYENNES :

LE HASARD DES DIFFÉRENCES (ACTE I). . . . . . 115

1. Principe des tests de comparaison de moyennes . . . . . . 117

2. La comparaison de deux moyennes ....119

2.1. La comparaison d’une moyenne à une norme ... . . . . . . 120

2.1.1. Méthode de calcul ....... . . 120

2.1.2. Hypothèses ....... . . . . . . . 122

2.1.3. Comparaison dans le cas où la variance de population est connue ..... . . . . . . . 122

2.1.4. Comparaison dans le cas où la variance de population est inconnue ..... . . . . . . 123

2.1.5. Facteur de correction dans le cas d’une population finie. . . . . . 127

2.2. La comparaison de deux moyennes observées ... . . . . . . 128

2.2.1. Comparaison de deux moyennes provenant d’échantillons indépendants ..... . . . . . 130

2.2.2. Comparaison de deux moyennes provenant d’échantillons appariés ......134

2.3. Comparaison de moyennes: autre méthode ... . . . . . . . 139

2.3.1. Méthode de l’intervalle de fluctuation pour la comparaison

d’une moyenne à une norme..... . . . . . 139

2.3.2. Méthode de l’intervalle de fluctuation d’une moyenne: cas de deux moyennes ......140

2.4. Test à une issue ou à deux issues : fondements pratiques . . . . . . . . 142

3. La comparaison de trois moyennes et plus : l’analyse de variance....... . . . . 144

3.1. Principe de la méthode....... . . . . 145



3.2. L’analyse de variance sur des moyennes d’échantillons indépendants ......... . 148

3.3. L’analyse de variance sur des moyennes d’échantillons appariés. . . 154

3.4. Extension du principe de l’analyse de variance : l’analyse de plans factoriels ....... 159

3.4.1. L’analyse de variance d’un plan factoriel utilisant des échantillons indépendants ..... . . . . 160

3.4.2. Plans en tous genres....... . 165

4. Applications avec traitement informatique ... 166

CHAPITRE 4 LA COMPARAISON DE FRÉQUENCES :

LE HASARD DES DIFFÉRENCES (ACTE II). . . . . 173

1. Principe des tests de comparaison de fréquences ou de proportions ....... . . . . . . . 176

2. La comparaison de deux proportions : approche paramétrique....... . 178

2.1. La comparaison d’une proportion observée à une norme . . . . . . . . 178

2.2. La comparaison de deux proportions observées ... . . . . 181

2.3. Cas des échantillons appariés ..... . . . . . . . . 183

2.4. Hypothèse bilatérale ou unilatérale..... . . . . 185

2.5. Comparaison de deux proportions: méthode par l’intervalle de fluctuation ..... . 185

2.5.1. Comparaison d’une proportion observée à une norme. . . . . . . 186

2.5.2. Comparaison de deux proportions par la méthode de l’intervalle de fluctuation ..... . . . . . 187

2.6. Limites du test de comparaison de proportions ... . . . . . 189

3. La comparaison de plusieurs fréquences : le text du χ2 ......... . . . 189

3.1. Méthode générale de calcul....... 190

3.2. Comparaison d’une répartition d’effectifs observée

à une répartition théorique: le χ2  d’ajustement ... . . . . 191

3.2.1. Comparaison d’une répartition d’effectifs observée à une répartition d’effectifs uniforme ... . . . . . . . . 191

3.2.2. Approfondissement de l’analyse ..... . . 195

3.2.3. Comparaison d’une répartition d’effectifs observée à une répartition d’effectifs théoriques indépendants . . . . . . . . 197

3.3. Le χ2  d’indépendance ....... . . . . 200

3.3.1. Cas des échantillons indépendants ..... 200

3.3.2. Cas des échantillons appariés : le χ2  de Mac Nemar . . . . . . . 210

3.4. Après le texte, l’analyse décomposée du χ2 ... . . . . . . . 212

3.5. Facteurs empiriques agissant sur la valeur du χ2  ... . . . . 215

3.5.1. Amplitude de l’écart entre effectifs observés et effectifs théoriques ....... 215

3.5.2. Importance du volume d’observations... . . . . . . . . 217

3.6. Limites d’utilisation du test du χ2  ..... . . . . . 218

3.6.1. Un nombre minimal d’observations ....219

3.6.2. L’évaluation du nombre de degrés de liberté ... . . . 219

3.7. Limites à l’interprétation du test du χ2  ..... . 223

4. Applications avec traitement informatique ... 223

CHAPITRE 5 LA CORRÉLATION :

LA RECHERCHE DES PARALLÈLES ... . 233

1. Principe des tests de corrélation..... . . 235

2. La corrélation linéaire ....... . . 240

2.1. Relation entre deux variables: approche graphique ... . 240

2.2. Méthode de calcul ....... . . . . . . . 241

2.3. Corrélations en tous genres ....... 245

2.4. Corrélations contagieuses....... . . 246

2.5. Bien voir ! Bien vu ! Analyse graphique de la corrélation . . . . . . . 247

2.6. La corrélation partielle: la recherche des facteurs communs . . . . . 250

2.7. Après la corrélation ....... . . . . . . 252

2.7.1. L’appréciation de l’influence de la relation... . . . . . 252

2.7.2. r ou r2? ......... 254

2.8. La régression linéaire: un outil de pronostic ... . . . . . . . 255

2.8.1. Régression et corrélation..... . . . . . . . . 257

2.8.2. Régression et prédiction ..... . . . . . . . . 258

2.8.3. Prudence et prédiction ......261

3. La corrélation des rangs ....... 262

3.1. Méthode de calcul ....... . . . . . . . 263

3.2. L’ajustement à un modèle théorique ..... . . . 265

3.3. Les rangs ex aequo dans la corrélation de Spearman... . 266

3.3.1. Détermination des rangs ex aequo..... . 267

3.3.2. La présence de rangs ex aequo en grand nombre ... 267

3.4. Test de corrélation bilatéral ou unilatéral ....269

3.5. Combinaison d’échelles d’intervalles et d’échelles ordinaires. . . . . 271

4. Les coefficients d’association de variables nominales 273

4.1. L’association de variables dichotomiques : le coefficient Phi. . . . . 274

4.2. L’association de variables polychotomiques : le coefficient de Cramer ....... . . . 279

5. Conclusion : corrélation et causalité... . . . . . . . . 282

6. Applications avec traitement informatique ... 283

EXERCICE 1: LA BONNE ODEUR DE L’ARGENT ... 291

EXERCICE 2: POURBOIRES POUR MANGER... . . . . 295

EXERCICE 3: THÉRAPIE ASSISTÉE PAR ANIMAUX. . . . . . . . 298

FRANÇAIS: MATCH NUL ..... 304

EXERCICE 5: SUICIDES ET CHÔMAGE ....313

EXERCICE 6: LE TÉLÉPHON QUI SON..... 317

EXERCICE 7: IL FAUT BOIRE POUR LE CROIRE ... 323

EXERCICE 8: LA MUSIQUE ADOUCIT LE STRESS..328

EXERCICE 9: UN «BON» COUPABLE ..... 340

EXERCICE 10: FAITES L’HUMOUR, PAS LA GUERRE . . . . . . . 345

INTERNET ET LA STATISTIQUE ......351

1. Pas de statistique sans statistiques : rapide aperçu des sites de données....353

2. Les cours en ligne : formation et entraînement à distance ......... . . . . . 355

3. Les logiciels de traitement statistique ... . . . . . 356

3.1. Les logiciels «Free»....... . . . . . . 356

3.2. Les logiciels commerciaux ....... . 357

3.2.1. Les logiciels en langue francaise ..... . . 358

3.2.2. Les logiciels en langue anglaise ..... . . . 359

4. Les logiciels de traitement « On-Line »... . . . . . . 360

4.1. Tables statistiques....... . . . . . . . . 360

4.2. Logiciels de traitements statistiques On-Line ... . . . . . . 361

4.2.1. Logiciels multi-analyses intégrés ..... . . 361

4.2.2. Logiciels multi-analyses décomposés ....362

4.3. Sites pour des analyses spécifiques ..... . . . . . 362

4.4. Des extracteurs de valeurs aléatoires, des répartiteurs aléatoires de condition ..... . 368

TABLES DE PROBABILITÉS ....... . . . . . 369

BIBLIOGRAPHIE ......... . . . . . . 381

INDEX ........... . . . . . . . 383



91