Cours gratuits » Cours statistique » Cours statistique psychologie » Document de formation sur la statistique psychologie

Document de formation sur la statistique psychologie


Télécharger



★★★★★★★★★★3.5 étoiles sur 5 basé sur 1 votes.
Votez ce document:

Document de formation sur la statistique psychologie

...

Chaque situation aboutissant à l’utilisation des statistiques a la même structure : on étudie certaines grandeurs ou caractéristiques (les variables) de personnes, objets, ou choses abstraites (les individus ou individus statistiques). Les individus font partie d’un ensemble : la population. On n’a cependant généralement accès qu’à une partie de la population, qu’on suppose aléatoirement choisie : l’échantillon. On parle indifféremment de taille ou d’effectif pour désigner ce que les anglosaxons appellent fréquence1 : le nombre d’individus.

Chaque variable donne une valeur pour chaque individu. Les valeurs

possibles d’une variable sont les modalités ou niveaux de la variable. L’ensemble des modalités est l’échelle de mesure. Les variables se distinguent d’une part selon ce qu’on en pense : si l’on pense qu’une variable X dépend d’une variable Y , on dit que X est la variable dépendante, et Y la variable indépendante ou facteur. Elles se distinguent également selon leur échelle de mesure. On parle de variable nominale (ou catégorielle, ou qualitative) lorsqu’il n’y a pas de structure sur l’échelle de mesure.

On parle de variable ordinale si les modalités sont ordonnées, et de variable numérique (ou quantitative) si les modalités sont des nombres. On distingue encore les variables numériques discrètes (prenant seulement certaines valeurs dont on peut faire la liste) et continues (pouvant prendre toutes les valeurs dans un intervalle réel). Décrire la situation statistique, c’est donner les individus, éventuellement la population et la taille de l’échantillon, les variables et leur type (dépendante ou indépendante, mais aussi nominale, ordinale ou numérique). La situation statistique doit être cohérente, ce qui implique que pour chaque individu, chaque variable donne une valeur et une seule.

Exercice 1 Définir les termes suivants (var = variable) population var manipulée var indépendante variable var contrôlée échantillon modalité var dépendante individus

Exercice 2 Parmi les mots suivants, lesquels sont synonymes ? variable facteur modalité quantitatif nominale variable aléatoire niveau individus taille de l’échantillon population qualitatif échantillon sujet catégoriel numérique

Exercice 3 Une variable est une application d’un ensemble de départ dans un ensemble d’arrivée. Expliquez et précisez l’ensemble de départ et l’ensemble d’arrivée.

Exercice 4 Donnez des exemples de situations où les individus sont (1) des personnes (2) des objets

(3) des groupes (4) des entités abstraites.

Exercice 5 Donnez des exemples de variables (1) nominales (2) ordinales (3) discrètes (4) continues.

1.2 Applications

Dans les cas suivants, décrivez la situation statistique

Exercice 6 On relève le temps mis par des rats pour atteindre le but dans un labyrinthe.

Exercice 7 On relève sur 50 garçons et 50 filles choisis au hasard un score X de timidité sociale. Les sujets sont étudiants en histoire, mathématique, ou psychologie. On veut déterminer si le genre et la section influencent X.

Exercice 8 On relève sur 15 couples de vrais jumeaux la différence absolue |QI1 − QI2| des QI.

Exercice 9 Des volontaires remplissent un questionnaire de santé où il doivent cocher les maladies pour lesquelles ils ont été hospitalisé parmi un ensemble de 5 maladies (ex : paludisme, méningite, ...).

Exercice 10 On mesure un score de dépression X avant et après une thérapie chez les mêmes 30 sujets (on parle de plan à mesures répétées : pourquoi ?)

Exercice 11 D’après l’INSEE2 , un tiers des étudiants exercent une activité rémunérée.

1.3 Réflexion

Exercice 12 Dans un questionnaire, l’une des questions est "Cochez le ou les mots qui évoquent pour vous le bonheur :

¤ enfant

¤ nature

¤ argent"

A combien de variables cela correspond-il ?

Exercice 13 Dans un questionnaire, l’une des questions est "Cochez le mot qui évoque le plus le bonheur pour vous :

¤ enfant

¤ nature

¤ argent"

A combien de variables cela correspond-il ?

Exercice 14 Lorsqu’on a une unique variable, parlera-t-on de variable dépendante ou indépendante?

2 Les variables

On note habituellement par une grande lettre latine une variable (X) et par une petite lettre (x) la valeur de la variable sur un individu particulier. Outre qu’on distingue habituellement les variables selon le type d’échelle et selon qu’elles sont dépendantes ou indépendantes, on a également souvent besoin de distinguer, pour une variable donnée – généralement à des fins de représentation graphique – (1) la variable elle-même comme application, (2) sa distribution, (3) sa répartition, et, dans le cas d’une variable continue, (4) sa densité. On parle de tableau descriptif quand on donne la liste des valeurs individu par individu, et de tableau statistique quand on donne la distribution. Certaines variables ont des distributions particulières. Si par exemple toutes les modalités ont la même probabilité d’apparition, on parle de variable uniforme.

Pour certaines variables, l’expérimentateur impose les valeurs correspondant à chaque individu : on dit que la variable est manipulée par l’expérimentateur. Dans d’autre cas, l’expérimentateur n’impose pas les valeurs, mais seulement la distribution de la variable : on dit alors qu’elle est contrôlée par l’expérimentateur. Lorsqu’on dispose d’une – ou plusieurs – variable X, on peut calculer des fonctions, disons f (x) individu par individu, en utilisant les valeurs de la variable. On obtient ainsi une nouvelle variable, qui se note f (X).

Exercice 15 Est-on généralement plutôt intéressé par la variable elle-même ou seulement par sa distribution?

Exercice 16 Quelle est la distribution d’une variable continue ?

Exercice 17 Lorsqu’on dit "Un tiers de la classe n’a pas la moyenne", parle-t-on de distribution ou d’autre chose ? (précisez)

Exercice 18 Quelle est la fonction de répartition d’une variable uniforme sur {0, 1, ..., 99} ?

Exercice 19 Donnez des exemples de variables contrôlées mais non manipulées. Des variables manipulées peuvent-elles ne pas être contrôlées ?

Exercice 20 On impose souvent, pour être certain que l’échantillon est équilibré, que l’échantillon (dans le cas où les individus sont des personnes) contienne autant de filles que de garçons. Peut-on dire alors qu’on manipule la variable genre ?

Exercice 21 Donnez un exemple de situation où on s’intéresse à la variable et pas seulement à sa distribution.

Exercice 22 Une variable prend les valeurs suivantes sur une population de 9 individus :

3 0 2

4 −5 1

4 −1 0.

Donnez le tableau correspondant à la variable 2X, puis celui de la variable X2.

Exercice 23 Une variable X est donnée par le tableau suivant :

1 (oui) 0 (non) n 3 12

(1) Décrivez la situation statistique. (2) De quel type de tableau s’agit-il ? (3) Calculez X2

Exercice 24 On relève un score X d’altruisme. Un individu donne une valeur de 9. Doit-on écrire X = 9 ou x = 9 ?

… …. …

CHAPITRE III QUALITÉS MÉTROLOGIQUES D'UN TEST

  • 14.      — Considéré comme un instrument de mesure, un test doit posséder un certain nombre de qualités destinées à le rendre apte à son utilisation métrologique.

Ces qualités sont de deux sortes : les unes sont des qualités métrologiques générales, communes à tous les instruments de mesure; les autres sont des qualités métrologiques propres à la nature psychologique des mesures que l'on a en vue.

Les qualités propres à tous les instruments de mesure sont essentiellement la fidélité, la sensibilité.et la justesse.

Parmi les qualités plus particulières aux tests, nous citerons l'équivalence, l'homogénéité et la valeur diagnostique.

Les qualités d'ordre général citées plus haut se présentent en psychométrie sous des aspects un peu différents de leur aspect ordinaire, et ont reçu de ce fait des appellations particulières. C'est ainsi que la fidélité devient la cons¬tance; la sensibilité s'appelle pouvoir différenciateur; quant à la notion de justesse, elle subit en psychométrie une modification très profonde du fait des conditions particulières dans lesquelles s'effectuent les mesures psychologiques et, en définitive, se trouve remplacée par une notion nouvelle, appelée validité, qui n'est pas entièrement comparable à la notion classique de justesse.

L'évaluation des qualités métrologiques d'un test est une opération extrê-mement importante du point de vue psychométrique, ainsi que nous l'avons dit plus haut, et elle exige l'emploi de procédés statistiques que nous allons examiner rapidement.

  • 15.      — La fidélité ou constance est la qualité par laquelle le test donne, d'une même grandeur psychique, toutes choses égales d'ailleurs, deux mesures identiques, quel que soit l'intervalle de temps séparant les deux mesures.

Contre cette qualité joue, bien entendu, la variation du sujet, que l'on ne sait ni supprimer ni éviter.

On convient de mesurer la constance d'un test par le coefficient de corrélation entre les résultats de deux applications de ce test à un même groupe de sujets suffisamment nombreux, quel que soit l'intervelle de temps écoulé entre les deux applications.

Il résulte de ce qui précède que, plus un test est fidèle, plus il est possible d'employer des intervalles petits dans sa graduation, et plus la mesure qu'il donne pour un sujet est caractéristique de ce sujet.

  • 16.      — La sensibilité, ou pouvoir différenciateur, est la qualité qui permet au test de mettre en lumière les différences individuelles des sujets examinés.

Le pouvoir différenciateur dépend d'un certain nombre de facteurs, notam¬ment :

10 De la constance du test : il est d'autant plus faible que la constance est elle-même faible, et inversement;

20 De son étalonnage : il est d'autant plus élevé que les degrés de sa graduation sont petits (en supposant ceux-ci légitimés par la fidélité de l'épreuve);

30 De sa force relativement au niveau mental des sujets que l'on examine : un test trop difficile, par exemple, ne différencie que les bons et les très bons sujets, et son pouvoir différenciateur est faible ou nul pour les mauvais et les moyens.

  • 17.      — La notion d'équivalence est relative à deux tests destinés à mesurer la même grandeur psychologique. On dit que deux tests sont équivalents lors¬que, appliqués à la mesure de la même grandeur quasi simultanément et toutes choses égales d'ailleurs, ils fournissent des résultats identiques.

On convient de mesurer l'équivalence par le coefficient de corrélation entre les résultats des deux épreuves effectuées à bref intervalle sur un même groupe suffisamment nombreux de sujets.

Contre cette qualité jouent :

10 La variation du sujet;

20 La comparabilité des étalonnages des deux tests.

En appliquant les deux épreuves à des groupes de sujets sélectionnés et suffisamment nombreux, on peut établir entre leurs graduations respectives une table ou « abaque » de correspondance. Lorsque cette correspondance est établie, la variation des sujets joue seule et, dès lors, le coefficient d'équiva¬lence défini plus haut peut être assimilé à un nouveau coefficient de fidélité relatif aux deux épreuves.

  • 18.      — L'homogénéité d'un instrument de mesure est essentiellement une qualité de sa graduation.

L'homogénéité d'un test se mesure en divisant l'épreuve en deux moitiés (questions paires et questions impaires) et en calculant le coefficient de corré¬lation entre les résultats donnés par chacune des deux moitiés sur un même groupe suffisamment nombreux de sujets.

On obtient en réalité, par ce procédé, le coefficient d'équivalence des deux moitiés du test.

L'homogénéité dépend essentiellement de deux facteurs :

10 De l'équivalence psychique des différentes parties du test. On contrôle pratiquement cette équivalence en étudiant les réponses faites par les sujets aux diverses questions du test, et en recherchant si certaines d'entre elles sont systématiquement ou bien faites ou mal faites, et comment, en général, se distribuent les fréquences de réussite par question. Cette étude peut conduire, bien entendu, à des retouches successives de l'épreuve.

20 De la variation des sujets pendant la durée de l'épreuve. Nous avons vu plus haut que ce procédé est même employé pour estimer la variation moyenne des sujets dans le test. D'après ce qui précède, cet emploi n'est correct que si l'on a réalisé au préalable l'équivalence parfaite des deux moitiés du test.

  • 19.      — On dit enfin qu'un test a une bonne valeur diagnostique lorsque sa constance et son pouvoir différenciateur sont satisfaisants.

Dès lors, il constitue un instrument de mesure fidèle, sensible et convenable¬ment gradué, chacune de ces qualités étant assurée dans des limites connues.

Quant à la notion de validité d'un test, qui se substitue à la notion classique de justesse, nous la retrouverons plus loin.

  • 20.      — Il y a lieu de remarquer que l'estimation des qualités métrologiques d'un test repose sur l'emploi du coefficient de corrélation de Pearson (usage conforme à la convention de terminologie psychotechnique du Congrès de Moscou de 1933). Or, l'emploi de cette caractéristique appelle d'importantes réserves.

Sa signification n'est bien claire, en effet, que lorsque la liaison statistique que l'on étudie est définie par une loi de fréquence normale ou quasi-normale. Or, lorsqu'on évalue la constance d'un test, par exemple, relativement à la mesure d'une fonction mentale ou d'une aptitude donnée, on ne connaît rien en général de la distribution de la variation de cette fonction mentale ou de cette aptitude dans le groupe de sujets que l'on étudie. L'emploi du coefficient de corrélation, dans ces conditions, est donc toujours fait en dehors de la réserve précédente.

Dans cette ignorance, le coefficient de corrélation ne peut constituer, en particulier, une mesure de la liaison que l'on étudie. On sait, en effet, qu'une liaison peut être rigide ou' fonctionnelle et donner lieu à un coefficient de corré¬lation aussi voisin que l'on veut d e zéro ou même nul.

L'emploi du coefficient de corrélation dans l'estimation des qualités métro¬logiques d'un test devra donc être soumis à une légitime revision lorsque l'étude statistique des fonctions mentales et de leurs variations aura été suffisamment poussée pour permettre une meilleure connaissance de leur loi de distribution sur des groupes suffisamment nombreux de sujets.

DEUXIÈME PARTIE L'outil statistique et la psychologie appliquée.

  • 21. — Du point de vue psychométrique, la psychologie appliquée requiert, de façon générale, l'évaluation d'une aptitude complexe chez un ou plusieurs individus. La plupart du temps, il s'agira de l'aptitude : à exécuter un travail (aptitude professionnelle); à recevoir un certain niveau de connaissances (apti¬tude scolaire); à acquérir rapidement une conduite professionnelle (appren¬tissage), etc.

En supposant cette évaluation poursuivie par l'emploi de la méthode ana-lytique, elle comprend les étapes méthodologiques suivantes :

1° D'abord une analyse de l'aptitude en fonctions mentales ou aptitudes plus simples, dont la mise en jeu simultanée est sensée reproduire, ou tout au moins conditionner, l'activité psychophysiologique complexe à mesurer.

2° Ensuite le choix ou la création des tests destinés à mesurer séparément chacune des fonctions psychologiques qui ont été isolées par l'analyse précé-dente; l'ensemble de ces tests constitue la batterie psychométrique adaptée à la mesure:

3° Les tests étant choisis, on effectue la mise au point de leurs techniques d'application : aménagement des salles d'examen, choix des appareils, établis-sement des consignes d'exécution des épreuves, etc...

4° On procède ensuite à la graduation des instruments de mesure constitués (tests ou séries partielles de mesures données par chaque test).

5° L'étude métrologique des tests ainsi gradués, si elle n'a pas été faite, doit de toute nécessité être effectuée avant l'exécution des mesures, afin de connaître à l'avance les qualités métrologiques propres à chaque épreuve et, s'il y a lieu, de procéder à des retouches systématiques des tests pour leur assurer les qualités requises à une degré suffisant.

6° Enfin, lorsque les mesures ont été réalisées, il y a lieu de faire l'étude systématique de leur validité, c'est-à-dire du degré d'accord existant entre l'aptitude réellement mesurée par la batterie psychométrique et celle dont on a en vue l'appréciation numérique.

Les trois premières étapes de ce programme sont de nature psychotechnique pure. Les deux suivantes comportent, comme nous l'avons vu, des opérations statistiques importantes.

La sixième et dernière étape fait appel également, comme nous allons le voir maintenant, à des procédés statistiques particuliers.

CHAPITRE I VALIDITÉ DES MESUBES PSYCHOTECHNIQUES

  • 22.      -- La notion de justesse est parfaitement claire dans la théorie des instruments de mesure des sciences physiques. Un instrument de mesure est dit « juste » lorsque la mesure qu'il indique est bien celle de la grandeur éva¬luée. Aucune ambiguité n'est possible, car, en physique, un instrument de mesure apprécie toujours une grandeur de même nature que celle à mesurer (longueur, volume, vitesse, etc...).

En psychométrie, cette dernière condition est loin d'être réalisée en général, et le problème qui se pose est de savoir, non pas si un test est un instrument juste, mais préalablement, si ce qu'il mesure est bien une grandeur psycholo¬gique de même nature que celle qu'il est sensé devoir mesurer (attention con¬centrée, mémoire, intelligence, etc...).

Ainsi donc, la notion de justesse se fond, en psychométrie, dans une notion plus générale et plus complexe désignée par le terme de « validité », et qui répond à la question suivante : un test mesure-t-il une grandeur psychologique de même nature que celle qu'il est sensé devoir mesurer, et dans quelles limites atteint-il son but?

  • 23.      — On convient d'exprimer la validité par le degré de liaison existant entre le rendement du sujet dans l'épreuve et son rendement dans l'activité mentale que l'épreuve est sensée devoir mesurer (ou prévoir).

L'appréciation d'une validité exige donc la connaissance de deux classe-ments :

1° Celui obtenu par le test;

2° Celui manifesté par les mêmes sujets dans l'activité mentale à mesurer. Lorsque ces deux classements sont connus, on convient de mesurer la vali¬dité par le coefficient de corrélation entre ces deux classements.

Rien entendu, si la forme numérique des deux classements ne permet pas l'emploi du coefficient de corrélation de Pearson, il sera toujours loisible d'en employer un autre : coefficient d'association de Yule; coefficient de corrélation par rangs de Spearman; coefficient de corrélation bisérial, etc...

  • 24. — Toutes les réserves faites plus haut sur l'emploi du coefficient de corrélation en dehors de toute connaissance relative à la nature des distribu-tions statistiques que l'on traite sont évidemment à rappeler ici.

L'obtention d'un coefficient de corrélation différent de l'unité pour exprimer la validité d'une épreuve peut être interprétée de trois façons :

  1. a)            Le test mesure en réalité une activité mentale un peu différente de celle qu'il est sensé devoir mesurer.
  2. b)           Le test mesure une fonction mentale identique, mais il est dépourvu de justesse (au sens métrologique habituel).
  3. c)            Le test mesure une fonction mentale identique, et, de plus, il est juste, mais il n'est pas fidèle (écarts dus à la variation des sujets dans l'obtention des deux classements comparés).

Dans le cas général, les trois causes de désaccord jouent à la fois.

On voit combien la validité est une notion complexe et combien l'interpré¬tation de son évaluation appelle des réserves légitimes.

  • 25. — L'emploi de tests associés en batterie, fondamental dans la méthode analytique, pose également des problèmes statistiques d'ordre particulier lorsqu'il s'agit d'associer les résultats des divers tests de la batterie.

Jusqu'à présent, l'association des résultats d'une batterie pour un individu donné s'est toujours faite presque exclusivement par une méthode graphique connue sous le nom de méthode des « profils psychologiques » imaginée par Rossolimo en 1909.

Cette méthode, sur laquelle il est inutile d'insister ici, ne permet cependant pas de caractériser un individu donné par une valeur numérique unique repré¬sentant sa réussite dans l'ensemble des tests.

Pour résoudre ce dernier problème, qui est le vieux problème des caracté-ristiques statistiques, on a tenté quelquefois, avec des succès d'ailleurs très variables, d'employer des moyennes pondérées de résultats donnés par un même individu dans les différents tests que l'on assemble en batterie.

L'usage d'un tel mode d'association numérique se heurte à deux ordres de difficultés : un tel emploi est-il légitime, d'une part, et, d'autre part, si on con

vient de l'employer, quelles sont les conditions les meilleures de son usage?

  • 26. — Des arguments psychologiques ont été invoqués contre l'emploi, dans de telles conditions, de moyennes pondérées.

Elles postulent, a-t-on dit, l'additivité de deux fonctions mentales, postulat entièrement arbitraire dans l'état actuel de nos connaissances.

En second lieu, en supposant même que plusieurs mesures mentales puissent être numériquement associées, on ne voit rien qui justifie une association d'un type linéaire.

Enfin, la quasi-unanimité des psychologues s'accorde pour reconnaître que la combinaison de plusieurs opérations mentales ne constitue jamais, à pro  prement parler, une simple juxtaposition, mais fait apparaître quelque chose de nouveau dont la nature psychologique n'est pas contenue dans les éléments composants.


119