Document de formation pour apprendre a utiliser le logiciel de statistique SPSS sous windows [Eng]
Document de formation pour apprendre à utiliser le logiciel de statistique SPSS sous windows [Eng]
La nature de SPSS
1.1 MISE EN ROUTE AVEC SPSS POUR WINDOWS
les fenêtres
SPSS for Windows est un paquetage informatique polyvalent qui exécutera un large éventail de procédures statistiques. Lorsque vous utilisez SPSS, vous rencontrerez plusieurs types de fenêtres. La fenêtre avec laquelle vous travaillez à tout moment est appelée fenêtre active. Quatre types de fenêtres sont:
Fenêtre de l'éditeur de données. Cette fenêtre affiche le contenu du fichier de données actuel. Une fenêtre d'éditeur de données vierges s'ouvre automatiquement lorsque vous démarrez SPSS pour Windows; Une seule fenêtre de données peut être ouverte à la fois. Dans cette fenêtre, vous pouvez créer de nouveaux fichiers de données ou modifier ceux existants.
Fenêtre de visualisation de sortie. Cette fenêtre affiche les résultats de toutes les procédures statistiques que vous exécutez, telles que des statistiques descriptives ou des distributions de fréquences. Toutes les tables et graphiques sont également affichés dans cette fenêtre. La fenêtre de la visionneuse s'ouvre automatiquement lorsque vous créez une sortie.
Fenêtre de l'éditeur de diagramme. Dans cette fenêtre, vous pouvez modifier les graphiques et les graphiques. Par exemple, vous pouvez faire pivoter les axes, modifier les couleurs des graphiques, sélectionner différentes polices et faire pivoter les diagrammes de diffusion tridimensionnels.
Fenêtre de l'éditeur de syntaxe. Vous utiliserez cette fenêtre si vous souhaitez utiliser la syntaxe SPSS pour exécuter des commandes au lieu de cliquer sur les menus déroulants. Un avantage sur cette méthode est qu'il vous permet d'effectuer des fonctionnalités spéciales de SPSS qui ne sont pas disponibles dans des boîtes de dialogue. La syntaxe est également un excellent moyen de conserver un registre de vos analyses.
Pour démarrer une session SPSS, sélectionnez SPSS dans le sous-menu des programmes du menu Démarrer de Windows. La figure 1.1 montre à quoi ressemblera l'écran lorsque SPSS pour Windows s'ouvre.
Le menu principal
SPSS for Windows est un programme piloté par menu. La plupart des fonctions sont effectuées en sélectionnant une option dans l'un des menus. Nous désignons ces menus en tant que menus "déroulants" car un menu entier d'options apparaît lorsque l'on est sélectionné. La barre de menu principale est l'endroit où la plupart des fonctions commencent, et se trouve en haut de la fenêtre (voir la figure 1.1). Tout menu peut être activé en cliquant simplement sur l'élément de menu désiré, ou en utilisant la touche de touche Alt (chaque menu utilise la première lettre dans le mot de menu). Par exemple, pour activer le menu du fichier, cliquez sur la souris sur le fichier ou utilisez le clavier avec Alt-F. La barre de menu principale répertorie 10 menus:
Fichier. Ce menu sert à créer de nouveaux fichiers, à ouvrir des fichiers existants, à lire des fichiers qui ont été créés par un autre logiciel (par exemple, des feuilles de calcul ou des bases de données) et des fichiers d'impression.
Modifier. Ce menu sert à modifier ou copier du texte à partir des fenêtres de sortie ou de syntaxe.
Vue. Ce menu vous permet de modifier l'apparence de votre écran. Vous pouvez, par exemple, modifier les polices, personnaliser les barres d'outils et afficher les données en utilisant leurs étiquettes de valeur.
Les données. Utilisez ce menu pour effectuer des modifications temporaires dans les fichiers de données SPSS, tels que fusionner des fichiers, transposer des variables et des cas, et sélectionner des sous-ensembles de cas pour des analyses. Les modifications ne sont pas permanentes, sauf si vous enregistrez explicitement les modifications.
Transformer. Le menu de transformation modifie les variables sélectionnées dans le fichier de données et calcule de nouvelles variables en fonction des valeurs des variables existantes. Les transformations ne sont pas permanentes à moins d'enregistrer explicitement les modifications.
Analyser. Utilisez ce menu pour sélectionner une procédure statistique à effectuer, telles que des statistiques descriptives, des corrélations, une analyse de variance et des tableaux croisés.
Graphiques. Ce menu sert à créer des diagrammes à barres, des diagrammes circulaires, des histogrammes et des diagrammes de scatter. Certaines procédures dans le menu Analyser génèrent également des graphiques.
Figure 1.1 SPSS Data Editor
Services publics. Ce menu sert à modifier les polices, afficher les informations sur le contenu des fichiers de données SPSS ou ouvrir un index des commandes SPSS.
Fenêtre. Utilisez le menu de la fenêtre pour organiser, sélectionner et contrôler les attributs des fenêtres SPSS.
Aidez-moi. Ce menu ouvre une fenêtre d'aide Microsoft contenant des informations sur la façon d'utiliser plusieurs fonctionnalités SPSS.
1.2 GESTION DES DONNÉES ET DES FICHIERS
Saisir et sélectionner des fichiers de données dans SPSS pour Windows est assez simple. Nous allons démontrer comment saisir les données brutes à partir de zéro et comment ouvrir les fichiers de données existants.
Entrer vos propres données
Assistant d'importation de texte comme décrit ci-dessous.) L'éditeur SPSS ressemble à une feuille de calcul ou une grille et s'ouvre automatiquement chaque fois que vous démarrez une session SPSS. L'éditeur permet d'entrer, d'éditer et de visualiser le contenu de votre fichier de données. Si vous ouvrez un fichier de données existant, les données apparaîtront dans l'éditeur et vous pourrez ensuite utiliser l'éditeur pour modifier les données ou ajouter ou supprimer des cas ou des variables. Si vous démarrez à partir de zéro et souhaitez saisir des données, l'éditeur de données sera vide lorsqu'il sera ouvert.
L'éditeur de données est un rectangle défini par des lignes et des colonnes. Chaque cellule représente une intersection en ligne par colonne particulière (par exemple, ligne 1, colonne 3). Tous les fichiers de données dans l'éditeur de données ont un format standard. Chaque rangée de l'éditeur de données représente un cas (par exemple, le sujet n ° 1 ou John Doe). Chaque colonne de l'éditeur de données représente une variable (par exemple, fréquence cardiaque ou sexe). Les cellules de l'éditeur peuvent ne pas être vides. C'est-à-dire, si la variable est numérique et qu'il n'y a pas de valeur valide, la cellule est représentée par une valeur "manquant" et une période apparaît dans la cellule. Si le variable est une variable de chaîne, une cellule vide est considérée comme valide. (Voir la section 1.5 pour plus d'informations sur le traitement des valeurs manquantes.)
Pour commencer à saisir des données dans l'éditeur de données, procédez comme suit:
- Cliquez sur Fichier dans la barre de menus.
- Cliquez sur Nouveau puis sur Données dans le menu déroulant du fichier.
- Cliquez sur la cellule dans laquelle vous souhaitez entrer des données (ou utilisez les touches fléchées pour mettre en surbrillance la cellule). Commencez à la partie supérieure de la cellule gauche du rectangle. Il s'agit de la ligne 1, colonne 1. Une fois que vous avez cliqué sur cette cellule, une bordure sombre apparaîtra autour de la cellule; Cela vous indique que c'est la cellule que vous avez sélectionnée.
- Tapez la valeur que vous souhaitez apparaître dans cette cellule, puis appuyez sur Entrée. Vous devriez remarquer que la valeur que vous tapez apparaîtra en haut de la fenêtre de l'éditeur de données et dans la cellule. Notez que saisir une valeur dans cette première colonne et appuyer sur Entrée crée automatiquement une variable avec le nom par défaut VAR00001, qui apparaît en haut de la colonne. Plus tard, nous montrerons comment spécifier les noms originaux et les formats alternatifs pour les variables. Par exemple, supposons que vous enregistrez des âges pour 25 personnes. Si l'âge de la première personne est de 18 ans, entre 18 dans la première cellule.
- Tapez une autre valeur pour le second cas. Cette cellule est directement au-dessous de la cellule précédente. Cet emplacement est la ligne 2, colonne 1. Encore une fois, vous verrez la valeur en haut de l'éditeur de données et dans la cellule. Supposons que l'âge de la deuxième personne ait eu 22 ans, entrez 22 dans la colonne 2, colonne 1.
- Répétez ce processus jusqu'à ce que vous avez entré toutes les données que vous souhaitez pour coline 1 (valeurs pour tous les cas sur la variable 1).
- Lorsque vous êtes prêt à ajouter une autre variable, cliquez sur la première cellule dans la colonne suivante (ligne 1, colonne 2). Supposons que la "taille de la chaussure" soit la prochaine variable, et la première personne a la taille 7. Entrez cette valeur et appuyez sur Entrée. Cela créera automatiquement une nouvelle variable et l'appellera VAR00002.
- Répétez cette procédure pour toutes les valeurs de la colonne 2.
- Continuez cette procédure jusqu'à ce que vous ayez saisi des valeurs pour tous les cas et toutes les variantes que vous souhaitez pour votre fichier de données.
Une fois que vous avez entré des données dans l'éditeur de données, vous pouvez modifier ou supprimer des val-ues. Pour modifier ou supprimer une valeur dans une cellule, il suffit de cliquer sur la cellule que vous souhaitez modifier. Vous remarquerez qu'une bordure sombre apparaît autour de la cellule sélectionnée et que la valeur dans la cellule apparaît en haut de l'éditeur de données. Si vous modifiez la valeur, tapez simplement la nouvelle valeur et appuyez sur Entrée. Vous devriez voir la nouvelle valeur remplacer l'ancienne valeur dans la cellule.
Ajout de cas et de variables
Pour insérer un nouveau cas (ligne) entre les cas qui existent déjà dans votre fichier de données:
- Pointez la flèche de la souris et cliquez sur le numéro de la ligne en dessous de la ligne où vous souhaitez entrer le nouveau cas. La ligne doit être mise en surbrillance en noir.
- Cliquez sur Données dans la barre de menu.
- Cliquez sur Insérer des cas dans le menu déroulant.
Une nouvelle ligne est maintenant insérée et vous pouvez commencer à saisir des données dans les cellules. Notez qu'avant d'entrer vos valeurs, toutes les cellules ont des valeurs manquantes (représentées par une période).
Pour insérer une nouvelle variable (colonne) entre les variables existantes:
- Cliquez sur le nom de la variable de la colonne qui se trouve à droite de la position où vous souhaitez entrer une nouvelle variable. La colonne doit être mise en surbrillance en noir.
- Cliquez sur Données dans la barre de menu.
- Cliquez sur Insérer une variable dans le menu déroulant.
Une nouvelle variable (colonne) est maintenant insérée et vous pouvez commencer à saisir des données dans les cellules.
Suppression de cas et de variables
Pour supprimer un cas:
- Cliquez sur le numéro de dossier que vous souhaitez supprimer.
- Cliquez sur Modifier dans la barre de menus.
- Cliquez sur Effacer.
Le cas sélectionné sera supprimé et les lignes ci-dessous se déplacent vers le haut. Pour supprimer une variable:
- Cliquez sur le nom de la variable que vous souhaitez supprimer.
- Cliquez sur Modifier dans la barre de menus.
- Cliquez sur Effacer.
La variable sélectionnée sera supprimée et toutes les variables à droite de la variable supprimée passeront à gauche. La suppression de variables peut également être effectuée en utilisant la syntaxe SPSS (voir la section 1.6) avec les sous-commandes Drop et Keep.
Définition des variables
Par défaut, SPSS attribue les noms et les formats de variables à toutes les variables du fichier de données SPSS. Par défaut, les variables sont appelées VAR ##### (préfixe VAR suivi de cinq chiffres) et toutes les valeurs sont valides (les champs sont attribués à la valeur système de valeurs). La plupart du temps, cependant, vous voudrez personnaliser votre fichier de données. Par exemple, vous voudrez peut-être donner à vos variables des noms plus significatifs, fournir des étiquettes pour des valeurs spécifiques, modifier les formats de variables, et définir des valeurs spécifiques pour être considérées comme «manquantes». Pour effectuer tout ou partie de ces éléments:
- Tout d'abord, assurez-vous que votre fenêtre de fichier de données est la fenêtre active et cliquez sur le nom de la variable que vous souhaitez modifier.
- Cliquez sur l'onglet Affichage de la variable ou double-cliquez sur le nom de la variable dans l'éditeur de données.
- Tapez le nom de la variable dans la colonne Nom. Les noms de variables doivent être uniques, commencer par une lettre et ne pas contenir des espaces vides.
- Si vous souhaitez modifier le type ou le format d'une variable, cliquez sur le bouton dans la cellule Type pour ouvrir la boîte de dialogue Type de variable. Par défaut, toutes les variables sont numériques, mais vous pouvez travailler avec d'autres types tels que des noms, des dates et d'autres données non numériques. Supposons que vous ayez une variable contenant des lettres (par exemple, les noms d'étudiants). C'est ce qu'on appelle une variable de chaîne et vous l'indiquez en cliquant sur Chaîne dans la boîte de dialogue Type de variable puis en cliquant sur OK.
- Supposons que vous ayez une variable représentant le coût moyen des courses par personne appartenant au centième le plus proche (p. Ex., 32,24) et que vous souhaitez modifier ce format afin que le coût moyen soit affiché en nombre entier (arrondis au Le dollar le plus proche, par exemple, 32). Pour modifier le format de la variable nu-meric, cliquez dans la zone Largeur. Le numéro de cette zone vous indique le nombre total de colonnes que la variable occupe dans le fichier de données (y compris une colonne pour les décimales, les signes plus ou moins). Par exemple, 8 indique que la variable est de 8 colonnes de largeur. Utilisez les flèches pour ajuster la largeur de la colonne de la variable. Si vous souhaitez modifier le nombre de décimales, cliquez dans la case Decimales. Le numéro dans cette case vous indique combien de nombres apparaissent après la décimale. Par exemple, le nombre 32.24 aurait une "largeur" de 5 et une 2 dans la zone "décimales". Le numéro 32 aurait une largeur de 2 et un 0 dans la case à décimeter. Utilisez les flèches pour ajuster le nombre de décimales.
- Si une de vos variables est catégorique, vous pouvez attribuer des nombres pour représenter les catégories de la variable. Par exemple, le sexe variable comportera 2 catégories: hommes et femmes. Les hommes peuvent avoir la valeur assignée "1" et "2" représente les femelles. Il est utile d'avoir des étiquettes descriptives attribuées aux valeurs de 1 et 2 afin qu'il soit facile de voir quel numéro représente quelle catégorie dans vos fichiers de sortie.
Pour attribuer des étiquettes de valeur à la variable, cliquez sur le bouton dans la cellule Valeurs pour ouvrir la boîte de dialogue des étiquettes de valeur. Tapez le numéro représentant le premier cate-gory (par exemple, 1) dans la zone Valeur. Tapez l'étiquette de valeur correspondante (par exemple, mâle) dans la zone Label de valeur. Cliquez sur le bouton Ajouter. Revenez à la zone Valeur et tapez la valeur suivante (par exemple, 2). Tapez l'étiquette de valeur pour cette valeur dans la zone Étiquette de valeur (par exemple, femme), puis cliquez sur Ajouter. Notez que chaque fois que vous cliquez sur Ajouter, vous verrez la valeur et son «étiquette correspondante apparaît dans la fenêtre située à droite du bouton Ajouter. Lorsque vous avez ajouté toutes les valeurs et les étiquettes, cliquez sur OK.
- S'il existe des valeurs spécifiques que vous souhaitez traiter comme des valeurs manquantes, cliquez sur Ne pas ouvrir la boîte de dialogue Valeurs manquantes. Cliquez sur Discrete Missing Values pour indiquer à SPSS que vous avez des valeurs spécifiques qui sont considérées comme manquantes. Tapez la (les) valeur (s) dans les cases (vous pouvez avoir jusqu'à trois valeurs). Si vous avez plus de trois valeurs manquantes, cliquez sur Plage plus une valeur manquante discrète optionnelle et entrez les limites inférieure et supérieure de la variable discrète. Cliquez sur OK lorsque vous avez entré dans toutes vos valeurs manquantes.
Ouverture des fichiers de données
SPSS pour Windows peut lire différents types de données déjà entrées dans les fichiers électroniques. Le type de fichier que nous utiliserons dans ce manuel est le fichier de données SPSS. Ces fichiers sont facilement identifiables car (par défaut) chaque nom de fichier est suivi d'une extension ".sav". Les fichiers de données SPSS sont uniques car ils contiennent les données réelles ainsi que des informations sur les données telles que les noms de variables, les formats et les emplacements de colonnes. Ces fichiers sont écrits dans un code spécial lue et interprété par le programme SPSS. Si vous essayez de lire ces fichiers de données avec un logiciel autre que SPSS, le fichier ressemblera à des lignes de code secret et n'aura aucun sens pour vous. Cependant, ils ont beaucoup de sens pour SPSS, et c'est pourquoi les lire avec SPSS est si simple. Si vous souhaitez consulter les informations contenues dans un fichier de données SPSS (actuellement ouvert), vous pouvez le faire en cliquant sur Fichier dans la barre de menus, puis sélectionnez Afficher les informations sur les fichiers de données et ensuite Fichier de travail.
SPSS pour Windows peut également lire des données brutes qui se trouvent dans des fichiers texte simples au format ASCII stan-dard. Les fichiers texte sont généralement identifiés par une extension ".dat" ou ".txt". Ce sont des fichiers de données qui contiennent des nombres ordinaires (ou des lettres). Il n'y a pas d'informations supplémentaires contenues dans le fichier, telles que les emplacements des variables, les mats, les étiquettes, les valeurs manquantes, etc. (les fichiers de données SPSS .sav contiennent ces informations supplémentaires). Vous pouvez lire des fichiers texte avec de nombreux logiciels différents, y compris WordPad. SPSS peut lire des fichiers de données textuels formatés comme définis ou délimités par des tabulations.
L'éditeur de données SPSS est conçu pour lire une variété de formats en plus des fichiers de données SPSS et des fichiers texte ASCII. Par exemple, les feuilles de calcul créées avec Lotus 1-2-3 et Excel, les fichiers de base de données créés avec les formats dBASE et SQL et les fichiers de données SYSTAT.
Lecture des fichiers de données SPSS
Nous allons illustrer comment lire un fichier de données SPSS existant. Le lecteur peut suivre en utilisant les données accompagnant ce guide. Pour ouvrir un fichier de données:
- Cliquez sur Fichier dans la barre de menus.
- Cliquez sur Ouvrir dans le menu déroulant du fichier.
- Cliquez sur Données dans le menu déroulant ouvert. Cela ouvre la boîte de dialogue Journal des fichiers ouverts, comme le montre la figure 1.2.
- Choisissez le répertoire correct dans la zone Rechercher dans: en haut de l'écran.
- Pointez la flèche vers le fichier de données que vous souhaitez ouvrir et cliquez dessus. Par défaut, tous les fichiers de données SPSS (* .sav) dans le répertoire actuel seront affichés dans la liste. Si votre fichier de données n'est pas visible dans la zone Nom du fichier, utilisez les flèches gauche et droite pour faire défiler les fichiers jusqu'à ce que vous trouviez le fichier désiré. Notez que tous les fichiers de données SPSS ont l'extension .sav, et cela est désigné dans la fenêtre Type de fichier. Avant d'ouvrir un fichier de données, assurez-vous que le type de fichier est correct. Si vous lisez des fichiers de données SPSS et que la zone de type de fichier ne lit pas "SPSS (* .sav)", vous devez faire défiler les types de fichiers et les sélections. Par exemple, pour ouvrir le fichier appelé "football.sav", mettez en surbrillance le nom de ce fichier en cliquant dessus avec le bouton de la souris.
- Cliquez sur Ouvrir. Vous devriez maintenant voir le contenu du fichier de données affiché dans la fenêtre de l'Éditeur de données. Le fichier de données «football.sav» contient deux variantes, «hauteur» et «poids» pour 56 joueurs de football de Stanford University. Les noms des variables sont affichés en haut de l'éditeur de données; Chaque colonne contient une variable. Les lignes dans le fichier de données sont les cas; Dans ce fichier de données, il y a 56 cas.
...
Résumer les données
Numériquement: mesures
De la tendance centrale
En plus des résumés graphiques (chapitre 2), les principales caractéristiques d'un ensemble de données peuvent être résumées par des indices numériques. Les mesures de tendance centrale ou d'emplacement spécifient le «centre» d'un ensemble de mesures. Ce chapitre décrit les moyens d'utiliser SPSS pour obtenir trois mesures communes de localisation: le mode, la médiane et la moyenne d'un échantillon. Les mesures de tendance centrale peuvent être utilisées pour:
N trouver le collège le plus courant pour un groupe d'étudiants;
N trouver le milieu d'un ensemble de poids corporels ordonnés qui divise l'ensemble en deux;
N calculer la moyenne brute des meilleurs films d'une année donnée;