Débuter avec le logiciel de statistique SPSS étape par étape guide de formation complet [Eng]
CHAPITRE 2 Codage, entrée et vérification des données
Ce chapitre commence par un très bref aperçu des étapes initiales d'un point de vue de la recherche. Après cette introduction, le chapitre se concentrera sur: 1) mettre vos données à jour pour entrer dans SPSS ou une feuille de calcul, 2) définir et étiqueter des variables, 3) entrer correctement les données et 4) vérifier que la saisie des données a été effectuée Correctement sans erreurs.
Planifiez l'étude, le test pilote et collectez des données
Planifiez l'étude. Comme on l'a vu au chapitre 1, la recherche commence par l'identification d'un problème de recherche et de questions de recherche ou d'hypothèses, il est également nécessaire de planifier la conception de la recherche avant de sélectionner les instruments de collecte de données et de commencer à recueillir des données. La plupart des livres de méthodes de recherche traitent abondamment de cette partie du processus de recherche (par exemple, voir Gliner et Morgan, 2000).
Sélectionnez ou développez l'instrument (sJ. Si un instrument approprié est disponible et qu'il a été utilisé avec une population similaire à la vôtre, il est généralement souhaitable de l'utiliser. Cependant, il est nécessaire de modifier un instrument existant ou de développer votre propre choix Pour ce chapitre, nous avons développé un petit questionnaire à donner aux étudiants à la fin d'un cours. Rappelez-vous que les questionnaires ou les enquêtes ne sont qu'une façon de collecter des données quantitatives. Vous pouvez également utiliser des entretiens structurés, des observations, des tests, des inventaires normalisés, Ou un autre type de méthode de collecte de données. Les méthodes de recherche et les livres de mesure ont un ou plusieurs chapitres consacrés à la sélection et au développement d'instruments de collecte de données. Un livre utile sur l'élaboration de questionnaires est Salant et Dillman (1994).
Test pilote et affiner les instruments. Il est toujours souhaitable d'expérimenter votre instrument et vos instructions avec au moins quelques collègues ou amis. Dans la mesure du possible, vous devriez également effectuer une étude pilote avec un échantillon similaire à celui que vous envisagez d'utiliser plus tard. Ceci est particulièrement important si vous avez développé l'instrument ou qu'il sera utilisé avec une population différente de celle pour laquelle il a été développé et a été utilisé dans le passé.
Les participants pilotes devraient être interrogés sur l'élanité des articles et s'ils croient que les éléments devraient être ajoutés ou supprimés. Ensuite, utilisez les commentaires pour effectuer des modifications dans l'instrument avant de commencer la collecte des données. La validité du contenu peut également être vérifiée en demandant aux experts de juger si vos articles couvrent tous les aspects du domaine que vous avez l'intention de mesurer et si ils sont dans des proportions appropriées par rapport à ce domaine.
Collectez les données. La prochaine étape dans le processus de recherche consiste à collecter les données. Il existe plusieurs façons de recueillir un questionnaire ou des données d'enquête (comme le téléphone, le courrier ou le courrier électronique). Nous allons discuter ici, parce que c'est le but de ce livre. Le livre de Salant et Dillrnan (1994) intitulé «Comment conduire votre propre enquête» fournit des détails considérables sur les différentes méthodes de collecte des données d'enquête.
Vous devriez vérifier vos données brutes, même si vous la collectez même avant d'être entré dans l'ordinateur. Maire assurez-vous que les participants ont marqué leurs notes ou questionnaires de manière appropriée; Vérifiez s'il y a une double réponse à une question (lorsqu'une seule est attendue) ou des réponses marquées entre deux points de notation. Si cela se produit, vous devez avoir une rade (par exemple, "utiliser la moyenne") que vous pouvez appliquer de manière cohérente. Ainsi, vous devriez "nettoyer" vos données, en vous assurant qu'elles sont claires, cohérentes et lisibles, avant de les intégrer dans un fichier de données.
Supposons que les questionnaires remplis montrés à la Fig. 2.1 et 2.2 ont été donnés à un petit clan de 12 étudiants et qu'ils les ont remplis et les ont pris à la fin des clans. Le chercheur a numéroté les formes de I à 12 comme indiqué ID inverse.
...
Données de code pour l'entrée de données
Promenades pour le codage des données
Le codage est le processus d'attribution de nombres aux valeurs ou à la composition de chaque variable. Avant de commencer le processus de codage, nous souhaitons présenter quelques suggestions ou règles générales à garder à l'esprit au fur et à mesure que vous procéderez. Ces suggestions sont adaptées de mies proposées dans le livre utile de Newton et Rudestam (1999) intitulé Four Statistical Consultant. Nous croyons que nos suggestions sont appropriées, mais certains chercheurs pourraient proposer des alternatives, en particulier pour les "raies" 1, 2, 4, 5 et 7
Ces problèmes pourraient vous conduire à fournir un certain nombre de catégories, chacune avec une gamme de valeurs relativement étroite, pour des variables telles que l'âge, le poids et le revenu. N'oubliez jamais ces catégories avant d'entrer les données dans SPSS. Par exemple, si vous avez des catégories d'âge pour les étudiants de niveau universitaire 16-18, 18-20, 21-23, etc., vous vous rendez compte qu'il n'y a que quelques étudiants dans le groupe ci-dessous 18, conservez les codes comme c'est le cas maintenant. Plus tard, vous pouvez créer une nouvelle catégorie de 20 ou moins en utilisant une fonction SPSS, Transform => Recode. Si vous effondrez les catégories avant d'entrer les données, les informations sont terminées.
5_ Pour chaque participant, il doit y avoir un code ou une valeur pour chaque variable. Ces codes doivent être des nombres, à l'exception des variables pour lesquelles les données sont manquantes. Nous rappelons les blancs lorsque des données sont manquantes ou inutilisables, car SPSS est conçu pour traiter les blancs comme valeurs manquantes. Cependant, parfois, vous pouvez avoir plus d'un type de données manquantes, telles que les éléments laissés en blanc et ceux qui avaient une réponse qui n'était pas appropriée ou utilisable. Dans ce cas, vous pouvez attribuer des codes numériques tels que 98 et 99, mais vous devez indiquer à SPSS que ces codes sont pour les valeurs manquantes, ou SPSS les traitera comme des données réelles.
Formulaire de codage
Vous devez maintenant prendre quelques décisions sur la façon de coder les données fournies à la Fig. 2.1 et 2 2, en particulier les données qui ne sont pas déjà sous forme numérique. Lorsque les réponses fournies par les participants sont des nombres, la variable est appelée «auto-codage». Vous pouvez simplement entrer le nurnber qui a été encerclé ou vérifié. En revanche, les variables comme le genre ou l'université n'ont pas de valeur intrinsèque qui leur est associée. Voir la Fig. 2.3 pour les décisions que nous avons prises au sujet de la façon de décrire les variables, de coder les valeurs et de naine, les huit variables. N'oubliez pas de numéroter chacun des questionnaires afin que vous puissiez vérifier les données saisies contre les questionnaires.
...
Problème 2.1: Vérifier les questionnaires remplis
Examinez maintenant la Fig. 2.1 et 2.2 pour les réponses incomplètes, peu claires ou doubles. Arrêtez-vous et faites ceci maintenant, avant de continuer. Quels problèmes avez-vous vus? Le chercheur a besoin de faire des manières de gérer ces problèmes et de les noter sur les questionnaires ou sur un maître "instructions de codage pour que les mêmes contes soient utilisés pour tous les cas.
Nous avons identifié au moins 11 réponses sur 6 des 12 questionnaires qui doivent être clarifiés. Pouvez-vous les trouver tous? Comment les résoudriez-vous? Ecrire sur la Fig. 2.1 et 2.2, comment vous traiteriez chaque problème que vous voyez.
Malte se promène sur la façon de gérer ces problèmes
Pour chaque type de réponse incomplète, vierge, peu claire ou double, vous devez faire une règle pour ce qu'il faut faire. Dans la mesure du possible, vous devriez faire ces défauts avant la collecte des données, mais il se pourrait que vous ayez des problèmes imprévus. Il est important que vous appliquiez les mies régulièrement pour tous les problèmes similaires, de sorte que net pour polariser vos résultats.
Interprétation du problème 2.1 et Fig. 2.4.
Maintenant, nous discuterons de chacun des problèmes et de la manière dont nous décidons de les gérer. Bien sûr, certains choix raisonnables auraient pu être différents des nôtres. Nous pensons que les données pour les participants I - 6 sont assez claires et prêtes à entrer dans SPSS avec l'aide de la Fig. 2.3. Cependant, les questionnaires pour les participants 7 à 12 posent un certain nombre de problèmes de mineur et plus de serions pour la persan d'entrer les données. Nous avons écrit notre décision dans les cases numérotées sur la Fig. 2.4, qui sont les enquêtes et les réponses pour les sujets 7 à 12.
L Pour le participant 7, le GPA semble être écrit comme 250. h semble raisonnable de supposer qu'il avait l'intention d'inclure une décimale après le 2, et nous allons donc entrer 2.50. Nous aurions pu dire que c'était une réponse invalide et l'avoir codé comme manquant. Cependant, les données manquantes créent des problèmes dans l'analyse ultérieure des données, surtout pour les statistiques complexes. Ainsi, nous voulons utiliser autant de données fournies que raisonnable. L'important ici est que vous devez traiter tous les autres problèmes similaires de la même manière.