Cours statistique débutant


Manuel de statistique pour les debutants

Manuel de statistique pour les debutants
                  ecole preparatoire en sciences economiques manuel de statistique pour les debutants commerciales et       des sciences  de gestion de constantine introductio...

Statistique pour debutant formation approfondi

Statistique pour debutant formation approfondi
Ségolen geffray iut carquefou année 2008-2009 la démarche statistique pour debutant formation approfondi distinction proba/stat la théorie des probabilités : permet de modélis...

Cours et exercices complet de statistique debutant

Cours et exercices complet de statistique debutant
Cours et exercices complet de statistique débutant cours et exercices complet de statistique debutant introduction : utilisation des statistiques. la presse, les médias où les...

Les chiffres et les données peuvent être difficiles à comprendre. C'est là que les statistiques interviennent pour les rendre plus faciles à comprendre et à interpréter.

Les utilisations les plus courantes des statistiques consistent à vérifier si un échantillon est représentatif d'une population et à vérifier si deux échantillons proviennent de la même population.

Pour donner un aperçu plus détaillé de ce que sont les statistiques, ce cours sera divisé en plusieurs parties :

Nous commencerons par donner une définition de ce que sont les statistiques pour clarifier la différence entre ‘’les statistiques’’ et ‘’une statistique''.

Ensuite, nous parlerons de l'objectif et du rôle des statistiques, de leurs deux principaux types et nous aborderons également la manière de représenter une variable statistique et ses catégories.

Et finalement, nous nous concentrerons sur l'analyse statistique, ses outils et nous terminerons par les différentes étapes pour réaliser une étude statistique.

Table des matières

C’est quoi les statistiques?

Quelle est la différence entre les statistiques et la statistique ?

Quel est le but des statistiques ?

Quel est le rôle de la statistique ?

Quels sont les deux types de statistique ?

La statistique descriptive

La statistique inférentielle

Quels sont les types de variables statistiques ?

1. Les variables discrètes

2. Les variables continues

Comment présenter une variable statistique?

Diagrammes à barres

Histogramme

Graphique linéaire

Pourquoi faire une analyse statistique ?

Quels sont les outils d'analyse statistique ?

SPSS

SAS

R

Quelles sont les étapes d'une étude statistique ?

1. Conception et mise en œuvre de l'étude.

2. La collecte de données

3. Analyse des données recueillies lors de l'enquête ou de l'expérience.

4. Tirer des conclusions

id 380 01

C’est quoi les statistiques?

Le mot "statistique" vient du mot grec "stata", qui signifie "compter". Les statistiques peuvent être définis comme étant la science de la collecte, de l'analyse, l'interprétation et de la présentation des données obtenues par des enquêtes ou des expériences dans les sciences physiques, biologiques et sociales..

La partie la plus importante des statistiques est qu'elles présentent les données d'une manière qui permet la comparaison et l'interprétation.

La forme la plus répandue de statistiques est la théorie des probabilités, qui sert à analyser la probabilité qu'un événement se produise dans le futur, compte tenu de certaines connaissances sur le passé. Le modèle mathématique de la probabilité est connu sous le nom de distribution binomiale.

Les statistiques peuvent être utilisées pour résumer des informations en les rendant plus faciles à comprendre et à communiquer. Elles peuvent également être utilisées pour prédire les tendances futures sur la base des données passées.

Les statistiques sont utilisées dans de nombreux domaines tels que les soins de santé, les affaires, l'éducation, les sports et la politique. Cette science d’étude des distributions est également utilisée pour décrire les informations qui peuvent être exprimées en chiffres.

Quelle est la différence entre les statistiques et la statistique ?

Comme on vient de le voir dans la section précédente, le terme "statistiques" est utilisé pour désigner le domaine des mathématiques qui traite de la collecte, de l'analyse, de l'interprétation et de la présentation des données. Dans ce contexte, les données désignent les informations numériques ou qualitatives présentes dans un échantillon ou une population.

Dans le contexte de la méthode scientifique, une statistique est une mesure ou un nombre qui est utilisé pour décrire une population ou un échantillon.  Une statistique peut alors désigner une valeur numérique dérivée d'un échantillon, telle que la moyenne, la médiane ou le mode.

Par exemple, le poids moyen d'un groupe de personnes peut être utilisé pour décrire la population ou le poids d'un échantillon de personnes peut être utilisé pour décrire l'échantillon.

Quel est le but des statistiques ?

Les statistiques ont pour but l'étude des données et des méthodes utilisées pour les collecter, les analyser, les interpréter et en tirer des conclusions. Les statistiques peuvent être appliquées à de nombreux domaines tels que la biologie, l'économie, l'ingénierie et la physique. L'objectif des statistiques est de décrire le monde d'une manière plus objective.

Les statistiques sont utilisées par les scientifiques, les chercheurs, les hommes d'affaires et les gestionnaires afin d'acquérir des connaissances sur divers phénomènes. Par exemple, les scientifiques utilisent les statistiques pour répondre à des questions telles que "Quelle est la taille moyenne d'un homme adulte ?".

Les statistiques nous aident également à comprendre comment certains événements se produisent (par exemple, pourquoi certaines personnes sont plus grandes que d'autres) et comment ils affectent d'autres domaines de la vie (comme la taille de nos enfants).

Quel est le rôle de la statistique ?

Les statistiques sont des nombres, des faits et des chiffres compilés et analysés pour mieux comprendre le monde qui nous entoure. Les statistiques utilisent l'analyse des données et les probabilités pour corriger les biais cachés, les idées fausses courantes ou d'autres complications qui peuvent fausser les résultats d'une étude. Avec d'autres domaines scientifiques, les statistiques peuvent être utilisées pour tester ou soutenir des théories et des hypothèses scientifiques, résoudre des problèmes et améliorer la prise de décision.

Pour mieux comprendre le rôle des statistiques dans la science, nous devons d'abord comprendre le rôle du scientifique. Les scientifiques mesurent et analysent le monde pour découvrir ce qu'il est et comment il fonctionne. Ils utilisent ensuite ces informations pour trouver des moyens de mieux le comprendre ou de le manipuler à leurs propres fins.

En général, les statistiques sont utilisées pour répondre à des questions et résoudre des problèmes.  Mais elles aident aussi les gens à prendre des décisions et à améliorer leur vie d'une manière qu'ils n'auraient peut-être pas cru possible.  Les statistiques peuvent aider à prédire l'avenir, à identifier les tendances, à évaluer les politiques et pour aider les entreprises à prendre de meilleures décisions.

Ce sont les modèles statistiques qui nous permettent d'utiliser des données pour prédire ce qui pourrait se passer à l'avenir. Ils permettent d'estimer la probabilité qu'un événement se produise et son coût probable.

La statistique intègre l'utilisation de la théorie des probabilités, des statistiques mathématiques et de l'analyse des données pour construire des modèles et prédire les tendances.

En tant que discipline appliquée, la statistique est utilisée pour aider les entreprises, les organismes sans but lucratif, les organismes gouvernementaux et les particuliers à prendre de meilleures décisions, à résoudre des problèmes et à améliorer les résultats.  Les statistiques constituent le fondement de nombreux domaines scientifiques, notamment la biologie, la géologie, l'informatique et l'ingénierie.

Le rôle des statistiques est alors de nous aider à répondre à des questions importantes dans le monde réel et de nous aider à prendre des décisions intelligentes.

id 380 02

Quels sont les deux types de statistique ?

Il existe quatre grandes branches de la statistique : descriptive, inférentielle, graphique et informatique.

La statistique descriptive

Aussi appelé statistique exploratoire, ce type est utilisé pour résumer des ensembles de données en calculant des propriétés de base telles que la moyenne, la médiane et le mode.

Il s'agit de la première étape du processus statistique.

Elle est utilisée pour répondre aux questions de base d'un ensemble de données, telles que : combien de personnes sont dans l'ensemble de données, quelles sont les valeurs les plus courantes d'une variable dans l'ensemble de données, et ainsi de suite. 

Dans un simple ensemble de données comportant seulement deux observations, les statistiques descriptives peuvent répondre à des questions telles que : combien de personnes sont présentes dans l'ensemble de données et quelles sont les valeurs les plus courantes d'une variable dans l'ensemble de données.

La statistique inférentielle

Ce type est utilisé pour faire des prédictions sur une population à partir d'un échantillon de cette population. Il permet de faire des inférences à partir de données. Afin de faire des inférences, vous devez introduire une variable statistique dans votre modèle.

Celle-ci peut être qualitative ou quantitative, selon le type de variables que vous utilisez. En général, si vous souhaitez comparer deux groupes, il est nécessaire d'utiliser une variable quantitative comme l'âge ou le sexe, car il s'agit de chiffres spécifiques.

En revanche, si vous souhaitez comparer deux sous-groupes au sein d'un groupe plus large (par exemple, les hommes par rapport aux femmes), il est préférable d'utiliser des variables qualitatives telles que "quel est le statut marital" ou "quel niveau scolaire ?".

Quels sont les types de variables statistiques ?

Avant de donner les types de variables statistiques, il convient tout d’abord de définir ce qu’est une variable statistique : il s’agit d’une caractéristique d'une population ou d'un individu qui est mesurée ou observée, et qui peut être utilisée pour tirer des conclusions ou faire des inférences sur cette population ou cet individu.

Les variables statistiques les plus courantes sont les effectifs, les proportions, les moyennes et les variances.

Il existe deux types de variables : les variables discrètes et les variables continues.

1. Les variables discrètes

Les variables discrètes sont celles qui n'ont qu'un nombre fini de valeurs et qui sont classées de la plus petite à la plus grande, comme la couleur des yeux, le groupe sanguin, le sexe, l'état civil, etc. Les valeurs de ces types de variables peuvent être positives ou négatives.

2. Les variables continues

Les variables continues sont des mesures qui peuvent prendre n'importe quelle valeur dans une fourchette, elles ont un nombre infini de valeurs possibles et ne sont pas classées de la plus petite à la plus grande. Par exemple, la taille, le poids, l'âge, etc. Ces types de variables peuvent également être positifs ou négatifs.

Comment présenter une variable statistique?

La première étape de la présentation d'une variable statistique consiste à décider si elle est discrète ou continue. Il existe deux façons de présenter une variable statistique. La première est la plus courante, elle consiste à utiliser un graphique à barres ou un graphique circulaire pour afficher les données.

La deuxième méthode est moins courante mais peut être utile dans les situations où vous souhaitez montrer la relation entre vos variables.

● Diagrammes à barres

Si vous utilisez un graphique en barres, essayez d'en choisir un qui montre autant d'informations que possible sur vos données. Cela signifie que si vous avez plusieurs variables avec des valeurs différentes pour chacune d'entre elles, essayez de les regrouper pour qu'elles soient toutes représentées sur un côté du graphique.

Par exemple, si vous avez quatre types de fruits différents dans votre ensemble de données, au lieu d'avoir quatre barres différentes sur votre graphique, essayez de les regrouper sous une seule catégorie.

● Histogramme

Un histogramme est une représentation graphique d'une variable. Un histogramme est utilisé pour afficher la distribution d'une variable, telle que la distribution des hauteurs des hommes et des femmes, la distribution des scores de QI des personnes ayant obtenu un diplôme universitaire.

Un histogramme est un graphique à barres dans lequel la hauteur des barres est proportionnelle à la fréquence de la variable dans la population. Par exemple, si la taille des hommes est normalement distribuée, un histogramme de la taille des hommes aura une distribution normale.

● Graphique linéaire

Un graphique linéaire est un type de graphique qui présente les données sous la forme d'une ligne ou d'une série de lignes. Les graphiques linéaires sont utilisés pour montrer la relation entre deux ou plusieurs quantités dans le temps, comme la hauteur d'un bâtiment mesurée sur une période donnée.

Ils sont également utilisés pour montrer la relation entre deux ou plusieurs quantités mesurées sur la même échelle, comme le poids d'une personne mesuré en kilogrammes et le poids des vêtements de cette personne mesuré en grammes.

Il s'agit d'un type de graphique utilisé pour illustrer les tendances et les changements dans les données. Les graphiques linéaires sont souvent utilisés pour afficher les données d'une enquête ou d'une expérience. L'axe vertical d'un graphique linéaire montre les valeurs d'une variable.

id 380 03

Pourquoi faire une analyse statistique ?

L'analyse statistique permet d'identifier les modèles et les tendances dans les données. Elle permet de donner un sens aux données et de comprendre ce qui s'y passe.

Par exemple, pour une entreprise qui veut faire une analyse statistique, cette technique peut lui renseigner sur la taille du marché, l'évolution des ventes dans le passé, le potentiel de croissance, les connaissances acquises sur le fonctionnement du marché, etc.

Lorsque nous effectuons une analyse statistique, nous essayons d'apprendre ce que signifient les données en identifiant une relation entre deux variables, et en trouvant des modèles et des tendances dans les données qui pourraient aider à prédire ce qui pourrait se passer à l'avenir.

L'analyse statistique est un moyen d'analyser des données recueillies auprès d'une grande variété de sources afin de tirer des conclusions sur leur qualité et de comparer les résultats pour évaluer les déductions que l'on peut en tirer.

L'analyse statistique est alors une technique qui peut être réalisée à l'aide d'une simple feuille de calcul ou avec des outils plus compliqués comme SPSS ou le langage R.

Quels sont les outils d'analyse statistique ?

Dans cette section, nous allons passer en revue les différents outils d'analyse statistique que nous pouvons utiliser pour extraire des informations à partir des données.

L'analyse statistique peut être effectuée à l'aide de divers outils tels que R, SAS, SPSS, etc.

● SPSS

Pour effectuer une analyse statistique, il est possible d’utiliser SPSS (Statistical Package for the Social Sciences), qui est le logiciel d'analyse de données le plus populaire au monde. Ce logiciel est payant avec possibilité d'essai gratuit.

L'outil SPSS d'analyse des données est un outil puissant, mais souvent, avec un débutant, il peut être difficile à comprendre mais il suffit d’apprendre comment il fonctionne pour le maîtriser

.

Il est utilisé par des chercheurs, des scientifiques, des étudiants, des enseignants, des hommes d'affaires et des gouvernements du monde entier pour prendre des décisions, résoudre des problèmes et répondre à des questions.

● SAS

SAS est le logiciel d'analyse statistique qui aide les hommes d'affaires, les scientifiques, les étudiants et les chercheurs à effectuer leurs analyses statistiques. SAS est l'un des outils d'analyse de données qui a de nombreuses utilisations, notamment l'analyse des données clients, la création de rapports et l'analyse prédictive.

SAS est un puissant système polyvalent d'analyse statistique. Il fournit un environnement intégré pour l'exploration et la gestion des données, ainsi qu'une large gamme d'outils statistiques et graphiques puissants.

● R

R est un langage de programmation qui est utilisé pour les calculs statistiques et la modélisation. Il est particulièrement utile pour analyser des données comportant un grand nombre de variables, ce qui peut être difficile dans d'autres langages.

R permet également de créer facilement des programmes capables d'effectuer des calculs statistiques sophistiqués et de modéliser les relations entre les variables. Cela a suscité un grand intérêt pour R parmi les scientifiques des données et les statisticiens, qui utilisent R pour effectuer des analyses complexes et construire des modèles complexes pour répondre à des questions.

Contrairement à d'autres langages de programmation, R est un langage polyvalent, ce qui signifie qu'il peut être utilisé à des fins très diverses. Il a été utilisé dans des domaines tels que l'économie, la biologie et la médecine, et a été utilisé pour analyser des données dans une grande variété de domaines.

Il y a aussi d’autres outils qui peuvent être utilisés dans une analyse statistique, notamment  :

  • une feuille de calcul conçue à cet effet,
  • un questionnaire basé sur des tests,
  • un progiciel d'analyse de données standard,
  • et un questionnaire basé sur une feuille de calcul.

Quelles sont les étapes d'une étude statistique ?

Avant de détailler les étapes d'une étude statistique, voyons en premier lieu ce que c’est une étude statistique :

Une étude statistique est une collection de données qui ont été analysées statistiquement pour déterminer les relations entre diverses variables.

1. Conception et mise en œuvre de l'étude.

Par exemple, vous pouvez décider de mener une enquête auprès de 500 personnes sur le nombre d'heures qu'elles travaillent chaque semaine et sur leur perception de leur santé. Dans ce cas, vous devrez décider qui doit être interrogé (par exemple, les employés d'une entreprise) et quel type de questions vous voulez leur poser (par exemple, "Combien d'heures travaillez-vous habituellement chaque semaine ?").

2. La collecte de données :

Cette étape consiste à recueillir des données auprès de la population cible. Par exemple, vous pouvez recueillir des informations démographiques (âge, sexe, race) et d'autres informations personnelles (comme le niveau de revenu) auprès des participants à votre projet de recherche. Votre objectif est de disposer de suffisamment d'informations sur chaque participant pour pouvoir analyser les données en toute confiance.

3. Analyse des données recueillies lors de l'enquête ou de l'expérience.

Vous devez analyser vos données afin de pouvoir conclure si votre hypothèse était correcte ou non. Cette analyse peut se faire de plusieurs manières :

  • Vous pouvez comparer chaque groupe avec lui-même pour voir s'il existe une différence entre eux (par exemple, en comparant ceux qui ont travaillé plus de 40 heures par semaine et ceux qui ont travaillé moins de 40 heures par semaine).
  • Vous pouvez comparer chaque groupe avec un autre pour voir dans quelle mesure ils s'accordent (par exemple, en comparant ceux qui ont travaillé 40 heures par semaine avec ceux qui ont travaillé 20 heures par semaine).
  • Vous pouvez utiliser des tests statistiques (tels que le test t de Student) pour voir s'il existe des différences significatives entre deux groupes ou entre deux personnes.

4. Tirer des conclusions :

Après avoir effectué ces analyses sur vos données, vous voudrez tirer des conclusions raisonnables sur leur relation entre elles ou avec d'autres facteurs ou variables.

Somme toute, il est possible de conclure que les statistiques sont utilisées pour répondre à des questions et résoudre des problèmes.  Mais elles aident aussi les gens à prendre des décisions et à améliorer leur vie d'une manière qu'ils n'auraient peut-être pas cru possible.

Les statistiques peuvent aider à prédire l'avenir, à identifier les tendances, à évaluer les politiques et à soutenir la prise de décision.  Elles sont également utilisées pour aider les entreprises à prendre de meilleures décisions.