
1. La Moyenne
1.1. La définition
1.1.1. C'est une mesure statistique qui représente la valeur centrale d'une source de données
1.2. Le terme
1.2.1. C'est un calcul simple en additionnant toutes les valeurs du groupe de chiffre, et en divisant cette somme par le nombre total de valeurs.
1.3. Un exemple
1.3.1. Par exemple : (2 4 6 8). 2 + 4 + 6 + 8 = 20. 20 divisé en 4 = 5.
1.4. Un avantage
1.4.1. La rapidité pour calculer est l'un des plus grands avatages de cette mesure.
1.5. Un désavantage
1.5.1. Par contre, plus il y a de données, plus les erreurs sont communes.
2. La Médiane
2.1. La définition
2.1.1. C'est une mesure de tendance centrale qui représente la valeur au millieu d'une source de données.
2.2. Le terme
2.2.1. Le terme médiane signifie milieu en statistique. C'est la valeur qui sépare les données en deux parties égales.
2.3. Un exemple
2.3.1. Par exemple : 12 15 14 10 18. Tout d'abord nous devons trier les données en ordre croissant : 10 12 14 15 18. Ensuite, nous déterminons le nombre de valeurs. Il y a 5 valeurs (impair). La médiane est la valeur au milieu qui est 14.
2.4. Un avantage
2.4.1. L'avantage de la médiane est qu'elle est moins influencée par des valeurs extrêmes que la moyenne.
2.5. Un désavantage
2.5.1. Elle ne prend pas en compte toutes les valeurs du groupe de données. Par exemple, si les valeurs changent légerèrement, la médiane peut rester la même.
3. Le Mode
3.1. La définition
3.1.1. Le mode représente la valeur la plus fréquente dans un groupe de données.
3.2. Le terme
3.2.1. C'est un indicateur de tendance centrale qui permet de comprendre quelle valeur est la plus courante.
3.3. Un exemple
3.3.1. Par exemple : 3 7 7 2 7 3. Le mode est 7, car c'est la valeur qui se répète le plus souvent.
3.4. Un avantage
3.4.1. Il est particulièrement utile pour les données qualitatives ou catégorielles. Par exemple : les préférences de couleurs.
3.5. Un désavantage
3.5.1. Il peut être peu informatif dans des groupes de données ou les valeurs sont très dispersées ou uniformément réparties.
4. Les mesures de dispersion!
4.1. L'écart type
4.1.1. La définition
4.1.1.1. C'est une mesure de statistique qui quantifie la dispersion ou la variation des valeurs dans un groupe de données.
4.1.2. Le terme
4.1.2.1. Il désigne une mesure qui indique à quel point les valeurs d'un groupe de données s'écartent de la moyenne. Il est souvent noté par la lettre grecque sigma pour une population et par la lettre s pour un échantillon.
4.1.3. Un exemple
4.1.3.1. Par exemple : 1 2 3 4 et 5. Utiliser la fonction STDEVP sur la calculatrice pour trouver 1.414213562.
4.1.4. Un avantage
4.1.4.1. Il fournit une indication claire de la variabilité des données, ce qui permet de comprendre a quel point les valeurs sont éloignées de la moyenne.
4.1.5. Un désavantage
4.1.5.1. Il est sensible au valeurs extrêmes.
5. Les valeurs aberrantes!
5.1. La définition
5.1.1. C'est une donnée qui se situe à une distance significaticement plus grande que les autres valeurs.
5.2. Le terme
5.2.1. Une observation qui se distingue fortement des autres valeurs d'un groupe de données.
5.3. Un exemple
5.3.1. Les résultats d'une classe de mathématique où la plupart des élèves ont des scores compris entre 60 et 80, mais un élève obtient un score de 30. Ce score de 30 serait considéré comme une valeur aberrante.
5.4. Les répercussions d'une valeur aberrante sur l'interprétation de données statistiques.
5.4.1. Influence sur les mesures de tendance centrale : les valeur aberrente peuvent fausser la moyenne.
5.4.2. Impact sur l'écart type : les valeurs aberrantes augmentent l'écart type ce qui peut donner l'impression qu'il y a plus de variabilité dans les données qu'il y en a réellement.
6. Les biais.
6.1. La définition
6.1.1. Un biais est une tendance systématique à favoriser ou à désavantager certaines valeurs ou résultats dans un groupe de données.
6.2. Le terme
6.2.1. Une déviation systématique par rapport a la vérité ou à la réalité dans la collecte, l'analyse ou l'interprétation des données.
6.3. Un exemple
6.3.1. Un sondage sur les préférences alimentaires, réalisé uniquement auprès de personnes qui fréquentent des restaurants végétariens. Cela introduit un biais de sélection, car les résultats ne refléteront pas les préférences de la population, mais seulement celle d'un groupe spécifique qui a une préférence pour les aliments végétariens.
6.4. Les répercussions d'un biais sur les données statistiques.
6.4.1. Distortion des résultats : un biais peut fausser les résultats d'une étude, rendant les conclusions inexactes.
6.4.2. Mauvaise prise de décision : des conclusions biaisées peuvent conduire à des décisions érronées, que ce soit dans le domaine des affaires de la santé, ou des politiques publiques.
7. Les mesures de position!
7.1. Les centiles
7.1.1. La définition
7.1.1.1. Les centiles sont des mesures statistiques qui divisent un groupe de données en 100 parts égales.
7.1.2. Le terme
7.1.2.1. Une valeur qui divise une ditribution de données en 100 parties égales. Par exemple, si une valeur est au 90ème centile, cela signifie qu'elle est supérieure à 90% des données.
7.1.3. Un exemple
7.1.3.1. Si un élève obtient un score au 75ème centile, cela signifie que ce score est suppérieur a celui de 75% des autres élèves ayant passé le même test.
7.1.4. Un avantage
7.1.4.1. Ils permettent de mieux comprendre la distribution des données en fournissant des informations sur la positions relatives d'une valeur au sein d'un groupe de données.
7.1.5. Un désavantage
7.1.5.1. Ils peuvent être influencés par des valeurs extrêmes ou aberrantes, ce qui peut fausser la représentation de la distribution des données.
8. Les mesures de position!
8.1. Les quartiles
8.1.1. La définition
8.1.1.1. Un quartile est une mesure de position qui divise un groupe de données en quatre parties égales. Il existe trois quartiles : Q1. Le premier quartile : Il représente la valeurs en dessous de laquelle 25% des données se situent. Q2. Le deuxième quartile : C'est la médiane qui divise les données en 2 parties égales. (50%). Q3. Le troisième quartile : Il représente la valeur en dessous de laquelle 75% des données se situent.
8.1.2. Le terme
8.1.2.1. Ils sont utilisés pour comprendre la distribution des données.
8.1.3. Un exemple
8.1.3.1. 2 4 6 8 10 12 14 16 18. Q1 se retrouve a la position 25%. Q1 se situe entre la 2ème et la 3ème valeur. Donc le premier quartile est a 4.5. Pour Q2 qui est la médiane, donc la moitier : Q2 se situe entre la 4ème et la 5ème valeur. Alors 9. etc pour Q3.
8.1.4. Un avantage
8.1.4.1. Ils permetent de diviser un groupe de données en quatre parties égales, ce qui facilite la compréhension de la distribution des données.
8.1.5. Un désavantage
8.1.5.1. Ils ne prennent pas en compte toutes les valeurs individuelles du groupe de données.
9. Les mesures de dispersion!
9.1. L'étendue
9.1.1. La définition
9.1.1.1. C'est la différence entre la valeur maximale et la valeur minimale d'un groupe de données.
9.1.2. Le terme
9.1.2.1. Il se réfère a la plage de valeurs dans un groupe de données. C'est calculé en soustrayant la valeur minimale de la valeur maximale.
9.1.3. Un exemple
9.1.3.1. Par exemple : 5 10 15 20. 5 - 20 = 15. L'étendue serait 15.
9.1.4. Un avantage
9.1.4.1. Elle est facile a calculer et a comprendre
9.1.5. Un désavantage
9.1.5.1. Elle ne prend en compte que les valeurs extrêmes (la plus grande et la plus petite) et ignore toutes les autres données.