Question 1

Comment calculer la moyenne d'une série statistique ?

Accepted Answer

La moyenne arithmétique se calcule en additionnant toutes les valeurs de la série puis en divisant le résultat par le nombre de valeurs (effectif n). Formule : x̄ = (Σ xᵢ) / n. Exemple : pour la série [2, 4, 6, 8], la somme est 20 et l'effectif est 4, donc la moyenne est 20 / 4 = 5. La moyenne est sensible aux valeurs extrêmes : une seule valeur aberrante peut la déplacer significativement.

Question 2

Quelle différence entre moyenne et médiane ?

Accepted Answer

La moyenne est la somme des valeurs divisée par leur nombre : elle est sensible aux valeurs extrêmes. La médiane est la valeur centrale de la série triée : elle est robuste aux valeurs aberrantes. Pour les distributions asymétriques (revenus, prix immobiliers), la médiane représente mieux la valeur typique que la moyenne. Si moyenne > médiane, quelques valeurs élevées tirent la distribution vers la droite. Si elles sont proches, la distribution est environ symétrique.

Question 3

Comment calculer l'écart-type d'une série ?

Accepted Answer

L'écart-type se calcule en trois étapes : 1) calculer la moyenne x̄ ; 2) calculer la variance = moyenne des carrés des écarts à la moyenne [Σ(xᵢ − x̄)² / n pour une population, / (n−1) pour un échantillon] ; 3) prendre la racine carrée de la variance. L'écart-type est exprimé dans la même unité que les données, ce qui le rend plus interprétable que la variance (exprimée en unité²).

Question 4

Quelle différence entre variance population et variance échantillon ?

Accepted Answer

La variance population divise par n : elle est exacte quand vous disposez de toutes les données du groupe étudié. La variance échantillon divise par n − 1 (correction de Bessel) : elle est utilisée quand vos données ne sont qu'un extrait d'une population plus grande. La correction n − 1 compense le fait que l'échantillon est centré sur sa propre moyenne, ce qui sous-estime légèrement la variabilité réelle de la population. Sur de grands échantillons, la différence est négligeable.

Question 5

Qu'est-ce que le mode en statistiques ?

Accepted Answer

Le mode est la valeur qui apparaît le plus fréquemment dans une série. Une série peut avoir : aucun mode (amodale, si toutes les valeurs sont distinctes), un seul mode (unimodale), ou plusieurs modes (bimodale, multimodale) si plusieurs valeurs partagent la même fréquence maximale. Pour les données qualitatives ou discrètes, le mode est souvent plus pertinent que la moyenne. Pour les données continues, il est rarement utilisé seul.

Question 6

À quoi sert l'intervalle interquartile (IQR) ?

Accepted Answer

L'IQR (Q3 − Q1) mesure la dispersion des 50 % centraux de la distribution, indépendamment des valeurs extrêmes. Il est utilisé pour deux usages principaux : 1) évaluer la dispersion de la distribution centrale de façon robuste (contrairement à l'étendue, une seule valeur aberrante ne le modifie pas) ; 2) détecter les valeurs aberrantes via la règle de Tukey : toute valeur inférieure à Q1 − 1,5 × IQR ou supérieure à Q3 + 1,5 × IQR est considérée aberrante.

Question 7

Comment identifier une valeur aberrante dans une série ?

Accepted Answer

La méthode la plus courante est la règle de Tukey : calculer Q1, Q3 et IQR, puis déterminer les bornes basse (Q1 − 1,5 × IQR) et haute (Q3 + 1,5 × IQR). Toute valeur hors de ces bornes est une valeur aberrante potentielle. Cette méthode ne suppose aucune forme de distribution. Une alternative basée sur l'écart-type (valeur à plus de 2σ ou 3σ de la moyenne) est moins robuste car elle est elle-même influencée par les valeurs aberrantes.

Question 8

Qu'est-ce qu'une série bimodale ?

Accepted Answer

Une série bimodale présente deux valeurs dont la fréquence est égale et maximale. Exemple : [1, 1, 2, 3, 3], les valeurs 1 et 3 apparaissent chacune 2 fois, fréquence maximale. La bimodalité peut indiquer que la série mélange deux sous-populations distinctes (ex. : tailles d'adultes hommes et femmes confondues). Dans ce cas, analyser les sous-groupes séparément est souvent plus pertinent que calculer des statistiques globales.

Question 9

Pourquoi l'écart-type est-il plus utile que la variance ?

Accepted Answer

La variance est exprimée dans l'unité² des données (ex. : kg² pour des masses). L'écart-type est la racine carrée de la variance, donc exprimé dans la même unité que les données (ex. : kg). Cela le rend directement comparable aux valeurs de la série et interprétable sans conversion. En pratique, on dit qu'une valeur se situe « à 2 écarts-types de la moyenne », ce qui a un sens immédiat, alors que dire qu'elle est « à 4 unités² » n'en a aucun.

Calculateur de statistiques descriptives

Ce que le calculateur de statistiques calcule

Les indicateurs statistiques essentiels

Glossaire : les treize indicateurs calculés

Comment calculer les statistiques descriptives d'une série ?

Les formules : moyenne, médiane, variance et écart-type

Exemple : série [2, 4, 4, 4, 5, 5, 7, 9]

Exemple : analyse complète avec mode multiple et échantillon

Comment interpréter moyenne, médiane et écart-type ensemble ?

Population ou échantillon : quelle formule choisir ?

Calculateurs pour approfondir l'analyse statistique

Les erreurs fréquentes dans le calcul des statistiques

Questions fréquentes