Calculatrice de variance et d'écart type
Calculez la variance et l'écart type d'une série de données. Basculez entre les formules échantillon (n−1) et population (n) avec la correction de Bessel.
Données
Résultats
Définitions
La variance est une mesure de la dispersion d'un ensemble de données autour de sa moyenne : elle calcule la moyenne des carrés des écarts entre chaque valeur et la moyenne arithmétique. L'écart type est la racine carrée de la variance ; il s'exprime dans la même unité que les données et constitue la mesure de dispersion la plus couramment utilisée en statistiques.
Deux versions de ces mesures coexistent : la version population (diviseur n), applicable quand les données couvrent l'intégralité du groupe étudié, et la version échantillon (diviseur n−1), applicable quand les données constituent un sous-ensemble d'une population plus large. Le choix entre les deux formules est discuté dans la section dédiée ci-dessous.
Formules
Moyenne
Somme des carrés des écarts
SC quantifie la dispersion totale des données autour de la moyenne. C'est le numérateur commun aux deux formules de variance.
Variance et écart type de population
Variance et écart type d'échantillon
Exemple pas-à-pas : 4, 8, 15, 16, 23, 42
Saisissez une liste de nombres séparés par des virgules et choisissez le mode Échantillon ou Population. La calculatrice affiche l'effectif (n), la moyenne (x̄), la somme des carrés des écarts (SC), la variance et l'écart type. Les données par défaut — 4, 8, 15, 16, 23, 42 — correspondent à l'exemple ci-dessous.
Étape 1 — Calculer la moyenne.
Étape 2 — Calculer les carrés des écarts.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SC | 910 |
Étape 3a — Statistiques d'échantillon (n = 6).
Étape 3b — Statistiques de population (n = 6).
La correction de Bessel (diviseur n−1)
Lorsque la variance est calculée à partir d'un échantillon, la moyenne x̄ est elle-même estimée à partir des mêmes données. Les valeurs de l'échantillon tendent donc à se regrouper plus près de x̄ que de la vraie moyenne de la population μ. En conséquence, diviser par n sous-estime la dispersion réelle de la population.
La correction de Bessel consiste à remplacer n par n−1 : en moyenne, sur tous les échantillons possibles, s² est un estimateur non biaisé de σ². Le degré de liberté « perdu » reflète le fait que, connaissant x̄ et les n−1 premières valeurs, la dernière valeur est entièrement déterminée et n'apporte aucune information supplémentaire sur la dispersion.
Un exemple concret : en simulant des milliers d'échantillons de taille 2 issus d'une population de variance σ² = 100, la moyenne des estimateurs SC/n gravite autour de 50, tandis que la moyenne des estimateurs SC/(n−1) converge vers 100. La correction devient négligeable pour des grands effectifs (n−1 ≈ n), mais peut être significative pour de petits échantillons, comme ceux des études pilotes ou des contrôles de fabrication.
Population ou échantillon
| Situation | Formule à utiliser |
|---|---|
| Données couvrant toute la population | Population (÷ n) |
| Données constituant un sous-ensemble | Échantillon (÷ n−1) |
| Effectif très grand (plusieurs milliers) | Indifférent — les formules convergent |
Exemples population : les notes d'un élève sur l'ensemble des devoirs d'un trimestre ; les temps au tour d'un pilote de karting sur l'ensemble d'une journée de roulage.
Exemples échantillon : la taille de 50 adultes tirés au sort pour estimer la dispersion dans la population française ; les mesures de résistance sur 20 pièces prélevées dans un lot de fabrication de 5 000.
En l'absence d'information sur le périmètre des données, la variance d'échantillon (÷ n−1) est l'option statistiquement prudente, car elle prend en compte l'incertitude liée à l'observation partielle de la population.
Interprétation de l'écart type
L'écart type (σ ou s) s'exprime dans la même unité que les données, ce qui le rend directement interprétable. Si des résultats à un test de mathématiques ont un écart type de 6 points, la plupart des élèves se situent à moins de 6 points de la moyenne.
Pour une distribution normale, les proportions suivantes s'appliquent :
| Intervalle | Proportion approximative des valeurs |
|---|---|
| μ ± 1σ | 68 % |
| μ ± 2σ | 95 % |
| μ ± 3σ | 99,7 % |
Ces proportions restent une bonne première approximation même pour des distributions non normales. Une valeur à plus de 2σ de la moyenne peut indiquer une valeur aberrante ou un phénomène exceptionnel.
Unité de la variance
La variance est exprimée dans le carré de l'unité des données d'origine. Des tailles en centimètres donnent une variance en cm² ; des revenus en euros donnent une variance en euros². Cette unité au carré rend la variance difficile à interpréter directement — une variance de 2 500 cm² est peu parlante.
L'écart type corrige ce problème en prenant la racine carrée, ce qui ramène la mesure dans l'unité d'origine. Dans les rapports statistiques — météorologie, rendements financiers, contrôle qualité — on communique généralement l'écart type plutôt que la variance. La variance reste néanmoins indispensable comme étape intermédiaire dans de nombreux calculs statistiques.
Questions fréquentes (FAQ)
Quand utiliser la variance d'échantillon plutôt que la variance de population ?
Utilisez la variance d'échantillon (diviseur n−1) quand vos données constituent un sous-ensemble d'un groupe plus large et que vous souhaitez estimer la variance de ce groupe. Par exemple, si vous mesurez la taille de 30 élèves dans un lycée de 500, optez pour la variance d'échantillon.
Utilisez la variance de population (diviseur n) uniquement si vos données couvrent l'intégralité du groupe — par exemple, les notes des cinq joueurs d'une équipe de basket sur l'ensemble de la saison.
Pourquoi diviser par n−1 et non par n pour la variance d'échantillon ?
Diviser par n sous-estime systématiquement la variance réelle de la population, car les valeurs d'un échantillon tendent à se regrouper plus près de la moyenne de l'échantillon que de la vraie moyenne de la population.
La correction de Bessel (division par n−1) compense ce biais : en moyenne, sur tous les échantillons possibles, s² est un estimateur non biaisé de σ². Le degré de liberté « perdu » traduit le fait qu'une fois la moyenne x̄ calculée, la dernière valeur de l'échantillon ne porte aucune information supplémentaire sur la dispersion.
Quelle est l'unité de la variance ?
La variance est exprimée dans le carré de l'unité des données d'origine. Si vos données sont en mètres, la variance est en m² ; si elles sont en euros, elle est en euros².
C'est pourquoi l'écart type — racine carrée de la variance — est plus facile à interpréter : il s'exprime dans la même unité que les données. Par exemple, si des notes ont un écart type de 4 points, on peut directement dire que « la plupart des notes sont à moins de 4 points de la moyenne ».
Quel est le lien entre l'écart type et la cote Z (score Z) ?
La cote Z mesure de combien d'écarts types une valeur s'éloigne de la moyenne : z = (x − μ) / σ. L'écart type est l'unité de mesure de cet écart. Une cote Z de 1 signifie que la valeur est exactement un écart type au-dessus de la moyenne ; une cote Z de −2 signifie qu'elle est deux écarts types en dessous. Dans une distribution normale, environ 68 % des valeurs se trouvent à moins d'un écart type de la moyenne, et environ 95 % à moins de deux.
Recommandations
Calculateur de statistiques descriptives
Calculez la moyenne, l'écart-type, la variance, l'étendue, le minimum et le maximum pour 8 valeurs. Affiche les statistiques de population et d'échantillon.