Varianz und Standardabweichung berechnen
Varianz und Standardabweichung aus kommaseparierten Messwerten berechnen — wahlweise mit Stichproben- oder Grundgesamtheitsformel.
Eingaben
Ergebnisse
Definition
Die Varianz ist ein Streuungsmaß, das die mittlere quadratische Abweichung aller Messwerte vom arithmetischen Mittel angibt. Die Standardabweichung ist die Quadratwurzel der Varianz und hat dieselbe Einheit wie die Originaldaten; sie ist damit das gebräuchlichste Streuungsmaß in Wissenschaft und Praxis.
Je größer Varianz und Standardabweichung, desto weiter streuen die Werte um ihren Mittelwert. Bei einem Datensatz ohne jede Streuung — alle Werte identisch — sind beide gleich null.
Der Rechner gibt folgende Größen aus:
- Anzahl (n) — Anzahl der eingegebenen Werte
- Mittelwert (x̄) — arithmetisches Mittel
- Quadratsumme (SS) — gemeinsamer Zähler Σ(xᵢ − x̄)²
- Varianz — SS ÷ (n−1) bei Stichprobenformel, SS ÷ n bei Grundgesamtheitsformel
- Standardabweichung — Quadratwurzel der Varianz
Besselsche Korrektur: Warum n−1?
Bei der Berechnung der Stichprobenvarianz wird der Mittelwert x̄ aus denselben Daten geschätzt, die man auch zur Varianzberechnung heranzieht. Die Stichprobenwerte streuen deshalb enger um x̄ als um den unbekannten wahren Mittelwert μ der Grundgesamtheit. Eine Division durch n unterschätzt daher systematisch die tatsächliche Streuung.
Friedrich Wilhelm Bessel erkannte: Ersetzt man n durch n−1, hebt man diese Unterschätzung gerade so weit an, dass der Schätzer erwartungstreu wird — im Mittel über alle denkbaren Stichproben gleicher Größe gilt dann E[s²] = σ². Der fehlende Freiheitsgrad spiegelt wider, dass x̄ aus denselben Daten berechnet wurde und damit eine Unbekannte bindet: Sind x̄ und n−1 Werte bekannt, ist der letzte Wert bereits festgelegt — er liefert keine eigenständige Information über die Streuung.
Ein anschauliches Beispiel: Man zieht tausende Stichproben der Größe 2 aus einer Grundgesamtheit mit σ² = 100. Der Mittelwert aller SS/n-Schätzer liegt um 50, der Mittelwert aller SS/(n−1)-Schätzer liegt nahe 100. Die Korrektur wirkt am stärksten bei kleinem n; für große Stichproben nähern sich n−1 und n an, und die beiden Formeln liefern nahezu identische Ergebnisse.
Formeln
Mittelwert
Quadratsumme der Abweichungen
Die Quadratsumme SS ist die Grundlage beider Varianzformeln. Sie misst die gesamte Streuung der Daten um den Mittelwert.
Populationsvarianz und -standardabweichung
Stichprobenvarianz und -standardabweichung
Rechenbeispiel: 4, 8, 15, 16, 23, 42
Schritt 1 — Mittelwert berechnen.
Schritt 2 — Quadratische Abweichungen bestimmen.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SS | 910 |
Schritt 3a — Stichprobenstatistik (n = 6).
Schritt 3b — Statistik der Grundgesamtheit (n = 6).
Stichprobe oder Grundgesamtheit?
| Situation | Formel |
|---|---|
| Daten umfassen alle Mitglieder der Gruppe | Grundgesamtheit (÷ n) |
| Daten sind eine Teilmenge einer größeren Gruppe | Stichprobe (÷ n−1) |
| Sehr große Stichprobe (mehrere Tausend) | Beide Formeln konvergieren |
Typische Grundgesamtheitsfälle: Die Prüfungsnoten aller fünf Teilnehmenden eines Seminars; die genauen Rundenzeiten eines Rennfahrers in einem bestimmten Rennen.
Typische Stichprobenfälle: Körpergrößen von 50 zufällig ausgewählten Erwachsenen aus einer Stadt mit 500 000 Einwohnern; Gewichtsmessungen an 30 Packungen aus einer Produktionscharge von 10 000 Stück.
Im Zweifelsfall gilt: Stichprobenvarianz verwenden. Sie ist die konservativere Wahl, weil sie die Unsicherheit über die nicht beobachtete Grundgesamtheit eingesteht.
Standardabweichung: Interpretation und Faustregeln
Die Standardabweichung (σ oder s) ist das praktisch nützlichste Streuungsmaß, weil sie dieselbe Einheit wie die Originalwerte hat. Hat eine Messreihe s = 5 kg, lässt sich direkt sagen: „Die meisten Werte liegen etwa 5 kg vom Mittelwert entfernt."
Für eine Normalverteilung gelten die folgenden empirischen Faustregeln:
| Bereich | Enthält ungefähr |
|---|---|
| μ ± 1σ | 68 % der Werte |
| μ ± 2σ | 95 % der Werte |
| μ ± 3σ | 99,7 % der Werte |
Diese Regeln sind für nicht-normalverteilte Daten nur Näherungen, liefern aber eine nützliche erste Einschätzung. Ein Wert, der mehr als 2σ vom Mittelwert abweicht, ist als möglicher Ausreißer zu prüfen.
Varianz: quadratische Einheiten
Die Varianz hat die quadrierte Einheit der Originaldaten. Messwerte in Zentimetern liefern eine Varianz in cm²; Geldbeträge in Euro ergeben eine Varianz in €². Das macht die Varianz für die direkte Anschauung ungeeignet — eine Varianz von 2 500 cm² ist schwer vorstellbar.
Die Standardabweichung behebt dies, indem sie die Quadratwurzel zieht und damit zur Originaleinheit zurückkehrt. Deshalb werden in der Praxis — in der Qualitätssicherung, beim Risikomanagement, in den Naturwissenschaften — fast immer Standardabweichungen berichtet, während die Varianz meist nur als Zwischengröße auftritt.
Häufig gestellte Fragen (FAQ)
Wann nehme ich Stichprobe, wann Grundgesamtheit?
Die Stichprobenvarianz (Division durch n−1) ist die richtige Wahl, wenn die vorliegenden Daten nur einen Ausschnitt einer größeren Gruppe darstellen und man auf die Streuung dieser gesamten Gruppe schließen möchte. Beispiel: Die Körpergrößen von 50 zufällig ausgewählten Studierenden einer Universität mit 20 000 Eingeschriebenen.
Die Populationsvarianz (Division durch n) ist nur dann korrekt, wenn die Daten tatsächlich alle Mitglieder der Gruppe umfassen — etwa die Prüfungsnoten aller fünf Teilnehmenden eines Seminars.
Warum teilt die Stichprobenvarianz durch n−1 statt durch n?
Die Stichprobenwerte streuen um das Stichprobenmittel x̄, nicht um den unbekannten wahren Mittelwert μ der Grundgesamtheit. Dadurch erscheint die Streuung künstlich klein: Die Division durch n liefert im Mittel einen zu niedrigen Wert.
Die Besselsche Korrektur — Division durch n−1 — gleicht diese systematische Unterschätzung aus und macht den Schätzer erwartungstreu. Der „verbrauchte" Freiheitsgrad spiegelt wider, dass x̄ bereits aus denselben Daten geschätzt wurde und damit eine Unbekannte bindet.
In welcher Einheit wird die Varianz angegeben?
Die Varianz hat die quadrierte Einheit der ursprünglichen Daten. Messwerte in Metern ergeben eine Varianz in m²; Messwerte in Euro ergeben eine Varianz in €². Das macht die Varianz als direkte Interpretationsgröße unhandlich — weshalb in der Praxis meistens die Standardabweichung berichtet wird, die durch das Ziehen der Quadratwurzel wieder auf die Originaleinheit zurückführt.
Wie hängen Standardabweichung und z-Werte zusammen?
Ein z-Wert gibt an, um wie viele Standardabweichungen ein Messwert vom Mittelwert abweicht: z = (x − μ) / σ. Die Standardabweichung ist also der Maßstab, mit dem die Abweichung gemessen wird.
Ein z-Wert von 1 bedeutet, der Messwert liegt genau eine Standardabweichung über dem Mittelwert; ein z-Wert von −2 bedeutet zwei Standardabweichungen darunter. Bei einer Normalverteilung fallen rund 68 % aller Werte in den Bereich μ ± 1σ und rund 95 % in den Bereich μ ± 2σ.
Weitere Empfehlungen
Deskriptive Statistik Rechner
Berechnet Mittelwert, Varianz, Standardabweichung und Spannweite für bis zu 8 Messwerte — jeweils als Populations- und Stichprobenkennwert.