Die Standardabweichung ist das in der Statistik am häufigsten verwendete Maß für die Streuung. Es zeigt Ihnen, wie weit ein typischer Wert vom Mittelwert entfernt ist – unabhängig davon, ob Ihre Daten eng gebündelt oder weit verstreut sind. Sobald Sie die Berechnung einmal von Hand durchgearbeitet haben, wird das Konzept intuitiv.
Was Ihnen die Standardabweichung sagt
Wenn eine Klasse von Schülern ein durchschnittliches Prüfungsergebnis von 70 mit einer Standardabweichung von 5 hat, liegen die meisten Ergebnisse zwischen 65 und 75. Wenn die Standardabweichung 20 wäre, würden die Ergebnisse viel weiter schwanken – von 50 bis 90 und mehr.
Eine kleine Standardabweichung bedeutet Konsistenz. Ein großes bedeutet Variabilität.
Population vs. Stichprobenstandardabweichung
Es gibt zwei Versionen, und es kommt darauf an, die richtige auszuwählen:
Populationsstandardabweichung (σ): Verwenden Sie diese Option, wenn Sie Daten für jedes Mitglied der Gruppe haben, die Ihnen wichtig ist. Dividiert durch n.
Stichprobenstandardabweichung(en): Verwenden Sie diese Option, wenn es sich bei Ihren Daten um eine Stichprobe aus einer größeren Grundgesamtheit handelt. Dividiert durch n − 1 (Bessel-Korrektur, die die durch die Stichprobe eingeführte Unsicherheit berücksichtigt).
In der Praxis verwenden Sie fast immer die Stichprobenstandardabweichung – es sei denn, Sie analysieren eine vollständige Volkszählung oder einen kontrollierten Datensatz ohne fehlende Elemente.
Schritt-für-Schritt-Berechnung
Datensatz: 4, 7, 13, 2, 1 (eine Stichprobe von 5 Werten)
Schritt 1: Berechnen Sie den Mittelwert
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Schritt 2: Finden Sie jede Abweichung vom Mittelwert
Subtrahieren Sie den Mittelwert von jedem Wert:
| Wert (x) | Abweichung (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Schritt 3: Quadrieren Sie jede Abweichung
Durch die Quadrierung werden negative Vorzeichen eliminiert und größere Abweichungen hervorgehoben:
| Abweichung | Quadratische Abweichung |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3,4 | 11.56 |
| −4,4 | 19.36 |
Schritt 4: Summieren Sie die quadrierten Abweichungen
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Schritt 5: Division durch n − 1 (für Stichprobenstandardabweichung)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Schritt 6: Ziehen Sie die Quadratwurzel
Standard deviation (s) = √23.3 = 4.83
Interpretation: Die Werte in diesem Datensatz liegen typischerweise etwa 4,83 Einheiten vom Mittelwert von 5,4 entfernt.
Die Formel ausgeschrieben
Standardabweichung der Stichprobe:
s = √[ Σ(x − x̄)² / (n − 1) ]
Populationsstandardabweichung:
σ = √[ Σ(x − μ)² / n ]
Wobei μ (mu) der Bevölkerungsmittelwert ist.
Die empirische Regel (68-95-99,7-Regel)
Bei Daten, die einer Normalverteilung folgen, besteht eine zuverlässige Beziehung zwischen der Standardabweichung und dem Anteil der Daten innerhalb jedes Bereichs:
| Reichweite | Anteil der Daten |
|---|---|
| Mittelwert ± 1 SD | ~68 % |
| Mittelwert ± 2 SD | ~95 % |
| Mittelwert ± 3 SD | ~99,7 % |
Angewandtes Beispiel: IQ-Werte haben einen Mittelwert von 100 und eine Standardabweichung von 15.
- 68 % der Menschen erreichen einen Wert zwischen 85 und 115
- 95 % Punktzahl zwischen 70 und 130
- 99,7 % Punktzahl zwischen 55 und 145
Diese Regel gilt nur für normalverteilte Daten. Für schiefe oder stark ausgeprägte Verteilungen verwenden Sie stattdessen die Tschebyscheff-Ungleichung.
Varianz vs. Standardabweichung
Varianz ist die quadratische Abweichung (Schritt 5 oben) – Standardabweichung ist ihre Quadratwurzel. Beide messen die Streuung, die Standardabweichung wird jedoch in denselben Einheiten wie die Originaldaten ausgedrückt, wodurch sie besser interpretierbar ist.
Wenn Ihre Daten in Kilogramm vorliegen, ist Ihre Standardabweichung in Kilogramm. Ihre Varianz wird in Kilogramm zum Quadrat angegeben, was schwieriger sinnvoll zu interpretieren ist.
Häufige Anwendungen
Finanzen: Messung der Investitionsvolatilität. Eine Aktie mit täglichen Renditen und einer hohen SD ist volatiler – höhere potenzielle Gewinne und höhere potenzielle Verluste.
Qualitätskontrolle: Die Fertigung nutzt SD, um sicherzustellen, dass die Produkte innerhalb der Toleranz bleiben. Ein Prozess mit zu großem SD erzeugt zu viele fehlerhafte Artikel.
Bildung: Standardisierung von Testergebnissen. Ein Z-Score gibt an, um wie viele Standardabweichungen ein Score über oder unter dem Mittelwert liegt: z = (x − Mittelwert) / SD.
Wissenschaft: Messunsicherheit ausdrücken und experimentelle Ergebnisse vergleichen.
Verknüpfung zur Berechnung
Verwenden Sie für große Datensätze die Berechnungsformel, die die individuelle Berechnung von Abweichungen vermeidet:
s² = [Σx² − (Σx)²/n] / (n − 1)
Dies ist mathematisch äquivalent, erfordert jedoch nur zwei statt drei Durchgänge durch die Daten.
Verwenden Sie unseren Standardabweichungsrechner, um SD, Varianz und eine vollständige Aufschlüsselung für jeden von Ihnen eingegebenen Datensatz zu berechnen.