De standaardafwijking geeft aan hoe verspreid de gegevens rond het gemiddelde liggen. Een kleine standaardafwijking betekent dat dataclusters strak zijn; een grote betekent dat het wijd verspreid is.
Waarom standaardafwijking belangrijk is
Twee klassen scoren beide gemiddeld 75% op een toets. Maar in klasse A variëren de scores van 70-80%. In klasse B variëren de scores van 40–100%. Het gemiddelde verbergt belangrijke informatie; de standaardafwijking onthult deze.
De formule
Voor een populatie (alle gegevens):
σ = √[ Σ(x - μ)² / N ]
Voor een voorbeeld (subset van gegevens):
s = √[ Σ(x - x̄)² / (n-1) ]
Waar:
- σ (sigma) = standaarddeviatie van de populatie
- s = standaarddeviatie van de steekproef
- x = elke waarde
- μ of x̄ = gemiddelde
- N = populatiegrootte, n = steekproefomvang
De voorbeeldformule wordt gedeeld door n-1 (niet n) om te corrigeren voor vertekening bij het schatten op basis van een subset.
Stapsgewijs voorbeeld
Gegevens: 4, 7, 13, 2, 9 (steekproef van 5 waarden)
Stap 1: Bereken het gemiddelde:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
Stap 2: Trek het gemiddelde af van elke waarde en vierkant:
| X | x - bedoel | (x - gemiddelde)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
Stap 3: Tel de gekwadrateerde verschillen op: 9 + 0 + 36 + 25 + 4 = 74
Stap 4: Delen door n-1 = 4: 74/4 = 18,5
Stap 5: Neem de wortel: √18,5 ≈ 4,30
Standaardafwijking = 4,30
De 68-95-99.7-regel
Voor normaal verdeelde gegevens:
- 68% van de waarden valt binnen ±1 standaardafwijking van het gemiddelde
- 95% valt binnen ±2 standaardafwijkingen
- 99,7% valt binnen ±3 standaardafwijkingen
Voorbeeld: Hoogtes met gemiddeld 170 cm, SD 10 cm:
- 68% is tussen de 160 en 180 cm
- 95% is tussen de 150 en 190 cm
Toepassingen in de echte wereld
- Financiën: meet de volatiliteit van beleggingen (risico)
- Productie: Kwaliteitscontrole — producten buiten ±3σ zijn defecten
- Geneeskunde: abnormale testresultaten identificeren
- Onderwijs: Beoordeling volgens een curve
Gebruik onze Standard Deviation Calculator om het gemiddelde, de mediaan, de variantie en de standaarddeviatie voor elke dataset te berekenen.