Standaarddeviatie begrijpen: wat het betekent en hoe u het kunt berekenen

De standaardafwijking geeft aan hoe verspreid de gegevens rond het gemiddelde liggen. Een kleine standaardafwijking betekent dat dataclusters strak zijn; een grote betekent dat het wijd verspreid is.

Waarom standaardafwijking belangrijk is

Twee klassen scoren beide gemiddeld 75% op een toets. Maar in klasse A variëren de scores van 70-80%. In klasse B variëren de scores van 40–100%. Het gemiddelde verbergt belangrijke informatie; de standaardafwijking onthult deze.

De formule

Voor een populatie (alle gegevens):

σ = √[ Σ(x - μ)² / N ]

Voor een voorbeeld (subset van gegevens):

s = √[ Σ(x - x̄)² / (n-1) ]

Waar:

σ (sigma) = standaarddeviatie van de populatie
s = standaarddeviatie van de steekproef
x = elke waarde
μ of x̄ = gemiddelde
N = populatiegrootte, n = steekproefomvang

De voorbeeldformule wordt gedeeld door n-1 (niet n) om te corrigeren voor vertekening bij het schatten op basis van een subset.

Stapsgewijs voorbeeld

Gegevens: 4, 7, 13, 2, 9 (steekproef van 5 waarden)

Stap 1: Bereken het gemiddelde:

Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7

Stap 2: Trek het gemiddelde af van elke waarde en vierkant:

X	x - bedoel	(x - gemiddelde)²
4	-3	9
7	0	0
13	6	36
2	-5	25
9	2	4

Stap 3: Tel de gekwadrateerde verschillen op: 9 + 0 + 36 + 25 + 4 = 74

Stap 4: Delen door n-1 = 4: 74/4 = 18,5

Stap 5: Neem de wortel: √18,5 ≈ 4,30

Standaardafwijking = 4,30

De 68-95-99.7-regel

Voor normaal verdeelde gegevens:

68% van de waarden valt binnen ±1 standaardafwijking van het gemiddelde
95% valt binnen ±2 standaardafwijkingen
99,7% valt binnen ±3 standaardafwijkingen

Voorbeeld: Hoogtes met gemiddeld 170 cm, SD 10 cm:

68% is tussen de 160 en 180 cm
95% is tussen de 150 en 190 cm

Toepassingen in de echte wereld

Financiën: meet de volatiliteit van beleggingen (risico)
Productie: Kwaliteitscontrole — producten buiten ±3σ zijn defecten
Geneeskunde: abnormale testresultaten identificeren
Onderwijs: Beoordeling volgens een curve

Gebruik onze Standard Deviation Calculator om het gemiddelde, de mediaan, de variantie en de standaarddeviatie voor elke dataset te berekenen.