De standaardafwijking geeft aan hoe verspreid de gegevens rond het gemiddelde liggen. Een kleine standaardafwijking betekent dat dataclusters strak zijn; een grote betekent dat het wijd verspreid is.

Waarom standaardafwijking belangrijk is

Twee klassen scoren beide gemiddeld 75% op een toets. Maar in klasse A variëren de scores van 70-80%. In klasse B variëren de scores van 40–100%. Het gemiddelde verbergt belangrijke informatie; de ​​standaardafwijking onthult deze.

De formule

Voor een populatie (alle gegevens):

σ = √[ Σ(x - μ)² / N ]

Voor een voorbeeld (subset van gegevens):

s = √[ Σ(x - x̄)² / (n-1) ]

Waar:

  • σ (sigma) = standaarddeviatie van de populatie
  • s = standaarddeviatie van de steekproef
  • x = elke waarde
  • μ of x̄ = gemiddelde
  • N = populatiegrootte, n = steekproefomvang

De voorbeeldformule wordt gedeeld door n-1 (niet n) om te corrigeren voor vertekening bij het schatten op basis van een subset.

Stapsgewijs voorbeeld

Gegevens: 4, 7, 13, 2, 9 (steekproef van 5 waarden)

Stap 1: Bereken het gemiddelde:

Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7

Stap 2: Trek het gemiddelde af van elke waarde en vierkant:

X x - bedoel (x - gemiddelde)²
4 -3 9
7 0 0
13 6 36
2 -5 25
9 2 4

Stap 3: Tel de gekwadrateerde verschillen op: 9 + 0 + 36 + 25 + 4 = 74

Stap 4: Delen door n-1 = 4: 74/4 = 18,5

Stap 5: Neem de wortel: √18,5 ≈ 4,30

Standaardafwijking = 4,30

De 68-95-99.7-regel

Voor normaal verdeelde gegevens:

  • 68% van de waarden valt binnen ±1 standaardafwijking van het gemiddelde
  • 95% valt binnen ±2 standaardafwijkingen
  • 99,7% valt binnen ±3 standaardafwijkingen

Voorbeeld: Hoogtes met gemiddeld 170 cm, SD 10 cm:

  • 68% is tussen de 160 en 180 cm
  • 95% is tussen de 150 en 190 cm

Toepassingen in de echte wereld

  • Financiën: meet de volatiliteit van beleggingen (risico)
  • Productie: Kwaliteitscontrole — producten buiten ±3σ zijn defecten
  • Geneeskunde: abnormale testresultaten identificeren
  • Onderwijs: Beoordeling volgens een curve

Gebruik onze Standard Deviation Calculator om het gemiddelde, de mediaan, de variantie en de standaarddeviatie voor elke dataset te berekenen.