Hoe u de standaarddeviatie kunt berekenen - stap voor stap

Standaarddeviatie is de meest gebruikte maatstaf voor spreiding in statistieken. Het vertelt u hoe ver een typische waarde van het gemiddelde ligt, of uw gegevens strak geclusterd of wijd verspreid zijn. Zodra je de berekening één keer met de hand hebt doorlopen, wordt het concept intuïtief.

Wat standaarddeviatie u vertelt

Als een klas studenten een gemiddelde examenscore van 70 heeft met een standaarddeviatie van 5, liggen de meeste scores tussen 65 en 75. Als de standaarddeviatie 20 zou zijn, zouden de scores veel breder variëren – van 50 tot 90 en hoger.

Een kleine standaardafwijking betekent consistentie. Een grote betekent variabiliteit.

Populatie versus steekproefstandaarddeviatie

Er zijn twee versies, en het kiezen van de juiste is belangrijk:

Standaardafwijking van de populatie (σ): Gebruik deze optie als u gegevens heeft voor elk lid van de groep waar u om geeft. Deelt door n.

Standaardafwijking(en) van de steekproef: Gebruik deze optie als uw gegevens een steekproef zijn uit een grotere populatie. Deelt door n − 1 (Bessels correctie, die rekening houdt met de onzekerheid die door de steekproeven wordt geïntroduceerd).

In de praktijk gebruikt u bijna altijd de standaarddeviatie van de steekproef, tenzij u een volledige volkstelling of een gecontroleerde dataset analyseert zonder ontbrekende leden.

Stapsgewijze berekening

Dataset: 4, 7, 13, 2, 1 (een voorbeeld van 5 waarden)

Stap 1: Bereken het gemiddelde

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Stap 2: Zoek elke afwijking van het gemiddelde

Trek het gemiddelde van elke waarde af:

Waarde (x)	Afwijking (x − x̄)
4	4 − 5,4 = −1,4
7	7 − 5,4 = +1,6
13	13 − 5,4 = +7,6
2	2 − 5,4 = −3,4
1	1 − 5,4 = −4,4

Stap 3: Vier elke afwijking

Kwadrateren elimineert negatieve signalen en benadrukt grotere afwijkingen:

Afwijking	Kwadratische afwijking
−1,4	1.96
+1.6	2.56
+7.6	57.76
−3,4	11.56
−4.4	19.36

Stap 4: Tel de gekwadrateerde afwijkingen bij elkaar op

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Stap 5: Delen door n − 1 (voor standaarddeviatie van de steekproef)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Stap 6: Neem de vierkantswortel

Standard deviation (s) = √23.3 = 4.83

Interpretatie: Waarden in deze dataset liggen doorgaans ongeveer 4,83 eenheden verwijderd van het gemiddelde van 5,4.

De formule uitgeschreven

Voorbeeld standaardafwijking:

s = √[ Σ(x − x̄)² / (n − 1) ]

Standaardafwijking populatie:

σ = √[ Σ(x − μ)² / n ]

Waar μ (mu) het populatiegemiddelde is.

De empirische regel (regel 68-95-99.7)

Voor gegevens die een normale verdeling volgen, heeft de standaardafwijking een betrouwbare relatie met het aandeel gegevens binnen elk bereik:

Bereik	Aandeel van gegevens
Gemiddelde ± 1 SD	~68%
Gemiddelde ± 2 SD	~95%
Gemiddelde ± 3 SD	~99,7%

Toegepast voorbeeld: IQ-scores hebben een gemiddelde van 100 en een SD van 15.

68% van de mensen scoort tussen de 85 en 115
95% scoort tussen 70 en 130
99,7% scoort tussen 55 en 145

Deze regel is alleen van toepassing op normaal verdeelde gegevens. Voor scheve of zware verdelingen kunt u in plaats daarvan de ongelijkheid van Chebyshev gebruiken.

Variantie versus standaarddeviatie

Variantie is de kwadratische afwijking (stap 5 hierboven) — standaardafwijking is de vierkantswortel. Beide meten de spreiding, maar de standaardafwijking wordt uitgedrukt in dezelfde eenheden als de originele gegevens, waardoor deze beter interpreteerbaar worden.

Als uw gegevens in kilogrammen zijn, is uw standaarddeviatie in kilogrammen. Uw variantie wordt uitgedrukt in kilogram in het kwadraat, wat moeilijker zinvol te interpreteren is.

Algemene toepassingen

Financiën: Meten van de volatiliteit van beleggingen. Een aandeel met een dagelijks rendement met een hoge SD is volatieler: een hogere potentiële winst en een hoger potentieel verlies.

Kwaliteitscontrole: Bij de productie wordt SD gebruikt om ervoor te zorgen dat producten binnen de toleranties blijven. Een proces waarbij de SD te groot is, levert te veel defecte artikelen op.

Onderwijs: Testscores standaardiseren. Een z-score geeft aan hoeveel standaarddeviaties een score boven of onder het gemiddelde ligt: z = (x − gemiddelde) / SD.

Wetenschap: Meetonzekerheid uitdrukken en experimentele resultaten vergelijken.

Sneltoets voor berekening

Gebruik voor grote datasets de rekenformule waarmee wordt vermeden dat afwijkingen afzonderlijk worden berekend:

s² = [Σx² − (Σx)²/n] / (n − 1)

Dit is wiskundig equivalent, maar vereist slechts twee passages door de gegevens in plaats van drie.

Gebruik onze Standard Deviation Calculator om SD, variantie en een volledige uitsplitsing te berekenen voor elke dataset die u invoert.