Standaarddeviatie is de meest gebruikte maatstaf voor spreiding in statistieken. Het vertelt u hoe ver een typische waarde van het gemiddelde ligt, of uw gegevens strak geclusterd of wijd verspreid zijn. Zodra je de berekening één keer met de hand hebt doorlopen, wordt het concept intuïtief.
Wat standaarddeviatie u vertelt
Als een klas studenten een gemiddelde examenscore van 70 heeft met een standaarddeviatie van 5, liggen de meeste scores tussen 65 en 75. Als de standaarddeviatie 20 zou zijn, zouden de scores veel breder variëren – van 50 tot 90 en hoger.
Een kleine standaardafwijking betekent consistentie. Een grote betekent variabiliteit.
Populatie versus steekproefstandaarddeviatie
Er zijn twee versies, en het kiezen van de juiste is belangrijk:
Standaardafwijking van de populatie (σ): Gebruik deze optie als u gegevens heeft voor elk lid van de groep waar u om geeft. Deelt door n.
Standaardafwijking(en) van de steekproef: Gebruik deze optie als uw gegevens een steekproef zijn uit een grotere populatie. Deelt door n − 1 (Bessels correctie, die rekening houdt met de onzekerheid die door de steekproeven wordt geïntroduceerd).
In de praktijk gebruikt u bijna altijd de standaarddeviatie van de steekproef, tenzij u een volledige volkstelling of een gecontroleerde dataset analyseert zonder ontbrekende leden.
Stapsgewijze berekening
Dataset: 4, 7, 13, 2, 1 (een voorbeeld van 5 waarden)
Stap 1: Bereken het gemiddelde
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Stap 2: Zoek elke afwijking van het gemiddelde
Trek het gemiddelde van elke waarde af:
| Waarde (x) | Afwijking (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Stap 3: Vier elke afwijking
Kwadrateren elimineert negatieve signalen en benadrukt grotere afwijkingen:
| Afwijking | Kwadratische afwijking |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3,4 | 11.56 |
| −4.4 | 19.36 |
Stap 4: Tel de gekwadrateerde afwijkingen bij elkaar op
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Stap 5: Delen door n − 1 (voor standaarddeviatie van de steekproef)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Stap 6: Neem de vierkantswortel
Standard deviation (s) = √23.3 = 4.83
Interpretatie: Waarden in deze dataset liggen doorgaans ongeveer 4,83 eenheden verwijderd van het gemiddelde van 5,4.
De formule uitgeschreven
Voorbeeld standaardafwijking:
s = √[ Σ(x − x̄)² / (n − 1) ]
Standaardafwijking populatie:
σ = √[ Σ(x − μ)² / n ]
Waar μ (mu) het populatiegemiddelde is.
De empirische regel (regel 68-95-99.7)
Voor gegevens die een normale verdeling volgen, heeft de standaardafwijking een betrouwbare relatie met het aandeel gegevens binnen elk bereik:
| Bereik | Aandeel van gegevens |
|---|---|
| Gemiddelde ± 1 SD | ~68% |
| Gemiddelde ± 2 SD | ~95% |
| Gemiddelde ± 3 SD | ~99,7% |
Toegepast voorbeeld: IQ-scores hebben een gemiddelde van 100 en een SD van 15.
- 68% van de mensen scoort tussen de 85 en 115
- 95% scoort tussen 70 en 130
- 99,7% scoort tussen 55 en 145
Deze regel is alleen van toepassing op normaal verdeelde gegevens. Voor scheve of zware verdelingen kunt u in plaats daarvan de ongelijkheid van Chebyshev gebruiken.
Variantie versus standaarddeviatie
Variantie is de kwadratische afwijking (stap 5 hierboven) — standaardafwijking is de vierkantswortel. Beide meten de spreiding, maar de standaardafwijking wordt uitgedrukt in dezelfde eenheden als de originele gegevens, waardoor deze beter interpreteerbaar worden.
Als uw gegevens in kilogrammen zijn, is uw standaarddeviatie in kilogrammen. Uw variantie wordt uitgedrukt in kilogram in het kwadraat, wat moeilijker zinvol te interpreteren is.
Algemene toepassingen
Financiën: Meten van de volatiliteit van beleggingen. Een aandeel met een dagelijks rendement met een hoge SD is volatieler: een hogere potentiële winst en een hoger potentieel verlies.
Kwaliteitscontrole: Bij de productie wordt SD gebruikt om ervoor te zorgen dat producten binnen de toleranties blijven. Een proces waarbij de SD te groot is, levert te veel defecte artikelen op.
Onderwijs: Testscores standaardiseren. Een z-score geeft aan hoeveel standaarddeviaties een score boven of onder het gemiddelde ligt: z = (x − gemiddelde) / SD.
Wetenschap: Meetonzekerheid uitdrukken en experimentele resultaten vergelijken.
Sneltoets voor berekening
Gebruik voor grote datasets de rekenformule waarmee wordt vermeden dat afwijkingen afzonderlijk worden berekend:
s² = [Σx² − (Σx)²/n] / (n − 1)
Dit is wiskundig equivalent, maar vereist slechts twee passages door de gegevens in plaats van drie.
Gebruik onze Standard Deviation Calculator om SD, variantie en een volledige uitsplitsing te berekenen voor elke dataset die u invoert.