Keskihajonta kertoo, kuinka hajautettu data on keskiarvon ympärillä. Pieni keskihajonta tarkoittaa, että dataklusterit ovat tiiviitä; suuri tarkoittaa, että se on hajallaan.
Miksi keskihajonta on tärkeää
Kahden luokan keskiarvo on 75 % kokeesta. Mutta luokassa A pisteet vaihtelevat 70–80 prosentin välillä. Luokassa B pisteet vaihtelevat 40–100 %. Keskiarvo kätkee tärkeän tiedon – keskihajonta paljastaa sen.
Kaava
väestölle (kaikki tiedot):
σ = √[ Σ(x - μ)² / N ]
näyte (tietojen osajoukko):
s = √[ Σ(x - x̄)² / (n-1) ]
Jossa:
- σ (sigma) = populaation keskihajonta
- s = näytteen keskihajonta
- x = jokainen arvo
- μ tai x̄ = keskiarvo
- N = populaation koko, n = otoskoko
Otoskaava jakaa n-1:llä (ei n:llä) poikkeaman korjaamiseksi osajoukosta arvioitaessa.
Vaiheittainen esimerkki
Tiedot: 4, 7, 13, 2, 9 (näyte 5 arvosta)
Vaihe 1: Laske keskiarvo:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
Vaihe 2: Vähennä keskiarvo kustakin arvosta ja neliöstä:
| x | x - tarkoittaa | (x - keskiarvo)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
Vaihe 3: Laske neliöerot yhteen: 9 + 0 + 36 + 25 + 4 = 74
Vaihe 4: Jaa n-1 = 4: 74 / 4 = 18,5
Vaihe 5: Ota neliöjuuri: √18,5 ≈ 4,30
Keskihajonta = 4,30
Sääntö 68-95-99.7
Normaalisti hajautetut tiedot:
- 68 % arvoista on ±1 keskihajonnan sisällä
- 95 % on ±2 standardipoikkeaman sisällä
- 99,7 % on ±3 standardipoikkeaman sisällä
Esimerkki: Korkeudet keskimäärin 170 cm, SD 10 cm:
- 68 % on välillä 160-180 cm
- 95 % on välillä 150-190 cm
Reaalimaailman sovellukset
- Rahoitus: mittaa sijoitusten volatiliteettia (riski)
- Valmistus: Laadunvalvonta – ±3σ:n ulkopuolella olevat tuotteet ovat vikoja
- Lääketiede: Poikkeavien testitulosten tunnistaminen
- Koulutus: Arviointi käyrän mukaan
Käytä [Standardipoikkeamalaskuria] (/en/math/statistics/standard-deviation) laskeaksesi keskiarvon, mediaanin, varianssin ja keskihajonnan mille tahansa tietojoukolle.