Keskihajonta on tilastoissa yleisimmin käytetty leviämisen mitta. Se kertoo, kuinka kaukana tyypillinen arvo on keskiarvosta – onko tietosi tiiviisti ryhmitelty vai hajallaan. Kun olet käsin laskenut kerran, konseptista tulee intuitiivinen.
Mitä keskihajonta kertoo
Jos opiskelijoiden luokan keskimääräinen tenttipistemäärä on 70 ja keskihajonna 5, useimmat pisteet putoavat 65:n ja 75:n välillä. Jos keskihajonta olisi 20, pisteet vaihtelevat paljon laajemmin – 50:stä 90:een ja enemmän.
Pieni keskihajonta tarkoittaa johdonmukaisuutta. Suuri tarkoittaa vaihtelua.
Populaatio vs otoksen keskihajonta
On olemassa kaksi versiota, ja oikean valinnalla on väliä:
Peruspopulaation keskihajonta (σ): Käytä tätä, kun sinulla on tietoja jokaisesta sinulle tärkeästä ryhmän jäsenestä. Jakaa n:lla.
Otos keskihajonna(t): Käytä, kun tietosi ovat otos, joka on otettu suuremmasta populaatiosta. Jakaa luvulla n − 1 (Besselin korjaus, joka selittää otannan aiheuttaman epävarmuuden).
Käytännössä käytät lähes aina näytteen keskihajontaa – ellet analysoi täydellistä väestölaskentaa tai kontrolloitua tietojoukkoa, jossa ei ole puuttuvia jäseniä.
Vaiheittainen laskenta
Tietojoukko: 4, 7, 13, 2, 1 (5 arvon näyte)
Vaihe 1: Laske keskiarvo
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Vaihe 2: Etsi jokainen poikkeama keskiarvosta
Vähennä keskiarvo kustakin arvosta:
| Arvo (x) | Poikkeama (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Vaihe 3: Neliöi jokainen poikkeama
Neliöinti eliminoi negatiiviset merkit ja korostaa suurempia poikkeamia:
| Poikkeama | Neliön poikkeama |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Vaihe 4: Summaa neliöidyt poikkeamat
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Vaihe 5: Jaa n − 1:llä (näytteen keskihajonnan saamiseksi)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Vaihe 6: Ota neliöjuuri
Standard deviation (s) = √23.3 = 4.83
Tulkinta: Tämän tietojoukon arvot ovat yleensä noin 4,83 yksikön päässä keskiarvosta 5,4.
Kaava kirjoitettu
Esimerkki keskihajonnasta:
s = √[ Σ(x − x̄)² / (n − 1) ]
Perusjoukon keskihajonta:
σ = √[ Σ(x − μ)² / n ]
Missä μ (mu) on väestön keskiarvo.
Empiirinen sääntö (68-95-99.7 sääntö)
Normaalijakaumaa noudattavien tietojen keskihajonnalla on luotettava suhde tietojen osuuteen kullakin alueella:
| Alue | Tietojen osuus |
|---|---|
| Keskiarvo ± 1 SD | ~68 % |
| Keskiarvo ± 2 SD | ~95 % |
| Keskiarvo ± 3 SD | ~99,7 % |
Sovellettu esimerkki: ÄO-pisteiden keskiarvo on 100 ja SD 15.
- 68 % ihmisistä saa pisteet välillä 85-115
- 95 % pisteet 70 ja 130 välillä
- 99,7 % pisteet 55 ja 145 välillä
Tämä sääntö koskee vain normaalisti jaettua dataa. Vääristyneiden tai raskaan pyrstön jakaumien tapauksessa käytä sen sijaan Tšebyševin epäyhtälöä.
Varianssi vs keskihajonta
Varianssi on neliöpoikkeama (vaihe 5 yllä) – keskihajonta on sen neliöjuuri. Molemmat mittaavat leviämistä, mutta keskihajonta ilmaistaan samoissa yksiköissä kuin alkuperäinen data, mikä tekee siitä paremmin tulkittavissa.
Jos tietosi ovat kilogrammoina, keskihajontasi on kilogrammoina. Varianssi on kilogramman neliö, jota on vaikeampi tulkita mielekkäästi.
Yleiset sovellukset
Rahoitus: Sijoitusten volatiliteetin mittaaminen. Osake, jonka päivittäisellä tuotolla on korkea SD, on epävakaampi – suurempi mahdollinen voitto ja suurempi mahdollinen tappio.
Laadunvalvonta: Valmistus käyttää SD:tä varmistaakseen, että tuotteet pysyvät toleranssien sisällä. Prosessi, jossa SD on liian suuri, tuottaa liian monta viallista tuotetta.
Koulutus: Testin tulosten standardointi. Z-piste kertoo, kuinka monta keskihajontaa pistemäärä on keskiarvon ylä- tai alapuolella: z = (x − keskiarvo) / SD.
Tiede: Mittausepävarmuuden ilmaiseminen ja koetulosten vertailu.
Laskennan pikakuvake
Käytä suuria tietojoukkoja varten laskennallista kaavaa, joka välttää poikkeamien laskemisen erikseen:
s² = [Σx² − (Σx)²/n] / (n − 1)
Tämä on matemaattisesti vastaava, mutta vaatii vain kaksi läpikulkua datan kolmen sijaan.
Käytä [Standardipoikkeamalaskuriamme] (/en/math/statistics/standard-poikkeama) laskeaksesi SD:n, varianssin ja täydellisen erittelyn kaikille syöttämillesi tiedoille.