Keskihajonta on tilastoissa yleisimmin käytetty leviämisen mitta. Se kertoo, kuinka kaukana tyypillinen arvo on keskiarvosta – onko tietosi tiiviisti ryhmitelty vai hajallaan. Kun olet käsin laskenut kerran, konseptista tulee intuitiivinen.

Mitä keskihajonta kertoo

Jos opiskelijoiden luokan keskimääräinen tenttipistemäärä on 70 ja keskihajonna 5, useimmat pisteet putoavat 65:n ja 75:n välillä. Jos keskihajonta olisi 20, pisteet vaihtelevat paljon laajemmin – 50:stä 90:een ja enemmän.

Pieni keskihajonta tarkoittaa johdonmukaisuutta. Suuri tarkoittaa vaihtelua.

Populaatio vs otoksen keskihajonta

On olemassa kaksi versiota, ja oikean valinnalla on väliä:

Peruspopulaation keskihajonta (σ): Käytä tätä, kun sinulla on tietoja jokaisesta sinulle tärkeästä ryhmän jäsenestä. Jakaa n:lla.

Otos keskihajonna(t): Käytä, kun tietosi ovat otos, joka on otettu suuremmasta populaatiosta. Jakaa luvulla n − 1 (Besselin korjaus, joka selittää otannan aiheuttaman epävarmuuden).

Käytännössä käytät lähes aina näytteen keskihajontaa – ellet analysoi täydellistä väestölaskentaa tai kontrolloitua tietojoukkoa, jossa ei ole puuttuvia jäseniä.

Vaiheittainen laskenta

Tietojoukko: 4, 7, 13, 2, 1 (5 arvon näyte)

Vaihe 1: Laske keskiarvo

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Vaihe 2: Etsi jokainen poikkeama keskiarvosta

Vähennä keskiarvo kustakin arvosta:

Arvo (x) Poikkeama (x − x̄)
4 4 − 5,4 = −1,4
7 7 − 5,4 = +1,6
13 13 − 5,4 = +7,6
2 2 − 5,4 = −3,4
1 1 − 5,4 = −4,4

Vaihe 3: Neliöi jokainen poikkeama

Neliöinti eliminoi negatiiviset merkit ja korostaa suurempia poikkeamia:

Poikkeama Neliön poikkeama
−1.4 1.96
+1.6 2.56
+7.6 57.76
−3.4 11.56
−4.4 19.36

Vaihe 4: Summaa neliöidyt poikkeamat

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Vaihe 5: Jaa n − 1:llä (näytteen keskihajonnan saamiseksi)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Vaihe 6: Ota neliöjuuri

Standard deviation (s) = √23.3 = 4.83

Tulkinta: Tämän tietojoukon arvot ovat yleensä noin 4,83 yksikön päässä keskiarvosta 5,4.

Kaava kirjoitettu

Esimerkki keskihajonnasta:

s = √[ Σ(x − x̄)² / (n − 1) ]

Perusjoukon keskihajonta:

σ = √[ Σ(x − μ)² / n ]

Missä μ (mu) on väestön keskiarvo.

Empiirinen sääntö (68-95-99.7 sääntö)

Normaalijakaumaa noudattavien tietojen keskihajonnalla on luotettava suhde tietojen osuuteen kullakin alueella:

Alue Tietojen osuus
Keskiarvo ± 1 SD ~68 %
Keskiarvo ± 2 SD ~95 %
Keskiarvo ± 3 SD ~99,7 %

Sovellettu esimerkki: ÄO-pisteiden keskiarvo on 100 ja SD 15.

  • 68 % ihmisistä saa pisteet välillä 85-115
  • 95 % pisteet 70 ja 130 välillä
  • 99,7 % pisteet 55 ja 145 välillä

Tämä sääntö koskee vain normaalisti jaettua dataa. Vääristyneiden tai raskaan pyrstön jakaumien tapauksessa käytä sen sijaan Tšebyševin epäyhtälöä.

Varianssi vs keskihajonta

Varianssi on neliöpoikkeama (vaihe 5 yllä) – keskihajonta on sen neliöjuuri. Molemmat mittaavat leviämistä, mutta keskihajonta ilmaistaan ​​samoissa yksiköissä kuin alkuperäinen data, mikä tekee siitä paremmin tulkittavissa.

Jos tietosi ovat kilogrammoina, keskihajontasi on kilogrammoina. Varianssi on kilogramman neliö, jota on vaikeampi tulkita mielekkäästi.

Yleiset sovellukset

Rahoitus: Sijoitusten volatiliteetin mittaaminen. Osake, jonka päivittäisellä tuotolla on korkea SD, on epävakaampi – suurempi mahdollinen voitto ja suurempi mahdollinen tappio.

Laadunvalvonta: Valmistus käyttää SD:tä varmistaakseen, että tuotteet pysyvät toleranssien sisällä. Prosessi, jossa SD on liian suuri, tuottaa liian monta viallista tuotetta.

Koulutus: Testin tulosten standardointi. Z-piste kertoo, kuinka monta keskihajontaa pistemäärä on keskiarvon ylä- tai alapuolella: z = (x − keskiarvo) / SD.

Tiede: Mittausepävarmuuden ilmaiseminen ja koetulosten vertailu.

Laskennan pikakuvake

Käytä suuria tietojoukkoja varten laskennallista kaavaa, joka välttää poikkeamien laskemisen erikseen:

s² = [Σx² − (Σx)²/n] / (n − 1)

Tämä on matemaattisesti vastaava, mutta vaatii vain kaksi läpikulkua datan kolmen sijaan.

Käytä [Standardipoikkeamalaskuriamme] (/en/math/statistics/standard-poikkeama) laskeaksesi SD:n, varianssin ja täydellisen erittelyn kaikille syöttämillesi tiedoille.