Smerodajná odchýlka je najpoužívanejším meradlom rozptylu v štatistike. Povie vám, ako ďaleko je typická hodnota od priemeru – či sú vaše údaje tesne zoskupené alebo značne rozptýlené. Keď raz prejdete výpočtom ručne, koncept sa stane intuitívnym.
Čo vám hovorí smerodajná odchýlka
Ak má trieda študentov priemerné skóre zo skúšky 70 so štandardnou odchýlkou 5, väčšina skóre spadá medzi 65 a 75. Ak by bola štandardná odchýlka 20, skóre by sa pohybovalo oveľa širšie – od 50 do 90 a viac.
Malá štandardná odchýlka znamená konzistenciu. Veľký znamená variabilitu.
Populácia verzus vzorová štandardná odchýlka
Existujú dve verzie a na výbere tej správnej záleží:
Štandardná odchýlka populácie (σ): Použite, keď máte údaje pre každého člena skupiny, na ktorej vám záleží. Delí n.
Vzorová štandardná odchýlka (y): Použite, keď sú vaše údaje vzorkou z väčšej populácie. Delí sa n − 1 (Besselova korekcia, ktorá zohľadňuje neistotu zavedenú vzorkovaním).
V praxi takmer vždy používate vzorovú smerodajnú odchýlku – pokiaľ neanalyzujete úplné sčítanie alebo kontrolovaný súbor údajov bez chýbajúcich členov.
Výpočet krok za krokom
Množina údajov: 4, 7, 13, 2, 1 (vzorka 5 hodnôt)
Krok 1: Vypočítajte priemer
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Krok 2: Nájdite každú odchýlku od priemeru
Odpočítajte priemer od každej hodnoty:
| Hodnota (x) | Odchýlka (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Krok 3: Odmocnite každú odchýlku
Umocnenie eliminuje negatívne znamienka a zdôrazňuje väčšie odchýlky:
| Odchýlka | Štvorcová odchýlka |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Krok 4: Spočítajte druhé mocniny odchýlok
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Krok 5: Vydelenie n − 1 (pre vzorovú štandardnú odchýlku)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Krok 6: Vezmite druhú odmocninu
Standard deviation (s) = √23.3 = 4.83
Interpretácia: Hodnoty v tomto súbore údajov sú zvyčajne približne 4,83 jednotiek od priemeru 5,4.
Vzorec napísaný
Vzorová štandardná odchýlka:
s = √[ Σ(x − x̄)² / (n − 1) ]
Štandardná odchýlka populácie:
σ = √[ Σ(x − μ)² / n ]
Kde μ (mu) je priemer populácie.
Empirické pravidlo (pravidlo 68-95-99,7)
Pre údaje, ktoré sledujú normálne rozdelenie, má smerodajná odchýlka spoľahlivý vzťah s podielom údajov v rámci každého rozsahu:
| Rozsah | Podiel údajov |
|---|---|
| Priemer ± 1 SD | ~68 % |
| Priemer ± 2 SD | ~95 % |
| Priemer ± 3 SD | ~99,7 % |
Použitý príklad: Skóre IQ má priemer 100 a SD 15.
- 68 % ľudí má skóre medzi 85 a 115
- 95 % skóre medzi 70 a 130
- 99,7 % skóre medzi 55 a 145
Toto pravidlo platí len pre normálne distribuované údaje. Pre šikmé alebo ťažké distribúcie použite namiesto toho Čebyševovu nerovnosť.
Rozptyl verzus štandardná odchýlka
Variancia je druhá mocnina odchýlky (krok 5 vyššie) – štandardná odchýlka je jej druhá odmocnina. Obidve merajú rozptyl, ale štandardná odchýlka je vyjadrená v rovnakých jednotkách ako pôvodné údaje, vďaka čomu je lepšie interpretovať.
Ak sú vaše údaje v kilogramoch, vaša štandardná odchýlka je v kilogramoch. Váš rozptyl je v kilogramoch na druhú, čo je ťažšie zmysluplne interpretovať.
Bežné aplikácie
Financie: Meranie volatility investícií. Akcie s dennými výnosmi s vysokým SD sú volatilnejšie – vyšší potenciálny zisk a vyššia potenciálna strata.
Kontrola kvality: Pri výrobe sa používa SD, aby sa zabezpečilo, že produkty zostanú v rámci tolerancie. Proces s príliš veľkým SD produkuje príliš veľa chybných položiek.
Vzdelávanie: Štandardizácia výsledkov testov. Z-skóre vám hovorí, koľko štandardných odchýlok skóre je nad alebo pod priemerom: z = (x − priemer) / SD.
Veda: Vyjadrenie neistoty merania a porovnanie experimentálnych výsledkov.
Skratka pre výpočet
Pre veľké súbory údajov použite výpočtový vzorec, ktorý sa vyhýba individuálnemu výpočtu odchýlok:
s² = [Σx² − (Σx)²/n] / (n − 1)
To je matematicky ekvivalentné, ale vyžaduje si iba dva prechody cez dáta, a nie tri.
Použite našu [Kalkulátor štandardnej odchýlky] (/sk/math/štatistika/štandardná odchýlka) na výpočet SD, rozptylu a úplného rozdelenia pre ľubovoľný súbor údajov, ktorý zadáte.