Rozptyl meria, ako je rozložená množina čísel od ich priemeru. Je to jeden z najdôležitejších pojmov v štatistike – používa sa vo financiách na meranie investičného rizika, vo vede na hodnotenie experimentálnej konzistencie a pri každodennej analýze údajov.
Čo je rozptyl?
Rozptyl je priemer druhých mocnín rozdielov od priemeru. Nízky rozptyl znamená, že dátové body sa zhlukujú tesne okolo priemeru. Vysoký rozptyl znamená, že sú veľmi rozšírené.
Existujú dva typy:
- Rozptyl populácie (σ²) – používa sa, keď máte údaje pre celú populáciu
- Vzorkový rozptyl (s²) – používa sa, keď sú vaše údaje vzorkou z väčšej populácie
V praxi budete takmer vždy používať rozptyl vzorky.
Vzorec rozptylu
Rozptyl populácie
σ² = Σ(xᵢ - μ)² / N
kde:
- xᵢ = každý údajový bod
- μ = priemer populácie
- N = počet údajových bodov
Vzorový rozptyl
s² = Σ(xᵢ - x̄)² / (n - 1)
kde:
- x̄ = priemer vzorky
- n - 1 = stupne voľnosti (Besselova korekcia)
CODE0 v rozptyle vzorky koriguje skutočnosť, že vzorka má tendenciu podceňovať skutočné rozšírenie populácie.
Príklad krok za krokom
Množina údajov: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5
Krok 1: Vypočítajte priemer
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
Krok 2: Odpočítajte priemer od každej hodnoty a odmocnite výsledok
| Hodnota | Hodnota − Priemer | (Hodnota − Stredná hodnota)² |
|---|---|---|
| 4 | 4 − 5,2 = −1,2 | 1.44 |
| 8 | 8 − 5,2 = 2,8 | 7.84 |
| 6 | 6 − 5,2 = 0,8 | 0.64 |
| 5 | 5 − 5,2 = −0,2 | 0.04 |
| 3 | 3 − 5,2 = −2,2 | 4.84 |
| 2 | 2 − 5,2 = −3,2 | 10.24 |
| 8 | 8 − 5,2 = 2,8 | 7.84 |
| 9 | 9 − 5,2 = 3,8 | 14.44 |
| 2 | 2 − 5,2 = −3,2 | 10.24 |
| 5 | 5 − 5,2 = −0,2 | 0.04 |
Krok 3: Spočítajte druhé mocniny rozdielov
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
Krok 4: Vydeľte číslom n − 1 (rozptyl vzorky)
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
Vzorový rozptyl je 6,4.
Rozptyl verzus štandardná odchýlka
Smerodajná odchýlka je jednoducho druhá odmocnina rozptylu:
s = √s² = √6.4 ≈ 2.53
Smerodajná odchýlka je vyjadrená v rovnakých jednotkách ako pôvodné údaje, čo uľahčuje interpretáciu. Ak sú vaše údaje v kilogramoch, štandardná odchýlka je v kilogramoch. Rozptyl je v kilogramoch². To je dôvod, prečo sa štandardná odchýlka častejšie uvádza, ale v mnohých štatistických výpočtoch sa používa rozptyl.
Populácia verzus vzorka: Kedy použiť každú
| Situácia | Použite |
|---|---|
| Máte údaje pre každého člena skupiny | Rozptyl populácie (÷ N) |
| Vaše údaje sú vzorkou z väčšej skupiny | Vzorový rozptyl (÷ n − 1) |
| V porovnaní s inými štatistickými testami | Zvyčajne vzorový rozptyl |
| Váš súbor údajov predstavuje úplný obraz | Populačný rozptyl |
V prípade pochybností použite odchýlku vzorky. Väčšina množín údajov z reálneho sveta sú vzorky.
Prečo vyrovnávame rozdiely
Možno sa čudujete: prečo nespriemerovať hrubé rozdiely od priemeru?
Problém je v tom, že kladné a záporné odchýlky sa rušia. Pre vyššie uvedený súbor údajov sú niektoré hodnoty nad priemerom a niektoré nižšie. Ak ich všetky spočítate bez odmocnenia, vždy dostanete nulu.
Umocnenie odstraňuje záporné znamienka, takže všetky odchýlky pozitívne prispievajú k celkovému rozptylu.
Praktické aplikácie
Financie: Odchýlka portfólia meria investičné riziko. Portfólio s rozptylom 0,04 je menej rizikové ako portfólio s rozptylom 0,16 – aj keď obe majú rovnaký očakávaný výnos.
Kontrola kvality: Výrobný proces s nízkou odchýlkou produkuje konzistentnejší výstup. Vysoký rozptyl znamená nepredvídateľné výsledky.
Veda: V experimentoch vysoké rozdiely medzi opakovanými meraniami naznačujú chybu merania alebo nekontrolované premenné.
Športová analýza: Odchýlka výkonu hráča vám povie, či je hráč konzistentný (nízky rozptyl) alebo prerastený (vysoký rozptyl).
Bežné chyby
Použitie N namiesto n − 1 pre vzorky — Toto podceňuje skutočný rozptyl populácie. Pre vzorové údaje vždy použite n − 1.
Zabúdanie na druhú mocninu – Bežnou chybou je spriemerovanie hrubých rozdielov, nie štvorcov.
Zamieňanie rozptylu s rozsahom — Rozsah je jednoducho maximum mínus minimum. Odchýlka sa týka všetkých údajových bodov, nielen extrémov.
Rýchly prehľad
| Vzorec | Kedy použiť |
|---|---|
| KÓD0 | Plná populácia |
| KÓD0 | Vzorka z populácie |
| KÓD0 | Ak chcete získať štandardnú odchýlku |
Čítať ďalej
- Ako vypočítať štandardnú odchýlku
- [Čo je štandardná odchýlka?](/sk/blog/čo je štandardná odchýlka)
- Ako nájsť medián