Odchylenie standardowe jest najpowszechniej stosowaną miarą rozrzutu w statystykach. Informuje, jak daleko typowa wartość znajduje się od średniej — niezależnie od tego, czy dane są ciasno skupione, czy bardzo rozproszone. Po ręcznym przeprowadzeniu obliczeń koncepcja staje się intuicyjna.
Co mówi odchylenie standardowe
Jeśli klasa uczniów ma średni wynik egzaminu 70 z odchyleniem standardowym 5, większość wyników mieści się w przedziale od 65 do 75. Jeśli odchylenie standardowe wynosiłoby 20, wyniki wahałyby się znacznie szerzej – od 50 do 90 i więcej.
Małe odchylenie standardowe oznacza spójność. Duża oznacza zmienność.
Populacja a odchylenie standardowe próbki
Istnieją dwie wersje i wybór tej właściwej ma znaczenie:
Odchylenie standardowe populacji (σ): Użyj, jeśli masz dane dla każdego członka grupy, na którym Ci zależy. Dzieli przez n.
Przykładowe odchylenie standardowe (s): Użyj, gdy dane stanowią próbkę pobraną z większej populacji. Dzieli przez n − 1 (poprawka Bessela, która uwzględnia niepewność wprowadzoną przez próbkowanie).
W praktyce prawie zawsze stosuje się odchylenie standardowe próbki — chyba że analizuje się pełny spis ludności lub kontrolowany zbiór danych niezawierający brakujących elementów.
Obliczenia krok po kroku
Zbiór danych: 4, 7, 13, 2, 1 (próbka 5 wartości)
Krok 1: Oblicz średnią
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Krok 2: Znajdź każde odchylenie od średniej
Odejmij średnią od każdej wartości:
| Wartość (x) | Odchylenie (x - x̄) |
|---|---|
| 4 | 4 - 5,4 = -1,4 |
| 7 | 7 - 5,4 = +1,6 |
| 13 | 13 - 5,4 = +7,6 |
| 2 | 2 - 5,4 = -3,4 |
| 1 | 1 - 5,4 = -4,4 |
Krok 3: Podnieś każde odchylenie do kwadratu
Kwadrat eliminuje znaki ujemne i podkreśla większe odchylenia:
| Odchylenie | Odchylenie kwadratowe |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
Krok 4: Zsumuj kwadraty odchyleń
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Krok 5: Podziel przez n – 1 (dla odchylenia standardowego próbki)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Krok 6: Weź pierwiastek kwadratowy
Standard deviation (s) = √23.3 = 4.83
Interpretacja: Wartości w tym zbiorze danych zazwyczaj różnią się o około 4,83 jednostki od średniej wynoszącej 5,4.
Zapisana formuła
Przykładowe odchylenie standardowe:
s = √[ Σ(x − x̄)² / (n − 1) ]
Odchylenie standardowe populacji:
σ = √[ Σ(x − μ)² / n ]
Gdzie μ (mu) to średnia populacji.
Reguła empiryczna (Reguła 68-95-99.7)
W przypadku danych o rozkładzie normalnym odchylenie standardowe ma wiarygodny związek z proporcją danych w każdym zakresie:
| Zakres | Proporcja danych |
|---|---|
| Średnia ± 1 SD | ~68% |
| Średnia ± 2 SD | ~95% |
| Średnia ± 3 SD | ~99,7% |
Przykład zastosowany: Wyniki IQ mają średnią 100 i SD 15.
- 68% osób osiąga wynik pomiędzy 85 a 115
- 95% wyników od 70 do 130
- 99,7% wyniku od 55 do 145
Ta zasada dotyczy tylko danych o rozkładzie normalnym. W przypadku rozkładów skośnych lub ciężkoogoniastych zamiast tego użyj nierówności Czebyszewa.
Wariancja a odchylenie standardowe
Wariancja to odchylenie kwadratowe (krok 5 powyżej) — odchylenie standardowe to pierwiastek kwadratowy. Obydwa mierzą rozrzut, ale odchylenie standardowe wyrażane jest w tych samych jednostkach, co dane oryginalne, co czyni je łatwiejszymi do interpretacji.
Jeśli dane podawane są w kilogramach, odchylenie standardowe jest podawane w kilogramach. Twoja wariancja jest podana w kilogramach kwadratowych, co jest trudniejsze do sensownej interpretacji.
Typowe aplikacje
Finanse: Pomiar zmienności inwestycji. Akcje z dziennymi zwrotami i wysokim SD są bardziej zmienne – większy potencjalny zysk i większa potencjalna strata.
Kontrola jakości: Produkcja wykorzystuje SD, aby zapewnić, że produkty mieszczą się w tolerancji. Proces ze zbyt dużą wartością SD wytwarza zbyt wiele wadliwych elementów.
Wykształcenie: Standaryzacja wyników testów. Wynik z informuje, o ile odchyleń standardowych wynik znajduje się powyżej lub poniżej średniej: z = (x – średnia) / SD.
Nauka: Wyrażanie niepewności pomiaru i porównywanie wyników eksperymentów.
Skrót do obliczeń
W przypadku dużych zbiorów danych należy zastosować wzór obliczeniowy, który pozwala uniknąć indywidualnego obliczania odchyleń:
s² = [Σx² − (Σx)²/n] / (n − 1)
Jest to matematycznie równoważne, ale wymaga tylko dwóch przejść przez dane, a nie trzech.
Skorzystaj z naszego Kalkulatora odchylenia standardowego, aby obliczyć SD, wariancję i pełny podział dowolnego wprowadzonego zbioru danych.