Odchylenie standardowe jest najpowszechniej stosowaną miarą rozrzutu w statystykach. Informuje, jak daleko typowa wartość znajduje się od średniej — niezależnie od tego, czy dane są ciasno skupione, czy bardzo rozproszone. Po ręcznym przeprowadzeniu obliczeń koncepcja staje się intuicyjna.

Co mówi odchylenie standardowe

Jeśli klasa uczniów ma średni wynik egzaminu 70 z odchyleniem standardowym 5, większość wyników mieści się w przedziale od 65 do 75. Jeśli odchylenie standardowe wynosiłoby 20, wyniki wahałyby się znacznie szerzej – od 50 do 90 i więcej.

Małe odchylenie standardowe oznacza spójność. Duża oznacza zmienność.

Populacja a odchylenie standardowe próbki

Istnieją dwie wersje i wybór tej właściwej ma znaczenie:

Odchylenie standardowe populacji (σ): Użyj, jeśli masz dane dla każdego członka grupy, na którym Ci zależy. Dzieli przez n.

Przykładowe odchylenie standardowe (s): Użyj, gdy dane stanowią próbkę pobraną z większej populacji. Dzieli przez n − 1 (poprawka Bessela, która uwzględnia niepewność wprowadzoną przez próbkowanie).

W praktyce prawie zawsze stosuje się odchylenie standardowe próbki — chyba że analizuje się pełny spis ludności lub kontrolowany zbiór danych niezawierający brakujących elementów.

Obliczenia krok po kroku

Zbiór danych: 4, 7, 13, 2, 1 (próbka 5 wartości)

Krok 1: Oblicz średnią

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Krok 2: Znajdź każde odchylenie od średniej

Odejmij średnią od każdej wartości:

Wartość (x) Odchylenie (x - x̄)
4 4 - 5,4 = -1,4
7 7 - 5,4 = +1,6
13 13 - 5,4 = +7,6
2 2 - 5,4 = -3,4
1 1 - 5,4 = -4,4

Krok 3: Podnieś każde odchylenie do kwadratu

Kwadrat eliminuje znaki ujemne i podkreśla większe odchylenia:

Odchylenie Odchylenie kwadratowe
−1,4 1.96
+1.6 2.56
+7.6 57.76
−3.4 11.56
−4.4 19.36

Krok 4: Zsumuj kwadraty odchyleń

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Krok 5: Podziel przez n – 1 (dla odchylenia standardowego próbki)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Krok 6: Weź pierwiastek kwadratowy

Standard deviation (s) = √23.3 = 4.83

Interpretacja: Wartości w tym zbiorze danych zazwyczaj różnią się o około 4,83 jednostki od średniej wynoszącej 5,4.

Zapisana formuła

Przykładowe odchylenie standardowe:

s = √[ Σ(x − x̄)² / (n − 1) ]

Odchylenie standardowe populacji:

σ = √[ Σ(x − μ)² / n ]

Gdzie μ (mu) to średnia populacji.

Reguła empiryczna (Reguła 68-95-99.7)

W przypadku danych o rozkładzie normalnym odchylenie standardowe ma wiarygodny związek z proporcją danych w każdym zakresie:

Zakres Proporcja danych
Średnia ± 1 SD ~68%
Średnia ± 2 SD ~95%
Średnia ± 3 SD ~99,7%

Przykład zastosowany: Wyniki IQ mają średnią 100 i SD 15.

  • 68% osób osiąga wynik pomiędzy 85 a 115
  • 95% wyników od 70 do 130
  • 99,7% wyniku od 55 do 145

Ta zasada dotyczy tylko danych o rozkładzie normalnym. W przypadku rozkładów skośnych lub ciężkoogoniastych zamiast tego użyj nierówności Czebyszewa.

Wariancja a odchylenie standardowe

Wariancja to odchylenie kwadratowe (krok 5 powyżej) — odchylenie standardowe to pierwiastek kwadratowy. Obydwa mierzą rozrzut, ale odchylenie standardowe wyrażane jest w tych samych jednostkach, co dane oryginalne, co czyni je łatwiejszymi do interpretacji.

Jeśli dane podawane są w kilogramach, odchylenie standardowe jest podawane w kilogramach. Twoja wariancja jest podana w kilogramach kwadratowych, co jest trudniejsze do sensownej interpretacji.

Typowe aplikacje

Finanse: Pomiar zmienności inwestycji. Akcje z dziennymi zwrotami i wysokim SD są bardziej zmienne – większy potencjalny zysk i większa potencjalna strata.

Kontrola jakości: Produkcja wykorzystuje SD, aby zapewnić, że produkty mieszczą się w tolerancji. Proces ze zbyt dużą wartością SD wytwarza zbyt wiele wadliwych elementów.

Wykształcenie: Standaryzacja wyników testów. Wynik z informuje, o ile odchyleń standardowych wynik znajduje się powyżej lub poniżej średniej: z = (x – średnia) / SD.

Nauka: Wyrażanie niepewności pomiaru i porównywanie wyników eksperymentów.

Skrót do obliczeń

W przypadku dużych zbiorów danych należy zastosować wzór obliczeniowy, który pozwala uniknąć indywidualnego obliczania odchyleń:

s² = [Σx² − (Σx)²/n] / (n − 1)

Jest to matematycznie równoważne, ale wymaga tylko dwóch przejść przez dane, a nie trzech.

Skorzystaj z naszego Kalkulatora odchylenia standardowego, aby obliczyć SD, wariancję i pełny podział dowolnego wprowadzonego zbioru danych.