Стандартното отклонение ви казва колко разпръснати данни са около средната стойност. Малко стандартно отклонение означава плътно групиране на данни; голям означава, че е широко разпръснат.
Защо стандартното отклонение има значение
Два класа средно по 75% на тест. Но в клас А резултатите варират от 70–80%. В клас B резултатите варират от 40–100%. Средната стойност крие важна информация - стандартното отклонение я разкрива.
Формулата
За популация (всички данни):
σ = √[ Σ(x - μ)² / N ]
За извадка (подмножество от данни):
s = √[ Σ(x - x̄)² / (n-1) ]
където:
- σ (сигма) = стандартно отклонение на популацията
- s = извадково стандартно отклонение
- x = всяка стойност
- μ или x̄ = средно
- N = размер на популацията, n = размер на извадката
Примерната формула се дели на n-1 (не на n), за да коригира отклонението при оценка от подмножество.
Пример стъпка по стъпка
Данни: 4, 7, 13, 2, 9 (извадка от 5 стойности)
Стъпка 1: Изчислете средната стойност:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
Стъпка 2: Извадете средната стойност от всяка стойност и квадрат:
| х | x - средно | (x - средно)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
Стъпка 3: Съберете разликите на квадрат: 9 + 0 + 36 + 25 + 4 = 74
Стъпка 4: Разделете на n-1 = 4: 74 / 4 = 18,5
Стъпка 5: Извадете корен квадратен: √18,5 ≈ 4,30
Стандартно отклонение = 4,30
Правилото 68-95-99.7
За нормално разпределени данни:
- 68% от стойностите попадат в рамките на ±1 стандартно отклонение от средната стойност
- 95% попадат в рамките на ±2 стандартни отклонения
- 99,7% попадат в рамките на ±3 стандартни отклонения
Пример: Височини със средни 170 cm, SD 10 cm:
- 68% са между 160–180 см
- 95% са между 150–190 см
Приложения от реалния свят
- Финанси: Измерва променливостта на инвестициите (риск)
- Производство: Контрол на качеството — продуктите извън ±3σ са дефекти
- Медицина: Идентифициране на необичайни резултати от теста
- Образование: Оценяване по крива
Използвайте нашия Калкулатор за стандартно отклонение, за да изчислите средна стойност, медиана, дисперсия и стандартно отклонение за всеки набор от данни.