Стандартне відхилення вказує на те, наскільки розподілені дані довкола середнього. Невелике стандартне відхилення означає щільне скупчення даних; великий означає, що він широко розкиданий.
Чому стандартне відхилення має значення
Два класи в середньому 75% на тесті. Але в класі А показники коливаються в межах 70–80%. У класі B оцінки коливаються від 40 до 100%. Середнє значення приховує важливу інформацію — стандартне відхилення розкриває її.
Формула
Для населення (усі дані):
σ = √[ Σ(x - μ)² / N ]
Для вибірки (підмножини даних):
s = √[ Σ(x - x̄)² / (n-1) ]
Де:
- σ (сигма) = стандартне відхилення сукупності
- s = стандартне відхилення вибірки
- x = кожне значення
- μ або x̄ = середнє значення
- N = розмір сукупності, n = розмір вибірки
Формула зразка ділиться на n-1 (а не на n), щоб виправити зміщення під час оцінювання з підмножини.
Покроковий приклад
Дані: 4, 7, 13, 2, 9 (вибірка з 5 значень)
Крок 1: Обчисліть середнє значення:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
Крок 2: Відніміть середнє від кожного значення та зведіть у квадрат:
| x | х - середнє | (x - середнє)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
Крок 3: Підведіть квадрати різниць: 9 + 0 + 36 + 25 + 4 = 74
Крок 4: Поділіть на n-1 = 4: 74 / 4 = 18,5
Крок 5: Витягніть квадратний корінь: √18,5 ≈ 4,30
Стандартне відхилення = 4,30
Правило 68-95-99.7
Для нормально розподілених даних:
- 68% значень знаходяться в межах ±1 стандартного відхилення від середнього
- 95% знаходяться в межах ±2 стандартних відхилень
- 99,7% знаходяться в межах ±3 стандартних відхилень
Приклад: Зріст із середнім 170 см, SD 10 см:
- 68% мають зріст 160–180 см
- 95% мають зріст 150–190 см
Програми реального світу
- Фінанси: вимірює нестабільність інвестицій (ризик)
- Виробництво: контроль якості — вироби за межами ±3σ є дефектами
- Медицина: виявлення аномальних результатів тесту
- Освіта: оцінювання за кривою
Використовуйте наш Калькулятор стандартного відхилення, щоб обчислити середнє значення, медіану, дисперсію та стандартне відхилення для будь-якого набору даних.