Розуміння стандартного відхилення: що це означає та як його обчислити

Стандартне відхилення вказує на те, наскільки розподілені дані довкола середнього. Невелике стандартне відхилення означає щільне скупчення даних; великий означає, що він широко розкиданий.

Чому стандартне відхилення має значення

Два класи в середньому 75% на тесті. Але в класі А показники коливаються в межах 70–80%. У класі B оцінки коливаються від 40 до 100%. Середнє значення приховує важливу інформацію — стандартне відхилення розкриває її.

Формула

Для населення (усі дані):

σ = √[ Σ(x - μ)² / N ]

Для вибірки (підмножини даних):

s = √[ Σ(x - x̄)² / (n-1) ]

Де:

σ (сигма) = стандартне відхилення сукупності
s = стандартне відхилення вибірки
x = кожне значення
μ або x̄ = середнє значення
N = розмір сукупності, n = розмір вибірки

Формула зразка ділиться на n-1 (а не на n), щоб виправити зміщення під час оцінювання з підмножини.

Покроковий приклад

Дані: 4, 7, 13, 2, 9 (вибірка з 5 значень)

Крок 1: Обчисліть середнє значення:

Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7

Крок 2: Відніміть середнє від кожного значення та зведіть у квадрат:

x	х - середнє	(x - середнє)²
4	-3	9
7	0	0
13	6	36
2	-5	25
9	2	4

Крок 3: Підведіть квадрати різниць: 9 + 0 + 36 + 25 + 4 = 74

Крок 4: Поділіть на n-1 = 4: 74 / 4 = 18,5

Крок 5: Витягніть квадратний корінь: √18,5 ≈ 4,30

Стандартне відхилення = 4,30

Правило 68-95-99.7

Для нормально розподілених даних:

68% значень знаходяться в межах ±1 стандартного відхилення від середнього
95% знаходяться в межах ±2 стандартних відхилень
99,7% знаходяться в межах ±3 стандартних відхилень

Приклад: Зріст із середнім 170 см, SD 10 см:

68% мають зріст 160–180 см
95% мають зріст 150–190 см

Програми реального світу

Фінанси: вимірює нестабільність інвестицій (ризик)
Виробництво: контроль якості — вироби за межами ±3σ є дефектами
Медицина: виявлення аномальних результатів тесту
Освіта: оцінювання за кривою

Використовуйте наш Калькулятор стандартного відхилення, щоб обчислити середнє значення, медіану, дисперсію та стандартне відхилення для будь-якого набору даних.