Стандартне відхилення є найбільш широко використовуваним показником розкиду в статистиці. Він говорить вам, наскільки розподілені значення навколо середнього. У цьому посібнику пояснюється це з перших принципів і прикладів.
Що вам говорить стандартне відхилення
Середнє значення вказує на центр набору даних. Стандартне відхилення говорить вам, наскільки далеко значення зазвичай відхиляються від цього центру.
Низьке стандартне відхилення → значення, щільно згруповані навколо середнього Високе стандартне відхилення → значення значно відрізняються від середнього
Два екзаменаційні класи в середньому становлять 70%, але:
- Клас A: бали 68, 69, 70, 71, 72 — SD ≈ 1,4 (дуже постійний)
- Клас B: бали 40, 55, 70, 85, 100 — SD ≈ 22,4 (дуже варіабельний)
Те саме значення, дуже різні розподіли.
Формула
Є дві версії залежно від того, чи є у вас повна сукупність чи вибірка.
Стандартне відхилення сукупності (σ)
Використовуйте, якщо у вас є дані для кожного члена групи.
σ = √((Σ(x_i - μ)^2) / (N))
Зразок стандартного відхилення (s)
Використовуйте, коли ваші дані є вибіркою з більшої сукупності (найчастіший випадок).
s = √( Σ(x_i − x̄)² / (n − 1) )
Знаменник дорівнює n − 1 (а не n), щоб виправити зміщення, яке виникає в результаті оцінки параметра генеральної сукупності за вибіркою. Це називається поправкою Бесселя.
Покроковий розрахунок
Набір даних: Тестові результати для 6 студентів: 72, 85, 68, 91, 74, 80
Крок 1: Знайдіть середнє значення
x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33
Крок 2: Знайдіть кожне відхилення від середнього
| Оцінка | Відхилення (x − x̄) | Квадрат відхилення |
|---|---|---|
| 72 | −6,33 | 40.07 |
| 85 | +6.67 | 44.49 |
| 68 | −10,33 | 106.71 |
| 91 | +12.67 | 160.53 |
| 74 | −4,33 | 18.75 |
| 80 | +1.67 | 2.79 |
Крок 3: підсумуйте квадрати відхилень
Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34
Крок 4: Розділіть на n − 1 (зразок)
(373.34) / (6 - 1) = (373.34) / (5) = 74.67
Крок 5: Витягніть квадратний корінь
s = √(74.67) = 8.64
Стандартне відхилення становить 8,64 бала. Типовий результат учня приблизно на 8–9 балів відстає від середнього в класі.
Правило 68-95-99.7
Для нормально розподілених даних (дзвоноподібна крива) стандартне відхилення має передбачуваний зв’язок із розповсюдженням:
- 68% значень знаходяться в межах 1 SD від середнього
- 95% значень знаходяться в межах 2 SD від середнього
- 99,7% значень знаходяться в межах 3 SD від середнього
Застосовано до нашого прикладу (середнє = 78,33, SD = 8,64):
- 68% балів: 78,33 ± 8,64 → 69,7 до 86,97
- 95% балів: 78,33 ± 17,28 → 61,05 до 95,61
- 99,7% балів: 78,33 ± 25,92 → 52,41 до 104,25
Дисперсія проти стандартного відхилення
Дисперсія – це квадрат стандартного відхилення: s² = 74,67 у нашому прикладі.
Навіщо використовувати стандартне відхилення замість дисперсії?
- Стандартне відхилення вказано в тих самих одиницях, що й ваші дані (бали, долари, метри)
- Дисперсія в квадратних одиницях — важче інтерпретувати практично
- «Середній бал відхилено на 8,64 бали» має значення; "дисперсія становила 74,67 балів²" - це не так
Використання в реальному світі
Фінанси. Акції з середньою щоденною прибутковістю 0,05% і SD 1,2% набагато ризикованіші, ніж акції з такою ж середньою прибутковістю та SD 0,3%. Стандартне відхилення є основою вимірювання волатильності.
Виробництво: Заводське виробництво болтів із цільовим діаметром 10 мм і SD 0,02 мм є набагато послідовнішим, ніж болти з SD 0,5 мм. Контроль якості покладається на SD.
Медицина: клінічні випробування повідомляють про SD разом із засобами, які показують, наскільки стабільно лікування ефективне для пацієнтів.
Погода: "Середня температура 18°C із SD 4°C" говорить вам набагато більше, ніж сама по собі середня – ви знаєте, що взяти з собою.
Z-оцінки
Z-показник перетворює будь-яке значення в одиниці стандартного відхилення, що дозволяє порівнювати різні набори даних:
z = /x - x̄s
Студент, який набрав 91 бал у нашому прикладі:
z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47
Цей показник на 1,47 стандартного відхилення вище середнього — краще, ніж приблизно 93% класу.
Обчисліть стандартне відхилення зараз
Наш калькулятор статистики обчислює стандартне відхилення, дисперсію, середнє значення, медіану, моду тощо з будь-якого введеного вами набору даних. Вставте свої цифри та миттєво отримайте повні результати.