Стандартне відхилення є найбільш широко використовуваним показником розкиду в статистиці. Він говорить вам, наскільки розподілені значення навколо середнього. У цьому посібнику пояснюється це з перших принципів і прикладів.

Що вам говорить стандартне відхилення

Середнє значення вказує на центр набору даних. Стандартне відхилення говорить вам, наскільки далеко значення зазвичай відхиляються від цього центру.

Низьке стандартне відхилення → значення, щільно згруповані навколо середнього Високе стандартне відхилення → значення значно відрізняються від середнього

Два екзаменаційні класи в середньому становлять 70%, але:

  • Клас A: бали 68, 69, 70, 71, 72 — SD ≈ 1,4 (дуже постійний)
  • Клас B: бали 40, 55, 70, 85, 100 — SD ≈ 22,4 (дуже варіабельний)

Те саме значення, дуже різні розподіли.

Формула

Є дві версії залежно від того, чи є у вас повна сукупність чи вибірка.

Стандартне відхилення сукупності (σ)

Використовуйте, якщо у вас є дані для кожного члена групи.

σ = √((Σ(x_i - μ)^2) / (N))

Зразок стандартного відхилення (s)

Використовуйте, коли ваші дані є вибіркою з більшої сукупності (найчастіший випадок).

s = √( Σ(x_i − x̄)² / (n − 1) )

Знаменник дорівнює n − 1 (а не n), щоб виправити зміщення, яке виникає в результаті оцінки параметра генеральної сукупності за вибіркою. Це називається поправкою Бесселя.

Покроковий розрахунок

Набір даних: Тестові результати для 6 студентів: 72, 85, 68, 91, 74, 80

Крок 1: Знайдіть середнє значення

x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33

Крок 2: Знайдіть кожне відхилення від середнього

Оцінка Відхилення (x − x̄) Квадрат відхилення
72 −6,33 40.07
85 +6.67 44.49
68 −10,33 106.71
91 +12.67 160.53
74 −4,33 18.75
80 +1.67 2.79

Крок 3: підсумуйте квадрати відхилень

Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34

Крок 4: Розділіть на n − 1 (зразок)

(373.34) / (6 - 1) = (373.34) / (5) = 74.67

Крок 5: Витягніть квадратний корінь

s = √(74.67) = 8.64

Стандартне відхилення становить 8,64 бала. Типовий результат учня приблизно на 8–9 балів відстає від середнього в класі.

Правило 68-95-99.7

Для нормально розподілених даних (дзвоноподібна крива) стандартне відхилення має передбачуваний зв’язок із розповсюдженням:

  • 68% значень знаходяться в межах 1 SD від середнього
  • 95% значень знаходяться в межах 2 SD від середнього
  • 99,7% значень знаходяться в межах 3 SD від середнього

Застосовано до нашого прикладу (середнє = 78,33, SD = 8,64):

  • 68% балів: 78,33 ± 8,64 → 69,7 до 86,97
  • 95% балів: 78,33 ± 17,28 → 61,05 до 95,61
  • 99,7% балів: 78,33 ± 25,92 → 52,41 до 104,25

Дисперсія проти стандартного відхилення

Дисперсія – це квадрат стандартного відхилення: s² = 74,67 у нашому прикладі.

Навіщо використовувати стандартне відхилення замість дисперсії?

  • Стандартне відхилення вказано в тих самих одиницях, що й ваші дані (бали, долари, метри)
  • Дисперсія в квадратних одиницях — важче інтерпретувати практично
  • «Середній бал відхилено на 8,64 бали» має значення; "дисперсія становила 74,67 балів²" - це не так

Використання в реальному світі

Фінанси. Акції з середньою щоденною прибутковістю 0,05% і SD 1,2% набагато ризикованіші, ніж акції з такою ж середньою прибутковістю та SD 0,3%. Стандартне відхилення є основою вимірювання волатильності.

Виробництво: Заводське виробництво болтів із цільовим діаметром 10 мм і SD 0,02 мм є набагато послідовнішим, ніж болти з SD 0,5 мм. Контроль якості покладається на SD.

Медицина: клінічні випробування повідомляють про SD разом із засобами, які показують, наскільки стабільно лікування ефективне для пацієнтів.

Погода: "Середня температура 18°C ​​із SD 4°C" говорить вам набагато більше, ніж сама по собі середня – ви знаєте, що взяти з собою.

Z-оцінки

Z-показник перетворює будь-яке значення в одиниці стандартного відхилення, що дозволяє порівнювати різні набори даних:

z = /x - x̄s

Студент, який набрав 91 бал у нашому прикладі:

z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47

Цей показник на 1,47 стандартного відхилення вище середнього — краще, ніж приблизно 93% класу.

Обчисліть стандартне відхилення зараз

Наш калькулятор статистики обчислює стандартне відхилення, дисперсію, середнє значення, медіану, моду тощо з будь-якого введеного вами набору даних. Вставте свої цифри та миттєво отримайте повні результати.