Стандартне відхилення є найбільш широко використовуваним показником розкиду в статистиці. Він повідомляє вам, наскільки типове значення розташовується від середнього — незалежно від того, чи ваші дані тісно згруповані чи сильно розкидані. Після того, як ви один раз попрацювали над розрахунком вручну, концепція стає інтуїтивно зрозумілою.

Що вам говорить стандартне відхилення

Якщо клас студентів має середній бал іспиту 70 зі стандартним відхиленням 5, більшість балів потрапляє між 65 і 75. Якби стандартне відхилення становило 20, бали коливалися б набагато ширше — від 50 до 90 і більше.

Невелике стандартне відхилення означає послідовність. Великий означає мінливість.

Популяція проти стандартного відхилення вибірки

Існує дві версії, і важливо вибрати правильну:

Стандартне відхилення сукупності (σ): Використовуйте, якщо у вас є дані для кожного члена групи, яка вам цікава. Ділиться на n.

Стандартне відхилення вибірки (s): Використовуйте, коли дані є вибіркою, зібраною з більшої сукупності. Ділиться на n − 1 (поправка Бесселя, яка враховує невизначеність, яку вносить вибірка).

На практиці ви майже завжди використовуєте вибіркове стандартне відхилення, якщо тільки ви не аналізуєте повний перепис або контрольований набір даних без відсутніх елементів.

Покроковий розрахунок

Набір даних: 4, 7, 13, 2, 1 (вибірка з 5 значень)

Крок 1: обчисліть середнє значення

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Крок 2: Знайдіть кожне відхилення від середнього

Відніміть середнє значення від кожного значення:

Значення (x) Відхилення (x − x̄)
4 4 − 5,4 = −1,4
7 7 − 5,4 = +1,6
13 13 − 5,4 = +7,6
2 2 − 5,4 = −3,4
1 1 − 5,4 = −4,4

Крок 3: Зведіть у квадрат кожне відхилення

Зведення в квадрат усуває негативні знаки і підкреслює більші відхилення:

Відхилення Квадрат відхилення
−1,4 1.96
+1.6 2.56
+7.6 57.76
−3,4 11.56
−4,4 19.36

Крок 4: підсумуйте квадрати відхилень

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Крок 5: Розділіть на n − 1 (для зразкового стандартного відхилення)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Крок 6: Витягніть квадратний корінь

Standard deviation (s) = √23.3 = 4.83

Інтерпретація: значення в цьому наборі даних зазвичай відрізняються приблизно на 4,83 одиниці від середнього значення 5,4.

Написана формула

Зразок стандартного відхилення:

s = √[ Σ(x − x̄)² / (n − 1) ]

Стандартне відхилення сукупності:

σ = √[ Σ(x − μ)² / n ]

Де μ (mu) – середнє значення сукупності.

Емпіричне правило (Правило 68-95-99.7)

Для даних, які відповідають нормальному розподілу, стандартне відхилення має надійний зв’язок із часткою даних у кожному діапазоні:

Діапазон Пропорція даних
Середнє ± 1 SD ~68%
Середнє ± 2 SD ~95%
Середнє ± 3 SD ~99,7%

**Приклад: ** Середнє значення показників IQ становить 100, а SD – 15.

  • 68% людей набрали від 85 до 115 балів
  • 95% балів від 70 до 130
  • 99,7% балів від 55 до 145

Це правило стосується лише нормально розподілених даних. Для нерівності або розподілу з важкими хвостами використовуйте натомість нерівність Чебишева.

Дисперсія проти стандартного відхилення

Дисперсія – це квадрат відхилення (крок 5 вище) – стандартне відхилення – квадратний корінь. Обидва вимірюють розповсюдження, але стандартне відхилення виражається в тих самих одиницях, що й вихідні дані, що робить його легшим для інтерпретації.

Якщо ваші дані в кілограмах, стандартне відхилення вказано в кілограмах. Ваша дисперсія виражена в кілограмах в квадраті, що важче тлумачити.

Загальні програми

Фінанси: Вимірювання нестабільності інвестицій. Акція з щоденною прибутковістю, яка має високий SD, є більш мінливою — вищий потенційний прибуток і вищий потенційний збиток.

Контроль якості: Виробництво використовує SD, щоб гарантувати, що продукти залишаються в межах допуску. Процес із надто великим SD створює забагато дефектних елементів.

Освіта: Стандартизація результатів тестів. Z-показник показує, на скільки стандартних відхилень оцінка вище або нижче середнього значення: z = (x − середнє) / SD.

Наука: Вираження невизначеності вимірювання та порівняння результатів експериментів.

Ярлик для розрахунку

Для великих наборів даних використовуйте обчислювальну формулу, яка дозволяє уникнути індивідуального розрахунку відхилень:

s² = [Σx² − (Σx)²/n] / (n − 1)

Це математично еквівалентно, але вимагає лише двох проходів через дані, а не трьох.

Використовуйте наш Калькулятор стандартного відхилення, щоб обчислити SD, дисперсію та повну структуру для будь-якого набору даних, який ви вводите.