Стандартное отклонение является наиболее широко используемой мерой разброса в статистике. Он сообщает вам, насколько далеко типичное значение находится от среднего значения — являются ли ваши данные плотно кластеризованными или сильно разбросанными. После того как вы один раз выполнили расчет вручную, концепция становится интуитивно понятной.

О чем говорит стандартное отклонение

Если класс студентов имеет средний балл на экзамене 70 со стандартным отклонением 5, большинство баллов попадает в диапазон от 65 до 75. Если бы стандартное отклонение было 20, оценки варьировались бы гораздо шире — от 50 до 90 и выше.

Небольшое стандартное отклонение означает последовательность. Большой означает изменчивость.

Население и выборочное стандартное отклонение

Есть две версии, и важно выбрать правильную:

Стандартное отклонение совокупности (σ): Используйте, если у вас есть данные по каждому члену интересующей вас группы. Делит на n.

Стандартное отклонение выборки (s): Используйте, если ваши данные представляют собой выборку, полученную из более крупной совокупности. Делит на n − 1 (поправка Бесселя, учитывающая неопределенность, вносимую выборкой).

На практике вы почти всегда используете стандартное отклонение выборки — если только вы не анализируете полную перепись или контролируемый набор данных без недостающих элементов.

Пошаговый расчет

Набор данных: 4, 7, 13, 2, 1 (выборка из 5 значений)

Шаг 1. Вычислите среднее значение

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Шаг 2. Найдите каждое отклонение от среднего значения.

Вычтите среднее значение из каждого значения:

Значение (х) Отклонение (x − x̄)
4 4 - 5,4 = -1,4
7 7 − 5,4 = +1,6
13 13 − 5,4 = +7,6
2 2 - 5,4 = -3,4
1 1 - 5,4 = -4,4

Шаг 3. Возведите каждое отклонение в квадрат

Возведение в квадрат устраняет отрицательные признаки и подчеркивает более крупные отклонения:

Отклонение Квадрат отклонения
−1,4 1.96
+1.6 2.56
+7.6 57.76
−3,4 11.56
−4,4 19.36

Шаг 4. Суммируйте квадраты отклонений

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Шаг 5: Разделите на n − 1 (для выборочного стандартного отклонения)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Шаг 6: Извлеките квадратный корень

Standard deviation (s) = √23.3 = 4.83

Интерпретация: Значения в этом наборе данных обычно отклоняются примерно на 4,83 единицы от среднего значения 5,4.

Формула записана

Выборочное стандартное отклонение:

s = √[ Σ(x − x̄)² / (n − 1) ]

Стандартное отклонение совокупности:

σ = √[ Σ(x − μ)² / n ]

Где μ (мю) — среднее значение численности населения.

Эмпирическое правило (правило 68-95-99,7)

Для данных, которые соответствуют нормальному распределению, стандартное отклонение имеет надежную связь с долей данных в каждом диапазоне:

Диапазон Доля данных
Среднее ± 1 стандартное отклонение ~68%
Среднее ± 2 СО ~95%
Среднее ± 3 СО ~99,7%

Прикладной пример: среднее значение IQ равно 100, а стандартное отклонение — 15.

  • 68% людей набирают от 85 до 115 баллов.
  • 95% получают от 70 до 130
  • 99,7% баллов между 55 и 145

Это правило применимо только к нормально распределенным данным. Для асимметричных распределений или распределений с тяжелыми хвостами вместо этого используйте неравенство Чебышева.

Дисперсия против стандартного отклонения

Дисперсия – это квадрат отклонения (шаг 5 выше), а стандартное отклонение – это его квадратный корень. Оба измеряют разброс, но стандартное отклонение выражается в тех же единицах, что и исходные данные, что делает их более интерпретируемыми.

Если ваши данные указаны в килограммах, ваше стандартное отклонение будет в килограммах. Ваша дисперсия выражена в килограммах в квадрате, что труднее интерпретировать осмысленно.

Общие приложения

Финансы. Измерение волатильности инвестиций. Акции с дневной доходностью и высоким SD более волатильны: более высокий потенциальный доход и более высокий потенциальный убыток.

Контроль качества. Производство использует SD, чтобы гарантировать соответствие продукции допускам. Процесс со слишком большим SD производит слишком много дефектных изделий.

Образование: стандартизация результатов тестов. Z-показатель показывает, на сколько стандартных отклонений показатель находится выше или ниже среднего: z = (x − среднее) / SD.

Наука: выражение неопределенности измерений и сравнение экспериментальных результатов.

Ярлык для расчета

Для больших наборов данных используйте расчетную формулу, которая позволяет избежать индивидуального расчета отклонений:

s² = [Σx² − (Σx)²/n] / (n − 1)

Это математически эквивалентно, но требует только двух проходов по данным, а не трех.

Используйте наш Калькулятор стандартного отклонения, чтобы рассчитать стандартное отклонение, дисперсию и полную разбивку для любого введенного вами набора данных.