Стандартное отклонение является наиболее широко используемой мерой разброса в статистике. Он сообщает вам, насколько далеко типичное значение находится от среднего значения — являются ли ваши данные плотно кластеризованными или сильно разбросанными. После того как вы один раз выполнили расчет вручную, концепция становится интуитивно понятной.
О чем говорит стандартное отклонение
Если класс студентов имеет средний балл на экзамене 70 со стандартным отклонением 5, большинство баллов попадает в диапазон от 65 до 75. Если бы стандартное отклонение было 20, оценки варьировались бы гораздо шире — от 50 до 90 и выше.
Небольшое стандартное отклонение означает последовательность. Большой означает изменчивость.
Население и выборочное стандартное отклонение
Есть две версии, и важно выбрать правильную:
Стандартное отклонение совокупности (σ): Используйте, если у вас есть данные по каждому члену интересующей вас группы. Делит на n.
Стандартное отклонение выборки (s): Используйте, если ваши данные представляют собой выборку, полученную из более крупной совокупности. Делит на n − 1 (поправка Бесселя, учитывающая неопределенность, вносимую выборкой).
На практике вы почти всегда используете стандартное отклонение выборки — если только вы не анализируете полную перепись или контролируемый набор данных без недостающих элементов.
Пошаговый расчет
Набор данных: 4, 7, 13, 2, 1 (выборка из 5 значений)
Шаг 1. Вычислите среднее значение
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Шаг 2. Найдите каждое отклонение от среднего значения.
Вычтите среднее значение из каждого значения:
| Значение (х) | Отклонение (x − x̄) |
|---|---|
| 4 | 4 - 5,4 = -1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 - 5,4 = -3,4 |
| 1 | 1 - 5,4 = -4,4 |
Шаг 3. Возведите каждое отклонение в квадрат
Возведение в квадрат устраняет отрицательные признаки и подчеркивает более крупные отклонения:
| Отклонение | Квадрат отклонения |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3,4 | 11.56 |
| −4,4 | 19.36 |
Шаг 4. Суммируйте квадраты отклонений
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Шаг 5: Разделите на n − 1 (для выборочного стандартного отклонения)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Шаг 6: Извлеките квадратный корень
Standard deviation (s) = √23.3 = 4.83
Интерпретация: Значения в этом наборе данных обычно отклоняются примерно на 4,83 единицы от среднего значения 5,4.
Формула записана
Выборочное стандартное отклонение:
s = √[ Σ(x − x̄)² / (n − 1) ]
Стандартное отклонение совокупности:
σ = √[ Σ(x − μ)² / n ]
Где μ (мю) — среднее значение численности населения.
Эмпирическое правило (правило 68-95-99,7)
Для данных, которые соответствуют нормальному распределению, стандартное отклонение имеет надежную связь с долей данных в каждом диапазоне:
| Диапазон | Доля данных |
|---|---|
| Среднее ± 1 стандартное отклонение | ~68% |
| Среднее ± 2 СО | ~95% |
| Среднее ± 3 СО | ~99,7% |
Прикладной пример: среднее значение IQ равно 100, а стандартное отклонение — 15.
- 68% людей набирают от 85 до 115 баллов.
- 95% получают от 70 до 130
- 99,7% баллов между 55 и 145
Это правило применимо только к нормально распределенным данным. Для асимметричных распределений или распределений с тяжелыми хвостами вместо этого используйте неравенство Чебышева.
Дисперсия против стандартного отклонения
Дисперсия – это квадрат отклонения (шаг 5 выше), а стандартное отклонение – это его квадратный корень. Оба измеряют разброс, но стандартное отклонение выражается в тех же единицах, что и исходные данные, что делает их более интерпретируемыми.
Если ваши данные указаны в килограммах, ваше стандартное отклонение будет в килограммах. Ваша дисперсия выражена в килограммах в квадрате, что труднее интерпретировать осмысленно.
Общие приложения
Финансы. Измерение волатильности инвестиций. Акции с дневной доходностью и высоким SD более волатильны: более высокий потенциальный доход и более высокий потенциальный убыток.
Контроль качества. Производство использует SD, чтобы гарантировать соответствие продукции допускам. Процесс со слишком большим SD производит слишком много дефектных изделий.
Образование: стандартизация результатов тестов. Z-показатель показывает, на сколько стандартных отклонений показатель находится выше или ниже среднего: z = (x − среднее) / SD.
Наука: выражение неопределенности измерений и сравнение экспериментальных результатов.
Ярлык для расчета
Для больших наборов данных используйте расчетную формулу, которая позволяет избежать индивидуального расчета отклонений:
s² = [Σx² − (Σx)²/n] / (n − 1)
Это математически эквивалентно, но требует только двух проходов по данным, а не трех.
Используйте наш Калькулятор стандартного отклонения, чтобы рассчитать стандартное отклонение, дисперсию и полную разбивку для любого введенного вами набора данных.