Нормальное распределение (или распределение Гаусса) является наиболее важным распределением вероятностей в статистике. Он описывает, как распределены многие природные явления — результаты тестов, высоты, ошибки измерений, доходность акций — и является основой большинства статистических выводов и проверки гипотез.

Формула

Функция плотности вероятности для нормального распределения:

f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))

Где:

  • μ (мю) = среднее значение (центр распределения)
  • σ (сигма) = стандартное отклонение (разброс распределения)
  • x = значение, которое вы оцениваете
  • е ≈ 2,71828
  • π ≈ 3,14159

Форма имеет колоколообразную кривую, и около 68% значений находятся в пределах 1 стандартного отклонения от среднего значения, 95% — в пределах 2 стандартных отклонений и 99,7% — в пределах 3 стандартных отклонений (правило 68–95–99,7).

Рабочий пример

Стандартизированный тест имеет среднее значение 100 и стандартное отклонение 15. Какова вероятность того, что случайный результат будет меньше 115?

Сначала преобразуйте в z-показатель:

z = (115 - 100) / 15 = 1.0

Z-показатель 1,0 означает, что 115 на одно стандартное отклонение выше среднего. Используя стандартную нормальную таблицу или калькулятор, P(z ≤ 1,0) ≈ 0,8413 или 84,13%.

Таким образом, около 84% тестируемых набирают балл ниже 115.

Ключевые свойства

Нормальное распределение полностью определяется его средним значением и стандартным отклонением. Сдвиг среднего значения перемещает кривую влево или вправо; увеличение стандартного отклонения сглаживает и расширяет его. Общая площадь под кривой всегда равна 1.

Любое нормальное распределение можно преобразовать в стандартное нормальное распределение (среднее значение 0, стандартное отклонение 1), используя приведенную выше формулу z-показателя. Такая стандартизация позволяет использовать одну универсальную нормальную таблицу.

Когда использовать

Используйте нормальное распределение, когда:

  • Кластеры данных вокруг центрального значения
  • Значения соответствуют колоколообразной гистограмме.
  • Применяется центральная предельная теорема (выборочные средние из любого распределения приближаются к нормальному)
  • Вы проводите проверку гипотез или доверительные интервалы.

Большинство реальных непрерывных данных примерно соответствуют нормальному распределению, что делает их рабочей лошадкой прикладной статистики.

Советы

Прежде чем считать данные нормальными, проверьте нормальность с помощью гистограммы или графика QQ. Если данные сильно искажены или имеют выбросы, нормальное распределение может оказаться неприемлемым. Для ненормальных данных используйте непараметрические тесты или преобразование данных.

Используйте наш Калькулятор нормального распределения, чтобы мгновенно найти вероятности, процентили и z-показатели.