Медиана — это среднее значение в отсортированном наборе данных. Это один из трех основных показателей центральной тенденции — наряду со средним значением и модой — и он особенно полезен, когда ваши данные содержат выбросы или искаженные значения.

Что такое медиана?

Медиана делит набор данных ровно пополам: 50% значений находятся ниже нее, а 50% — выше нее. В отличие от среднего значения, на медиану не влияют экстремальные значения.

Пример: Средняя зарплата в 50 000 долларов говорит вам больше о типичном работнике, чем средняя зарплата в 90 000 долларов, которую подняла горстка руководителей, зарабатывающих миллионы.

Как найти медиану: нечетное количество значений

Шаг 1. Отсортируйте все значения в порядке возрастания (от меньшего к большему).

Шаг 2. Найдите среднее значение — то, в котором количество значений с каждой стороны одинаково.

Пример: Набор данных: 7, 3, 5, 1, 9.

  1. Сортировка: 1, 3, 5, 7, 9.
  2. Среднее значение — 5 (2 значения ниже, 2 значения выше).

Медиана – 5.

Как найти медиану: четное количество значений

Когда имеется четное количество значений, нет единого среднего значения — их два. Медиана — это среднее значение этих двух средних значений.

Шаг 1. Отсортируйте все значения в порядке возрастания.

Шаг 2. Определите два средних значения.

Шаг 3. Сложите их и разделите на 2.

Пример: Набор данных: 4, 8, 6, 2, 10, 3.

  1. Сортировка: 2, 3, 4, 6, 8, 10.
  2. Два средних значения — 4 и 6.
  3. Медиана = (4 + 6) / 2 = 5

Медиана – 5.

Нахождение средней позиции

Для любого набора данных из n значений средняя позиция:

  • Нечетное n: Позиция = (n + 1) / 2
  • Четное n: Средние позиции n/2 и (n/2) + 1
n значений Среднее положение
5 Позиция 3
7 Позиция 4
10 Среднее позиций 5 и 6
12 Среднее позиций 6 и 7

Рабочий пример: больший набор данных

Набор данных: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

Шаг 1: Подсчет: 12 значений (четных)

Шаг 2: Сортировка: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31.

Шаг 3: Средние позиции — это 6-е и 7-е значения = 17 и 18.

Шаг 4: Медиана = (17 + 18) / 2 = 17,5

Медиана или среднее значение: что следует использовать?

Ситуация Лучшая мера
Данные имеют выбросы медиана
Данные искажены (например, доход) медиана
Симметричное распределение Либо (среднее точнее)
Категориальные или порядковые данные медиана
Необходимо использовать в дальнейших расчетах Иметь в виду

Практическое правило: Если среднее значение и медиана сильно различаются, ваши данные искажены. Укажите медиану как более репрезентативное значение.

Медиана сгруппированных данных

Когда данные представлены в таблицах частот или сгруппированных интервалах, медиану можно оценить с помощью интерполяции.

Пример:

Счет Частота Совокупная частота
0–20 3 3
21–40 7 10
41–60 12 22
61–80 8 30
81–100 5 35

Итого: 35 значений. Медианой является 18-е значение (позиция = (35+1)/2 = 18).

18-е значение попадает в группу 41–60 (кумулятивная частота в этой группе достигает 22, а до этого была 10).

Median ≈ L + [(n/2 − F) / f] × h

Где:

  • L = нижняя граница медианного класса = 41
  • n = общая частота = 35
  • F = совокупная частота до медианного класса = 10
  • f = частота медианного класса = 12
  • h = ширина класса = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Взвешенная медиана

Если точки данных имеют разные веса или важность, используйте взвешенную медиану — значение, при котором совокупный вес достигает 50%.

Примеры из реальной жизни

Цены на жилье. Средняя цена дома в городе лучше отражает «типичный» дом, чем среднюю цену, которая может быть искажена несколькими роскошными объектами недвижимости.

Результаты тестов. Если большинство учащихся набирают 60–70 баллов, но некоторые набирают 100 баллов, средний балл более информативен, чем средний балл.

Время ответа. В веб-производительности среднее время ответа показывает, что испытывает типичный пользователь, тогда как среднее значение может быть испорчено случайными медленными запросами.

Распространенные ошибки

Без предварительной сортировки — необходимо отсортировать данные, прежде чем найти среднее значение.

С отклонением на единицу позиции — для 9 значений медиана находится в позиции 5, а не в позиции 4,5.

Использование среднего значения для четных наборов данных. Для четного числа значений всегда усредняйте два средних значения.


Читать дальше