«Среднее» — одно из наиболее часто употребляемых и чаще всего неправильно употребляемых слов в математике. В повседневном языке это обычно означает одну конкретную вещь — сложить числа и разделить. Но в статистике есть три различных типа средних значений, каждый из которых подходит для разных ситуаций. Неправильный выбор приводит к ошибочным выводам.

Три типа средних значений

1. Среднее (среднее арифметическое)

Среднее — это то, что большинство людей понимают под «средним». Сложите все значения и разделите на их количество.

Mean = Sum of all values / Number of values

Пример: Результаты тестов: 72, 85, 91, 68, 77, 95, 82.

Сумма = 72 + 85 + 91 + 68 + 77 + 95 + 82 = 570 Количество = 7 Среднее = 570/7 = 81,4

Когда использовать: Когда данные примерно симметричны и не имеют резких выбросов. Хорошо работает для высоты, результатов тестов, температуры.

Когда НЕ использовать: При наличии выбросов. Один миллиардер в группе со средними доходами приводит к тому, что средний доход крайне вводит в заблуждение.

2. Медиана (среднее значение)

Медиана — это среднее значение, когда данные отсортированы по порядку. Половина значений выше него, половина ниже.

Для нечетного числа значений: отсортируйте и выберите среднее. Для четного числа выполните сортировку и возьмите среднее значение двух средних значений.

Пример (нечетный): 72, 68, 85, 91, 77, 95, 82. Сортировка: 68, 72, 77, 82, 85, 91, 95. Медиана = 82

Пример (четный): 68, 72, 77, 82, 85, 91. Два средних: 77 и 82. Медиана = (77 + 82) / 2 = 79,5

Когда использовать: Когда данные имеют выбросы или искажены. Цены на жилье, зарплаты и распределение доходов всегда используют медианное значение, поскольку несколько крайних значений могут исказить среднее значение.

3. Режим (наиболее частое значение)

Режим — это значение, которое появляется чаще всего. Набор данных может иметь один режим (унимодальный), два (бимодальный) или более (мультимодальный). Если ни одно значение не повторяется, режима нет.

Пример: Размеры обуви, проданные за неделю: 6, 7, 7, 8, 8, 8, 9, 9, 10. Режим = 8 (появляется 3 раза)

Когда его использовать: Категориальные данные, ответы на опросы или когда вам нужно наиболее распространенное значение, а не математический центр. Производителя обуви волнует мода, а не средний размер обуви.

Средневзвешенное значение

Если некоторые значения имеют большее значение, чем другие, используйте средневзвешенное значение:

Weighted mean = Σ(value × weight) / Σ(weights)

Пример: Оценки за университетские модули с разным весом кредитов:

Модуль Оценка Кредиты
Математика 72 30
Английский 85 15
История 68 15
Наука 91 40

Средневзвешенное значение = (72×30 + 85×15 + 68×15 + 91×40) / (30+15+15+40) = (2160 + 1275 + 1020 + 3640) / 100 = 8095/100 = 80,95

Это отличается от простого среднего значения 79,0: более высокий кредитный вес модуля «Наука» увеличивает среднее значение.

В расчетах среднего балла, доходности инвестиционного портфеля и выставлении оценок на экзаменах используются взвешенные средние значения.

Среднее геометрическое

Для величин, которые складываются или умножаются (темпы роста, доход от инвестиций), используйте среднее геометрическое:

Geometric mean = (x₁ × x₂ × ... × xₙ)^(1/n)

Пример: Годовая доходность инвестиций +50 %, −30 %, +20 %.

Простое среднее = (+50 − 30 + 20) / 3 = +13,3% — обманчиво оптимистичный прогноз.

Среднее геометрическое = (1,50 × 0,70 × 1,20)^(1/3) - 1 = (1,26)^(1/3) - 1 = 1,0797 - 1 = +7,97% в год

Это отражает фактическое начисление процентов: 1000 фунтов стерлингов → 1500 фунтов стерлингов → 1050 фунтов стерлингов → 1260 фунтов стерлингов, что дает годовой рост на 7,97%, а не на 13,3%.

Какое среднее значение следует использовать?

Ситуация Лучшее среднее
Симметричные данные, без выбросов Иметь в виду
Присутствуют искаженные данные или выбросы медиана
Требуется наиболее распространенное значение Режим
Ценности имеют разное значение Взвешенное среднее
Ставки, коэффициенты или сложные проценты Среднее геометрическое
Сравнение зарплат/доходов медиана
Статистика цен на жилье медиана
Средние спортивные показатели Среднее значение (или конкретная формула)
Возврат инвестиций на протяжении многих лет Среднее геометрическое

Распространенные ошибки

Предполагаем, что «средняя» всегда означает «среднюю». Когда вы видите «среднюю зарплату» в новостях, спросите, является ли она средней или медианной. Среднее значение обычно на 20–30% выше медианного из-за того, что высокооплачиваемые люди искажают данные.

Усреднение процентов без взвешивания. Если в вашем портфеле есть 1000 фунтов стерлингов в фонде А (+10%) и 9000 фунтов стерлингов в фонде Б (+2%), средняя доходность НЕ составит 6%. Это (100 фунтов стерлингов + 180 фунтов стерлингов) / 10 000 фунтов стерлингов = 2,8%.

Игнорирование распределения. Среднее значение может быть одинаковым для самых разных наборов данных. Класс, в котором все набирают 70%, и класс, в котором половина набирает 40%, а половина набирает 100%, имеют одинаковое среднее значение, но очень разные результаты обучения.

Используйте наш Калькулятор среднего, медианы, режима и Калькулятор средневзвешенного значения, чтобы вычислить любой тип среднего значения на основе ваших собственных данных.