«Среднее» — одно из наиболее часто употребляемых и чаще всего неправильно употребляемых слов в математике. В повседневном языке это обычно означает одну конкретную вещь — сложить числа и разделить. Но в статистике есть три различных типа средних значений, каждый из которых подходит для разных ситуаций. Неправильный выбор приводит к ошибочным выводам.
Три типа средних значений
1. Среднее (среднее арифметическое)
Среднее — это то, что большинство людей понимают под «средним». Сложите все значения и разделите на их количество.
Mean = Sum of all values / Number of values
Пример: Результаты тестов: 72, 85, 91, 68, 77, 95, 82.
Сумма = 72 + 85 + 91 + 68 + 77 + 95 + 82 = 570 Количество = 7 Среднее = 570/7 = 81,4
Когда использовать: Когда данные примерно симметричны и не имеют резких выбросов. Хорошо работает для высоты, результатов тестов, температуры.
Когда НЕ использовать: При наличии выбросов. Один миллиардер в группе со средними доходами приводит к тому, что средний доход крайне вводит в заблуждение.
2. Медиана (среднее значение)
Медиана — это среднее значение, когда данные отсортированы по порядку. Половина значений выше него, половина ниже.
Для нечетного числа значений: отсортируйте и выберите среднее. Для четного числа выполните сортировку и возьмите среднее значение двух средних значений.
Пример (нечетный): 72, 68, 85, 91, 77, 95, 82. Сортировка: 68, 72, 77, 82, 85, 91, 95. Медиана = 82
Пример (четный): 68, 72, 77, 82, 85, 91. Два средних: 77 и 82. Медиана = (77 + 82) / 2 = 79,5
Когда использовать: Когда данные имеют выбросы или искажены. Цены на жилье, зарплаты и распределение доходов всегда используют медианное значение, поскольку несколько крайних значений могут исказить среднее значение.
3. Режим (наиболее частое значение)
Режим — это значение, которое появляется чаще всего. Набор данных может иметь один режим (унимодальный), два (бимодальный) или более (мультимодальный). Если ни одно значение не повторяется, режима нет.
Пример: Размеры обуви, проданные за неделю: 6, 7, 7, 8, 8, 8, 9, 9, 10. Режим = 8 (появляется 3 раза)
Когда его использовать: Категориальные данные, ответы на опросы или когда вам нужно наиболее распространенное значение, а не математический центр. Производителя обуви волнует мода, а не средний размер обуви.
Средневзвешенное значение
Если некоторые значения имеют большее значение, чем другие, используйте средневзвешенное значение:
Weighted mean = Σ(value × weight) / Σ(weights)
Пример: Оценки за университетские модули с разным весом кредитов:
| Модуль | Оценка | Кредиты |
|---|---|---|
| Математика | 72 | 30 |
| Английский | 85 | 15 |
| История | 68 | 15 |
| Наука | 91 | 40 |
Средневзвешенное значение = (72×30 + 85×15 + 68×15 + 91×40) / (30+15+15+40) = (2160 + 1275 + 1020 + 3640) / 100 = 8095/100 = 80,95
Это отличается от простого среднего значения 79,0: более высокий кредитный вес модуля «Наука» увеличивает среднее значение.
В расчетах среднего балла, доходности инвестиционного портфеля и выставлении оценок на экзаменах используются взвешенные средние значения.
Среднее геометрическое
Для величин, которые складываются или умножаются (темпы роста, доход от инвестиций), используйте среднее геометрическое:
Geometric mean = (x₁ × x₂ × ... × xₙ)^(1/n)
Пример: Годовая доходность инвестиций +50 %, −30 %, +20 %.
Простое среднее = (+50 − 30 + 20) / 3 = +13,3% — обманчиво оптимистичный прогноз.
Среднее геометрическое = (1,50 × 0,70 × 1,20)^(1/3) - 1 = (1,26)^(1/3) - 1 = 1,0797 - 1 = +7,97% в год
Это отражает фактическое начисление процентов: 1000 фунтов стерлингов → 1500 фунтов стерлингов → 1050 фунтов стерлингов → 1260 фунтов стерлингов, что дает годовой рост на 7,97%, а не на 13,3%.
Какое среднее значение следует использовать?
| Ситуация | Лучшее среднее |
|---|---|
| Симметричные данные, без выбросов | Иметь в виду |
| Присутствуют искаженные данные или выбросы | медиана |
| Требуется наиболее распространенное значение | Режим |
| Ценности имеют разное значение | Взвешенное среднее |
| Ставки, коэффициенты или сложные проценты | Среднее геометрическое |
| Сравнение зарплат/доходов | медиана |
| Статистика цен на жилье | медиана |
| Средние спортивные показатели | Среднее значение (или конкретная формула) |
| Возврат инвестиций на протяжении многих лет | Среднее геометрическое |
Распространенные ошибки
Предполагаем, что «средняя» всегда означает «среднюю». Когда вы видите «среднюю зарплату» в новостях, спросите, является ли она средней или медианной. Среднее значение обычно на 20–30% выше медианного из-за того, что высокооплачиваемые люди искажают данные.
Усреднение процентов без взвешивания. Если в вашем портфеле есть 1000 фунтов стерлингов в фонде А (+10%) и 9000 фунтов стерлингов в фонде Б (+2%), средняя доходность НЕ составит 6%. Это (100 фунтов стерлингов + 180 фунтов стерлингов) / 10 000 фунтов стерлингов = 2,8%.
Игнорирование распределения. Среднее значение может быть одинаковым для самых разных наборов данных. Класс, в котором все набирают 70%, и класс, в котором половина набирает 40%, а половина набирает 100%, имеют одинаковое среднее значение, но очень разные результаты обучения.
Используйте наш Калькулятор среднего, медианы, режима и Калькулятор средневзвешенного значения, чтобы вычислить любой тип среднего значения на основе ваших собственных данных.