“平均”是数学中最常用和最误用的词之一。在日常语言中,它通常意味着一件特定的事情——将数字相加并除以。但在统计学中,平均值分为三种不同类型,每种类型适用于不同的情况。选择错误会导致误导性的结论。
平均值的三种类型
1. 平均值(算术平均值)
平均值就是大多数人所说的“平均值”。将所有值相加并除以有多少。
Mean = Sum of all values / Number of values
示例: 测试成绩:72、85、91、68、77、95、82
总和 = 72 + 85 + 91 + 68 + 77 + 95 + 82 = 570 计数 = 7 平均值 = 570 / 7 = 81.4
何时使用它: 当数据大致对称且没有极端异常值时。适用于测量身高、测试成绩、温度。
**何时不使用它:**当存在异常值时。一位亿万富翁与一屋子普通收入者一起,使得平均收入极具误导性。
2.中位数(中间值)
中位数是数据按顺序排序后位于中间的值。一半的值高于它,一半低于它。
**对于奇数个值:**排序并取中间的值。 **对于偶数:**排序并取两个中间值的平均值。
示例(奇数): 72、68、85、91、77、95、82 排序:68、72、77、82、85、91、95 中位数 = 82
示例(偶数): 68、72、77、82、85、91 中间两个:77 和 82 中位数 = (77 + 82) / 2 = 79.5
何时使用它: 当数据存在异常值或存在偏差时。房价、工资和收入分配总是使用中位数,因为少数极端值会扭曲平均值。
3.众数(最常见的值)
众数是最常出现的值。数据集可以有一种模式(单峰)、两种(双峰)或更多(多峰)。如果没有值重复,则没有众数。
示例: 一周内售出的鞋子尺码:6, 7, 7, 8, 8, 8, 9, 9, 10 众数 = 8(出现 3 次)
何时使用它: 分类数据、调查回复,或者当您需要最常见的值而不是数学中心时。鞋子制造商关心的是款式,而不是平均鞋码。
加权平均值
当某些值比其他值更重要时,请使用加权平均值:
Weighted mean = Σ(value × weight) / Σ(weights)
示例: 具有不同学分权重的大学模块成绩:
| 模块 | 年级 | 制作人员 |
|---|---|---|
| 数学 | 72 | 30 |
| 英语 | 85 | 15 |
| 历史 | 68 | 15 |
| 科学 | 91 | 40 |
加权平均值 = (72×30 + 85×15 + 68×15 + 91×40) / (30+15+15+40) = (2,160 + 1,275 + 1,020 + 3,640) / 100 = 8,095 / 100 = 80.95
这与 79.0 的简单平均值不同——科学模块较高的学分权重拉高了平均值。
GPA 计算、投资组合回报和考试评分均使用加权平均值。
几何平均值
对于复合或乘数的数量(增长率、投资回报),使用几何平均值:
Geometric mean = (x₁ × x₂ × ... × xₙ)^(1/n)
示例: 年投资回报率为+50%、−30%、+20%
简单平均值 = (+50 − 30 + 20) / 3 = +13.3% — 乐观误导
几何平均值 = (1.50 × 0.70 × 1.20)^(1/3) − 1 = (1.26)^(1/3) − 1 = 1.0797 − 1 =每年+7.97%
这反映了实际的复利:1,000英镑→1,500英镑→1,050英镑→1,260英镑,年化增长率为7.97%——而不是13.3%。
您应该使用哪个平均值?
| 情况 | 最佳平均值 |
|---|---|
| 数据对称,无异常值 | 意思是 |
| 存在偏差数据或异常值 | 中位数 |
| 所需的最常见值 | 模式 |
| 价值观有不同的重要性 | 加权平均值 |
| 比率、比率或复利 | 几何平均数 |
| 薪资/收入比较 | 中位数 |
| 房价统计 | 中位数 |
| 体育运动击球率 | 平均值(或具体公式) |
| 历年投资回报 | 几何平均数 |
常见错误
假设“平均”总是意味着平均。 当您在新闻报道中看到“平均工资”时,询问它是平均还是中位数。由于高收入者扭曲了数据,平均值通常比中位数高 20-30%。
不加权的平均百分比。 如果您的投资组合中基金 A 为 1,000 英镑(+10%),基金 B 为 9,000 英镑(+2%),则平均回报率不是 6%。是(100 英镑 + 180 英镑)/10,000 英镑 = 2.8%。
忽略分布。 对于非常不同的数据集,平均值可能相同。每个人都得分 70% 的班级和一半人得分 40% 和一半人得分 100% 的班级具有相同的平均值,但学习结果却截然不同。
使用我们的平均值、中位数、众数计算器 和加权平均值计算器 根据您自己的数据计算任何类型的平均值。