"평균"은 수학에서 가장 많이 사용되고 가장 오용되는 단어 중 하나입니다. 일상 언어에서는 일반적으로 숫자를 더하고 나누는 특정한 일을 의미합니다. 그러나 통계에는 서로 다른 상황에 적합한 세 가지 유형의 평균이 있습니다. 잘못된 것을 선택하면 잘못된 결론을 얻게 됩니다.
평균의 세 가지 유형
1. 평균(산술 평균)
평균은 대부분의 사람들이 "평균"으로 의미하는 것입니다. 모든 값을 더하고 개수로 나눕니다.
Mean = Sum of all values / Number of values
예: 시험 점수: 72, 85, 91, 68, 77, 95, 82
합계 = 72 + 85 + 91 + 68 + 77 + 95 + 82 = 570 개수 = 7 평균 = 570 / 7 = 81.4
사용 시기: 데이터가 극단적인 이상값 없이 대략 대칭인 경우. 키, 시험 점수, 온도에 적합합니다.
사용하지 말아야 할 경우: 이상값이 존재할 때. 평균 소득자가 있는 방에 있는 한 억만장자는 평균 소득을 극도로 오해하게 만듭니다.
2. 중앙값(중간값)
중앙값은 데이터를 순서대로 정렬했을 때 가운데 있는 값입니다. 값의 절반은 그 위에 있고 절반은 아래에 있습니다.
홀수의 값인 경우: 정렬하여 가운데 값을 가져옵니다. 짝수의 경우: 정렬하여 두 중간 값의 평균을 취합니다.
예(홀수): 72, 68, 85, 91, 77, 95, 82 정렬: 68, 72, 77, 82, 85, 91, 95 중앙값 = 82
예(짝수): 68, 72, 77, 82, 85, 91 중간 2: 77 및 82 중앙값 = (77 + 82) / 2 = 79.5
사용 시기: 데이터에 이상값이 있거나 왜곡된 경우. 소수의 극단값이 평균을 왜곡할 수 있으므로 주택 가격, 급여 및 소득 분포는 항상 중앙값을 사용합니다.
3. 모드(가장 자주 사용되는 값)
모드는 가장 자주 나타나는 값입니다. 데이터 세트에는 하나의 모드(단봉), 두 개(이봉) 또는 그 이상(다중 모드)이 있을 수 있습니다. 값이 반복되지 않으면 모드가 없는 것입니다.
예: 일주일 동안 판매된 신발 사이즈: 6, 7, 7, 8, 8, 8, 9, 9, 10 모드 = 8 (3회 등장)
사용 시기: 범주형 데이터, 설문 조사 응답 또는 수학 센터가 아닌 가장 일반적인 값이 필요한 경우. 신발 제조업체는 평균 신발 사이즈가 아닌 모드에 관심을 갖습니다.
가중 평균
일부 값이 다른 값보다 더 많이 계산되는 경우 가중 평균을 사용하세요.
Weighted mean = Σ(value × weight) / Σ(weights)
예: 학점 가중치가 다른 대학 모듈 성적:
| 기준 치수 | 등급 | 크레딧 |
|---|---|---|
| 수학 | 72 | 30 |
| 영어 | 85 | 15 |
| 역사 | 68 | 15 |
| 과학 | 91 | 40 |
가중 평균 = (72×30 + 85×15 + 68×15 + 91×40) / (30+15+15+40) = (2,160 + 1,275 + 1,020 + 3,640) / 100 = 8,095 / 100 = 80.95
이는 단순 평균 79.0과 다릅니다. 과학 모듈의 높은 신용 가중치로 인해 평균이 높아집니다.
GPA 계산, 투자 포트폴리오 수익 및 시험 표시는 모두 가중 평균을 사용합니다.
기하평균
복합되거나 곱해지는 수량(성장률, 투자 수익)의 경우 기하 평균을 사용합니다.
Geometric mean = (x₁ × x₂ × ... × xₙ)^(1/n)
예: 연간 투자 수익 +50%, −30%, +20%
단순 평균 = (+50 − 30 + 20) / 3 = +13.3% — 오해의 여지가 있을 정도로 낙관적
기하평균 = (1.50 × 0.70 × 1.20)^(1/3) − 1 = (1.26)^(1/3) − 1 = 1.0797 - 1 = 연간 +7.97%
이는 실제 복리 계산을 반영합니다: £1,000 → £1,500 → £1,050 → £1,260, 연간 성장률은 13.3%가 아니라 7.97%입니다.
어떤 평균을 사용해야 합니까?
| 상황 | 최고 평균 |
|---|---|
| 대칭 데이터, 이상값 없음 | 평균 |
| 왜곡된 데이터 또는 이상값 존재 | 중앙값 |
| 필요한 가장 일반적인 값 | 방법 |
| 가치의 중요성은 다양하다 | 가중 평균 |
| 금리, 비율 또는 복리 | 기하평균 |
| 급여/소득 비교 | 중앙값 |
| 집값통계 | 중앙값 |
| 스포츠 타율 | 평균(또는 특정 공식) |
| 수년간의 투자 수익 | 기하평균 |
흔히 저지르는 실수
"평균"은 항상 평균을 의미한다고 가정합니다. 뉴스 보도에서 "평균 급여"를 보면 그것이 평균인지 중간인지 물어보세요. 고소득자의 데이터 왜곡으로 인해 평균은 일반적으로 중앙값보다 20~30% 더 높습니다.
가중치를 적용하지 않은 평균 비율. 포트폴리오에 펀드 A에 £1,000(+10%), 펀드 B에 £9,000(+2%)가 있는 경우 평균 수익률은 6%가 아닙니다. (£100 + £180) / £10,000 = 2.8%입니다.
분포를 무시합니다. 매우 다른 데이터세트에서도 평균은 동일할 수 있습니다. 모두가 70% 점수를 받는 수업과 반 점수가 40%, 반 점수가 100%인 수업은 평균은 같지만 학습 결과는 매우 다릅니다.
평균, 중앙값, 모드 계산기 및 가중 평균 계산기를 사용하여 자체 데이터에서 모든 유형의 평균을 계산하세요.