표준편차는 데이터가 평균을 중심으로 얼마나 분산되어 있는지를 나타냅니다. 표준 편차가 작다는 것은 데이터 클러스터가 촘촘하다는 것을 의미합니다. 큰 것은 널리 흩어져 있음을 의미합니다.
표준편차가 중요한 이유
두 과목 모두 시험에서 평균 75%를 기록합니다. 그러나 A등급에서는 점수 범위가 7080%입니다. 클래스 B의 점수 범위는 40100%입니다. 평균은 중요한 정보를 숨기고, 표준편차는 이를 드러냅니다.
공식
인구(모든 데이터)의 경우:
σ = √[ Σ(x - μ)² / N ]
샘플(데이터 하위 집합)의 경우:
s = √[ Σ(x - x̄)² / (n-1) ]
어디:
- σ(시그마) = 모집단 표준편차
- s = 표본 표준편차
- x = 각 값
- μ 또는 x̄ = 평균
- N = 모집단 크기, n = 표본 크기
표본 공식은 하위 집합에서 추정할 때 편향을 수정하기 위해 n-1(n 아님)로 나눕니다.
단계별 예
데이터: 4, 7, 13, 2, 9(5개 값의 샘플)
1단계: 평균을 계산합니다.
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
2단계: 각 값과 제곱에서 평균을 뺍니다.
| 엑스 | x - 평균 | (x - 평균)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
3단계: 차이 제곱의 합: 9 + 0 + 36 + 25 + 4 = 74
4단계: n-1 = 4로 나누기: 74 / 4 = 18.5
5단계: 제곱근을 구합니다: √18.5 ≒ 4.30
표준편차 = 4.30
68-95-99.7 규칙
정규 분포 데이터의 경우:
- 68% 값이 평균의 ±1 표준편차 내에 속함
- **95%**는 ±2 표준편차 내에 속합니다.
- **99.7%**는 표준편차 ±3 이내
예: 평균 키 170cm, 표준편차 10cm:
- 68%가 160~180cm 사이입니다.
- 95%가 150~190cm 사이입니다.
실제 애플리케이션
- 금융: 투자 변동성(위험) 측정
- 제조: 품질 관리 — ±3σ를 벗어나는 제품은 불량입니다.
- 의학: 이상 검사 결과 확인
- 교육: 곡선 등급 지정
표준편차 계산기를 사용하여 모든 데이터세트의 평균, 중앙값, 분산, 표준편차를 계산하세요.