표준편차는 통계에서 가장 널리 사용되는 확산 척도입니다. 이는 평균 주위에 값이 얼마나 분산되어 있는지 알려줍니다. 이 가이드에서는 실제 사례를 통해 첫 번째 원칙부터 설명합니다.
표준편차가 알려주는 것
평균은 데이터세트의 중심을 알려줍니다. 표준편차는 값이 일반적으로 해당 중심에서 얼마나 멀리 떨어져 있는지를 알려줍니다.
낮은 표준 편차 → 값이 평균 주위에 밀집되어 있음 높은 표준편차 → 값이 평균에서 넓게 퍼져 있음
두 시험 과목 모두 평균 70%이지만:
- 클래스 A: 점수 68, 69, 70, 71, 72 — SD ≒ 1.4(매우 일관됨)
- 클래스 B: 점수 40, 55, 70, 85, 100 — SD ≒ 22.4(매우 가변적)
같은 의미, 매우 다른 분포.
공식
전체 모집단 또는 표본이 있는지 여부에 따라 두 가지 버전이 있습니다.
모집단 표준편차(σ)
그룹의 모든 구성원에 대한 데이터가 있는 경우 사용합니다.
σ = √((Σ(x_i - μ)^2) / (N))
샘플 표준편차
데이터가 더 큰 모집단의 표본일 때 사용합니다(가장 일반적인 경우).
s = √( Σ(x_i − x̄)² / (n − 1) )
표본에서 모집단 모수를 추정하여 발생하는 편향을 수정하기 위해 분모는 n − 1(n이 아님)입니다. 이를 베셀 보정(Bessel's Correction)이라고 합니다.
단계별 계산
데이터세트: 학생 6명의 시험 점수: 72, 85, 68, 91, 74, 80
1단계: 평균 찾기
x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33
2단계: 평균으로부터의 각 편차 찾기
| 점수 | 편차(x − x̄) | 제곱편차 |
|---|---|---|
| 72 | -6.33 | 40.07 |
| 85 | +6.67 | 44.49 |
| 68 | -10.33 | 106.71 |
| 91 | +12.67 | 160.53 |
| 74 | -4.33 | 18.75 |
| 80 | +1.67 | 2.79 |
3단계: 편차 제곱의 합
Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34
4단계: n − 1로 나누기(샘플)
(373.34) / (6 - 1) = (373.34) / (5) = 74.67
5단계: 제곱근을 구합니다
s = √(74.67) = 8.64
표준편차는 8.64포인트입니다. 일반적인 학생 점수는 학급 평균에서 약 8~9점 떨어져 있습니다.
68-95-99.7 규칙
정규 분포 데이터(종형 곡선)의 경우 표준 편차는 스프레드와 예측 가능한 관계를 갖습니다.
- 값의 **68%**가 평균의 1 SD 내에 속합니다.
- 값의 **95%**가 평균의 2 SD 내에 속합니다.
- 값의 **99.7%**가 평균의 3 SD 내에 속합니다.
예제에 적용(평균 = 78.33, SD = 8.64):
- 점수의 68%: 78.33 ± 8.64 → 69.7 ~ 86.97
- 점수의 95%: 78.33 ± 17.28 → 61.05 ~ 95.61
- 99.7% 점수: 78.33 ± 25.92 → 52.41 ~ 104.25
분산 대 표준편차
분산은 제곱 표준 편차입니다. 이 예에서는 s² = 74.67입니다.
분산 대신 표준편차를 사용하는 이유는 무엇입니까?
- 표준 편차는 데이터와 동일한 단위(포인트, 달러, 미터)입니다.
- 분산은 제곱 단위이므로 실제로 해석하기가 더 어렵습니다.
- "8.64점 차이가 있는 평균점수"는 의미가 있습니다. "차이는 74.67포인트²였습니다."는 그렇지 않습니다.
실제 사용
금융: 일일 평균 수익률이 0.05%이고 SD가 1.2%인 주식은 동일한 평균 수익률과 SD가 0.3%인 주식보다 훨씬 더 위험합니다. 표준편차는 변동성 측정의 기초입니다.
제조: 목표 직경이 10mm이고 SD가 0.02mm인 볼트를 생산하는 공장은 SD가 0.5mm인 공장보다 훨씬 더 일관성이 있습니다. 품질 관리는 SD에 의존합니다.
의학: 임상 실험에서는 환자들에게 치료가 얼마나 일관되게 효과가 있었는지를 보여주는 수단과 함께 SD를 보고합니다.
날씨: "평균 기온 18°C, SD 4°C"를 보면 평균보다 훨씬 더 많은 정보를 알 수 있습니다. 무엇을 준비해야 할지 알 수 있습니다.
Z-점수
z-점수는 모든 값을 표준 편차 단위로 변환하여 다양한 데이터 세트 간의 비교를 가능하게 합니다.
z = /x - x̄s
이 예에서 91점을 받은 학생은 다음과 같습니다.
z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47
이 점수는 평균보다 1.47 표준편차 높으며, 전체 클래스의 약 93%보다 좋습니다.
지금 표준편차를 계산해보세요
당사의 통계 계산기는 귀하가 입력한 모든 데이터 세트에서 표준 편차, 분산, 평균, 중앙값, 최빈값 등을 계산합니다. 숫자를 붙여넣고 전체 결과를 즉시 얻으세요.