標準偏差は、平均付近でデータがどの程度広がっているかを示します。標準偏差が小さいということは、データが密にクラスター化されていることを意味します。大きいものは広範囲に散在していることを意味します。
標準偏差が重要な理由
2 つのクラスはどちらもテストで平均 75% でした。ただし、クラス A では、スコアは 70 ~ 80% の範囲です。クラス B では、スコアの範囲は 40 ~ 100% です。平均値は重要な情報を隠しますが、標準偏差は重要な情報を明らかにします。
数式
母集団 (すべてのデータ) の場合:
σ = √[ Σ(x - μ)² / N ]
サンプル (データのサブセット) の場合:
s = √[ Σ(x - x̄)² / (n-1) ]
どこ:
- σ (シグマ) = 母集団標準偏差
- s = サンプル標準偏差
- x = 各値
- μ または x̄ = 平均
- N = 母集団サイズ、n = サンプルサイズ
サンプルの式は、サブセットから推定する際のバイアスを補正するために、n-1 (n ではない) で除算します。
段階的な例
データ: 4、7、13、2、9 (5 つの値のサンプル)
ステップ 1: 平均を計算します:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
ステップ 2: 各値から平均を引いて 2 乗します。
| × | × - 平均 | (x - 平均)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
ステップ 3: 差の二乗を合計します: 9 + 0 + 36 + 25 + 4 = 74
ステップ 4: n-1 = 4 で割る: 74 / 4 = 18.5
ステップ 5: 平方根を計算します: √18.5 ≈ 4.30
標準偏差 = 4.30
68-95-99.7 ルール
正規分布データの場合:
- 68% の値が平均値の ±1 標準偏差以内に収まります
- 95% は ±2 標準偏差以内に収まります
- 99.7% は ±3 標準偏差以内に収まります
例: 平均身長 170 cm、SD 10 cm:
- 68% は 160 ~ 180 cm です
- 95% は 150 ~ 190 cm の間です
現実世界のアプリケーション
- 財務: 投資のボラティリティ (リスク) を測定します。
- 製造: 品質管理 - ±3σを超える製品は欠陥です
- 医学: 異常な検査結果の特定
- 教育: 曲線上の等級付け
標準偏差計算ツール を使用して、任意のデータセットの平均、中央値、分散、標準偏差を計算します。