標準偏差は、平均付近でデータがどの程度広がっているかを示します。標準偏差が小さいということは、データが密にクラスター化されていることを意味します。大きいものは広範囲に散在していることを意味します。

標準偏差が重要な理由

2 つのクラスはどちらもテストで平均 75% でした。ただし、クラス A では、スコアは 70 ~ 80% の範囲です。クラス B では、スコアの範囲は 40 ~ 100% です。平均値は重要な情報を隠しますが、標準偏差は重要な情報を明らかにします。

数式

母集団 (すべてのデータ) の場合:

σ = √[ Σ(x - μ)² / N ]

サンプル (データのサブセット) の場合:

s = √[ Σ(x - x̄)² / (n-1) ]

どこ:

  • σ (シグマ) = 母集団標準偏差
  • s = サンプル標準偏差
  • x = 各値
  • μ または x̄ = 平均
  • N = 母集団サイズ、n = サンプルサイズ

サンプルの式は、サブセットから推定する際のバイアスを補正するために、n-1 (n ではない) で除算します。

段階的な例

データ: 4、7、13、2、9 (5 つの値のサンプル)

ステップ 1: 平均を計算します:

Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7

ステップ 2: 各値から平均を引いて 2 乗します。

× × - 平均 (x - 平均)²
4 -3 9
7 0 0
13 6 36
2 -5 25
9 2 4

ステップ 3: 差の二乗を合計します: 9 + 0 + 36 + 25 + 4 = 74

ステップ 4: n-1 = 4 で割る: 74 / 4 = 18.5

ステップ 5: 平方根を計算します: √18.5 ≈ 4.30

標準偏差 = 4.30

68-95-99.7 ルール

正規分布データの場合:

  • 68% の値が平均値の ±1 標準偏差以内に収まります
  • 95% は ±2 標準偏差以内に収まります
  • 99.7% は ±3 標準偏差以内に収まります

例: 平均身長 170 cm、SD 10 cm:

  • 68% は 160 ~ 180 cm です
  • 95% は 150 ~ 190 cm の間です

現実世界のアプリケーション

  • 財務: 投資のボラティリティ (リスク) を測定します。
  • 製造: 品質管理 - ±3σを超える製品は欠陥です
  • 医学: 異常な検査結果の特定
  • 教育: 曲線上の等級付け

標準偏差計算ツール を使用して、任意のデータセットの平均、中央値、分散、標準偏差を計算します。