正規分布 (またはガウス分布) は、統計において最も重要な確率分布です。これは、テストのスコア、高さ、測定誤差、株価収益率など、自然現象がどの程度分布しているかを記述しており、ほとんどの統計的推論と仮説検証の基礎となります。
数式
正規分布の確率密度関数は次のとおりです。
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
どこ:
- μ (μ) = 平均値 (分布の中心)
- σ (シグマ) = 標準偏差 (分布の広がり)
- x = 評価している値
- e ≈ 2.71828
- π ≈ 3.14159
形状は釣鐘型で、値の約 68% が平均の 1 標準偏差以内、95% が 2 標準偏差以内、99.7% が 3 標準偏差以内に収まります (68-95-99.7 ルール)。
実際に動作した例
標準化テストの平均値は 100、標準偏差は 15 です。ランダムなスコアが 115 未満になる確率はどれくらいですか?
まず、Z スコアに変換します。
z = (115 - 100) / 15 = 1.0
Z スコア 1.0 は、115 が平均より 1 標準偏差大きいことを意味します。標準の正規表または計算機を使用すると、P(z ≤ 1.0) ≈ 0.8413 または 84.13% となります。
つまり、受験者の約 84% のスコアは 115 未満です。
主要なプロパティ
正規分布は、平均と標準偏差によって完全に定義されます。平均をシフトすると、曲線が左または右に移動します。標準偏差を増加させると、標準偏差が平坦になり幅が広がります。曲線の下の合計面積は常に 1 に等しくなります。
上記の Z スコア式を使用して、任意の正規分布を標準正規分布 (平均 0、標準偏差 1) に変換できます。この標準化により、1 つの汎用正規テーブルを使用できるようになります。
いつ使用するか
次の場合に正規分布を使用します。
- 中心値の周囲にデータがクラスター化
- 値は釣鐘型のヒストグラムに従います
- 中心極限定理が適用されます (任意の分布からの標本平均は正規分布に近似します)
- 仮説検定または信頼区間を行っている
現実世界のほとんどの連続データはおおよそ正規分布に従っており、これが応用統計の主力となっています。
ヒント
データが正常であると仮定する前に、ヒストグラムまたは Q-Q プロットを使用して正規性を確認してください。データに大きな偏りがある場合、または外れ値がある場合、正規分布は適切ではない可能性があります。非正規データの場合は、ノンパラメトリック テストまたはデータ変換を使用します。
正規分布計算ツール を使用すると、確率、パーセンタイル、Z スコアを即座に見つけることができます。