정규분포(또는 가우스 분포)는 통계에서 가장 중요한 확률 분포입니다. 이는 테스트 점수, 높이, 측정 오류, 주가 수익률 등 자연 현상이 얼마나 많이 분포되어 있는지 설명하며 대부분의 통계적 추론 및 가설 테스트의 기초입니다.

공식

정규 분포의 확률 밀도 함수는 다음과 같습니다.

f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))

어디:

  • μ(mu) = 평균(분포의 ​​중심)
  • σ(시그마) = 표준 편차(분포의 확산)
  • x = 평가 중인 값
  • e ≒ 2.71828
  • π ≒ 3.14159

모양은 종형 곡선이며, 값의 약 68%가 평균의 1 표준편차 내에, 95%가 2 표준편차 내에, 99.7%가 3 표준편차 내에 속합니다(68-95-99.7 규칙).

작업한 예

표준화된 테스트의 평균은 100이고 표준 편차는 15입니다. 무작위 점수가 115보다 작을 확률은 얼마입니까?

먼저 z-점수로 변환합니다.

z = (115 - 100) / 15 = 1.0

z-점수 1.0은 115가 평균보다 1표준편차 높다는 것을 의미합니다. 표준 정규 테이블이나 계산기를 사용하면 P(z ≤ 1.0) ≒ 0.8413 또는 84.13%입니다.

따라서 응시자의 약 84%가 115점 미만의 점수를 받았습니다.

주요 속성

정규분포는 전적으로 평균과 표준편차로 정의됩니다. 평균을 이동하면 곡선이 왼쪽이나 오른쪽으로 이동합니다. 표준편차를 늘리면 편평해지고 넓어집니다. 곡선 아래의 총 면적은 항상 1과 같습니다.

위의 z-점수 공식을 사용하면 모든 정규 분포를 표준 정규 분포(평균 0, 표준 편차 1)로 변환할 수 있습니다. 이 표준화를 통해 하나의 보편적 정규 테이블을 사용할 수 있습니다.

사용 시기

다음과 같은 경우 정규 분포를 사용합니다.

  • 중앙 가치를 중심으로 한 데이터 클러스터
  • 값은 종 모양의 히스토그램을 따릅니다.
  • 중심 극한 정리가 적용됩니다(샘플은 모든 분포의 대략적인 정규 평균을 의미함).
  • 가설 검정이나 신뢰 구간을 수행 중입니다.

대부분의 실제 연속 데이터는 대략 정규 분포를 따르므로 이를 응용 통계의 주요 도구로 만듭니다.

데이터가 정규라고 가정하기 전에 히스토그램이나 Q-Q 플롯을 사용하여 정규성을 확인하세요. 데이터가 심하게 치우쳐 있거나 특이치가 있는 경우 정규 분포가 적절하지 않을 수 있습니다. 비정규 데이터의 경우 비모수적 테스트 또는 데이터 변환을 사용합니다.

정규 분포 계산기를 사용하면 확률, ​​백분위수, z-점수를 즉시 찾을 수 있습니다.