정규분포(또는 가우스 분포)는 통계에서 가장 중요한 확률 분포입니다. 이는 테스트 점수, 높이, 측정 오류, 주가 수익률 등 자연 현상이 얼마나 많이 분포되어 있는지 설명하며 대부분의 통계적 추론 및 가설 테스트의 기초입니다.
공식
정규 분포의 확률 밀도 함수는 다음과 같습니다.
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
어디:
- μ(mu) = 평균(분포의 중심)
- σ(시그마) = 표준 편차(분포의 확산)
- x = 평가 중인 값
- e ≒ 2.71828
- π ≒ 3.14159
모양은 종형 곡선이며, 값의 약 68%가 평균의 1 표준편차 내에, 95%가 2 표준편차 내에, 99.7%가 3 표준편차 내에 속합니다(68-95-99.7 규칙).
작업한 예
표준화된 테스트의 평균은 100이고 표준 편차는 15입니다. 무작위 점수가 115보다 작을 확률은 얼마입니까?
먼저 z-점수로 변환합니다.
z = (115 - 100) / 15 = 1.0
z-점수 1.0은 115가 평균보다 1표준편차 높다는 것을 의미합니다. 표준 정규 테이블이나 계산기를 사용하면 P(z ≤ 1.0) ≒ 0.8413 또는 84.13%입니다.
따라서 응시자의 약 84%가 115점 미만의 점수를 받았습니다.
주요 속성
정규분포는 전적으로 평균과 표준편차로 정의됩니다. 평균을 이동하면 곡선이 왼쪽이나 오른쪽으로 이동합니다. 표준편차를 늘리면 편평해지고 넓어집니다. 곡선 아래의 총 면적은 항상 1과 같습니다.
위의 z-점수 공식을 사용하면 모든 정규 분포를 표준 정규 분포(평균 0, 표준 편차 1)로 변환할 수 있습니다. 이 표준화를 통해 하나의 보편적 정규 테이블을 사용할 수 있습니다.
사용 시기
다음과 같은 경우 정규 분포를 사용합니다.
- 중앙 가치를 중심으로 한 데이터 클러스터
- 값은 종 모양의 히스토그램을 따릅니다.
- 중심 극한 정리가 적용됩니다(샘플은 모든 분포의 대략적인 정규 평균을 의미함).
- 가설 검정이나 신뢰 구간을 수행 중입니다.
대부분의 실제 연속 데이터는 대략 정규 분포를 따르므로 이를 응용 통계의 주요 도구로 만듭니다.
팁
데이터가 정규라고 가정하기 전에 히스토그램이나 Q-Q 플롯을 사용하여 정규성을 확인하세요. 데이터가 심하게 치우쳐 있거나 특이치가 있는 경우 정규 분포가 적절하지 않을 수 있습니다. 비정규 데이터의 경우 비모수적 테스트 또는 데이터 변환을 사용합니다.
정규 분포 계산기를 사용하면 확률, 백분위수, z-점수를 즉시 찾을 수 있습니다.