확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.
확률 밀도 함수 | |
---|---|
붉은 색은 표준정규분포 | |
누적 분포 함수 | |
확률밀도함수의 색과 같은 색 | |
매개변수 | 평균 분산 |
지지집합 | |
확률 밀도 | |
누적 분포 | |
기댓값 | |
중앙값 | |
최빈값 | |
분산 | |
비대칭도 | 0 |
첨도 | 0 |
엔트로피 | |
적률생성함수 | |
특성함수 |
정규분포는 2개의 매개 변수 평균 과 표준편차 에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 을 표준 정규 분포(standard normal distribution)라고 한다.
정규분포는 아브라암 드무아브르가 1733년 쓴 글에서 특정 이항 분포의 이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》(The Doctrine of Chances) 2판(1738년)에 다시 실렸다. 피에르시몽 라플라스는 그의 저서 《확률론의 해석이론》(Théorie analytique des probabilités)(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.
라플라스는 실험 오차를 분석하면서 정규분포를 사용했다. 1805년에는 아드리앵마리 르장드르가 매우 중요한 방법인 최소제곱법을 도입했다. 카를 프리드리히 가우스는 이 방법을 1794년부터 사용해왔다고 주장했는데 1809년에는 실험 오차가 정규분포를 따른다는 가정하에 최소제곱법을 이론적으로 엄밀히 정당화했다.
위에서 첫 번째 적분은 홀함수의 적분으로 0이고 두 번째 적분은 가우스 적분으로 적분값이 로 잘 알려져 있다. 따라서 기댓값은 다.
정규 분포 밀도 함수에서 를 통해 X(원점수)를 Z(Z점수)로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.
에서 k값이 변화함에 따라 구해지는 값을 불확실성(uncertainty)이라고 한다. 예를 들어 를 90% 불확실성, 는 95% 불확실성, 은 99% 불확실성이다. 특히, 를 50% 불확실성이라고 하며, 확률오차(probable error)라고도 한다. 이는 관측값이 전체 관측값의 50%에 있을 확률을 의미한다.
This article uses material from the Wikipedia 한국어 article 정규 분포, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). 별도로 명시하지 않은 경우, 내용은 CC BY-SA 4.0에 따라 사용할 수 있습니다. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki 한국어 (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.