Son's Data story

글

라벨이 states인 게시물 표시

이산확률분포: 확률질량함수와 누적분포함수

내용 확률질량함수(PMF) 누적분포함수(Cumulative Distribution Function, CDF) 이산확률분포 확률분포는 샘플공간의 각 지점 또는 각 구간의 확률을 기준으로 작성됩니다. 이러한 확률은 함수로 작성될 수 있으며 그 확률의 대상이 되는 사건(확률변수)이 이산변수일 경우 확률질량함수(Probability Mass Function, PMF) , 연속변수일 경우 확률밀도함수(Probability Density Function, PDF) 이라고 합니다. 두 경우 모두 일정한 변수구간에서의 각 확률의 합은 확률누적분포 함수(Cumulative Distribution Function, CDF) 라고 합니다. 이 함수의 결과와 확률변수 값에 대해 시각적으로 나타낸 것을 확률분포 라고 합니다. 확률분포는 각 확률변수와 함수의 값을 대응시킨 것으로 시각적으로 나타낼 수 있습니다. 이러한 분포의 형태는 특정한 함수로 구현되는 분포들을 따르는 경향을 보입니다. 그러므로 데이터들의 분석에서 적합한 확률분포를 가정하여 여러 통계 방법들을 적용할 수 있습니다. 이러한 점 때문에 분포의 특성들을 이해하는 것은 데이터들에 대한 통계분석의 기반을 제공한다고 할 수 있습니다. 확률질량함수(PMF), 누적분포함수(CDF)를 정리하는 것이 분포를 이해하는데 큰 도움이 됩니다. 확률밀도함수(PDF)는 연속변수를 소개할 때 다시 정리합니다. 확률질량함수(PMF) 확률변수 X의 범위 $R_x$가 셀수 있는 집합이라면 그 집합 즉 샘플공간(sample space, S)을 다음과 같이 나타낼 수 있습니다. S={x 1 , x 2 , x 3 , …} 확률변수는 변수에 값을 대응시키는 함수 이기도 합니다. 즉, S의 등은 각 확률변수에 대응하는 사건들 입니다. 각 사건에 대응하는 확률을 산출할 수 있는 함수가 확률질량함수가 됩니다. 관심의 대상이 되는 사건(event) A는 다음과 같이 나타냅니다. $$\text{A}=\{\text{s} \in

자세한 내용 보기

Son's Data story

이 블로그 검색

글

통계관련 함수와 메서드 사전

이산확률분포: 확률질량함수와 누적분포함수