기본 콘텐츠로 건너뛰기

라벨이 quad인 게시물 표시

[matplotlib]quiver()함수

[data analysis]연속확률분포: 확률밀도 함수(pdf)

연속확률분포 내용 확률밀도함수(Probability Density Function, PDF) 일정구간 [a, b]에서 무작위로 하나의 수를 선택하는 확률이 동일하다면 그 수는 랜덤변수(random variable) 가 됩니다. 그 구간의 수들은 무한하므로 하나의 점을 특정할 수 없습니다. 즉, 연속변수에서 특정한 점에서의 확률은 정의할 수 없습니다. 대신에 전체를 일정구간으로 소그룹화하면 하나의 그룹을 선택할 확률은 전체 구간의 길이에 대해 그 선택된 부분의 길이로 정의할 수 있습니다. 이 관계는 식 1과 같이 나타낼 수 있습니다. \begin{align}P(X ∈ [a, b])&=1\\P(\in [x_1,\,x_2])&=\frac{x_2-x_1}{b-a}\\a\le x_1&\le x_2 \le b \end{align} (식 1) 식 1을 기반으로 확률변수 X에 대한 누적분포함수(CDF)는 식 2와 같이 나타낼 수 있습니다. $$F(X)=\begin{cases}0&\text{for}\; x \le a\\\frac{x-a}{b-a}&\text{for}\; a \le x \le b\\1&\text{for}\; x \ge b \end{cases}$$ (식 2) 사실 연속변수의 경우 한 지점에서의 확률은 정의할 수 없으므로 기호 "≤" 와 "<"의 차이 역시 정의 할 수 없습니다. [연속확률함수의 조건] 식 3의 관계가 성립하기 위해서는 함수 f(x)가 모든 x에서 대응하는 값을 정의할 수 있는 연속함수(continuous function)이어야 합니다. F(x) = P(X ≤ x) (식 3) 다시말하면 누적분포함수인 F(x)는 모든 범위에서 미분가능한 함수이어야 합니다. 확률밀도함수(Probability Density Function, PDF) 이산확률함수에 각 경우의 확률은 확률질량함수(PMF)와 누적분포함수(CDF)...