기본 콘텐츠로 건너뛰기

라벨이 결합인 게시물 표시

[matplotlib]quiver()함수

[data analysis] 랜덤변수들의 결합

랜덤변수들의 결합 실제 자료 분석에서 두 개 이상의 변수들 사이의 관계가 분석 대상이 되는 경우가 빈번합니다. 예를 들어 암과 담배의 관계나 주가와 이자의 관계를 파악하기 위해 다양한 변수들이 필요합니다. 이러한 다변수의 상황에서 확률과 다양한 통계량들의 산출 과정은 단변수에서의 과정과 유사합니다. 예 1) A 학급 12명의 학생들 중 축구 선수가 3명이고 야구 선수가 4 명 있습니다. 다른 학급과 어떤 운동경기를 위해 3명을 선출하는 경우 모두 선수 출신 학생일 확률? 축구선수의 변수를 X, 야구선수의 변수를 Y, 나머지를 Z이라 하면 이 분포의 확률은 식 1과 같이 계산됩니다. \begin{align}P(X=x,\;Y=y,\;Z=z)&=\frac{\binom{3}{x} \binom{4}{y} \binom{5}{z}}{\binom{12}{3}}\\x+y+z&=12 \end{align} (식 1) itertools 모듈의 함수 itertools.combinations(data, r) 는 조합의 모든 내용을 반환합니다. 즉, 함수는 data 중에 r을 뽑는 모든 경우를 반환합니다. 이 함수를 사용하여 x, y, z으로 구성된 데이터에서 3명을 선택되는 모든 경우를 나타냅시다. import itertools data=['x']*3+['y']*4+['z']*5; data ['x', 'x', 'x', 'y', 'y', 'y', 'y', 'z', 'z', 'z', 'z', 'z'] case=list(itertools.combinations(data, r=3)) case[:3] [('x', 'x', 'x'), ('x', 'x', 'y...