기본 콘텐츠로 건너뛰기

라벨이 변동인 게시물 표시

[matplotlib]quiver()함수

[data analysis] 변동: 범위(Range)

변동(Variation) 관련내용 범위(range) 4분위수(Quantile) 중간값 절대 편차(MAD) 분산(Variance) 표준편차(Standard Deviation) 분산계수(Variation Coefficient) 범위(range) 데이터 셋의 범위를 의미합니다. 식 1과 같이 그 범위는 최대값과 최소값의 차이를 나타냅니다. 범위 = 최대값 - 최소값 (식 1) 이 값은 numpy 함수인 max() 와 min() 을 사용하여 데이터 셋의 최대와 최소값을 결정한 후 두 값의 차이로 계산할 수 있습니다. 다음은 [1, 100) 사이에 랜덤수 50개를 추출한 후 그 범위를 산출한 것입니다. np.max(x, axis=None) 배열 객체 x에서 지정한 축에 따라 최대값을 반환 axis: None일 경우 1차원 벡터로 자동 변환 후 최대값 반환 array.max(axis), pd객체.max(axis) 와 같음 np.min(x, axis=None) 배열 객체 x에서 지정한 축에 따라 최소값을 반환 axis: None일 경우 1차원 벡터로 자동 변환후 최소값 반환 array.min(axis) , pd객체.min(axis)과 같음 np.random.seed(1) d=np.random.randint(1, 100, 5) d_max, d_min=np.max(d), np.min(d) d_max, d_min (76, 10) rng=d_max-d_min; rng 66 예) 다음 데이터들의 범위를 계산합니다. A = {4, 6, 2, 4, 6, −4, −7, 45} B = {4, 6, 2, 4, 6, −4, −7, 145} A 의 범위 = 45 - (-7) = 52 B의 범위 = 145 - (-7) = 152 위 예에서 두 그룹 A와 B는 하나의 값을 제외하고 같습니다. 그러나 B의 최대값은 다른 값에 비해 현저한 차이를...

변동(Variation)

변동(Variation) 변동(variation) 또는 스프레드(spread) 는 데이터들의 퍼짐 정도를 나타내는 것으로서 자료의 특성을 설명하는 기본 정보 입니다. 평균 등의 위치정보와 함께 변동을 사용하여 자료의 분포를 설명할 수 있습니다. 예를 들어 다음 자료는 다양한 금융자료를 호출할 수 있는 파이썬 라이브러리 FinanceDataReader 를의 DataReader() 함수를 사용하여 지정한 기간의 코스피 주가를 호출한 것입니다. 이 데이터는 연속형이므로 목록형으로 전환하기 위해 pd.cut() 함수를 사용합니다. 이 함수는 구간을 지정하여 각 인스턴스에 대한 목록화된 결과를 첫번째, 두번째로 각 구간의 경계점을 반환합니다. 또한 np.histogram() 을 사용하여 각 구간의 빈도수를 나타낼 수 있습니다. pd.cut(x, bins, right=True, labels=None, retbins=False, ...) 1차원 배열의 각 값을 지정한 구간(bins)에 대응하는 구간(계급)을 반환합니다. 연속형 변수를 범주형 변수로 변환할 경우 유용합니다. x : 1차원 배열 객체 bins: 계급(class) 구간의 갯수를 나타내는 정수 또는 명시적으로 구간을 구분하기 위한 리스트 객체 right = Ture → (a, b] · right = False → [a, b) label: 각 계급 구간에 대한 이름을 지정. 그러므로 bins의 수와 같아야 함 retbins: bins을 정수로 전달 할 경우 각 계급(class)의 구간을 반환 numpy.histogram(x, bins, density=False) x: numpy 객체로서 2차원 이상의 객체일 경우 1차원으로 자동 변환 bins: 데이터를 그룹화하기 위한 클래스의 수 또는 각 그룹의 상한값과 하한값으로 구성한 객체 density: True일 경우, 빈도 대신 밀도가 반환 \begin{align}\text{density}&=\frac{\t...