빈도수 구하기

1. np.bincount()

1차원 배열과 양의 정수형인 객체에 적용합니다.
객체의 원소중 0부터 최대값 범위의 정수값을 올림차순으로 정리한 뒤 각 원소에 대한 빈도수를 반환합니다.

>>> x=np.random.randint(1, 10, 50)
>>> x
array([7, 9, 5, 8, 1, 6, 8, 5, 1, 3, 2, 6, 2, 3, 3, 8, 6, 5, 9, 5, 9, 8, 8,
9, 8, 5, 7, 1, 3, 1, 2, 6, 4, 9, 3, 6, 3, 5, 2, 7, 1, 1, 2, 2, 5, 9,
7, 3, 8, 3])
>>> [min(x), max(x)]
[1, 9]

bincount()는 0 부터 객체x의 최대값인 9까지 각 원소의 빈도수를 계산합니다.
아래의 결과에서 0은 없기 때문에 빈도수는 0입니다.
>>> np.bincount(x)
array([0, 6, 6, 8, 1, 7, 5, 4, 7, 6], dtype=int64)

2. np.unique(객체, return_index=False, return_inverse=Fasle, return_counts=False)

return_index: 고유값이 최초로 나오는 인덱스 반환을 조정하는 인수로 True이면 인덱스를 반환하고 False이면 반환하지 않습니다. 기본값은 False입니다.

return_inverse: True이면 객체를 반환, 기본은 False입니다.return_counts: 객체의 고유값으로 분리한 후 각 값의 빈도수를 반환합니다. 기본은 False로 이 결과는 반환되지 않습니다.

>>> uni, count=np.unique(x, return_counts=True)

>>> uni
array([1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> count
array([6, 6, 8, 1, 7, 5, 4, 7, 6], dtype=int64)
이 함수는 부동소수에도 적용된다.

3. np.histogram(객체, binds)

객체를 구간수로 구분하여 각 구간수에 속하는 빈도수를 반환한다.
bins=정수일 경우에는 구간수를 나타내고
bins=연속열 일경우는 오른쪽 구간값을 나타낸다.
예를들어 bins=[0, 1, 2, 3]일 경우 (0, 1], (1, 2], (2, 3]

>>> x=np.random.randint(1, 100, 3000)
>>> y=np.linspace(1, 100, 6)
>>> np.histogram(x, y)
(array([634, 613, 576, 607, 570], dtype=int64),
array([ 1. , 20.8, 40.6, 60.4, 80.2, 100. ]))

sons dataStory

이 블로그 검색

pandas_ta를 적용한 통계적 인덱스 지표