Son's Data story

글

라벨이 클래스표시행렬인 게시물 표시

데이터 인코딩:labeling and one-hot encoding

목차 이진화(Binarization) 데이터 라벨링(Data Labeling) 클래스 표시 행렬 다중클래스 표시행렬 라벨인코딩(Label ecoding) 순서형 인코딩(Ordinal ecoding) 원-핫인코딩(One-Hot Encoding) 이진화(Binarization) 지정한 값을 기준으로 0과 1과 전환합니다. 이러한 전환은 데이터를 확률화로 전환할 경우 유용합니다. sklearn.preprocessing.Binarizer(*, threshold=0.0, copy=True) 클래스를 사용할 수 있습니다. 이 클래스에서 매개변수 threshold에 지정한 값을 기준으로 이하인 경우 0, 초과된 경우 1로 반환합니다. 다음의 경우 50을 임계값으로 지정하여 그 이하를 0 그 이상을 1로 변환한 것입니다. import numpy as np import pandas as pd import sklearn.preprocessing as sklpre np.random.seed(0) x=np.random.randint(0, 100, size=(5,3)) x array([[44, 47, 64], [67, 67, 9], [83, 21, 36], [87, 70, 88], [88, 12, 58]]) xBinary=sklpre.Binarizer(threshold=50).fit(x) xBinary.transform(x) array([[0, 0, 1], [1, 1, 0], [1, 0, 0], [1, 1, 1], [1, 0, 1]]) 데이터 라벨링(Data Labeling) 클래스 표시 행렬 라벨표시기행렬(label indicator matrix)를 작성합니다. label indicator matrix 클래스의 갯수가 정방행렬의 차원이 됨 클래스의 각 요소들은 올림차순으로 정렬 각 클래스는 그 행렬의 행과 열의 인덱스가

자세한 내용 보기

Son's Data story

이 블로그 검색

글

통계관련 함수와 메서드 사전

데이터 인코딩:labeling and one-hot encoding