원-핫인코딩(One-Hot encoding) 대상이 되는 값에 1 그외의 값에 0을 지정하는 방식으로 인코딩합니다. 이러한 할당방식을 one-hot 인코딩 이라 합니다. 예를 들어 변수에 할당된 목록 값이 female, male인 경우 다음과 같이 인코딩 됩니다. female male female 1 0 male 0 1 그러므로 x=['female']인 경우 Onehotcoding에 의해 [1, 0]으로 변환됩니다. 이 변환은 pandas.get_dummies() 함수나 sklearn.preprocessing.OneHotEncoder() 클래스 또는 torch.funtional.one_hot()에 의해 실행할 수 있습니다. 위 함수들은 원-핫 인코딩을 위한 함수들 들을 참조합니다. 다음 자료 x는 5개의 데이터와 고유값 3개(Na를 코딩에서 제외)를 포함합니다. 그러므로 다음과 같이 5행 3열의 결과가 되며 각각에 대응하는 위치에 1이 할당됩니다. x=['a', 'c', 'z', 'a', np.nan] pd.get_dummies(x, dtype="int") a c z 0 1 0 0 1 0 1 0 2 0 0 1 3 1 0 0 4 0 0 0 pd.get_dummies(x, dummy_na=True) a c z ...
python 언어를 적용하여 통계(statistics)와 미적분(Calculus), 선형대수학(Linear Algebra)을 소개합니다. 이 과정에서 빅데이터를 다루기 위해 pytorch를 적용합니다.