원-핫 인코딩을 위한 함수들 pandas.get_dummies pandas.get_dummies(x, prefix=None, dummy_na=False, dtype=None) 전달되는 데이터인 x는 1차원 Array, pandas Series, 그리고 DataFrame 모두 가능 데이터의 고유값(unique value)에 대응하는 클래스를 생성하여 값에 적합한 클래스에 True, 나머지 클래스에 False를 할당(one-hot encoding) True와 False로 표시가 기본값 인수 dtype = "int": True → 1, False → 0 dummy_na = True: 데이터의 포함된 Na를 포함 pd.get_dummies(['A', 'A', 'C', 'C', 'B']) A B C 0 True False False 1 True False False 2 False False True 3 False False True 4 False True False pd.get_dummies(['A', 'A', 'C', 'C', 'B'], dtype='int') A B C 0 1 0 0 ...
python 언어를 적용하여 통계(statistics)와 미적분(Calculus), 선형대수학(Linear Algebra)을 소개합니다. 이 과정에서 빅데이터를 다루기 위해 pytorch를 적용합니다.