sons dataStory

글

라벨이 특성인 게시물 표시

[data analysis] Scaling

Scaling 데이터의 각 변수의 스케일은 다양할 수 있기 때문에 전체 데이터의 스케일을 통일시킬 필요가 있습니다. 이러한 과정을 스케일링(scaling) 이라고 합니다. 일반적으로 모든 변수를 [0, 1]사이로 스케일을 조정 합니다. 이러한 과정은 sklearn 라이브러리의 MinMaxScaler() 또는 MaxAbsScaler() 을 적용하여 달성할 수 있습니다. 각각의 변환은 식 1과 같습니다. MinMaxScaler: $x_\text{scaled}=\frac{x-x_\text{min}}{x_\text{max}-x_\text{min}}$ (식 1) MaxAbsScaler: $x_\text{scaled}=\frac{x}{\vert x_\text{max} \vert}$ sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1)) 데이터를 행 단위로 다음과 같이 스케일 합니다. 다음의 첫번째 식은 데이터의 표준화를 위한 것으로 분모에 분산 대신 데이터의 범위를 사용한 것입니다. $\begin{align}x_\text{std}&=\frac{x-\mu}{x_\text{max}-x_\text{min}}\\x_\text{scaled}&=x_\text{std}\left(x_\text{max}-x_\text{min}\right)+x_\text{min}\end{align}$ .fit() 메소드로 데이터에 적합시키고 .transform() 메소드로 데이터를 변형 .inverse_transform() 메소드를 사용하여 원 데이터로 환원 다양한 속성이 있음 sklearn.preprocessing.MaxAbsScaler() 변수의 최대값의 절대값을 기준으로 각 데이터의 비를 계산 .fit() 메소드로 데이터에 적합시키고 .transform() 메소드로 데이터를 변형 .inverse_transform() 메소드를 사용하여 원 데이터로 환원 다양한 속성이...

sons dataStory

이 블로그 검색

글

[matplotlib]quiver()함수

[data analysis] Scaling