Data의 정규화(Normalization) 개요 L 1 Normalization L 2 Normalization 개요 각 샘플들이 단위 벡터가 되도록 하는 스케일 과정입니다. 즉, 행과 열로 이루어진 데이터 구조에서 표준화 가 각 열 단위로 스케일을 조정(각 변수별 조정)한다면 정규화는 동일한 행에 위치한 데이터들의 스케일을 조정합니다(샘플별 조정). sklearn.preprocessing.normalizer(x, norm='l2') 함수를 사용합니다. 이 함수의 매개변수 norm의 인자로 'l2'이면 L 2 정규화, 'l1'이면 L 1 정규화를 실행합니다. sklearn.preprocession.Normalizer(norm="l2") 데이터의 각 샘플이 단위벡터가 되도록 변환 인수 norm에 l1, l2 또는 max norm = "l1" → L 1 정규화, x/(∑|x|) norm = "l2" → L 2 정규화, x/(∑x 2 ) 0.5 norm = "max" → x/(max|x|) 기본값은 l2 L 1 Normalization 각 행에서 절대 값의 합이 항상 1이되는 방식으로 데이터 세트 값을 수정하는 방법으로 최소 절대 편차라고도합니다(식 1). $$\begin{align} \text{벡터}\qquad \qquad& \qquad \qquad \text{L}_1\; \text{정규화에 의한 벡터}\\ \begin{matrix} x_{11}&x_{12}& \cdots &x_{1p}\\ x_{21}&x_{22}& \cdots &x_{2p}\\ \vdots&\vdots& \ddots ...
python 언어를 적용하여 통계(statistics)와 미적분(Calculus), 선형대수학(Linear Algebra)을 소개합니다. 이 과정에서 빅데이터를 다루기 위해 pytorch를 적용합니다.