벡터와 행렬(vector & Matrix)
파이썬에서 벡터, 행렬 등은 numpy.array() 함수를 사용하여 생성합니다. 또한 각 객체는 차원(dimension)을 갖습니다.
벡터(vector)
A = (3,1), B = (2,3)는 두 개 축 위에 표시되는 좌표(점)로 나타낼 수 있습니다. 각 점은 어떤 기준에 대한 크기만을 가집니다. 예를 들어 원점 O(0,0)를 기준으로 A 또는 B의 거리는 식 1과 같이 계산할 수 있습니다.
\begin{align}\Vert \overline{OA}\Vert &=\sqrt{(3-0)^2+(1-0)^2}=\sqrt{10}\\ \Vert \overline{OB}\Vert &=\sqrt{(2-0)^2+(3-0)^2}=\sqrt{13}\end{align} | (식 1) |
식 1의 $\overline{OA}$는 점 O와 점 A 사이의 거리를 계산한 것입니다. 이 거리를 점 O를 시작하여 A 까지의 거리로 표현한다면 이동 방향이 고려된 것입니다. 이와 같이 거리 즉, 이동 크기에 방향을 함께 고려한 량을 벡터(Vector)라고 하고 식 2와 같이 화살표를 첨가하여 나타냅니다. 일반적으로 출발점이 원점(O)인 경우 출발점을 생략하며 벡터 표시인 화살표 없이 단순히 알파벳 소문자로 표시합니다. 벡터의 관점에서 보면 식 1은 벡터 a와 벡터 b의 길이(크기)를 계산한 것으로 놈(Norm)이라고 합니다.
벡터는 행과 열을 구분할 수 없습니다. 일반적으로 식 2와 같이 한 행으로 표시하지만 많은 경우 세로로 정렬됨을 의미 합니다. 이러한 표시를 열벡터라고 하지만 실제로는 행과 열로 구성된 행렬입니다. 또한 행렬(Matrix)의 경우는 대문자 알파벳으로 나타내며 벡터, 행렬을 구성하는 각각의 수를 요소(element)라고 합니다.
\begin{align}&\overrightarrow{oa}=\vec{a}=\begin{bmatrix}3&1\end{bmatrix}=\begin{bmatrix}3\\1\end{bmatrix}\\&\overrightarrow{ob}=\vec{b}=\begin{bmatrix}2&3\end{bmatrix}=\begin{bmatrix}2\\3\end{bmatrix} \end{align} | (식 2) |
결과적으로 점들은 벡터로 표시하여 방향을 가진 직선이 됩니다. 점은 차원이 없으며 벡터는 1차원(dimension)이 됩니다. 위의 점 A 또는 벡터 a를 시각화하기 위해서는 2개의 축이 필요하지만 좌표와 벡터는 축의 수와 관계 없이 각각 점과 직선을 나타냅니다(그림 1).
fig, ax=plt.subplots(figsize=(3,2)) cord=[(0,0), (3,1),(2,3)] nme=["O","A","B"] col=['g','b','r'] for i, j in enumerate(cord): ax.scatter(j[0], j[1], color="white", edgecolors=col[i]) ax.text(j[0], j[1]+0.15, nme[i], color=col[i], fontweight="bold") ax.arrow(0,0, 3, 1, color="b", head_width=0.1) ax.arrow(0,0, 2, 3, color="r", head_width=0.1) ax.text(1, 0.5, r"$\vec{a}$", color="b") ax.text(1, 1.8, r"$\vec{b}$",color="r") ax.spines['left'].set_position(("data", 0)) ax.spines['bottom'].set_position(("data", 0)) ax.spines['right'].set_visible(False) ax.spines['top'].set_visible(False) ax.grid(True) plt.show()
파이썬의 패키지 numpy의 array( )
함수는 행렬을 포함하는 1차원이상의 구조인 배열(array) 자료형을 생성합니다. 그러므로 이 함수에 의해 생성되는 데이터는 기본적으로 벡터이며 대괄호를 사용하여 나타냅니다.
numpy.array() 함수에 의한 배열의 생성과 차원, 그리고 인덱스는 기사 배열(Array)의 생성, 차원, 그리고 인덱스를 참조하세요.
import numpy as np
a=np.array([3,1]) b=np.array([2,3]) print(a)
[3 1]
print(b)
[2 3]
위 결과 객체 a, b의 출력을 위해 print()
함수를 사용하였습니다. 그러나 이 함수없이 그대로 각 객체를 나타낼 수 있습니다. 이 경우는 다음 결과와 같이 객체의 자료형등의 부가적인 정보를 나타냅니다.
a
array([3, 1])
벡터를 구성하는 각 값들은 요소(element, entries, codfficients, components)라고 합니다. 벡터내의 요소의 수는 벡터의 크기(size, dimentsion, length)라고 합니다.
다음은 특정한 요소들로 구성된 벡터입니다.
- zeo vector: 모든 요소가 0인 벡터
- 항등벡터(identity vector): 요소 한개의 값이 1이고 나머지 요소들은 0인 벡터(식 3)
$$e_1=\begin{bmatrix}1\\0\\1 \end{bmatrix}, \quad e_2=\begin{bmatrix}0\\1\\0 \end{bmatrix}, \quad e_3=\begin{bmatrix}0\\0\\1\end{bmatrix}$$ | (식 3) |
- one vector: 모든 요소가 1인 벡터
- 희소성(Sparsity)
- 벡터를 구성하는 대부분의 요소들이 0인 경우 벡터는 희소하다고 합니다.
- 0 벡터는 0이 아닌 항목이 없기 때문에 가장 높은 희소성을 가집니다.
- 희소 벡터는 많은 응용 프로그램에서 발생합니다.
그림 1과 같이 각 점과 벡터를 시각화를 위해 2개의 축이 필요하지만 벡터의 경우는 기본적으로 한 개의 축위에 표시할 수 있습니다. 다시 말하면 벡터를 표시하기 위해 실제적으로 필요한 축의 수는 1개입니다. 이와 같이 벡터 또는 1개 이상의 벡터들로 구성되는 행렬 등을 표시하기 위해 기본적으로 필요한 축의 수를 차원(dimension)으로 정의합니다. 이 차원은np.ndim() 함수로 확인할 수 있습니다. 위 벡터 a와 b는 2개의 요소로 구성된 모양을 가집니다. 이와 같이 벡터, 행렬 등 배열의 모양은 .shape 속성으로 확인할 수 있습니다.
a.shape, b.shape
((2,), (2,))
np.ndim(a), np.ndim(b)
(1, 1)
벡터에 있는 요소의 값은 크기만 정의할 수 있는 스칼라입니다. 모든 요소가 실수인 벡터를 실수 벡터(real vector)라고 하며 ℝn으로 나타냅니다. n은 행의 수를 나타냅니다. 벡터의 경우는 하나의 행으로 구성되므로 ℝ1, 2개의 행으로 구성된 행렬일 경우 ℝ2로 표시됩니다. 즉, n은 축의 수를 나타내는 차원을 나타냅니다.
행렬(Matrix)
행렬(matrix)는 여러개의 벡터로 구성됩니다. 예를 들어 위에서 생성한 두 벡터 a와 b를 식 4와 같이 행 단위로 구성하여 행렬로 나타낼 수 있습니다.
$$A=\begin{bmatrix}\text{[}3 & 1\text{]}\\\text{[}2 & 3\text{]}\end{bmatrix}=\begin{bmatrix}3 & 1 \\ 2 & 3 \end{bmatrix}$$ | (식 4) |
위 행렬 A의 가로방향을 행(row), 세로방향을 열(column)이라 하고 하며 벡터와 같이 numpy.array()
함수를 사용하여 생성합니다.
A=np.array([[3,1],[2,3]]) print(A)
[[3 1] [2 3]]
행렬 객체는 pandas.DataFrame()
함수를 사용하여 표의 형태로 나타낼 수 있습니다.
A_df=pd.DataFrame(A); A_df
0 | 1 | |
0 | 3 | 1 |
1 | 2 | 3 |
위 코드의 A_df는 행렬 A를 table 형태로 나타낸 것으로 데이터 과학에서는 각 열을 변수(feature), 행은 샘플(sample, instance)로 나타냅니다.
다양한 수학 계산을 위해 행렬 A의 행과 열을 교환하는 경우가 발생합니다. 이와 같이 행과 열의 교환을 전치(transform)라고 하며 식 5와 같이 나타냅니다. 객체의 전치는 객체.T
속성 또는 np.transpose(객체, axis=none)
함수를 사용하여 생성할 수 있습니다.
함수 np.transpose()의 인수 axis는 전치를 시행할 축을 지정합니다. 이에 대해 기사 함수의 인자 axis에 대해를 참조할 수 있습니다.
\begin{align}\text{Matrix}\;M&\Rightarrow \text{Transpose M}\; M^T\\ \begin{bmatrix}{\color{r}a}&b\\{\color{r}c}&d \end{bmatrix}& \Rightarrow \begin{bmatrix}{\color{r}a}&{\color{r}c}\\b&d \end{bmatrix}\\ \therefore\; A^T&=\begin{bmatrix}3&2\\1&3\end{bmatrix}\end{align} | (식 5) |
print(A.T)
[[3 2] [1 3]]
print(np.transpose(A))
[[3 2] [1 3]]
댓글
댓글 쓰기