내용
선형변환(Linear transformation)
선형변환
선형변환(Linear transformation, T: U → V)은 어떤 벡터 공간의 U를 다른 벡터 공간 V로 옮기는 함수입니다. 이러한 함수는 식 6.1를 만족해야 합니다. $$\begin{align}\tag{1} &\forall \; \text{u}_1,\; \text{u}_2 \in \text{U} \rightarrow T(\text{u}_1 + \text{u}_2) = T(\text{u}_1)+T(\text{u}_2)\\ &\forall \; \text{u} \in \text{U} \cap α \in \text{C} \rightarrow T(\alpha \text{u}) = \alpha T(\text{u}) \end{align}$$
위 식에서 U와 C는 각각 벡터와 스칼라입니다.
식 1은 벡터들의 선형결합의 조건과 같습니다. 즉, 선형결합이 성립되는 벡터들은 선형 변환이 가능하다는 것을 의미합니다.
예)
다음 식이 선형변환인지를 결정합니다.
정의역의 x1, x2, x3 에 대한 위 변환이 성립되면 변환의 결과(T1, T2)에 대한 행렬방정식은 다음과 같습니다.
$$Ax = T \rightarrow \begin{bmatrix} 2&0&1\\0&-4&0 \end{bmatrix}\begin{bmatrix} x_1\\x_2\\x_3 \end{bmatrix}=\begin{bmatrix} T_1\\T_2 \end{bmatrix}$$선형변환은 선형결합에 포함되므로 위 식의 표준 행렬 A에 대한 선형 결합성을 결정하여 유추할 수 있습니다.
import numpy as np import numpy.linalg as la import sympy as sp import matplotlib.pyplot as plt from matplotlib import rcParams rcParams["font.family"]="namumgothic" rcParams["font.weight"]="bold" rcParams["font.size"]="11"
A=np.array([[2,0,1],[0,-4,0]]); A
array([[ 2, 0, 1], [ 0, -4, 0]])
sp.Matrix(A).rref()[0]$\small\color{navy}{\left[\begin{matrix}1 & 0 & \frac{1}{2}\\0 & 1 & 0\end{matrix}\right]}$
표준 행렬 A의 rref는 1개의 자유 변수를 포함하는 것으로 두개의 기저를 가지므로 그 행렬 자체는 선형종속으로 선형결합이 성립됩니다. 다음으로 임의의 3차원 벡터에 대해 식 1이 성립되는지 결정합니다.
a=np.array([3, 6, 9]) b=np.array([2, 5, 8]) # T(a)+T(b) = T(a+b) Aa=np.dot(A, a) Ab=np.dot(A, b) Aa+Ab
array([ 27, -44])
Aab=np.dot(A, a+b) Aab
array([ 27, -44])
#cT(a)=T(ca) c=3 c*Aa
array([ 45, -72])
np.dot(A, c*a)
array([ 45, -72])
예)
다음 식이 선형 변환인지를 검정해 봅니다.
위 식의 우항으로부터 변환 T를 위한 표준행렬 A는 아래 코드의 객체 A와 같습니다. 그 표준행렬을 기준으로 선형결합 이 생성될 수 있습니다.
A=np.array([[4,2,0], [0,0,0], [1,0, 3]]) A
array([[4, 2, 0], [0, 0, 0], [1, 0, 3]])
sp.Matrix(A).rref()
(Matrix([ [1, 0, 3], [0, 1, -6], [0, 0, 0]]), (0, 1))
위의 변환은 변환을 변수 벡터와의 곱을 위한 표준행렬(A)과 상수벡터(c)를 포함합니다. 표준행렬 A는 직전의 예와 같이 2개의 기저와 1개의 자유변수를 가지는 선형종속으로 선형결합이 성립합니다. 임의의 두 벡터들에 대한 식 1의 성립 여부를 결정하기 위해 임의의 두 벡터를 적용하면 성립되지 않습니다.
a=np.array([3, 6, 9]) b=np.array([2, 5, 8]) Aa=np.dot(A,a).reshape(-1,1) Ab=np.dot(A, b).reshape(-1,1) Aa+c+Ab+c
array([[42], [ 0], [60]])
A_ab=np.dot(A,a+b).reshape(-1,1) A_ab+c
array([[42], [ 0], [58]])
선형결합은 선형변환의 필요조건이지만 모든 선형결합이 선형변환을 만족시키는 것은 아닙니다. 위의 예들과 같이 선형변환은 행렬로 이루어진 함수가 관계됩니다. 다음과 같이 나타낼 수 있습니다.
- 입력 인자와 출력 인자 모두가 벡터인 함수를 변환(transformation)이라 합니다.
- 식 1의 두 조건을 만족하는 변환을 선형 변환이라 합니다.
- 변환 함수 T가 m×m 형태의 2차원 행렬 A인 변환 즉, 행렬 함수가 관여된 연산을 행렬 변환(matrix transfomation)이라고 하며 다음과 같이 나타냅니다.
T(x) = Ax, x ∈ 벡터
예)
다음 행렬 변환이 선형 변환인지를 결정합니다.
A=np.array([[1,1,0],[0,1,-1]]) a=np.array([3, 6, 9]) b=np.array([2, 5, 8]) np.dot(A, a)+np.dot(A, b) == np.dot(A, a+b)
array([ True, True])
3*np.dot(A, a) == np.dot(A, 3*a)
array([ True, True])
행렬 A에 의한 행렬 변환은 식 1의 두 조건들을 모두 만족하므로 선형변환입니다.
- 벡터 u에 대해 T(u) = 0을 만족하는 변환을 영변환 (zero transformation)이라고 합니다.
- 벡터 u에 대해 T(u) = u와 같이 자신으로 변환되는 경우는 항등변환(identity transformation)이라고 합니다.
선형 변환은 식 1외에 다음과 같은 특성을 가집니다.
벡터의 1개 차원은 1개의 축으로 나타냅니다. 즉, 1개의 행으로 표시됩니다. 이를 기준으로 1차원인 1×5 형태의 행벡터가 전치되면 5×1차원의 열 벡터로 구조가 바뀌며 이것은 5개의 축을 가진 5차원 공간에 있는 텐서(3차원 이상의 배열)로 전환됩니다. 이러한 변화는 각 차원의 단위 값 만을 나타내는 기본 벡터, 즉 하나의 행이 1이고 나머지는 0인 벡터를 사용하여 시각적으로 나타낼 수 있습니다. 이 기본 벡터는 표준기저(standard basis)를 구성하는 열벡터입니다. 예를 들어 다음의 열벡터는 각 축을 스칼라 배하여 변환하는 3차원의 텐서로 나타낼 수 있습니다.
$$\begin{align} \begin{bmatrix} 3\\5\\7 \end{bmatrix}&=3\begin{bmatrix}1\\0\\0\end{bmatrix}+5\begin{bmatrix}0\\1\\0\end{bmatrix}+7\begin{bmatrix}0\\0\\1\end{bmatrix}\\ &=3e_1+5e_2+7e_3\\ &= \begin{bmatrix} 1&0&0\\0&1&0\\0&0&1 \end{bmatrix}\begin{bmatrix}3\\5\\7\end{bmatrix} \end{align}$$위의 e1, e2, e3를 표준기저벡터라고 하며 이를 적용하여 원 벡터를 스칼라 × 표준기저벡터의 형태로 나타낼 수 있습니다. 이러한 변환은 식 2와 같이 일반화하여 나타낼 수 있습니다.
$$\begin{align}\tag{2} x&=\begin{bmatrix} x_1\\x_2\\\vdots\\x_n \end{bmatrix}\\ &=x_1e_1 + x_2e_2 + \cdots + x_ne_n \end{align}$$식 2의 x의 변환은 각 표준기저벡터의 변환 결과로서 식 3과 같이 나타낼 수 있습니다.
$$\begin{align}\tag{3} T(x)&=AX, \quad x \in \mathbb{R}^n\\ & = x_1T(\text{e}_1) + x_2T(\text{e}_2) + \cdots + x_nT(\text{e}_n)\\ \end{align}$$식 3의 표준행렬은 표준기저벡터를 사용하여 식 4와 같이 나타낼 수 있습니다.
$$\begin{align}\tag{4} A&=\begin{bmatrix} T(\text{e}_1)&T(\text{e}_2)&\cdots& T(\text{e}_n) \end{bmatrix}\\ &=\begin{bmatrix} 1&0&\cdots&0\\0&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&1 \end{bmatrix} \end{align}$$예)
다음은 2차원에서 3차원으로의 변환(T: ℝ2 → ℝ3)을 나타낸 것입니다. 벡터 b와 c가 변환 T의 성립 여부를 결정하여 봅니다.
그 변환은 다음과 같이 선형결합의 형태로 나타낼 수 있습니다.
$$\begin{bmatrix}1&-3\\3&5\\-1&7 \end{bmatrix}\begin{bmatrix} x_1\\x_2 \end{bmatrix}=\begin{bmatrix} x_1-3x_2\\3x_1+5x_2\\-x_1+7x_2 \end{bmatrix}$$위 변환은 T(u) = Au로 나타낼 수 있습니다. 벡터 b와 c가 이 변환에 성립한다는 것은 다음 선형결합의 성립여부를 결정하는 것과 같습니다.
A=np.array([[1,-3],[3, 5],[-1,7]]) b=np.array([3, 2, -5]).reshape(-1, 1) c=np.array([3, 2, 5]).reshape(-1, 1) Ab=np.hstack([A,b]);Ab
array([[ 1, -3, 3], [ 3, 5, 2], [-1, 7, -5]])
sp.Matrix(Ab).rref()
(Matrix([ [1, 0, 3/2], [0, 1, -1/2], [0, 0, 0]]), (0, 1))
Ac=np.hstack([A,c]);Ac
array([[ 1, -3, 3], [ 3, 5, 2], [-1, 7, 5]])
sp.Matrix(Ac).rref()
(Matrix([ [1, 0, 0], [0, 1, 0], [0, 0, 1]]), (0, 1, 2))
위 결과에 의하면 A와 b의 확대 행렬의 rref로 부터 자명한 해를 계산할 수 있습니다. 그러므로 b는 T에 의한 변환이 성립합니다.
A와 c의 확대행렬의 3행은 다음과 같이 나타낼 수 있습니다.
위 식은 성립할 수 없습니다. 즉, 벡터 c와의 선형 결합은 성립하지 않습니다. 결과적으로 T에 의한 변환은 성립하지 않습니다.
예)
다음 벡터 u, v는 T에 의한 선형 변환 여부를 결정하여 봅니다.
T=np.array([[0,-1],[1,0]]) u=np.array([[4],[1]]) v=np.array([[2],[3]]) Tu=np.dot(T, u);Tu
array([[-1], [ 4]])
Tv=np.dot(T,v);Tv
array([[-3], [ 2]])
uv=u+v Tuv=np.dot(T, (uv)) Tu+Tv==Tuv
array([[ True], [ True]])
위 결과는 T(u) + T(v) = T(u + v)를 나타냅니다. 그러므로 변환 T는 선형입니다. 위 결과는 그림 1과 같이 기하적으로 나타낼 수 있습니다.
plt.figure(figsize=(10, 5), dpi=100) nme=['u', 'v', 'uv', 'Tu', 'Tv', 'Tuv'] col=['blue','blue','blue', 'red','red','red'] for i, j in enumerate([u, v, uv, Tu, Tv, Tuv]): plt.annotate(f"{nme[i]}", (0,0), j, fontsize=13, color=col[i], arrowprops=dict(color=col[i], lw=2, arrowstyle="<-")) plt.xlim(-5,7) plt.ylim(0,7) plt.grid(True) plt.show()
특별한 선형변환
벡터 공간에서의 변환(transformation)은 다른 벡터 공간으로 이관하는 함수의 다른 표현입니다. 그러한 변환 중에 몇 가지 특성을 만족시키는 특별한 선형변환은 다음과 같습니다.
동일차원으로 선형변환의 경우
$$\begin{align} &Ab=c\\ &A=\begin{bmatrix}0.2&0.5\\0.4&0.7 \end{bmatrix}\\ &b=\begin{bmatrix}3\\2 \end{bmatrix} \end{align}$$A=np.array([[0.2, 0.5],[0.4, 0.7]]);A
array([[0.2, 0.5], [0.4, 0.7]])
b=np.array([[3],[2]]);b
array([[3], [2]])
c=np.dot(A, b);c
array([[1.6], [2.6]])
위 과정은 그림 2와 같이 표준 행렬 A에 의해 벡터 b를 벡터 c로 위치 이동을 한 것입니다. 즉, 동일한 차원 내에서 일반적인 좌표 시스템에서 행렬 A의 각 열벡터가 기준이 되는 좌표 시스템으로 이동시킨 것입니다.
plt.figure(figsize=(10, 5), dpi=100) nme=['A1', 'A2', 'b', 'c'] col=['black','black','blue','red'] for i, j in enumerate([A[:,0], A[:, 1], b, c]): plt.annotate(nme[i], (0,0), j, fontsize=13, color=col[i], arrowprops=dict(color=col[i],lw=3, arrowstyle="<-")) plt.xlim(0, 3.5) plt.ylim(0, 3) plt.grid(True) plt.show()
예)
T:$\mathbb{R}^2$ → $\mathbb{R}^2$의 변환은 다음과 같습니다.
A=np.array([[-1, 0],[0, -1]]);A
array([[-1, 0], [ 0, -1]])
u=np.array([[-3],[-2]]);u
array([[-3], [-2]])
Au=np.dot(A, u);Au
array([[3], [2]])
v=np.array([[-3], [0]]); v
array([[-3], [ 0]])
Av=np.dot(A, v);Av
array([[3], [0]])
이 변환은 각 벡터를 π 만큼의 라디안(radian) 이동시킵니다.
plt.figure(figsize=(10, 5), dpi=100) nme=['u', 'v', 'Au', 'Av', 'A1','A2'] col=['blue','blue','red','red','black','black'] for i, j in enumerate([u, v, Au, Av, A[:,0], A[:,1]]): plt.annotate(nme[i], (0,0), j, fontsize=13, color=col[i], arrowprops=dict(color=col[i],lw=3, arrowstyle="<-")) plt.xlim(-3.5, 3.5) plt.ylim(-2.5,2.5) plt.grid(True) plt.show()
일정각도의 이동
식 6.5의 표준행렬은 동일 차원으로의 선형변형으로 벡터를 원점을 중심으로 θ만큼 시계 반대 방향으로 회전시킵니다.
$$\begin{equation} R_\theta = \begin{bmatrix} cos(\theta ) & −sin(\theta )\\sin(\theta ) & cos(\theta ) \end{bmatrix} \end{equation}$$벡터 b를 45°변환시킨 것입니다.
각도의 값을 계산하기 위해 np.deg2rad()
함수를 함께 적용하였습니다.
rad=np.cos(np.deg2rad(45)) round(rad, 3)
0.707
R=np.array([[np.cos(rad), -np.sin(rad)], [np.sin(rad), np.cos(rad)]]) np.around(R, 3)
array([[ 0.76, -0.65], [ 0.65, 0.76]])
b=np.array([[3],[2]]) c=np.dot(R, b) np.around(c,3)
array([[0.981], [3.469]])
위 변환 결과는 그림 4와 같습니다. 표준 행렬인 Rθ를 구성하고 있는 두 열벡터는 서로 직교 관계에 있습니다. 두 벡터는 기저 벡터들로서 이들 벡터들을 기준으로 벡터 b를 45° 이동시킨 벡터 c를 생성하였습니다. 이는 위와 같이 일반 좌표계를 행렬 A의 각 열벡터를 기준으로 하는 새로운 좌표계로 표시한 것입니다. 결과적으로 동일한 차원이지만 다른 벡터공간으로 변환시킨 것입니다
plt.figure(figsize=(10, 5), dpi=100) nme=['b', 'c', 'R1', 'R2'] col=['blue','red','black','black'] for i, j in enumerate([b, c, R[:,0], R[:,1]]): plt.annotate(nme[i], (0,0), j, fontsize=13, color=col[i], arrowprops=dict(color=col[i],lw=3, arrowstyle="<-")) plt.annotate("", (1.5, 1.3), (1, 2.2), arrowprops=dict(color='green', lw=2, arrowstyle="<-", alpha=0.5)) plt.text(1.3, 1.8, r"$45^\circ$ rotate", color="green") plt.xlim(-1, 4) plt.ylim(-1,4) plt.grid(True) plt.show()
댓글
댓글 쓰기