기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[Linear Algebra] 기저(Basis) 벡터

기저(Basis) 벡터

부분공간이 되는 벡터들은 스판인 벡터들의 확대 또는 축소의 결과입니다. 즉, 스판인 벡터들은 그 벡터 공간을 형성하는 기본이 되는 벡터(들)입니다. 이러한 벡터들을 기저(Basis) 또는 기저벡터라고 합니다. 기저벡터들의 선형결합은 선형독립입니다. 즉, 기저 벡터들은 다음 조건을 만족해야 합니다.

기저 벡터(Basis vector)

벡터 W가 벡터 공간 B(b1, b2, … , bp)의 부분공간인 경우 B가 W의 기저(basis)가 되는 것은 다음과 동치입니다.

  • ⇔ 다음의 W와 B의 선형결합은 독립입니다.
  • $$\begin{bmatrix}b_{11}&b_{12}&\cdots&b_{1p}\\\vdots&\vdots&\ddots&\vdots\\b_{n1}&b_{n2}&\cdots&b_{np}\end{bmatrix}\begin{bmatrix}x_1\\x_2\\\vdots\\x_p\end{bmatrix}=\begin{bmatrix}w_1\\\vdots\\w_n\end{bmatrix}$$
    • 벡터 공간에서 기저는 선형 독립인 벡터들입니다.
  • ⇔ W = Span{b1, b2, … , bp}

즉, W는 집합 B로 구성된 벡터공간의 부분 공간이며 그 벡터들의 선형결합의 결과입니다.

기약행사다리꼴 형태에서 피벗 열(pivot column)에 해당하는 벡터와 같습니다.

결과적으로 벡터 B 집합은 W(부분공간)의 스판이 되며 B의 선형 결합에 의한 결과 벡터가 W가 된다는 것을 의미합니다. 또한 B와 W의 선형결합은 독립이어야 하므로 자명한 해(유일해)를 가져야 합니다.

표준기저(Standard basis)

항등행렬을 표준행렬로 가진 선형결합의 경우 선형독립입니다. 그러므로 항등행렬을 구성하는 각 열벡터들은 기저벡터의 가장 기본형으로 표준기저라고 합니다.

import numpy as np
import numpy.linalg as la 
import sympy as sp
I3=np.eye(3)
print(I3)
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
c=np.zeros([3,1])
Matrix(np.hstack([I3, c])).rref()
(Matrix([
 [1, 0, 0, 0],
 [0, 1, 0, 0],
 [0, 0, 1, 0]]),
 (0, 1, 2))
la.det(I3)
1.0

다음과 같이 정리할 수 있습니다.

표준기저(Standard basis)
  • 항등 행렬의 각 열 벡터는 모든 벡터들과 선형 독립
  • 표준 기저(standard basis): 항등행렬의 각 열벡터들
  • 벡터들의 기약 행 사다리꼴(rref)에서 항등 행렬 형태를 보인다면 기저가 됩니다.

다음과 같이 정리할 수 있습니다.

  • 항등 행렬의 각 열 벡터는 모든 벡터들과 선형 독립
  • 표준 기저(standard basis): 항등행렬의 각 열벡터들
  • 벡터들의 기약행사다리꼴(rref)에서 항등 행렬 형태를 보인다면 기저가 됩니다.

예 1)

다음 세 벡터가 기저인지 결정해봅니다.

$$V=\left\{ \begin{bmatrix}3\\-4\\-2\end{bmatrix}, \; \begin{bmatrix}0\\1\\1\end{bmatrix}, \; \begin{bmatrix}6\\7\\3\end{bmatrix}\right\}$$

위 V의 각 열벡터들에 의해 이루어지는 동차 선형 결합이 선형 독립임을 나타내는 것입니다.

v1=np.array([3,0,6]).reshape(-1,1)
v2=np.array([-4, 1, 7]).reshape(-1,1)
v3=np.array([-2,1,5]).reshape(-1,1)
V=np.hstack([v1,v2,v3])
V
array([[ 3, -4, -2],
           [ 0,  1,  1],
           [ 6,  7,  5]])
round(la.det(V), 3)
-18.0

위 결과에 의하면 세 벡터들의 결합인 표준 행렬 V의 행렬식이 0이 아닙니다. 즉, V에 의한 선형결합은 선형독립이며 유일한 해를 가집니다. V는 정방행렬이며 가역행렬이므로 np.linalg.solve() 함수를 사용하여 해를 결정할 수 있습니다.

c=np.zeros((3,1))
sol=la.solve(V, c)
print(sol)
[[-0.]
 [ 0.]
 [-0.]]

또한 행렬 V와 상수행렬 c와의 결합인 확대 행렬(augment matrix)에 대한 기약행사다리꼴(rref)로 확인할 수 있습니다.

Matrix(np.c_[V, c]).rref()
(Matrix([
 [1, 0, 0, 0],
 [0, 1, 0, 0],
 [0, 0, 1, 0]]),
 (0, 1, 2))

확대 행렬의 모든 열벡터는 피벗 열이므로 자유변수가 없습니다. 즉, 그 시스템은 선형 독립이므로 표준 행렬의 모든 열벡터가 기저 벡터가 됩니다.

기약행사다리꼴에서 피벗 열(pivot column)은 기저 벡터들이 됩니다.

예 2)

다음 벡터들이 기저 인지를 결정해 봅니다.

$$v_1=\begin{bmatrix}0\\2\\-1 \end{bmatrix}, \; v_2=\begin{bmatrix} 2\\2\\0\end{bmatrix}, \; v_3=\begin{bmatrix}6\\16\\-5 \end{bmatrix}$$

v1=np.array([0, 2, -1])
v2=np.array([2, 2, 0])
v3=np.array([6, 16, -5])
V=np.vstack([v1,v2,v3])
print(V)
[[ 0  2  6]
 [ 2  2 16]
 [-1  0 -5]]
la.det(V).round(3)
0.0
c=np.zeros([3,1])
Matrix(np.hstack([V, c])).rref()
(Matrix([
 [1, 0, 5.0, 0],
 [0, 1, 3.0, 0],
 [0, 0,   0, 0]]),
 (0, 1))

행렬 V의 행렬식이 0이고 확대행렬에 대한 rref에서 자유 변수가 존재하므로 자명하지 않은 해를 가집니다. 위 rref에 의하면 피벗열인 v1, v2가 기저벡터이므로 이 기저벡터들과 v3사이의 선형결합(식 1)은 선형독립이 될 것입니다.

$$\begin{bmatrix}0&2\\2&2\\-1&0 \end{bmatrix}\begin{bmatrix}x_1\\x_2 \end{bmatrix} = \begin{bmatrix}6\\16\\-5 \end{bmatrix}$$(식 1)

식 1의 확대행렬(augmented matrix)에 대한 rref를 계산하면 다음과 같습니다.

Matrix(V).rref()
(Matrix([
[1, 0, 5],
[0, 1, 3],
[0, 0, 0]]),
(0, 1))

위 결과는 식 1은 선형독립임을 나타냅니다. 결과적으로 v1과 v2는 결과벡터 v3의 스판이 됩니다(식 2).

v3 = Span{v1, v2} (식 2)

위 예와 같이 벡터 집합에서 어떤 벡터(vk)가 나머지 벡터들과 선형 독립이면 vk의 span은 나머지 벡터들이 됩니다. 다음과 같이 정리할 수 있습니다.

선형 독립과 기저
  • vk = v1 + v2 + … + vp이 성립하고 선형 독립이면
    • → vk는 동일한 차원의 벡터 공간의 부분공간이 됩니다.
    • → vk = Span {v1, v2, …, vp}
    • vk의 span은 기저벡터들입니다.
  • 일반화하면 다음과 같이 나타낼 수 있습니다.
    • ∴ 부분공간 W ≠ 0 → W의 Span은 기저(basis)

예 3)

v1와 v2의 모두 기저 벡터임을 결정합니다.

$$v1=\begin{bmatrix} 1\\-2\\3\end{bmatrix} \quad v_2=\begin{bmatrix} -2\\7\\-9\end{bmatrix}$$

v1=np.array([1,-2, 3])
v2=np.array([-2, 7, -9])
V=np.c_[v1, v2]
print(V)
[[ 1 -2]
 [-2  7]
 [ 3 -9]]
Matrix(V).rref()
(Matrix([
 [1, 0],
 [0, 1],
 [0, 0]]),
 (0, 1))

위 결과에 의하면 V의 3행은 시스템에서 필요하지 않음을 나타냅니다. 비록 과잉된 요소들이 존재하지만 v1와 v2는 기저입니다. 즉, 식 3과 같이 나타낼 수 있습니다.

$$\text{base vector} = \left\{\begin{bmatrix}1\\-2 \end{bmatrix} ,\;\begin{bmatrix} -2\\7\end{bmatrix}\right\}$$ (식 3)

예 4)

다음 행렬 V의 기저 벡터(들)를 결정해 봅니다.

$$V=\begin{bmatrix}1&6&2&-4\\-3&2&-2&-8\\4&-1&3&9 \end{bmatrix}$$

행렬 V를 구성하는 벡터를 1열부터 v1, v2, v3, v4라고 명명합니다.

V=np.array([[1,6,2,4],[-3,2,-2,-8], [4, -1, 3, 9]])
print(V)
[[ 1  6  2 -4]
 [-3  2 -2 -8]
 [ 4 -1  3  9]]
Matrix(V).rref()
(Matrix([
[1, 0, 4/5,  2],
[0, 1, 1/5, -1],
[0, 0,   0,  0]]),
(0, 1))

rref에서 1과 2열이 피벗 열이므로 선도 변수 2개, 자유 변수 2개를 나타냅니다(기약행 사다리꼴 형태 참조). 즉, 기저 벡터는 첫번째와 두번째 열 즉 v1, v2로 두 개입니다. 두 기저벡터들과의 선형결합으로 생성되는 부분공간을 H라고 하면 H의 스판은 식 4와 같이 나타냅니다.

H = Span{v1, v2} (식 4)

이 기저 벡터들과 나머지 벡터들인 v3, v4와 각각 선형결합은 식 5와 같습니다.

\begin{align}v_1:v_2:v_3& = \begin{bmatrix}1&6\\-3&2\\4&-1\end{bmatrix} \begin{bmatrix}x_1\\x_2\end{bmatrix} =\begin{bmatrix}2\\-2\\3\end{bmatrix} \\ v_1:v_2:v_4& = \begin{bmatrix}1&6\\-3&2\\4&-1\end{bmatrix} \begin{bmatrix}x_1\\x_2\end{bmatrix} =\begin{bmatrix}-4\\-8\\9\end{bmatrix} \end{align} (식 5)
V123=V[:,[0,1,2]]
Matrix(V123).rref()
(Matrix([
[1, 0, 4/5],
[0, 1, 1/5],
[0, 0,   0]]),
(0, 1))
V124=V[:,[0,1,3]]
Matrix(V124).rref()
(Matrix([
[1, 0,  2],
[0, 1, -1],
[0, 0,  0]]),
(0, 1))

위 두 결과 모두 유일해를 갖는 것으로 선형 독립임을 나타냅니다.

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b