기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[Linear Algebra] 선형결합(Linear combination)

선형결합(Linear combination)

선형결합(Linear Combination)

v1, v2, …, vn으로 이루어진 벡터 집합 V와 c1, c2, …, cn로 구성된 스칼라 집합 C를 고려해봅니다. 식 1은 VC사이의 "가중치 × 벡터"의 관계를 나타낸 것입니다. 다시말하면 이 식은 벡터와 스칼라의 두 집합사이에 선형 결합(linear combination) 관계를 의미하는 것입니다.

\begin{align}\tag{1} y &= c_1v_1 + c_2v_2 + \cdots + c_nv_n\\ &= \begin{bmatrix} v_1& v_2&\cdots& v_n\end{bmatrix}\begin{bmatrix}c_1\\c_2\\\vdots\\c_n\end{bmatrix}\\ &= VC \end{align}(식 1)

식 1에서 V는 선형결합의 계수벡터들로 구성된 표준행렬(standard matrix), C는 스칼라로 구성된 변수벡터를 나타냅니다. 예를 들어 식 2는 2개의 변수와 각 변수의 계수 그리고 그들의 선형 결합의 결과인 상수로 구성된 3개의 식을 나타낸 것입니다.

\begin{align}\begin{bmatrix}c_1\\c_2\\c_3 \end{bmatrix}&=\begin{bmatrix} a_1\\a_2\\a_3 \end{bmatrix}x+\begin{bmatrix} b_1\\b_2\\b_3\end{bmatrix}y\\& = \begin{bmatrix} a_1& b_1\\a_2 & b_2\\ a_3 & b_3\end{bmatrix}\begin{bmatrix}x\\ y \end{bmatrix}\\ \Rightarrow\;&\begin{aligned} c_1&=a_1x + b_1y \\ c_2&=a_2x + b_2y \\c_3&=a_3x + b_3y\end{aligned}\end{align}(식 2)
import numpy as np
import numpy.linalg as la
from sympy import *
import matplotlib.pyplot as plt
a=np.array([1,-2,-5])
b=np.array([2,5,6])
c=np.array([7,4,-3])
A=np.c_[a, b]
print(A)
[[ 1  2]
 [-2  5]
 [-5  6]]

위 결과를 행렬시스템으로 정리하면 식 3과 같습니다.

$$\begin{bmatrix}7\\4\\3 \end{bmatrix}=\begin{bmatrix}1&2\\-2&5\\-5&6 \end{bmatrix} \begin{bmatrix}x\\y \end{bmatrix}$$(식 3)

식 3의 표준행렬은 정방 행렬이 아니므로 기약 행 사다리꼴 형태를 적용하여 해집합을 계산할 수 있습니다. 즉, 표준행렬(A)과 상수 벡터(c)의 결합인 확대 행렬sympy객체.rref() 메소드를 적용합니다.

위 코드의 A, c 모두 numpy 배열 객체이므로 sympy의 함수 또는 메소드를 적용하기 위해서는 sympy 객체로 전환하여야 합니다. 그러나 sympy 역시 python의 리스트형을 기본으로 하므로 numpy와 sympy 객체의 전환은 자연스럽게 이루어집니다.

Ac=np.c_[A, c]
print(Ac)
[[ 1  2  7]
 [-2  5  4]
 [-5  6 -3]]

Matrix() 함수를 적용하여 numpy.array 형의 객체를 sympy 객체로 변환합니다.

Matrix(Ac).rref()
(Matrix([
 [1, 0, 3],
 [0, 1, 2],
 [0, 0, 0]]),
 (0, 1))

식 3는 식 4와 같은 연립방정식을 나타냅니다. 위 결과는 그 연립방정식의 변수 x와 y의 해가 각각 3과 2임을 나타냅니다.

\begin{align} x + 2y& = 7\\ -2x + 5y &= 4\\ -5x + 6y & = 3\end{align}(식 4)

x와 y의 해가 각각 단일해라는 것은 식 4의 세 직선이 한 점에서 교차함을 의미하는 것으로 그림 1과 같이 나타낼 수 있습니다.

그림 1. 세개 직선의 교차점.
x=np.linspace(-0.5, 6, 100)
y1=(7-x)/2
y2=(4+2*x)/5
y3=(-3+5*x)/6
fig, ax=plt.subplots(figsize=(4,3))
ax.plot(x,y1, color="g", label=r"$\frac{7-x}{2}$")
ax.plot(x, y2, color="b", label=r"$\frac{4+2x}{5}$")
ax.plot(x, y3, color="r", label=r"$\frac{-3+5x}{6}$")
ax.scatter(3, 2, s=50, c="k")
ax.spines['left'].set_position(("data", 0))
ax.spines['bottom'].set_position(("data", 0))
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.legend(loc="upper center", labelcolor=['g', 'b', 'r'], frameon=False)
ax.set_xticks(np.arange(-0, 6))
ax.set_yticks(np.arange(-1, 8))
plt.show()

결과적으로 선형결합이 성립한다는 것은 해가 존재한다는 것을 의미하는 것으로 다음과 같이 나타낼 수 있습니다.

선형 결합이 성립 ⇔ 선형시스템의 해가 존재

위 예에서 표준 행렬 A와 상수 벡터 c사이에 선형 결합이 성립한다는 것은 해가 존재함을 의미합니다. 또한 그림 2에서 나타낸 것과 같이 상수 벡터 c는 행렬 A의 열벡터들인 벡터 a, b에 의해 형성된 공간 내에 존재한다고 할 수 있습니다.

그림 2 벡터 c의 스판 a, b.

이러한 관계에 있는 벡터들 a와 b는 벡터 c의 스판(span)이라 하며 식 5와 같이 나타냅니다.

스판 (Span)

특정한 벡터 b가 x, y, … 들의 벡터들이 공유되는 영역에서 포함되면 그 벡터들은 b의 스판이 되며 식 5와 같이 나타냅니다.

b = Span{x, y, …}(식 5)

다시말하면 식 5는 벡터 x, y, …들로 구성된 행렬과 벡터 b사이에 선형결합이 성립함을 의미합니다.

예 1)

다음 열벡터들 간의 선형 결합성을 조사합니다.

$$a_1=\begin{bmatrix}1\\-2\\3 \end{bmatrix}\quad b_1=\begin{bmatrix}5\\-13\\-3\end{bmatrix} \quad c_1=\begin{bmatrix}-3\\8\\1 \end{bmatrix}$$

a1=np.array([1,-2,3])
a2=np.array([5, -13, -3])
b=np.array([-3,8,1])
A=np.c_[a1,a2]
print(A)
[[  1   5]
 [ -2 -13]
 [  3  -3]]
aug=np.c_[A, b]
print(aug)
[[  1   5  -3]
 [ -2 -13   8]
 [  3  -3   1]]
Matrix(aug).rref()
(Matrix([
 [1, 0, 0],
 [0, 1, 0],
 [0, 0, 1]]),
 (0, 1, 2))

위 결과의 3행 0x + 0y = 1은 성립될 수 없습니다. 그림 3(a)에서 나타낸 것과 같이 직선들의 교차점은 존재하지 않습니다. 즉, 이 시스템의 해는 존재하지 않기 때문에 세 벡터 사이의 선형 결합은 성립되지 않는 모순된 시스템(inconsistent system)입니다. 그림 3(b)는 이 시스템을 구성하는 세개의 벡터를 나타낸 것으로 벡터 a1a2의 확대 또는 축소에 의한 공간에 벡터 b를 포함할 수 없습니다. 그러므로 벡터들 사이의 span 관계는 성립할 수 없습니다.

그림 3. 모순된시스템.
선형 결합의 특성

위 과정으로부터 선형결합의 특성을 정의할 수 있습니다(Ax = b).

  • 해 집합이 존재합니다.
    • ⇔ 표준 행렬 A를 구성하는 열벡터들은 상수 벡터인 b와 선형 결합이 성립
    • ⇔ A의 열벡터( a1, a2, …, an)가 R의 부분 공간이라면 b 역시 R의 부분 공간
    • ⇔ a1, a2, …, an ⊂ R ≡ b ⊂ R
    • ⇔ R = Span{a1, a2, …, an}
  • 유일한 해 집합이 존재
    • ⇔ A는 모든 행에 피벗위치를 포함(모든 변수가 선도변수)
    • 자유 변수가 존재하지 않음
    • ⇔ 역행렬이 존재

예 2)

다음 Ax = b의 해집합을 계산해 봅니다.

$$A=\begin{bmatrix}1& 5& -2& 0\\-3& 1& 9& -5\\4& -8& -1& 7 \end{bmatrix} \quad b=\begin{bmatrix} -7\\9\\0\end{bmatrix}$$

A=np.array([[1,5,-2,0],[-3,1, 9,-5],[4, -8, -1, 7]])
b=np.array([-7,9,0]).reshape(3,1)
Ab=np.hstack([A, b])
print(Ab)
[[ 1  5 -2  0 -7]
 [-3  1  9 -5  9]
 [ 4 -8 -1  7  0]]
Matrix(Ab).rref()
(Matrix([
 [1, 0, 0,  8/7, -11/7],
 [0, 1, 0, -2/7,  -6/7],
 [0, 0, 1, -1/7,   4/7]]),
 (0, 1, 2))

위 결과의 기약행사다리꼴형은 3개의 피봇열을 가집니다. 즉, 3개의 선도변수와 1개의 자유변수를 가지므로 그 자유변수의 값에 따라 다양한 해들을 가질 수 있습니다.

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b