기본 콘텐츠로 건너뛰기

[Linear Algebra] 정규직교(Orthonormal)

[Linear Algebra] 정규직교(Orthonormal)

정규직교(Orthonormal)

서로 직교하는 단위 벡터들을 정규 직교(orthonormal)라고 하며 기저 벡터가 됩니다. 정규직교 집합 {u1, u2, …, up}은 직교 벡터들의 선형결합으로 생성된 부분공간(W)의 스판이 됩니다. 식 1과 같이 나타낼 수 있습니다.

$$\tag{식 1} W=\text{span}\{u_1,\, u_2,\, \cdots,\, u_p\}$$

이 벡터들의 선형 결합은 선형 독립이므로 자명한(trivial) 해를 가집니다. 결과적으로 정규직교 집합은 W의 정규직교 기저(orthonormal basis)가 됩니다.

정규직교 집합은 정규직교기저가 됩니다.

예 1)

다음 세 벡터들은 ℝ3의 정규직교 기저인지를 결정합니다.

$$v_1=\begin{bmatrix}\frac{3}{\sqrt{11}}\\\frac{1}{\sqrt{11}}\\\frac{1}{\sqrt{11}} \end{bmatrix} \quad v_2=\begin{bmatrix}-\frac{1}{\sqrt{6}}\\\frac{2}{\sqrt{6}}\\\frac{1}{\sqrt{6}} \end{bmatrix} \quad v_3=\begin{bmatrix} -\frac{1}{\sqrt{66}}\\ -\frac{4}{\sqrt{66}}\\-\frac{7}{\sqrt{66}}\end{bmatrix}$$

v1=np.array([3/11**0.5, 1/11**0.5, 1/11**0.5]).reshape(3,1)
v2=np.array([-1/6**0.5, 2/6**0.5, 1/6**0.5]).reshape(3,1)
v3=np.array([-1/66**0.5, -4/66**0.5, 7/66**0.5]).reshape(3,1)
for i, j in enumerate([v1, v2, v3 ]): 
    print(F" v{i+1}의 norm: {np.around(la.norm(j),1)}")
 v1의 norm: 1.0
 v2의 norm: 1.0
 v3의 norm: 1.0
V=[v1,v2,v3]
for i, j in itertools.combinations([1,2,3], 2):
    print(f"v{i}와 v{j}의 inner: {np.around(V[i-1].T.dot(V[j-1]), 6)}")
v1와 v2의 inner: [[0.]]
v1와 v3의 inner: [[0.]]
v2와 v3의 inner: [[0.]]

위 결과에 의하면 세 벡터는 모두 정규직교 벡터입니다. 그러므로 ℝ3의 기저가 됩니다. 세 벡터의 선형결합이 선형독립임을 판단하는 것으로 기저임을 확인할 수 있습니다.

V=np.hstack([v1,v2,v3])
print(np.around(V,3))
 [[ 0.905 -0.408 -0.123]
 [ 0.302  0.816 -0.492]
 [ 0.302  0.408  0.862]]

표준행렬이 정방행렬이고 선형독립인 경우 역행렬이 존재합니다. 즉, 행렬식이 0이 아닙니다.

la.det(V).round(3)
1.0
V_inv=la.inv(V)
print(V_inv.round(3))
V_inv=la.inv(V)
print(V_inv.round(3))

위 결과는 표준행렬 V의 모든 열은 피벗열임을 의미합니다.

Matrix(V).rref()
 (Matrix([
[1, 0, 0],
[0, 1, 0],
[0, 0, 1]]),
(0, 1, 2))

위 결과에서 암시되는 것과 같이 표준행렬 V의 역행렬은 V의 전치행렬과 같습니다. 이것은 정규직교 벡터들로 구성된 행렬의 특성입니다.

print(np.isclose(V.T, la.inv(V)))
[[ True  True  True]
[ True  True  True]
[ True  True  True]]
정규직교의 특성

식 2가 성립되는 m×n 행렬 U의 열벡터들은 정규직교 벡터의 집합이 됩니다.

$$\tag{식 2}U^TU=I \Leftrightarrow U^T=U^{-1}$$

또한 정규 직교 벡터들로 구성된 m×n 행렬 U와 ℝn 차원의 벡터 x, y 사이에 식 3이 성립합니다.

\begin{align}\tag{식 3}\Vert{Ux}\Vert&=\Vert{x}\Vert\\ (Ux)\cdot(Uy) & = xy\\ x \cdot y =0 & \rightarrow (Ux)\cdot (Uy) = 0\end{align}

식 2의 특성은 정규직교 벡터들을 판단하기 위해 사용됩니다. 정규직교 벡터 a, b, 그리고 c로 구성되는 정규직교행렬 U(식 4)를 사용하여 그 특성을 확인합니다.

\begin{align}\tag{식 4}& a=\begin{bmatrix}a_1\\a_2\\a_3 \end{bmatrix}\quad b=\begin{bmatrix}b_1\\b_2\\b_3 \end{bmatrix}\quad c=\begin{bmatrix}c_1\\c_2\\c_3 \end{bmatrix} \\ & U=\begin{bmatrix}a_1& b_1& c_1\\a_2& b_2& c_2\\a_3& b_3& c_3 \end{bmatrix}\end{align}

행렬 U는 정규직교행렬이므로 $U^T·U = I$이 성립합니다(식 5).

\begin{align}\tag{식 5}&\begin{bmatrix}a_1& a_2& a_3\\b_1& b_2& b_3\\c_1& c_2& c_3 \end{bmatrix} \begin{bmatrix}a_1& b_1& c_1\\a_2& b_2& c_2\\a_3& b_3& c_3 \end{bmatrix}\\ &=\begin{bmatrix}a_1^2+a_2^2+a_3^2& a_1b_1+a_2b_2+a_3b_3& a_1c_1+a_2c_2+a_3c_3\\a_1b_1+a_2b_2+a_3b_3& b_1^2+b_2^2+b_3^2& b_1c_1+b_2c_2+b_3c_3\\a_1c_1+a_2c_2+a_3c_3& b_1c_1+b_2c_2+b_3c_3& c_1^2+c_2^2+c_3^2\end{bmatrix} \\ & \begin{bmatrix}1& 0 & 0\\ 0& 1& 0\\0& 0& 1 \end{bmatrix}\end{align}

식 5는 식 6과 같이 정리됩니다.

\begin{align}\tag{식 6} & \begin{bmatrix}a^Ta& a^Tb & a^Tc\\a^Tb& b^Tb& b^Tc\\a^Tc& b^Tc& c^Tc \end{bmatrix} = \begin{bmatrix}1& 0 & 0\\ 0& 1& 0\\0& 0& 1 \end{bmatrix} \\ & \Rightarrow \; \begin{cases}a^Ta=b^Tb=c^Tc=1 \\ a^Tb=a^Tc=b^Tc=0\end{cases} \end{align}

위 정규직교의 특성 중 식 3은 다음 예로 확인합니다.

예 2)

정규 직교 행렬 U에 대해 식 3의 성립 여부를 조사해 봅니다.

$$U=\begin{bmatrix}\sqrt{\frac{1}{2}} & \frac{2}{3}\\ \sqrt{\frac{1}{2}} & -\frac{2}{3}\\ 0 & \frac{1}{3}\end{bmatrix}$$

U=np.array([[1/2**0.5, 2/3], [1/2**0.5, -2/3], [0, 1/3]])
print(np.around(U, 3))
[[ 0.707  0.667]
[ 0.707 -0.667]
[ 0.     0.333]]
print(np.dot(U.T, U).round(3))
[[1. 0.]
 [0. 1.]]
x=np.array([[2**0.5],[3]])
y=np.array([[4], [6]])
Ux=np.dot(U,x)
Uy=np.dot(U, y)
#‖Ux‖=‖x‖
la.norm(Ux)==la.norm(x)
True
#(Ux)·(Uy)=x·y
UxUy=np.dot(Ux.T,Uy)
print(UxUy)
[[23.65685425]]
xy=np.dot(x.T,y)
print(xy)
[[23.65685425]]
np.allclose(UxUy, xy)
True

예 3)

다음 행렬 U는 직교 행렬입니까?

$$U=\begin{bmatrix}3& -4& 0\\ 4& 3& 0\\ 0& 0& 5\end{bmatrix}$$

U=np.array([[3, -4, 0],[4, 3, 0],[0,0,5]], dtype=np.float64)
print(U)
[[ 3. -4.  0.]
[ 4.  3.  0.]
[ 0.  0.  5.]]
U_norm=la.norm(U, axis=0)
print(U_norm)
[5., 5., 5.]
U1=U/U_norm #U를 단위 행렬로 전환
print(U1)
[[ 0.6 -0.8  0. ]
[ 0.8  0.6  0. ]
[ 0.   0.   1. ]]
np.allclose(U1.T, la.inv(U1))
True

위 행렬의 단위 행렬에서 전치 행렬과 역행렬이 같습니다. 그러므로 직교 행렬입니다.

댓글

이 블로그의 인기 게시물

유사변환과 대각화

내용 유사변환 유사행렬의 특성 대각화(Diagonalization) 유사변환(Similarity transformation) 유사변환 n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사하다고 하며 이 변환을 유사 변환 (similarity transformation)이라고 합니다. $$\begin{equation}\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B \end{equation}$$ 식 1의 유사 변환은 다음과 같이 고유값을 적용하여 특성 방정식 형태로 정리할 수 있습니다. $$\begin{align} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align}$$ 위 식의 행렬식은 다음과 같이 정리됩니다. $$\begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \t

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b