기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[Linear Algebra] 파이썬으로 행렬 객체 만들기

행렬 객체 만들기

python에서 행렬 객체를 생성하기 위해서는 numpy, pandas 모듈을 사용합니다. numpy 모듈에서 array() 함수는 다른 행렬 객체를 생성하는 대부분 함수의 기반이 되는 함수입니다.

 import numpy as np
from sympy import *
x=np.array([1,2,3]); x
array([1, 2, 3])

위 객체 x는 3개의 요소로 구성된 벡터입니다. 즉 하나의 차원을 가집니다(차원(dimension) 참조). 객체의 차원과 그에 따른 형태는 각각 .ndim, .shape속성을 확인할 수 있습니다.

x.ndim, x.shape
(1, (3,))

위 결과에 의하면 객체 x는 1차원으로 3개의 요소들로 구성됨을 나타냅니다. 같은 요소들로 구성된 다음 객체 x1은 행렬입니다.

x1=np.array([[1],[2],[3]]); x1
array([[1],
       [2],
       [3]])
print(x1)
[[1]
 [2]
 [3]]

파이썬의 함수 print()는 결과의 자료형 등의 속성을 배제한 상태로 출력합니다.

x1.ndim, x1.shape
(2, (3, 1))

객체 x1는 2차원 즉, 2개의 축으로 행과 열로 구성됩니다. 그러나 행 또는 열 중 하나가 1일 경우 실제적으로 1차원인 벡터입니다.

파이썬에서 벡터와 행렬을 구분한다는 것은 매우 중요합니다. 벡터, 행렬 연산의 경우 기본적으로 차원을 조정해야 하기 때문입니다. 예를 들어 행과 열이 바꾸는 것을 전치(transpose)라고 하며 객체.T로 실행됩니다. 그러나 벡터일 경우는 실행되지 않습니다.

x.T
array([1, 2, 3])
x1.T
array([1, 2, 3])

벡터인 객체 x를 행렬로 변경하기 위해 numpy객체.reshape(행의 수, 열의 수) 메소드를 사용할 수 있습니다. 이 함수에서 행의수 또는 열의수에 -1을 지정하면 다른쪽에 지정된 수에 의해 자동으로 변환됩니다. 예를 들어 다음 코드의 경우 3개의 요소를 가진 객체 x의 변환을 위해 열의 수를 1개로 지정했으므로 다른 지정수 -1은 3으로 인식됩니다.

x2=x.reshape(-1,1) #=x.reshape(3,1)
print(x2)
[[1]
 [2]
 [3]]

위 객체 x와 x1에서 보는 것과 같이 하나의 대괄호는 하나의 행을 나타냅니다. 다음 객체 y의 경우 큰 대괄호 내부에 두개의 대괄호를 포함합니다. 그러므로 2개의 행을 가진 객체이고 각 행은 3개의 요소들로 구성되므로 3열이 이루어집니다.

y=np.array([[1,2,3],[4,5,6]])
print(y)
[[1 2 3]
 [4 5 6]]

numpy 모듈에서는 array()외에 mat()함수를 사용하여 행렬객체를 생성할 수 있습니다. 이 함수에서 인수를 전달하는 형식은 array()보다 편리합니다.

  • np.mat(" "): 벡터, 행렬 객체의 생성
  • 인수는 따옴표내(' ' 또는 " ")에 각 행은 세미콜론(;)으로 구분합니다.
x=np.mat("1,2,3; 4, 5, 6")
x
matrix([[1, 2, 3],
        [4, 5, 6]])

그러나 이 함수는 수치형인 경우에만 작동됩니다. 즉, 사용이 편리하지만 전달하는 자료형과 연산에 사용되는 numpy 메소드, 속성 등에 한계가 있습니다.

수학에서는 식을 작성하기 위해 구체적인 수대신 x, y와 같은 미지수를 수학기호로 취급하여 사용하는 경우가 많습니다. 이러한 경우 array() 함수등은 사용할 수 없습니다. 파이썬에서 x, y 등은 문자로 인식하기 때문에 수를 대신할 수 없기 때문입니다. 그러나 sympy 모듈은 문자를 수학적 기호로 인식하여 식(expression, equation)을 생성합니다. 이 모듈에서 벡터, 행렬 객체를 생성하기 위해 다음 함수를 사용합니다.

  • Matrix(자료) 또는 Matrix(행의 수, 열의 수 , 자료)
    • 자료를 행렬로 변환시킵니다.
    • array()함수와 동일하게 대괄호([ ])로 행과 열의 수를 조정하지만 미리 행과 열의 수를 정의하여 보다 쉽게 사용할 수 있습니다.

    sympy.symbols('변수') 함수로 기호로 사용할 변수를 지정합니다.

    x1,x2,x3,x4,x5,x6=symbols("x1,x2,x3,x4,x5,x6")
    A=Matrix([x1,x2, x3]); A

    $\left[\begin{matrix}x_{1}\\x_{2}\\x_{3}\end{matrix}\right]$

    • sympy 객체.shape: 객체의 행과 열의 수를 나타냅니다.
    A.shape
    (3, 1)

    sympy의 다양한 속성, 메서드, 함수이름이 numpy에서 사용하는 그것들과 동일한 이름을 갖지만 numpy와

    sympy는 다른 별도의 모듈로서 각각의 모듈에서 생성되는 객체의 자료형이 다르기 때문에 두 모듈을 교차하여 사용할 수 없습니다. 즉, sympy 모듈에서는 sympy 객체에만 적용됩니다.

    b=Matrix([[x1,x2,x3],[x4,x5,x6]]);b

    $\left[\begin{matrix}x_{1} & x_{2} & x_{3}\\x_{4} & x_{5} & x_{6}\end{matrix}\right]$

    b1=Matrix(2, 3,[x1, x2, x3, x4, x5, x6]); b1

    $\left[\begin{matrix}x_{1} & x_{2} & x_{3}\\x_{4} & x_{5} & x_{6}\end{matrix}\right]$

    위의 객체에서 각 기호에 특정한 수를 지정하기 위해서는 다음 함수를 사용합니다.

    • 객체.subs(기호, 값): 전달할 인수가 여러개일 경우는 리스트로 전달합니다.
      • 객체.subs([(기호1, 값1), (기호2, 값2),...])
    b1.subs([(x1,1),(x2,2),(x3,3),(x4,4),(x5,5),(x6,6)])

    $\left[\begin{matrix}1 & 2 & 3\\4 & 5 & 6\end{matrix}\right]$

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b