기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

Sympy Introduction


개요

Symbolic 계산은 심벌로 이루어진 수학적 객체의 계산을 다룹니다
즉, 특정한 값이 전달되지 않은 변수들을 심벌로 표현하는 수학식을 나타낼 수 있다는 것을 의미합니다. 
9의 제곱근은 3인 정확한 수입니다.
>>> import math
>>> math.sqrt(9)
3.0
>>> 9**0.5
3.0
>>> pow(9, 0.5)
3.0
그러나 8의 제곱근은 다음과 같이 근사값이 반환되지요.
>>> math.sqrt(8)
2.8284271247461903
이러한 경우 sympy 모듈의 함수를 사용하면 정확히 반환되는 부분외의 다른 부분은 심벌을 사용하여 나타냅니다. , $\sqrt{8}=2 \sqrt{2}$의 형태로 나타냅니다.
>>> from sympy import *
>>> sqrt(8)
2*sqrt(2)

보다 정확한 표현을 위해 일정한 기호(심벌)을 사용하는 방식으로 다양한 변수들의 표현에 사용됩니다
이러한 수학적 표현을 형성하기 위해서는 일반적으로 문자로 인식되는 x, y등을 문자가 아닌 수학적 심벌(기호)로 사용한다는 것을 symbols()를 사용하여 미리 선언합니다. 

from sympy import symbol
>>> x, y=symbols('x y')#x,y는 문자가 아닌 심벌임을 선언 
>>> x
x
>>> y
y
>>> expr=x+2*y
>>> expr
x + 2*y
>>> type(x)
<class 'sympy.core.symbol.Symbol'>
위에서 expr 객체는 심벌 x, y를 지닌 객체이며 이 객체들과 심벌들 사이의 연산은 가능합니다.
>>> expr+1
x + 2*y + 1
>>> type(expr)
<class 'sympy.core.add.Add'>
>>> expr-x
2*y
>>> x*expr
x*(x + 2*y)
위의 결과는 $x^2+2xy$와 같이 모두 전개된 형태로 반환되지 않습니다. 이러한 형태로 반환하기 위해서는
expand 클래스의 expand() 함수를 사용하고 역으로 전개된 형태를 정리된 형태로 만들기 위해서는 factor.factor()함수를 사용합니다.
from sympy import expand, factor
>>> exEq=expand(x*expr)
>>> exEq
x**2 + 2*x*y
>>> factor(exEq)
x*(x + 2*y)

sympy 모듈하에서의 계산은 포함하는 심벌들을 중심으로 이루어 집니다. 즉, 심벌을 포함하는 방정식, 미분, 적분, 극한등의 식들은 단순화 또는 확장형태로 전개할 수 있습니다. 이러한 기능에 의해 심벌의 값이나 범위를 지정하여 식을 계산할 수 있으며 그 계산과정을 나타낼 수 있습니다. 
>>> from sympy import *
>>> x, t,z, nu=symbols("x t z nu")

unicode characters를 사용하여 반환하기 위해 print 조건을 다음과 같이 지정할 수 있습니다.
>>> init_printing(use_unicode=True)
sin(x)exp(x)의 미분
>>> diff(sin(x)*exp(x), x)#함수 sin(x)*exp(x)를 변수 x에 대해 미분 
exp(x) ⋅sin(x) + exp(x)⋅cos(x)
>>> dex=diff(sin(x)*exp(x), x)#미분된 식을 객체에 저장할 수 있습니다. 
>>> dex

exp(x)*sin(x) + exp(x)*cos(x)
위 결과를 다시 적분하면 원래의 함수가 반환됩니다.
$$\int^\infty_{-\infty} sin(x^2) dx$$
>>> integrate(dex, x)
exp(x)*sin(x)
무한대를 나타내는 $\infty$는 알파벳 소문자 o를 두개 이어서 표시합니다. "oo"
>>> integrate(sin(x**2), (x, -oo, oo))

sqrt(2)*sqrt(pi)/2
$\lim_{x \rightarrow 0} \frac{sin(x)}{x}$의 계산
>>> limit(sin(x)/x, x, 0)
1
$x^2-2=0$의 해를 구하기
>>> solve(x**2-2)
[-√2, √2]
$y^{\prime\prime}-y=e^t$ 의 미분방적식 풀기
>>> x, y, t,z, nu=symbols("x y t z nu")

>>> dsolve(Eq(y(t).diff(t, t) - y(t), exp(t)), y(t))
Eq(y(t), C2*exp(-t) + (C1 + t/2)*exp(t))
$\left[\begin{array}{rr} 1 & 2 \\ 2 & 2 \end{array}\right]$의 고유값
>>> m1= Matrix([[1,2], [2,2]]).eigenvals()
>>> m1

{-sqrt(17)/2 + 3/2: 1, 3/2 + sqrt(17)/2: 1}
 위의 sympy에 의한 값은 사전(dictionary)형식으로 반환되는데 고유값은 사전의 key로 반환합니다.
>>> type(m1)
<class 'dict'>
>>> m1.keys()
dict_keys([-sqrt(17)/2 + 3/2, 3/2 + sqrt(17)/2])
>>> list(m1.keys())
[-sqrt(17)/2 + 3/2, 3/2 + sqrt(17)/2]
>>> -(17**0.5/2)+1.5
-0.5615528128088303
위 식을 numpy.linalg.eig()함수를 사용하여 계산하면 다음과 같이 반환합니다. 
>>>  from numpy import linalg as LA
>>> LA.eigvals(np.array([[1,2], [2,2]]))#고유값만 반환 
array([-0.56155281,  3.56155281])
>>> LA.eig(np.array([[1,2], [2,2]]))#고유값과 고유벡터를 모두 반환 
(array([-0.56155281,  3.56155281]), array([[-0.78820544, -0.61541221],
       [ 0.61541221, -0.78820544]]))

심벌로 표현된 식을 LATEX 형식으로 출력.
>>> latex(Integral(cos(x)**2, (x, 0, pi)))
\int_{0}^{\pi} \cos^{2}{\left (x \right )}\, dx
$$\int_{0}^{\pi} cos^2(x)\, dx$$

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b