기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[sympy] Sympy객체의 표현을 위한 함수들

Sympy객체의 표현을 위한 함수들

General

  • simplify(x): 식 x(sympy 객체)를 간단히 정리 합니다.
import numpy as np
from sympy import *
x=symbols("x")
a=sin(x)**2+cos(x)**2
a

$\sin^{2}{\left(x \right)} + \cos^{2}{\left(x \right)}$

simplify(a)
1
simplify(b)

$\frac{x^{3} + x^{2} - x - 1}{x^{2} + 2 x + 1}$

simplify(b)
x - 1
c=gamma(x)/gamma(x-2)
c

$\frac{\Gamma\left(x\right)}{\Gamma\left(x - 2\right)}$

simplify(c)

$\displaystyle \left(x - 2\right) \left(x - 1\right)$

위의 예들 중 객체 c의 감마함수(gamma(x))는 확률분포 등 여러 부분에서 사용되는 표현식으로 다음과 같이 정의 됩니다. 감마함수는 음이 아닌 정수를 제외한 모든 수에서 정의됩니다. 식 1과 같이 자연수에서 감마함수는 factorial(!), 부동소수(양의 실수)인 경우 적분을 적용하여 계산합니다.

$$\tag{식 1}\Gamma(n) =\begin{cases}(n-1)!& n:\text{자연수}\\\int^\infty_0x^{n-1}e^{-x}\,dx& n:\text{부동소수}\end{cases}$$

x=symbols('x')
gamma(x).subs(x,4)
$\displaystyle 6$

factorial 계산은 math.factorial() 함수를 사용할 수 있습니다.

import math
math.factorial(3)
6
a=gamma(x).subs(x,4.5)
a.evalf(3)
11.6

simpilfy() 함수의 알고리즘은 식에서 공통사항을 찾아 정리하는 것입니다. 그러므로 다음 식의 경우 식 전체에서 공통부분이 없으므로 더이상 정리되지 않습니다.

simplify(x**2+2*x+1)

$x^{2} + 2 x + 1$

삼각함수를 단순하게 표현하기 위해 trigsimp() 함수를 적용합니다.

eq=sin(x)**2+cos(x)**2
trigsimp(eq)
1

위 예인 $x^{2} + 2 x + 1$의 경우 식 내부에 공통부분이 없으므로 simplify() 함수로 정리가 되지 않습니다. 그러나 식 2와 같이 인수분해를 통해 간략화 할 수 있습니다. 인수분해는 sympy.factor(식) 함수를 적용할 수 있습니다.

$$\tag{식 2} x^2+2x+1 \rightarrow (x+1)^2$$

  • factor(식)
    • 인수분해를 실행
    • 다항식을 더이상 감소될 수 없는 형태로 변환합니다.
factor(x**2+2*x+1)

$\left(x + 1\right)^{2}$

factor(x**3-x**2+x-1)

$\left(x - 1\right) \left(x^{2} + 1\right)$

y, z=symbols("y z")
factor(x**2*z+4*x**y*z+4*y*2*z)

$z \left(x^{2} + 4 x^{y} + 8 y\right)$

factor() 함수와 유사하지만 식을 정리하는 과정을 나타내는 함수로 factor_list() 함수를 사용할 수 있습니다.

  • factor_list(): factor() 결과에서 각각의 인수를 별도로 나타냄
factor_list(x**2*z+4*x**y*z+4*y*2*z)
(1, [(z, 1), (x**2 + 4*x**y + 8*y, 1)])
factor(x**2*z+4*x**y*z+4*y*2*z)

$z \left(x^{2} + 4 x^{y} + 8 y\right)$

factor() 함수와는 다르게 인수분해된 식을 전개하기 위해 expand() 함수를 사용합니다.

  • expand(식): simplify(), factor() 함수와는 반대로 식을 전개시킵니다.
expand((x+1)**2)

$x^{2} + 2 x + 1$

eq=(sin(x)+cos(x))**2
expand(eq)

$\sin^{2}{\left(x \right)} + 2 \sin{\left(x \right)} \cos{\left(x \right)} + \cos^{2}{\left(x \right)}$

위의 결과와 같이 expand()함수는 식들을 모두 전개시킴으로서 일반적으로 simplify()함수 보다 식의 크기가 증가하지만 expand()와 simplify() 모두 심벌로 지정된 문자를 포함하여 연산한 결과를 전개 또는 압축하는 것으로서 동일한 결과를 반환할 수 있습니다.

expand((x+1)*(x-2)-(x-1)*x)
-2
simplify((x+1)*(x-2)-(x-1)*x)
-2

다중 변수를 사용하는 식의 경우 collect() 함수로 정리할 수 있습니다.

  • collect(식, 변수=none)
    • 다항식에서 지정된 심벌과 각 항의 차수에 의해 식을 정리하여 반환
    • 지정된 변수에 의해 식을 정리, 기본값은 none
ex=x*y+x-3+2*x**2-z*x**2+x**3
ex

$ x^{3} - x^{2} z + 2 x^{2} + x y + x - 3$

col_ex=collect(ex, x)
col_ex

$x^{3} + x^{2} \cdot \left(2 - z\right) + x \left(y + 1\right) - 3$

식의 지정한 변수에 따른 각 차수의 계수는 .coeff(변수, 차수) 메소드를 사용하여 호출할 수 있습니다.

col_ex.coeff(x, 2)
2 - z

분수들의 연산 결과를 $\frac{p}{q}$ 형태로 정리하기 위해 cancel(분수) 함수를 적용할 수 있습니다.

ex= (3*x/2 - 2)/(x - 4) + 1/x
ex

$\frac{\frac{3 x}{2} - 2}{x - 4} + \frac{1}{x}$

cancel(ex)

$\frac{3 x^{2} - 2 x - 8}{2 x^{2} - 8 x}$

cancel()와 factor()를 함께 사용하면 분수형태로 최종적으로 정리된 상태로 반환합니다.

factor(cancel(ex))

$\frac{\left(x - 2\right) \left(3 x + 4\right)}{2 x \left(x - 4\right)}$

분수 형태를 부분분수로 나타내기 위해 apart(분수) 함수를 적용합니다. 예를들어 식 3과 같은 분수는 부분분수들의 합으로 분해 할 수 있습니다.

$$\tag{식 3}\frac{ 4x^3 + 21x^2 + 10x + 12}{ x^4 + 5x^3 + 5x^2 + 4*x}=\frac{2x - 1}{x^2 + x + 1} - \frac{1}{x + 4} + \frac{3}{x}$$

ex=(4*x**3 + 21*x**2 + 10*x + 12)/(x**4 + 5*x**3 + 5*x**2 + 4*x)
ex

$\frac{4 x^{3} + 21 x^{2} + 10 x + 12}{x^{4} + 5 x^{3} + 5 x^{2} + 4 x}$

apart(ex)

$\frac{2 x - 1}{x^{2} + x + 1} - \frac{1}{x + 4} + \frac{3}{x}$

파이썬에서 삼각함수의 역함수는 접두어로 a-를 첨가하여 표시하는데 sympy 역시 동일한 관례를 따릅니다. 예를 들어 cos()함수의 역함수는 acos()함수로 표현합니다.

acos(cos(x))

$\operatorname{acos}{\left(\cos{\left(x \right)} \right)}$

로그함수(logarithms)는 log(윗수, 밑수=e) 함수를 사용합니다. 이 함수의 밑수의 기본값은 e로서 자연로그입니다. 자연로그의 경우 ln(식) 함수를 사용할 수 있습니다.

ln(x)

$\log{\left(x \right)}$

log(x, 10)

$\frac{\log{\left(x \right)}}{\log{\left(10 \right)}}$

로그함수의 특성은 식 4와 같습니다.

\begin{align} \log(xy)&=\log(x) + \log(y)\\\log(x^n)&=n\cdot log(x)\\\log(\frac{x}{y})= log(x) - log(y)\\x, y &\geq 0, \; n \in \mathbb{R}\end{align}

위의 조건에 부합한다면 simplify(), expand()함수가 작동합니다. 특히 logcombind()는 simplify()와 expand_log()함수는 expand()함수와 동일한 효과를 나타냅니다. 그러나 simplify와 expand함수는 모든 로그 경우에서 올바른 작동을 하지 않은 경우가 발생하므로 위의 특화된 함수들을 사용하는 것이 유리합니다. 조건에 관계없이 강제적으로 변환을 할 경우 force=True를 함수에 전달합니다.

x,y =symbols('x, y', positive=True)
n=symbols('n', real=True) simplify(log(x) + log(y))
og(x*y)
simplify(n*log(x))
n*log(x)
logcombine(n*log(x))
log(x**n)
expand(log(x*y))
log(x) + log(y)
expand_log(log(x*y))
log(x) + log(y)

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b