기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

R caracas패키지를 이용한 극한, 미분, 적분 (R에서 sympy 사용하기)

caracas패키지를 이용한 극한, 미분, 적분

symbol과 subs()

문자 s1, s2 심벌(기호)로 선언하기 위해 def_sym()를 사용합니다. 이 함수는 symbol() 함수와 같습니다. 그러나 그 사용은 약간의 차이가 있습니다.
def_sym(s1, s2);s1 #s1, s2를 선언
[caracas]: s1
s2
[caracas]: s2
str(s1)
List of 1
 	$ pyobj:s1
 	- attr(*, "class")= chr "caracas_symbol"
s3<-s1*s2; s3 #기호 s1, s2의 연산에 의해 선언된 기호
[caracas]: s1*s2
str(s3) #attr(*, "class")= chr "caracas_symbol"
List of 1
 	$ pyobj:s1*s2
 	- attr(*, "class")= chr "caracas_symbol"
subs() 함수는 기호를 다른 문자나 숫자로 대체합니다.
subs(식 또는 심벌, 'caracas_symbol',대체할 문자 또는 숫자) 또는
subs('caracas_symbol',대체할 문자 또는 숫자)
%>%: pipe operator는 R에서 동일한 데이터를 대상으로 연속으로 작업하게 해주는 연산자입니다.
s4<-s3 %>%subs("s1", "u+v") %>% subs("s2", "u-v"); s4
[caracas]: (u - v)*(u + v)
s5<-expand(s4); s5
[caracas]:  2    2
			  u  - v
tex(s5)
[1] "u^{2} - v^{2}"
as_expr(심벌 또는 기호로 구성된 함수): R의 expression 함수로 전환
as_sym(expression): 심벌 또는 기호로 구성된 함수로 전환
위 변환된 객체 모두 caracas 객체입니다.
위 심벌은 식(expression)으로 강제변환됩니다.
e5<-as_expr(s5); e5
expression(u^2 - v^2)
또한 그 역인 식을 심벌로 강제변환이 가능합니다.
as_sym(e5)
[caracas]:  2    2
			u  - v
def_sym()은 다음의 symbol()에 의해 정의하는 것과 같습니다.
a<-symbol('a')
a
[caracas]: a
b<-symbol('b'); b
[caracas]: b
b1<-symbol('a'); str(b)
List of 1
 	$ pyobj:b
	 - attr(*, "class")= chr "caracas_symbol"
b2<-b1+1; b2
[caracas]: a + 1
b3<-subs(b2, 'a', 'k'); b3
[caracas]: k + 1
subs(a,'a', 2)
[caracas]: 2.00000000000000

극한(limit)을 사용하여 자연상수 발견하기

def_sym(n)
f<-(1+1/n)^n; f
[caracas]:        n
           /    1\ 
           |1 + -|
           \    n/
tex(f)
[1] "\\left(1 + \\frac{1}{n}\\right)^{n}"
위 함수 f를 $n \to \infty$로의 극한을 계산합니다.
lim_f<-lim(f, n, Inf); lim_f
[caracas]: exp(1)
 tex(lim_f)
[1] "e"
as_expr(lim_f)
[1] 2.718282
위 limit()함수에서 인수 doit = FALSE로 지정함으로서 극한 결과를 평가하지 않도록 하여 추후에 평가 및/또는 추가 대수적 조작을 위해서만 기호만을 설정할 수 있습니다.
lim_f1_sym<-lim(f, n, Inf, doit=FALSE); lim_f1_sym
[caracas]:             n
                   /    1\
            lim |1 + -|
           n->oo\    n/
위 결과는 기본적으로 UTF-8을 사용하는 caracas의 기본 형태입니다. 이 형태는 tex() 함수를 사용하여 다음과 같이 latex 코드로 전환하여 나타낼 수 있습니다.
tex(lim_f1_sym)
[1] "\\lim_{n \\to \\infty} \\left(1 + \\frac{1}{n}\\right)^{n}"
위 결과들에서 tex() 결과들을 latex 형태로 변환하면 다음과 같습니다. (위 결과에서 backspace가 두개씩 출력되는 것은 R 자체의 escape 문자 때문입니다. 즉, '\'가 원래 의미인 backspace로 사용한다는 것을 나타내기 위해 '\\'와 같이 나타내는 것입니다. 그러므로 latex 코드로 변환하기 위해서는 '\'를 사용합니다.) $$\left(1 + \frac{1}{n}\right)^{n}, \quad \lim_{n \to \infty} \left(1 + \frac{1}{n}\right)^{n}, \quad e$$ 위 결과는 평가되지 않은 상태입니다. 이를 평가하기 위해 doit() 함수를 사용합니다.
lim_f1<-doit(lim_f1_sym); lim_f1
[caracas]: exp(1)

미분과 적분

def_sym(), symbol(): 변수(심벌)정의
as_sym(): 함수 정의
der(): 미분
int():적분
def_sym(x, a, b, c)
f<-as_sym('a*x+b*x^2+c*sin(x^2)'); f
[caracas]:          2        / 2\
           a*x + b*x  + c*sin\x /
tex(f)
[1] "a x + b x^{2} + c \\sin{\\left(x^{2} \\right)}"
df<-der(f, x) #=der(f, 'x'); df
df
[caracas]:                      / 2\
           a + 2*b*x + 2*c*x*cos\x /
tex(df)
[1] "a + 2 b x + 2 c x \\cos{\\left(x^{2} \\right)}"
subs(df, "x",  2)
[caracas]: a + 4.0*b - 2.61457448345445*c
f1<-int(df, 'x')
f1
[caracas]:          2        / 2\
           a*x + b*x  + c*sin\x /
subs(f1, 'x', 4)
[caracas]: 4.0*a + 16.0*b - 0.287903316665065*c
subs(f1, 'a', 1)
[caracas]:    2        / 2\
           b*x  + c*sin\x / + 1.0*x

식으로 값 결정

위의 결과와 같이 subs() 함수에 의해서는 심벌 1개에 대한 값만을 입력할 수 있습니다. 위 식은 a, b, c, x 모두 심벌(기호)로서 동시에 값을 입력하기 위해서는 위 식을 expression으로 전환하여 eval() 함수를 사용합니다.
f1 %>% as_expr() %>% eval(list(a=1, b=3, c=2, x=4))
[1] 51.42419
subs() 함수에서 치환하기 위해 전달하는 인자값들의 계산이 치환 이전에 시행된다. 다음 함수 $f=exp(x^2)$에 대해 subs() 함수의 적용 예를 봅니다.
def_sym(x)
f<-exp(x^2)
subs(f, x, 1/3+1/4)
[caracas]: 1.40533790799144
subs(f, x, 7/12)
[caracas]: 1.40533790799144
N()함수를 사용하여 유효숫자를 지정합니다.
N(subs(f, x, 7/12), 2)
[caracas]: 1.4
여러개의 변수를 가진 식에 심벌들에 값을 전달하기 위해 as_expr()eval() 함수를 사용합니다.
g<-a*x^2+b*x+c
g
[caracas]:    2
           a*x  + b*x + c
g1<-as_expr(g); g1
expression(a*x^2 + b*x + c)
g2<-g %>% as_expr() %>% eval(list(a=2, b=3, c=1))
g2
[caracas]:    2
           2*x  + 3*x + 1
for (i in c(3, 5, 7, 9))  print(subs(g2, x, i))
[caracas]: 28.0000000000000
[caracas]: 66.0000000000000
[caracas]: 120.000000000000
[caracas]: 190.000000000000

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b