기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

다항식과 인수분해

다항식(plynomial)

내용

하나의 변수를 가진 다항식

식 1은 하나의 변수를 가진 다항식을 표현한 것입니다.

\begin{align}&ax^n\\ \tag{식 1} &a: \text{계수(coeficient)}\\ &x: \text{변수(variable)}\\ &n: \text{차수(degree)}\end{align}

  • 다항식의 차수는 0을 포함하는 양의 정수이어야 합니다.
  • 다항식 전체의 차수를 표현할 경우는 가장 높은 것으로 나타냅니다.

예 1)

(1) A = 5 x12 - 2 x6 + 5 x5 - 198 x + 1: 식 A의 차수는 12입니다.

(2) B=-8: B는 -8x0와 같습니다. 그러므로 차수는 0입니다.

(3) 5x-7: 역시 다항식입니다. 차수는 1입니다.

이와 같이 다항식은 변수의 차수가 반드시 1이상일 필요는 없으며 차수가 0으로 변수를 포함하지 않는 경우 역시 다항식으로 표현됩니다.

예 2)

다음식들은 다항식이 아닙니다.

(1)$4x^6+15x^{-4}+7$ : 음수(-4) 차수를 포함

(2)$5\sqrt{x} -x+3$: 차수 $\frac{1}{2}$는 정수가 아닌 차수

(3)$\frac{3}{x}+x^3-2$: 음수인 차수(-1)

물론 계수에는 이러한 제한이 없습니다.

두개의 변수를 가진 다항식

식 2는 두개의 변수를 가진 다항식의 일반 형태입니다.

\begin{align}\tag{식 2}& ax^ny^m\\ & a:\text{계수}\\ & x,y: \text{변수}\\ & n, m: \text{차수}\end{align}

  • 두 변수를 가진 다항식의 각 항의 차수는 각 항의 각 변수의 차수들의 합으로 표현합니다.
  • 전체에서 가장 높은 차수가 그 다항식을 대표합니다.

예 3)

$$x^2y-6x^3y^{12}+10x^2-7y+1$$

위 식의 첫재항의 차수는 3, 둘째항 15, 세째항은 2, 넷째항은 1, 다섯째 항은 0입니다. 그러므로 이 다항식의 차수는 15입니다.

아래의 식과 같이 두 변수를 가진 다항식에서 두 변수로 이루어진 항을 반드시 가질 필요는 없습니다. 즉, 다항식의 각항이 하나의 변수로 이루어 질 수 있습니다.

$$6x^3+7y^5+x-y$$

다항식이라는 이름에서 알 수 있듯이 식에는 1개 이상의 항들을 가집니다. 특히 하나의 항만을 가지는 경우를 단항식(monomial), 두개의 항을 가지는 경우를 이항식(binomial), 세개의 항을 가지는 식을 삼항식(trinomial)이라고 합니다.

연산

다항식의 더하기, 빼기 연산은 기본적으로 같은 차수 사이에서 이루어집니다.

\begin{align}(6x^5-10x^2+x-45)+(13x^2-9x+4)7& = 6x^5+(-10+13)x^2+(1-9)x+(-45+4)\\& =6x^5-3x^2-8x-41\end{align}

import numpy as np
import pandas as pd
from sympy import *
x =symbols('x')
A=6*x**5-10*x**2+x-45
B=13*x**2-9*x+4
A+B

$ 6 x^{5} + 3 x^{2} - 8 x - 41$

A-B

$6 x^{5} - 23 x^{2} + 10 x - 49$

곱하기와 나누기 연산은 차수와 상관없이 분배법칙이 적용됩니다.

\begin{align}4x^2(x^2-6x+2)&=4x^2 \cdot x^2-4x^2 \cdot 6x+ 4x^2 \cdot 2\\& =4x^{2+2}-4 \cdot 6x^{2+1}+ 4 \cdot 2 x^2\\& =4x^{4}-24x^{3}+ 8 x^2\end{align}

다음 코드에서 두 식의 곱을 전개하기 위해 sympy모듈의 expand()함수를 사용합니다.

x =symbols('x')
A=4*x**2
B=x**2-6*x+2
A*B

$4 x^{2} \left(x^{2} - 6 x + 2\right)$

expand(A*B)

$4 x^{4} - 24 x^{3} + 8 x^{2}$

다항식의 인수분해 (factoring polynomials)

인수분해는 주어진 값을 얻기 위해 배수를 결정하는 과정입니다. 예를들어 12는 6의 두배로 분해할 수 있고 4를 3배하는 것으로 분해하는 것과 같이 다양한 방법으로 분해가 가능합니다.

$$12=2 \cdot 6 \;\text{or} \; 3 \cdot 4 \;\text{or} \; 3 \cdot 2 \cdot 2 \cdots$$

일반적으로 숫자를 인수분해하는 것은 솟수(prime number)로 분해하는 것을 의미합니다

솟수는 1과 자신외에 나누어지지 않는 수로서 2, 3, 5, 7, ...등으로 12의 인수분해는 다음과 같이 나타낼 수 있습니다.

$$12 = 2 \cdot 2 \cdot 3$$

다항식을 인수분해하는 것 역시 유사합니다. 즉, 원래의 식을 얻을 수 있도록 여러 다항식들의 곱(배수)으로 나타내고 더 이상 분해되지 않는 인수들로 구성됩니다. 다음 함수를 사용할 수 있습니다.

sympy.factor(x): sympy 객체인 다항식 x를 인수분해합니다.

다항식 $x^2-16$을 인수분해 합니다.

$$x^2-16=x^2-4^2=(x+4)(x-4)$$

위 인수분해 과정을 코드화 합니다.

x =symbols('x')
y=x**2-16
factor(y)
(x−4)(x+4)
y=x**4-16
factor(y)

$\left(x - 2\right) \left(x + 2\right) \left(x^{2} + 4\right)$

인수분해를 위한 일반적인 방법은 공통적으로 가지는 인수들 중에 가장 큰 인수 즉, 최대공약수를 결정하고 그 공약수에 따라 식을 정리하는 것입니다.

$$8x^4-4x^3+10x^2$$

위 식의 최대공약수는 $2x^2$입니다. 그러므로 다음과 같이 인수분해 할 수 있습니다.

$$2x^2(4x^2-2x+5)$$

위 식에서 더이상의 공통인수를 발견할 수 없습니다.

x =symbols('x')
y=8*x**4-4*x**3+10*x**2
factor(y)

$2 x^{2} \cdot \left(4 x^{2} - 2 x + 5\right)$

y=9*x**2*(2*x+7)-12*x*(2*x+7)
factor(y)
3x(2x+7)(3x−4)
y=x**5-3*x**3-2*x**2+6
factor(y)

$3 x \left(2 x + 7\right) \left(3 x - 4\right)$

다음의 특별한 다항식의 인수분해는 공식화하여 사용합니다.

\begin{align}& x^2 +2xy+y^2=(x+y)^2\\ & x^2 -2xy+y^2=(x-y)^2\\ & x^2-y^2=(x+y)(x-y)\\ & x^3+y^3=(x+y)(x^2-xy+y^2)\\ & x^3-y^3=(x+y)(x^2+xy+y^2)\end{align}

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b