기본 콘텐츠로 건너뛰기

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

Sympy객체의 단순화

Simplification(단순화)

General

simplify sympy의 가장 유용한 특징중의 하나는 수학적 표현을 간단히 하는 기능입니다. 이를 위해 simplify() 함수를 사용합니다.
simplify(x): 식 x를 간단히 정리 합니다.

x=symbols("x")
simplify(sin(x)**2+cos(x)**2)
      1
simplify((x**3+x**2-x-1)/(x**2+2*x+1))
      x - 1
simplify(gamma(x)/gamma(x-2))
      (x - 2)*(x - 1)

위의 예는 식들 사이의 연산에 의한 간략화 된 형태의 식을 반환합니다.
3번째에서 나타낸 특수한 식인 감마함수(gamma(x))에 대해 소개합니다.
이 식은 확률분포 등 여러 부분에서 사용되는 표현식으로 다음과 같이 정의 됩니다.
$$\Gamma(n) =(n-1)!$$

gamma(x).subs(x,4)
      6

이 감마함수는 음이 아닌 정수를 제외한 모든 수에서 정의됩니다.
그러나 factorial(!)을 사용하는 경우 정의상 부동소수에서는 계산이 어렵지요.
이 경우는 다음과 같이 정의된 형태를 사용합니다.

$$\Gamma(z)=\int^\infty_0 x^{z-1}e^{-x} dx$$

gamma(x).subs(x,4.5)
      11.6317283965674

사용된 simplify()함수는 식의 연산 결과로 복잡한 식들을 간단한 형태로 정리하지만 연산이 아닌 하나의 식을 더 정리하는데는 제한됩니다.
즉, 다음 식은 인수분해를 통해 간략화 할 수 있습니다.
$$ x^2+2x+1 \rightarrow (x+1)^2$$
그러나 simplify() 함수는 위와 같은 결과를 반환하지 않습니다.
simpilfy()함수는 공통사항을 찾아 그 부분에 대한 정리를 기본으로 합니다.

simplify(x**2+2*x+1)
      x**2 + 2*x + 1
simplify(x+x+x**2+x**2)
      2*x*(x + 1)
위와같이 하나의 식의 간략화를 위해 simplify() 대신에 factor()를 사용할 수 있습니다.

factor(식);   인수분해를 실행
  simplify()함수에 의해 정리되지 않은 경우에도 보다 압축적인 형태를 반환

factor(x**2+2*x+1)
      (x + 1)**2
simplify()함수는
     식을 단순화 시키기 위해 거의 모든 알고리즘을 적용
     그러므로 다른 함수들에 비해 느리다는 단점을 가집니다.
     이러한 단점에도 불구하고
     simpify()함수는 어떤 식들의 단계적 감소형태를 찾을 경우
     효과적으로 사용될 수 있습니다.

expand(식);
  simplify(), factor() 함수와는 반대로 식을 전개시킵니다.

expand((x+1)**2)
      x**2 + 2*x + 1
expand((x+2)*(x-3))
      x**2 - x – 6
위의 결과와 같이 expand()함수는 식들을 모두 전개시킴으로서 일반적으로 simplify()함수 보다 식의 크기가 증가하지만
expand()와 simplify() 모두 심벌로 지정된 문자를 포함하여 연산한 결과를 전개 또는 압축하는 것으로서 동일한 결과를 반환할 수 있습니다.

expand((x+1)*(x-2)-(x-1)*x)
      -2
simplify((x+1)*(x-2)-(x-1)*x)
      -2

factor();
  다항식을 더이상 감소될 수 없는 형태로 변환합니다.

factor(x**3-x**2+x-1)
      (x - 1)*(x**2 + 1)
factor(x**2*z+4*x**y*z+4*y*2*z)
      z*(x**2 + 4*x**y + 8*y)

다항식에서 factor()는 expand()의 반대 역할을 합니다.

factor() 함수와 유사하지만 식을 정리하는 과정을 나타내는 함수로 factor_list() 함수를 사용할 수 있습니다.
factor_list();
  favtor() 결과에서 각각의 인수를 별도로 나타냄

x,y,z=symbols("x y z")
factor_list(x**2*z+4*x**y*z+4*y*2*z)
      (1, [(z, 1), (x**2 + 4*x**y + 8*y, 1)])
factor(x**2*z+4*x**y*z+4*y*2*z)
      z*(x**2 + 4*x**y + 8*y)

factor()와 expand()는 서로 반대의 역할을 합니다.

ex=expand((cos(x)+sin(x))**2)
ex
      sin(x)**2 + 2*sin(x)*cos(x) + cos(x)**2
factor(ex)
      (sin(x) + cos(x))**2

collect();
다항식에서 지정된 심벌에 의해 식을 정리하여 반환

다음 예는 x, y, z으로 구성된 식을 x에 관해 정리한 결과입니다.
ex=x*y+x-3+2*x**2-z*x**2+x**3
ex
      x**3 - x**2*z + 2*x**2 + x*y + x - 3
col_ex=collect(ex, x)#x,y,z 변수 중 x에 대해 식을 정리
col_ex
      x**3 + x**2*(-z + 2) + x*(y + 1) – 3
이 함수는 .coeff() 메소드를 사용하여 지정한 차수의 계수를 반환할 수 있습니다.
col_ex.coeff(x, 2)
      -z + 2

cancel();
분수형태의 다항식을 최종 $\frac{p}{q}$의 형태로 변환합니다.

cancel((x**2+2*x+1)/(x**2+x))
      (x + 1)/x ex=1/x+(3*x/2-2)/(x-4)
ex
      (3*x/2 - 2)/(x - 4) + 1/x
cancel(ex)
      (3*x**2 - 2*x - 8)/(2*x**2 – 8*x)
cancel()와 factor()를 함께 사용하면 분수형태로 최종적으로 정리된 상태로 반환합니다.
ex = (x*y**2 - 2*x*y*z + x*z**2 + y**2 - 2*y*z + z**2)/(x**2 - 1)
ex
            (x*y**2 - 2*x*y*z + x*z**2 + y**2 - 2*y*z + z**2)/(x**2 - 1)
cancel(ex)
      (y**2 - 2*y*z + z**2)/(x - 1)
factor(ex)
      (y - z)**2/(x – 1)

apart();
분수 형태를 부분분수로 분해하여 결과를 반환
예를들어 다음과 같은 분수는 부분분수들의 합으로 분해 할 수 있습니다.
$$\frac{ 4*x^3 + 21*x^2 + 10*x + 12}{ x^4 + 5*x^3 + 5*x^2 + 4*x}=\frac{2*x - 1}{x^2 + x + 1} - \frac{1}{x + 4} + \frac{3}{x}$$

ex=(4*x**3 + 21*x**2 + 10*x + 12)/(x**4 + 5*x**3 + 5*x**2 + 4*x)
ex
      (4*x**3 + 21*x**2 + 10*x + 12)/(x**4 + 5*x**3 + 5*x**2 + 4*x)
cancel(ex)
      (4*x**3 + 21*x**2 + 10*x + 12)/(x**4 + 5*x**3 + 5*x**2 + 4*x)
apart(ex)
      (2*x - 1)/(x**2 + x + 1) - 1/(x + 4) + 3/x
python에서 cos()함수의 역함수는 acos()함수로 표현합니다.
즉, 어떤 삼각함수의 역함수는 접두어로 a-를 첨가하여 표시하는데 sympy 역시 동일한 관례를 따릅니다.

cos(x)
      cos(x)
cos(acos(x))
      x
asin(1)
      pi/2

지수와 로그(Exponentials and logarithms) log는 자연로그를 의미합니다. 즉, log=ln

ln(x)
      log(x)
로그함수 간략화의 기본이 되는 식들은 다음과 같습니다.
1) log(xy)=log(x) + log(y)
2) $log(x^n)=n\cdot log(x)$
3)$ log(\frac{x}{y})= log(x) - log(y)$
$x, y \geq 0, \; n \in R$

위의 조건에 부합한다면 simplify(), expand()함수가 작동합니다.
특히 logcombind()는 simplify()와 expand_log()함수는 expand()함수와 동일한 효과를 나타냅니다.
그러나 simplify와 expand함수는 모든 로그 경우에서 올바른 작동을 하지 않은 경우가 발생하므로
위의 특화된 함수들을 사용하는 것이 유리합니다.
조건에 관계없이 강제적으로 변환을 할 경우 force=True를 함수에 전달합니다.

x,y =symbols('x, y', positive=True)
n=symbols('n', real=True)
simplify(log(x) + log(y))
      log(x*y)
simplify(n*log(x))
      n*log(x)
logcombine(n*log(x))
      log(x**n)
expand(log(x*y))
      log(x) + log(y)
expand_log(log(x*y))
      log(x) + log(y)

댓글

이 블로그의 인기 게시물

matplotlib의 그래프 종류

1. 산포도(scatter plot) plt.scatter(x, y) >>> import matplotlib.pyplot as plt >>> import numpy as np >>> data=np.random.rand(1024, 2) >>> data[:3, :] >>> plt.scatter(data[:,0], data[:,1]) >>> plt.show() 2. 막대그래프(bar chart) plt.bar(x, hight, width, align='center') 매개변수중 width에 인수를 전달하여 막대의 두께를 조절할 수 있다. 또한 align의 인수는 'center'와 'edge' 이다. 기본값은 'center'이다. 이 값은 x축의 레이블이 막대의 중간에 위치(center) 또는 왼쪽 가장자리에 위치(edge)시킨다. 코드에서 np.random.randint 는 특정한 범위내에서 지정한 갯수의 랜덤수를 생성 np.unique(배열, retrun_counts=False, axis=None) : 객체 내의 중복되지 않은 수들을 반환한다. return_counts=True이면 각 수에 대한 빈도수를 반환한다. axis를 통해 행(1), 열(0)을 선택한다. >>> x=np.random.randint(1, 6, size=100) >>> uni,count=np.unique(x, return_counts=True) >>> uni array([1, 2, 3, 4, 5]) >>> count array([25, 17, 23, 16, 19], dtype=int64) >>> plt.bar(uni, count) >>> plt.show() 위의 막대그래프의 막대의

유사변환과 대각화

내용 유사변환 유사행렬의 특성 대각화(Diagonalization) 유사변환(Similarity transformation) 유사변환 n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사하다고 하며 이 변환을 유사 변환 (similarity transformation)이라고 합니다. $$\begin{equation}\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B \end{equation}$$ 식 1의 유사 변환은 다음과 같이 고유값을 적용하여 특성 방정식 형태로 정리할 수 있습니다. $$\begin{align} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align}$$ 위 식의 행렬식은 다음과 같이 정리됩니다. $$\begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \t

sympy.solvers로 방정식해 구하기

sympy.solvers로 방정식해 구하기 대수 방정식을 해를 계산하기 위해 다음 함수를 사용합니다. sympy.solvers.solve(f, *symbols, **flags) f=0, 즉 동차방정식에 대해 지정한 변수의 해를 계산 f : 식 또는 함수 symbols: 식의 해를 계산하기 위한 변수, 변수가 하나인 경우는 생략가능(자동으로 인식) flags: 계산 또는 결과의 방식을 지정하기 위한 인수들 dict=True: {x:3, y:1}같이 사전형식, 기본값 = False set=True :{(x,3),(y,1)}같이 집합형식, 기본값 = False ratioal=True : 실수를 유리수로 반환, 기본값 = False positive=True: 해들 중에 양수만을 반환, 기본값 = False 예 $x^2=1$의 해를 결정합니다. solve() 함수에 적용하기 위해서는 다음과 같이 식의 한쪽이 0이 되는 형태인 동차식으로 구성되어야 합니다. $$x^2-1=0$$ import numpy as np from sympy import * x = symbols('x') solve(x**2-1, x) [-1, 1] 위 식은 계산 과정은 다음과 같습니다. $$\begin{aligned}x^2-1=0 \rightarrow (x+1)(x-1)=0 \\ x=1 \; \text{or}\; -1\end{aligned}$$ 예 $x^4=1$의 해를 결정합니다. solve() 함수의 인수 set=True를 지정하였으므로 결과는 집합(set)형으로 반환됩니다. eq=x**4-1 solve(eq, set=True) ([x], {(-1,), (-I,), (1,), (I,)}) 위의 경우 I는 복소수입니다.즉 위 결과의 과정은 다음과 같습니다. $$x^4-1=(x^2+1)(x+1)(x-1)=0 \rightarrow x=\pm \sqrt{-1}, \; \pm 1=\pm i,\; \pm1$$ 실수