기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

패키지와 모듈(Package and Module)

내용

모듈(module)

모듈

프로그램 중 실행가능한 일정한 부분을 그룹화하여 전체 코드들에서 분해 할 수 있습니다. 이 그룹화된 부분은 다른 프로그램을 작성하기 위해 반복적으로 사용할 수 있는 프로그램이 됩니다. 이러한 프로그램을 모듈(Module)이라고 합니다.

큰 프로그램의 경우 작은 단위로 모듈화한다면 프로그램의 실행과 수정, 복구 등 관리차원에서 매우 유리합니다. 다음과 같이 정리할 수 있습니다.

모듈
  • 객체 정의(definition)와 문(statement)를 포함하는 파일
  • 파이썬에서 생성하는 모듈의 확장명은 .py입니다.
  • 프로그램을 실행 가능한 부분들의 조합으로 작성하기 위해 사용

모듈 전체 또는 일부를 다른 모듈, 프로그램 또는 인터프리터에서 호출하여 사용할 수 있습니다. 예를 들어 다음 함수를 확장자 ".py" 형식으로 작성하여 별도의 파일에 저장 한다면 모듈이 됩니다.

모듈의 import

"임포트(import)"는 파이썬을 작성하고 실행하는 코드 해석기(interpreter)에 모듈을 장착하는 명령 키워드입니다. 다음은 모듈을 생성하고 저장한 모듈을 임포트(import)하는 코드의 예입니다.

다음 코드는 두 수를 더하는 사용자 정의 함수입니다. 이 함수는 파이썬 인터프리터의 모든 영역에서 사용할 수 있습니다. 그러나 파이썬 자체의 종결은 생성한 함수도 함께 소멸되므로 추후에 사용하기 위해 별도의 파일로 저장합니다. 이렇게 저장된 python파일이 모듈이 됩니다.

다음은 test.py의 내용으로 두 수를 더하는 함수입니다.

def add(a, b):
    return a+b

위 파일을 모듈로 사용하기 위해 실행파일에서 test.py를 임포트 합니다. 임포트 된 모듈의 함수를 사용하는 경우 식 1과 같이 그 함수의 모듈(파일)을 명시하여야 합니다.

모듈이름.함수()(식 1)

식 1과 같이 모듈이름과 그 내부에 포함된 함수를 연결하기 위해 점(.)을 사용하였습니다.

import test
test.add(3,5)
8

모듈의 경로 설정

파이썬은 임포트하기 위한 모듈의 경로를 먼저 지정하여야 됩니다. 다시 말하면 파이썬에 등록된 위치에 모듈들을 저장해야 합니다.

새로운 경로는 파이썬 패키지 syspath.append("경로")를 사용하여 등록할 수 있습니다. 이 함수는 리스트 형의 결과를 반환합니다. 그러므로 리스트의 요소를 제거할 수 있는 메소드 remove()를 적용하여 특정 경로를 삭제할 수 있습니다.

import sys
sys.path.append('~/python') #새로운 경로 등록
print(sys.path) #확인
[ … '~/anaconda3/lib/python3.8', …, '~/python']

패키지(Package)

모듈은 하나의 파일입니다. 만약에 특정한 용도에 사용될 수 있는 여러 개의 모듈들이 존재하는 경우 하나의 디렉토리에 저장할 수 있습니다. 이러한 형태를 패키지(package)라고 합니다. 패키지는 여러 개 모듈들의 모둠이라고 할 수 있습니다. 본질적으로 패키지와 모듈은 같은 것으로 라이브러리(library)라고도 합니다. 그 모듈들을 저장하는 디렉토리 이름이 패키지 이름이 됩니다.

이와 같이 패키지의 디렉토리 구조적 특성으로 최상위 디렉토리에 여러 하위 디렉토리를 포함할 수 있습니다. 예를 들어 다음 그림은 벡터와 행렬에 관련된 다양한 모듈을 가진 패키지인 numpy의 구조를 나타낸 것입니다. 최상단의 numpy 디렉토리에 다양한 하위 디렉토리를 가지며 마지막 단위의 디렉토리는 다양한 파일들을 포함하고 있습니다. 이러한 파일들은 모듈이 되며 그들을 포함하는 디렉토리가 패키지가 됩니다. 그러므로 디렉토리 이름이 패키지 이름이 됩니다. 이 패키지의 경우 다양한 하위 패키지를 포함하고 있는 구조입니다.

importing 방법

위 코드에서 나타낸 것과 같이 모듈의 임포팅을 위해서 키워드 import를 사용합니다. 다음은 모듈을 임포팅하는 5가지 방법입니다. 예를 들어 numpy 패키지하에 linalg라는 선형대수를 위한 하위패키지가 포함되어 있으며 matrix_power() 함수를 포함합니다. 이 경우 다음의 각 방식으로 이 함수를 임포트하는 경우입니다.

1) import 패키지
패키지의 모든 하위패키지와 모듈을 호출
그 패키지의 함수, 클래스를 사용하기 위해서는 모든 경로를 명시해야 합니다.
$$\begin{align}&\text{import numpy}\\&\text{numpy.linalg.matrix_power()}\end{align}$$
2) import 패키지 as 별칭
패키지의 모든 하위 패키지와 모듈을 호출하지만 패키지 이름을 별칭으로 사용
$$\begin{align}&\text{import numpy as np}\\&\text{np.linalg.matrix_power()}\end{align}$$
3) import 패키지.하위패키지
특정한 하위패키지 하의 모든 모듈을 호출
$$\begin{align}&\text{import numpy.linalg}\\&\text{linalg.matrix_power()}\end{align}$$
4) from 패키지 import *
패키지에 포함된 모든 모듈들을 호출
$$\begin{align}&\text{from numpy import *}\\&\text{linalg.matrix_power()}\end{align}$$
5) from 패키지 import 하위패키지
패키지의 특정 하위패키지내에 포함된 모든 객체들을 호출
$$\begin{align}&\text{from numpy import linalg}\\&\text{matrix_power()}\end{align}$$

위의 방법중 from 패키지을 적용하는 경우 그 패키지 이름은 명시하지 않아야 합니다. 이것은 코딩 과정에 편리함으로 작용할 수 있지만 다른 패키지의 동일한 이름이 존재한다면 충돌을 일으키는 등 문제를 일으킬 수 있으므로 여러 패키지를 사용하는 경우는 키워드 from은 지양되는 방법입니다.

import numpy  as np
import numpy.linalg as la
A=np.array([[1,2],[3,4]])
la.matrix_power(A, 2)
array([[ 7, 10],
       [15, 22]])
from numpy import *
A=array([[1,2],[3,4]])
linalg.matrix_power(A, 2)
array([[ 7, 10],
       [15, 22]])

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b