기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[numpy] 배열 생성을 위한 numpy 함수들

배열 생성을 위한 numpy 함수들

배열 생성을 위해 numpy 라이브러리의 array()함수 이외에 특정한 목적을 위해 zeros(), ones(), empty(), arrange(), linspace()의 함수를 사용할 수 있습니다.

배열의 모든 값이 0과 1인 경우 각각 zeros(), ones()함수를 사용하여 생성할 수 있습니다. 이 두 함수에 전달되는 인수는 생성하는 값의 갯수입니다. 물론 생성하는 배열의 차원에 따라 전달해야 하는 인수의 수가 다릅니다. 예를 들어 다음 코드의 1차원 배열의 경우 1개의 정수를 전달하지만 2차원 객체의 경우는 2개의 정수 즉 행과 열의 수를 전달해야 합니다. 이 두 함수 뿐만 아니라 numpy에서 배열을 생성하는 모든 함수의 경우 2개이상의 인수를 전달 할 경우는 튜플형식으로 전달합니다.

import numpy as np
np.zeros(3)
array([0., 0., 0.])
np.zeros((2,3))
array([[0., 0., 0.],
       [0., 0., 0.]])
np.ones(2), np.ones((2,2))
(array([1., 1.]),
 array([[1., 1.],
        [1., 1.]]))

np.empty() 함수는 위 두 함수와 다르게 초기값이 지정되지 않은 상태로 결과를 반환합니다. 다음 코드의 결과는 모든 요소를 0이지만 아직 결정된 값이 아닙니다. 즉, 함수로 배열을 틀만을 제시하는 것으로 요소들이 지정되지 않은 상태이므로 배열의 생성속도가 증가 된다는 장점이 있습니다.

np.empty(3)
array([0., 0., 0.])
np.empty((3,2))
array([[0., 0.],
       [0., 0.],
       [0., 0.]])

파이썬 내장함수인 range()와 같이 일정한 간격의 수열을 생성하기 위해 np.arange()함수를 사용할 수 있습니다. 이 함수는 특징은 다음과 같습니다.

  • np.arange(시작=0, 마지막=1, 간격)
    • [시작, 마지막) 사이의 실수를 지정한 간격으로 이루어진 수열을 생성
    • 인수 중 시작과 간격은 각각 0과 1의 기본값은 0, 1
      arrange(10): [1, 10)사이에서 1의 간격로 실수를 생성, 1,2,3,…, 9
      간격을 지정할 경우 시작값 역시 명시 필요
    • 이 함수에 결과는 마지막 수를 포함하지 않습니다.
list(range(-10, 10, 2))
[-10, -8, -6, -4, -2, 0, 2, 4, 6, 8]
np.arange(4)
array([0, 1, 2, 3])
np.arange(0, 1, 0.25)
array([0.  , 0.25, 0.5 , 0.75])

np.linspace()함수를 사용하여 수열을 생성합니다.

  • np.linspace(시작, 마지막, 갯수, endpoint=True)
    • [시작, 마지막] 사이의 실수 중 지정한 갯수를 일정한 간격으로 선택
    • endpoint=True(기본값)일 경우 마지막 수를 포함
      False일 경우는 마지막 수를 미포함
np.linspace(1, 5, 5)
array([1., 2., 3., 4., 5.])
np.linspace(1, 5, 5, endpoint=False)
array([1. , 1.8, 2.6, 3.4, 4.2])

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b