기본 콘텐츠로 건너뛰기

[ML] 결정트리(Decision Tree) 모델

[python] 연산자 II: 비트 연산자, 특수한 연산자

연산자 II

비트 연산자(Bitwise operators)

컴퓨터 연산은 2진법에 의해 진행됩니다. 데이터가 입력되면 2진수로 변환되고 그 결과는 메모리에 한 개(1비트)당 0 또는 1로 저장 됩니다. 입력된 두 데이터의 연산은 다음의 순서로 이루어집니다.

  1. 2진수로 변환
  2. 동일한 위치에 저장된 값들 사이에 비트단위로 연산

예를 들어 십진수 2와 10의 경우 2진수로 b0010, b1010이 됩니다. 두수의 각 비트의 연산은 표 1과 같습니다.

표 1 2와 10의 비트 연산
십진수 이진수
2 0 0 1 0
10 1 0 1 0
(+)12 1 1 0 0

비트로 표현된 객체 또는 객체들 사이에 연산은 표 2에 소개한 연산자를 사용합니다. 비트 연산을 위해서는 이진수로 전환이 필요하며 음의 이진수로의 변환을 위해서는 보수법을 적용합니다.

표 2 비트 연산자
연산자 의미
x & y 비트 단위로 AND
x | y 비트 단위로 OR
~x 비트 단위로 NOT, 1의 보수(complement)
x^y 비트 단위로 XOR
(다른 값: True(1), 같은 값: False(0))
x >> a 객체 x를 오른쪽으로 a 비트 이동
x << a 객체 x를 왼쪽으로 a 비트 이동

표 1에서 나타낸 것과 같이 표 2에서 소개한 비트연산자 역시 동일한 위치의 비트 사이에서 연산이 이루어집니다.

x=2
y=10
print(bin(x))
0b10
print(bin(y))
0b1010
x & y
2
x | y
10
x^y
8

위 두 연산의 과정은 다음과 같습니다.

x =  0(F)0(F)1(T)0(F) ⇒ 2
y =  1(T)0(F)1(T)0(F) ⇒ 10
& :  0010 ⇒ 2
| =  1010 ⇒ 10
x^y =  1000 ⇒ 8

연산자 ~는 각 비트 값의 반전입니다. 위 x의 반전(1의 보수)는 다음과 같습니다.

0010
not x(~x) ⇒ 1101

위 반전된 값은 최왼쪽 비트가 1이므로 음수를 나타냅니다. 그러므로 대응하는 십진수를 확인하기 위해서는 양수로 전환합니다. 양수와 음수의 상호전환은 2의 보수에 의해 결정합니다.

1101
2의보수 ⇒ 0011 ⇒ 3
∴ 1101(2) = -3(10)
~x
-3
bin(~0b10)
'-0b11'

비트의 수를 왼쪽, 오른쪽으로 이동하여 수의 변화를 일으킬수 있습니다. 다음은 오른쪽과 왼쪽으로 각 1비트와 2비트를 이동시킨 과정입니다.

x ⇒ 0010
오른쪽 1비트이동: >>1 ⇒ 0001 ⇒ 1
왼쪽 2비트이동: <<2 ⇒ 1000 ⇒ 8
x>>1
1
x<<2
8

특수한 연산자

재할당연산자

위에서 소개한 다양한 연산의 결과를 피연산자 객체에 다시 할당하기 위해 사용합니다(표 3).

표 3 재할당연산자
연산자 x = 5 x += 5 x -= 5 x *= 5 x /= 5
의미 x = 5 x = x+5 x = x-5 x = x*5 x = x/5
연산자 x %= 5 x //= 5 x **= 5 x &= 5 x |= 5
의미 x = x%5 x = x//5 x = x**5 x = x & 5 x = x | 5
연산자 x ^= 5 x >>= 5 x <<= 5
의미 x = x^5 x = x>>5 x = x<<5
x=5
x+=5
x
10
x//=5
x
2
x|=5
x
7
x = 0010
5 = 0101
| ⇒ 0111 = 7

다중할당

파이썬에서는 여러가지 객체에 값들을 동시에 할당할 수 있습니다.

a, b, c=1, 2, 3
(a, b, c)
(1, 2, 3)
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

위코드의 다중할당은 다음과 같이 순차적으로 실행할 수 있습니다.

a, b, c=1, 2, 3
a, b, c=b, c, a+b+c
(a, b, c)
(2, 3, 6)

in, is 연산자

객체들의 참조위치의 동일성 여부를 확인하기 위해 연산자 is를 적용할 수 있습니다. 또한 여러 요소들로 구성된 객체의 경우 각 요소와 객체의 소유 관계를 나타내기 위해 연산자 in을 사용합니다. 표 4는 이 두 연산자에 대해 소개하고 있습니다.

표 4 in, is 연산자
연산자 의미
x is not y x,y가 동일하면 False
x is y x,y가 동일하면 True
x in y x가 y의 원소이면 True
x not in y x가 y의 원소가 아니면 True
x='python'
y='python practice'
x is y
False
x is not y
True
x=[1,2, 'apple', 7]
 'apple' in x
True
10 in x
False
7 not in x
False

가변연산자('*')

객체의 참조는 일대일로 이루어집니다. 다음 코드는 다중할당을 실행하는 것으로 객체 a, b는 순차적으로 각 값 1과 2를 참조합니다. 나머지 두 개 3과 4를 할당받는 객체 두 개가 필요하지만 연산자 asterik(*)과 연결된 객체 c는 이 두 값을 모두 참조할 수 있습니다. 이 연산자를 가변연산자, 그 대상을 가변객체라고 합니다.

a, b, *c=1,2,3,4
print(a)
print(b)
print(c)
1
2
[3, 4]

위 코드에서 *c는 a와 b에 할당받고 남은 요소들을 모두 할당받습니다. 위와 반대로 할당되는 값이 부족한 경우 객체 가변 객체인 c에는 할당될 데이터가 없는 상태이므로 빈 객체가 생성됩니다. 다시 말하면 가변객체가 참조할 수 있는 객체의 크기는 코드의 실행 중에 결정되므로 일대일로 참조하는 객체들의 실행이 완료된 다음에 가변객체가 할당이 이루어 집니다.

a, b, *c=1,2
print(a)
print(b)
print(c)
1
2
[]

위와 같은 상황으로 가변 객체를 c에서 b로 변경하면 가변객체인 b의 실행은 a, c의 할당이 이루어진 후에 실행됩니다. 그러나 b에 할당할 값이 없는 상태이므로 빈 객체가 됩니다.

a, *b, c=1,2
print(a)
print(b)
print(c)
1
[]
2
a, *b, c=1,2,3,4
print(a)
print(b)
print(c)
1
[2,3]
4

위 코드 결과와 같이 연산자 *와 연결된 객체의 크기는 가변적입니다. 위 결과들로부터 할당하기 위한 값의 수가 객체의 수보다 많을 경우 할당 순서가 지켜집니다. 그러나 값의 수가 작을 경우 가변객체에 할당은 이루어지지 않습니다. 이 순서의 혼동 때문에 일반적으로 가변객체는 순서상 마지막에 입력됩니다.

댓글

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유사변환(Similarity transformation) n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사행렬(similarity matrix)이 되며 행렬 A를 가역행렬 P와 B로 분해하는 것을 유사 변환(similarity transformation) 이라고 합니다. $$\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B $$ 식 2는 식 1의 양변에 B의 고유값을 고려한 것입니다. \begin{align}\tag{식 2} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align} 식 2의 행렬식은 식 3과 같이 정리됩니다. \begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \textsf{det}(I)\end{aligned}\end{align} 유사행렬의 특성 유사행렬인 두 정방행렬 A와 B는 'A ~ B' 와 같

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b