기본 콘텐츠로 건너뛰기

[data analysis]로그-노말 분포(Log-normal distribution)

[python] 숫자형(Number type)

숫자형 (Number type)

기본 연산

파이썬은 마치 계산기와 같이 적합한 식을 전달하는 것에 의해 계산을 할 수 있습니다. 그러므로 그 자체로 훌륭한 계산기로 사용할 수 있습니다. 기본적인 계산을 위해 사용되는 연산자는 일반 수학이나 계산기에서 사용되는 것과 같습니다. 즉, 더하기, 빼기, 곱하기 그리고 나누기 연산자는 각각 +, -, * 그리고 / 기호를 사용합니다.

1+2
3
 0.9+0.231
1.131
 100-27
73
 -2.4-0.9
-3.3
 3*2
6
 3.45*0.12
0.414
 3/2
1.5
 4.23/1.27 ①
3.330708661417323

나누기 연산에서는 일반 계산기와 다르게 특이한 연산자를 사용할 수 있습니다. 위 코드 ①의 답 3.33…과 같은 실수인 경우 // %연산자를 사용하여 몫과 나머지로 표현할 수 있습니다(산술연산자 참조)

4.23//1.27
3.0
4.23%1.27
0.4200000000000004

위 경우는 실수를 실수로 나눈 것으로 정수에 적용해 봅니다.

5/3
1.6666666666666667
5//3
1
5%3
2

위 코드의 5를 3으로 나눈 경우 실수가 반환됩니다. 실수 중에 몫은 정수부분이 되지만 나머지는 이 결과의 소수부분과는 다릅니다. 즉, //, % 연산자에 의한 결과는 모두 정수로 표현됩니다. 위 정수와 정수의 나눗셈의 결과는 실수이며 몫은 정수입니다. 이 경우 실수를 정수로 변환하면 정수인 몫을 나타낼 수 있습니다. 실수를 정수로 변환하기 위해 내장함수인 int()를 적용합니다.

int(5/3)
1

파이썬에서는 수를 일정한 형식으로 구분하여 사용합니다. 사실 이러한 구분은 약간의 차이가 있지만 대부분의 프로그램언어에서 공통으로 사용하는 특성입니다. 파이썬에서 수치형을 구분하는 방식은 표 1과 같습니다.

표 1 숫자형과 진수의 표기
항목
십진수정수(int)0, 2, -3, 123
실수(부동소수, float)0.754, 3.4E10
복소수(complex)0+2j, 10-3j
2진수(접두어로 'b' 사용)b01, b0110
8진수(접두어로 '0o' 사용)0o34, 0o25
16진수(접두어로 '0x' 사용)0x2A, 0xFF

정수와 실수는 알려진 용어입니다. 복소수 역시 학교 수학시간에 많이 접하는 용어이지만 실생활에 쉽게 사용되는 종류는 아닙니다(복소수 참조).

컴퓨터가 구사하는 언어의 기본 틀은 0과 1 두 가지입니다. 이것은 컴퓨터 메모리의 가장 기본단위인 비트(bit)의 활성(1)과 비활성(0)의 방법으로 표현하기 때문입니다. 그러므로 모든 데이터를 두 종류로 표현해야 합니다. 컴퓨터의 용량이 커지면서 기본 저장단위를 1바이트(byte, 8비트), 2바이트(16비트)로 확장되고 있습니다. 이 체계에서 사용하기 위해 입력되는 수를 8진수, 16진수로 변환하여 사용할 수 있습니다. 컴퓨터에서 정수, 실수 그리고 복소수를 저장하고 표현하는 자세한 방식은 "컴퓨터에서 숫자를 다루는 방식"을 참조합니다.

일상적으로 사용되는 10진수를 2진수등 다른 진수의 형태로 확인해야 하는 경우가 존재합니다. 파이썬은 숫자 포맷간의 변환 결과를 반환하는 다양한 내장 함수들을 제공합니다. 이에 대해 7 절에서 소개합니다.

지수승(거듭제곱)연산

수의 거듭제곱은 연산자 **를 사용합니다.

2**4
16
4**(1/2)
2.0
4**(1/2.0)
2.0
int(1/2.0)
0
4**(int(1/2.0)) ②
1

위 결과에서 코드 ②는 내장함수 int()를 사용하여 실수를 정수로 변환의 경우입니다. 즉, 1/2.0은 0.5이지만 이를 정수로 변환할 경우 0이 됩니다. 그러므로 결과는 4**0이 됩니다.

거듭제곱은 연산자 ** 대신 내장함수인 pow()를 적용할 수 있습니다.

pow(2, 4)
16
pow(4, 0.5)
2.0

파이썬 뿐만 아니라 대부분의 컴퓨터 언어에서는 연산의 순서는 다음이 적용됩니다.

괄호 > 지수승 > 곱셈 > 나눗셈 > 덧셈, 뺄셈

5+5*3
20
(5+5)*3
30

다음 코드 ③과 ④의 연산 결과는 다른 연산에서 사용할 수 없습니다. 그에 반해 코드 ⑤의 경우는 결과를 a라는 이름에 저장하였으므로 다음에 이 대상(객체)를 사용할 수 있는 것입니다. 즉, 어떤 결과를 재사용하기 위해서는 코드 ⑤와 같이 객체화(objectification)하여야 합니다.

3+4 ③
7
(3+4)*5 ④
35
a=3+4 ⑤
a*5
35

정수와 실수

표 1에서 나타낸 것과 같이 파이썬에서 수는 정수(integer)와 부동소수(실수, float) 그리고 복소수(complex)로 구분합니다. 다시말하면 각각은 int class, float class, 그리고 complex class내에서만 작동합니다.

print(type(5))
<class 'int'>
print(type(5.3))
<class 'float'>
print(type(5+3j))
<class 'complex'>

type()은 객체의 자료형을 반환합니다.

자료형은 클래스로 작성되었기 때문에 각각은 고유한 속성과 작동 영역을 가집니다(자료형(type)의 분류 참조). 숫자형에서 정수, 실수, 그리고 복소수 역시 각각에 대응하는 클래스로부터 생성되는 객체입니다. 이것은 같은 형태 사이에서만 연산이 이루어짐을 의미합니다. 예를 들면 int 클래스에서 작성된 객체는 같은 int 클래스의 객체(정수)들과의 연산에 한정됨을 의미합니다. 그러므로 원칙적으로 정수와 실수는 다른 클래스로 생성된 객체이므로 연산되지 않지만 다음 코드와 같이 실수형인 결과를 반환합니다.

a=3
b=3.0
type(a), type(b)
(int, float)
c=a+b
c
6.0
type(c)
float

위 코드와 같이 정수와 실수의 연산에서 정수는 암묵적으로 실수형으로 변환됩니다. 즉, 수치형들의 상이한 자료형들 사이에 연산은 더 큰메모리를 필요로 하는 형태로 자동적으로 변환됩니다. 예를 들어 실수는 정수보다 큰 메모리가 필요하므로 모두 실수로 변환되어 연산됩니다. 그러나 다음 코드와 같이 완전히 다른 형태인 문자와 수치와의 연산은 이루어지지 않습니다. 이것은 문자와 수치를 입력할 때 각각의 자료형이 고정된 상태이기 때문입니다.

type("a")
str
a+"a"
TypeError: unsupported operand type(s) for +: 'int' and 'str'

위 코드 객체 a는 정수 3이 할당된 것으로 자료형은 int인데 반해 큰따옴표와 함께하는 "a"의 자료형은 문자열(string)입니다. 파이썬에서는 작은 따옴표 또는 큰 따옴표로 묶인 형태의 자료는 모두 문자(열)로 인식합니다.

반올림

반올림은 내장함수인 round(x, ndigit=None)을 적용합니다. 반올림은 10-(ndigit+1)에 위치한 수에서 실행합니다.

round(1.53, 1)
1.5

다음 코드의 ndigit은 -1이므로 반올림 대상 위치는 10-(-1+1), 즉, 1의 자리입니다.

round(123.53, -1)
120.0
round(1.3325, 3)
1.333

분수(Fraction) 표현

파이썬의 모듈인 fractions의 함수 Fraction(실수) 사용하여 분수를 나타낼 수 있습니다. 이 모듈은 모두 정수인 분자(numerator)와 분모(denominator)를 튜플 형식으로 반환합니다.

import fractions
fractions.Fraction(1.5)
Fraction(3, 2)
fractions.Fraction(0.2)
Fraction(3602879701896397, 18014398509481984)
fractions.Fraction(0.3) 
Fraction(5404319552844595, 18014398509481984)

위 코드들의 0.2와 0.3는 부동소수의 문제를 가집니다(컴퓨터에서 숫자를 다루는 방식 참조). 즉, 분수로 나타낼 경우 분모를 2진수로 나타낼 수 없습니다. 그러므로 2진수로의 변환은 근사치이므로 예상치 못한 결과가 반환됩니다. 이 경우 인수를 문자열로 전달하는 것은 하나의 해결방법이 됩니다.

fractions.Fraction('0.2')
Fraction(1, 5)
fractions.Fraction('1.1')
Fraction(11, 10)

위 결과들의 표현은 분수의 형태가 아닙니다. 대신에 수학에 특화된 파이썬 패키지인 sympy의 Rational()함수를 사용하면 정확히 분수의 형태로 결과를 나타낼 수 있습니다.

from sympy import *
Rational(3,2)

$\frac{3}{2}$

Rational('3/2')

$\frac{3}{2}$

Rational(1.5)

$\frac{3}{2}$

Rational('0.2')

$\frac{1}{5}$

두 패키지로 나타낸 분수의 연산이 실행됩니다.

fractions.Fraction(1, 3)+fractions.Fraction("3/2")
Fraction(11, 6)
Rational(1,3)+Rational(3/2)

$\frac{11}{6}$

복소수(complex number)

복소수는 실수부와 허수부가 복합되어 나타나는 형태로 허수부 표시로 수학에서는 i를 사용하는데 반해 파이썬에서는 j를 사용합니다. 즉, 2 + 3j와 같이 나타내고 2를 실수부, 3을 허수부라고 합니다. 허수인 j를 사용하여 복소수를 정의할 수 있지만 내장 함수인 complex()를 사용하여 복소수를 생성 할 수 도 있습니다.

cpl=3+5j
cpl
(3+5j)
type(cpl)
complex
cpl1=complex(3, 5)
cpl1
(3+5j)
type(cpl1)
complex

복소수의 사칙연산은 다음과 같이 이루어지지만 정수와 실수에서 사용되는 나머지 연산(%), 몫 연산(//)은 성립되지 않습니다.

a=complex(2, 3)
b=complex(4,2)
a+b
(6+5j)
a-b
(-2+1j)
a*b
(2+16j)
a/b
(0.7+0.4j)
a//b
TypeError: can't take floor of complex number.
a%b
TypeError: unsupported operand type(s) for %: 'complex' and 'complex'

복소수의 실수부와 허수부는 각각 속성 real, imag로 나타낼 수 있고 켤레복소수는 conjugate() 메소드로 계산됩니다.

클래스(class)에서 생성되는 객체는 그 클래스의 모든 내용을 상속 받습니다. 내용은 클래스의 특성을 나타내는 속성(attribute)과 그 내부에서만 작동하는 함수인 메소드(method)를 의미합니다. 다음 코드에서 사용한 .real와 .imag는 클래스Complex의 속성이며 .conjugate()는 메소드입니다.

a
(2+3j)
a.real
2.0
a.imag
3.0
a.conjugate()
(2-3j)

복소수의 크기는 다음과 같이 계산됩니다.

(a.real**2+a.imag**2)**0.5
3.605551275463989

위의 계산은 절대값을 계산하는 파이썬의 내장함수 abs()로 계산됩니다.

abs(a)
3.605551275463989

댓글

이 블로그의 인기 게시물

유사변환과 대각화

내용 유사변환 유사행렬의 특성 대각화(Diagonalization) 유사변환(Similarity transformation) 유사변환 n×n 차원의 정방 행렬 A, B 그리고 가역 행렬 P 사이에 식 1의 관계가 성립하면 행렬 A와 B는 유사하다고 하며 이 변환을 유사 변환 (similarity transformation)이라고 합니다. $$\begin{equation}\tag{1} A = PBP^{-1} \Leftrightarrow P^{-1}AP = B \end{equation}$$ 식 1의 유사 변환은 다음과 같이 고유값을 적용하여 특성 방정식 형태로 정리할 수 있습니다. $$\begin{align} B - \lambda I &= P^{-1}AP – \lambda P^{-1}P\\ &= P^{-1}(AP – \lambda P)\\ &= P^{-1}(A - \lambda I)P \end{align}$$ 위 식의 행렬식은 다음과 같이 정리됩니다. $$\begin{align} &\begin{aligned}\textsf{det}(B - \lambda I ) & = \textsf{det}(P^{-1}(AP – \lambda P))\\ &= \textsf{det}(P^{-1}) \textsf{det}((A – \lambda I)) \textsf{det}(P)\\ &= \textsf{det}(P^{-1}) \textsf{det}(P) \textsf{det}((A – \lambda I))\\ &= \textsf{det}(A – \lambda I)\end{aligned}\\ &\begin{aligned}\because \; \textsf{det}(P^{-1}) \textsf{det}(P) &= \textsf{det}(P^{-1}P)\\ &= \t

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

R 미분과 적분

내용 expression 미분 2차 미분 mosaic를 사용한 미분 적분 미분과 적분 R에서의 미분과 적분 함수는 expression()함수에 의해 생성된 표현식을 대상으로 합니다. expression expression(문자, 또는 식) 이 표현식의 평가는 eval() 함수에 의해 실행됩니다. > ex1<-expression(1+0:9) > ex1 expression(1 + 0:9) > eval(ex1) [1] 1 2 3 4 5 6 7 8 9 10 > ex2<-expression(u, 2, u+0:9) > ex2 expression(u, 2, u + 0:9) > ex2[1] expression(u) > ex2[2] expression(2) > ex2[3] expression(u + 0:9) > u<-0.9 > eval(ex2[3]) [1] 0.9 1.9 2.9 3.9 4.9 5.9 6.9 7.9 8.9 9.9 미분 D(표현식, 미분 변수) 함수로 미분을 실행합니다. 이 함수의 표현식은 expression() 함수로 생성된 객체이며 미분 변수는 다음 식의 분모의 변수를 의미합니다. $$\frac{d}{d \text{변수}}\text{표현식}$$ 이 함수는 어떤 함수의 미분의 결과를 표현식으로 반환합니다. > D(expression(2*x^3), "x") 2 * (3 * x^2) > eq<-expression(log(x)) > eq expression(log(x)) > D(eq, "x") 1/x > eq2<-expression(a/(1+b*exp(-d*x))); eq2 expression(a/(1 + b * exp(-d * x))) > D(eq2, "x") a * (b * (exp(-d * x) * d))/(1 + b