기본 콘텐츠로 건너뛰기

라벨이 matplotlib인 게시물 표시

[matplotlib]quiver()함수

[matplotlib] 산점도(scatter plot)

산점도(scatter plot) 2차원 그래프의 기본 구성은 한 축(x)에 대한 값들에 대응하는 다른 축(y)의 값들입니다. 산점도는 대응하는 위치마다 표시를 하는 것으로 다음 함수를 적용합니다. plt.scatter(x, y, s, c, marker, label) x, y: data s: 표시(marker)의 크기, x, y, c외에 다른 변수를 지정하여 그 변수에 따라 크기를 조절할 수 있음 c: 표시 색, x, y, s외에 다른 변수를 지정하여 그 변수에 따라 색을 조절할 수 있음 다양한 marker label: 범례 import numpy as np import pandas as pd from sklearn.preprocessing import StandardScaler import yfinance as yf import matplotlib as mpl import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False import seaborn as sns %matplotlib inline matplotlib하에서 작성된 플롯이지만 seaborn에서 제공하는 플롯의 스타일을 사용할 수 있습니다. 위 코드 sns.set_style() 함수에 의해 이루어집니다. np.random.seed(1) data=np.random.randn(100, 2) plt.figure(figsize=(4,3)) plt.scatter(data[:,0], data[:,1], s=10, c="b", label="random") plt.xlabel("x", loc="right") plt.ylabel("y", loc="top...

[matplotlib] 히스토그램(Histogram)

히스토그램(Histogram) 히스토그램은 확률분포의 그래픽적인 표현이며 막대그래프의 종류입니다. 이 그래프가 확률분포와 관계가 있으므로 통계적 요소를 나타내기 위해 많이 사용됩니다. plt.hist(X, bins=10)함수를 사용합니다. x=np.random.randn(1000) plt.hist(x, 10) plt.show() 위 그래프의 y축은 각 구간에 해당하는 갯수이다. 빈도수 대신 확률밀도를 나타내기 위해서는 위 함수의 매개변수 normed=True로 조정하여 나타낼 수 있다. 또한 매개변수 bins의 인수를 숫자로 전달할 수 있지만 리스트 객체로 지정할 수 있다. 막대그래프의 경우와 마찬가지로 각 막대의 폭은 매개변수 width에 의해 조정된다. y=np.linspace(min(x)-1, max(x)+1, 10) y array([-4.48810153, -3.54351935, -2.59893717, -1.65435499, -0.70977282, 0.23480936, 1.17939154, 2.12397372, 3.0685559 , 4.01313807]) plt.hist(x, y, normed=True) plt.show()

[matplotlib] 막대그래프(barplot) 그리기

막대그래프(barplot) 그리기 막대그래프는 변수를 두 개 이상의 그룹으로 구분하여 각 그룹에 대응되는 빈도를 시각적으로 나타낼 수 있습니다. 예를 들어 100명에 대한 점수를 그룹 A, B, C, D 분류하여 각 그룹에 포함된 빈도를 시각화 하면 다음과 같습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False 자료는 다음과 같이 생성하였습니다. np.ranodm.randint(시작, 마지막, 크기) 를 사용하여 50, 100 사이의 정수를 무작위로 100개를 추출 pd.cut(x, bins=4, labels=['D', 'C', 'B', 'A'], retbins=True) 함수를 사용하여 4개의 그룹으로 목록화 각 그룹의 이름은 인수 labels에 전달 각 그룹의 경계값을 알기 위해 인수 retbins=True 지정 이 함수는 변환된 값들과 각 그룹의 경계값을 반환 목록화한 변수들에 대해 각 그룹에 대응하는 빈도수는 DataFrame의 메소드 .value_counts() 를 산출 np.random.seed(3) d=np.random.randint(50, 101, 100) d1=pd.cut(d, bins=4, labels=['D', 'C', 'B', 'A'], retbins=True) d1[0] ['A', 'C', 'D', 'D', 'D', ..., 'B', 'B', 'A', 'D', ...

[matplotlib] 접선식 생성과 접선 그리기

접선 그리기 함수의 특정한 점에서 접선의 기울기는 그 지점에서의 미분값과 같습니다. a=symbols("a") f=(a-1)**2 df=f.diff('a') df 2a - 2 함수 f위의 점(3, f(3))에서의 접선 식은 다음과 같이 계산할 수 있습니다. slope=df.subs(a, 3); slope 4 $$\begin{align} y&=\text{slope}\times x+b \\ b&= y - \text{slope}\times x\\&=f(3)-f^\prime(3)\times 3\end{align}$$ b=f.subs(a, 3)-slope*3 eq=slope*a+b; eq 4a−8 위에서 생성한 두 식 f와 eq(접선식)에 대한 그래프를 작성합니다. 그래프 작성에 필요한 함수 plot()과 scatter() 그리고 축 설정은 조각함수 작성 에서 적용한 것과 같습니다. x=np.linspace(-1, 5, 100) fy=[f.subs(a, i) for i in x] eqy=[eq.subs(a, i) for i in x] fig, ax=plt.subplots(figsize=(4, 3)) ax.plot(x, fy, color="g", label=r"f(x)=(x-1)^2") ax.plot(x, eqy, color="b", label="g(x)=4x-8") ax.scatter(3, f.subs(a, 3), s=50, c="b") ax.spines['left'].set_position(("data", 0)) ax.spines['bottom'].set_position(("data", 0)) ax.spines['right'].set_visible(False) ax.spines['top'].set_visible(Fa...

경기종합지수

내용 경기선행지수 동행종합지수 후행종합지수 전년동월비 동행지수 순환변동치 경기종합지수 경기:살림살이의 상태, 즉 경제상황을 의미 전반적인 경기 동향을 쉽게 파악, 예측하고자 주요 경제지표 움직임을 종합해서 지수로 나타낸 것임. CI(Composite index)라고 함 생산·투자·소비·고용·금융·무역 등 결제의 각 부문 지표 중 민감하게 경기에 반영하는 주요 경제지표를 선정하고 이후 이 지표들의 전월 대비 증감률을 가중평균하여 작성함 전월대비 상승은 경기상승, 감소의 경우는 경기하락 지수 값은 기준시점 2005년의 숫자를 100으로 지정하여 환산 1983년 3월 부터 통계청에서 매달 발표 경기선행지수, 경기동행지수, 경기후행지수로 구분 일반적으로 경기선행지수가 상승하면 3~10개월 정도 후에 경기동행지수가 상승하고 실제 경기도 상승 경기선행지수 일반적으로 3~4 달간의 선행지수가 꾸준히 상승한 경우 몇달 후에 경기 상승 예측 가능 구성요소: 재고순환지표(%p), 경제심리지수, 기계류내수출하자수(선박제외), 건설수주액, 수출입물가비율, 코스피, 장단기 금리파 재고순환지표: 기업은 경기의 좋고 나쁨에 효율적으로 대응하고자 재고를 비축하거나 처분하는 과정에서 생산을 조정하기 떄문에 재고수준의 변동은 단기적인 경기 순환을 나타내는 중요한 기표로 인식됩니다. 출하(판매)증가율에서 재고증가율을 뺀 것으로 경기호황일 때는 출하증가율 > 재고증가율, 반대인 경우는 경기불황 경제심리지수: 기업과 소비자 모두를 포함한 민간의 결제상황에 대한 심리를 종합적으로 파악하고 결기판단을 위한 유용한 경제정보로 활용하는 것을 목적으로 합니다. 기업경기실사지수(BSI)와 소비자동향지수(CSI)를 합성하여 작성. 장기평균 100을 중심으로 표준편차가 10이 되도...