결정트리(Decision Tree) 모델 결정트리(decision tree) 모델은 분류 및 회귀에 사용되는 비모수적 지도학습방법으로 데이터의 특징들에서 추론된 규칙들에 의해 분류하여 예측값을 반환합니다. klearn.tree.DecisionTreeClassifier() 클래스를 사용하여 모델을 생성합니다. 클래스이 인수는 다음과 같습니다. max_depth: 분류 단계를 지정, 기본값은 min_sample_split에 지정된 수 또는 분류된 객체의 entropy가 최소가 될때까지 분류가 진행 min_sample_split: 분류된 그룹의 데이터수로 기본값은 2, 이에 적합된 노드에서 학습은 종료됩니다. max_feature: 최적의 분류를 찾을 때 고려되는 특징의 수, 기본값은 none random_state: random_seed의 역할 다음은 make_classification() 함수를 적용하여 생성한 가공 데이터 셋에 대해 생성한 결정트리모델입니다. import numpy as np import pandas as pd from sklearn.datasets import make_classification from sklearn.preprocessing import StandardScaler from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn import metrics import matplotlib.pyplot as plt import seaborn as sns X1, y =make_classification(n_samples=100, random_state=41) X=X1[:, :2] X.shape, y.shape ((100, 2), (100,)) clf=DecisionTreeClassifier().fit(X, y) pred=clf.predict(X) acc=me...
python 언어를 적용하여 통계(statistics)와 미적분(Calculus), 선형대수학(Linear Algebra)을 소개합니다. 이 과정에서 빅데이터를 다루기 위해 pytorch를 적용합니다.