기본 콘텐츠로 건너뛰기

라벨이 RandomForestClassifier인 게시물 표시

[matplotlib]quiver()함수

[stock]RandomForest를 사용한 주가 예측

RandomForest를 사용한 주가 예측 RandomForestClassifier RandomForestRegressor RandomForestClassifier 랜덤포레스트의 분류를 기법은 sklearn.ensemble.RandomForestClassifier() 를 사용합니다. n_estimators: 앙상블에 사용할 결정 트리의 개수. 일반적으로 클수록 모델의 성능이 향상되지만, 계산 비용도 증가. (기본값: 100) criterion: 각 트리의 노드를 분할하는 데 사용할 함수. 'gini' (지니 불순도) 또는 'entropy' (정보 이득)를 사용할 수 있습니다. (기본값: 'gini') max_depth: 각 트리의 최대 깊이를 제한합니다. 깊이가 깊어질수록 모델이 복잡해지고 과적합될 가능성이 높아집니다. None으로 설정하면 모든 리프 노드가 순수해질 때까지 또는 모든 리프 노드가 min_samples_split 샘플보다 적은 수의 샘플을 가질 때까지 트리가 확장됩니다. (기본값: None) min_samples_split: 노드를 분할하는 데 필요한 최소 샘플 수입니다. 이 값보다 적은 샘플을 가진 노드는 더 이상 분할되지 않습니다. (기본값: 2) min_samples_leaf: 리프 노드가 가져야 하는 최소 샘플 수입니다. 이 값보다 적은 샘플을 가진 리프 노드는 생성되지 않습니다. (기본값: 1) max_features: 각 노드에서 분할을 위해 고려할 특성의 최대 개수입니다. 'sqrt' (또는 'log2'): sqrt(n_features) 개의 특성을 사용합니다. 'log2': log2(n_features) 개의 특성을 사용합니다. None (또는 'auto'): 모든 특성을 사용합니다. 정수 값: 지정된 개수의 특성을 사용합니다. 부동 소수점 값 (0.0 ~ 1.0): 전체 특성 수의 해당 비율만큼 ...