내용
데이터 처리
- 결측치 조정
- 결측치와 무한값찾기
- scipy.stats 모듈
- FinanceDataReader에 의한 금융자료 호출
- 피벗테이블(Pivot table)
- 교차표(cross tabulation): crosstab
- 데이터 라벨링(Data Labeling)
- FinanceDataReader에 의한 금융자료 호출
- yahoo finantical 자료 호출
- 데이터 분석을 위한 금융자료 I
- Date 데이터의 조정
- Time 변수 조정
- 라벨 인코딩( Label encoding)
- 목록변수를 순서형변수로 전환
- 순서형 인코딩(Ordinal encoding)
- Scaling
- 정규화(Normalization)
- 연속형변수를 목록형변수로 변환
- 원-핫 인코딩(one-hot encoding)
- 이진화(Binarization)
- Time 변수 조정
- 표준화(Standardization)
- 교차표(cross tabulation): crosstab
- 피벗테이블(Pivot table)
- 가상 데이터 만들기
- 가상데이터 만들기 make_regression
- 증가 확률함수의 역함수
- sklearn.pipeline 적용
- 한국과 외국의 시계열 자료의 합병
확률과 통계
- 변수의 특성
- 자료의 위치정보
- 변동(Variation)
- 확률(probability)
- 순열과 조합 (Permutation & Combination)
- 이항정리와 큰수의 법칙
- 독립사건(independent event)
- 조건부확률(conditional probability)
- 베이즈정리 (Bayes theorem)
- 모멘트 생성함수(MGF)
- 확률과 주요통계량: 모멘트와 기대값
- 확률과 주요통계량: 모멘트와 기대값 예제
- 확률과 주요통계량: 분산
- 확률과 주요통계량: 왜도(skewness)와 첨도(kurtosis)
- 확률부등식
- 랜덤변수들의 결합
- 커널밀도추정(kernel density estimator)
- 이산확률분포: 확률질량함수와 누적분포함수
- 베르누이와 이항확률분포
- 기하분포(Geometric distribution)
- 음이항분포(Negative Binomial Distribution)
- 초기하분포(Hypergeometric distribution)
- 포아송분포(Poisson distribution)
- 연속확률분포: 확률밀도 함수(pdf)
- 연속확률분포: 누적분포함수 (CDF)
- 균일분포(Uniform Distribution)
- 정규분포(Normal Distribution)
- 로그-노말 분포(Log-normal distribution)
- 지수분포(Exponential Distribution)
- 감마분포(Gamma Distribution)
- 카이제곱분포(chi-squared distribution)
- t 분포(Student's t distribution)
- F 분포(F distribution)
- 표본과 모집단(smaple and population)
- 표본분포(Sample distribution)
- 표준편차와 표준오차
- 추정(Estimation)
- 가설검정(Hypothesis test)
- 신뢰구간(Confidence Interval)
- 단측검정과 양측검정
- 정규성검정(Normality Test)
- 두 독립집단의 비교
- 카이제곱 검정($\chi^2$ test)
- 공분산과 상관계수
- 상관분석(Correlation analysis)
- 분산분석
- 등분산분석
- 회귀분석(Regression analysis)의 정의와 가정
- 단순회귀분석(Simple regression)
- 회귀계수의 추정: 최소제곱법(Least Square method)
- 최대우도추정(Maximum likelihood estimation)
- 회귀모델의 오차에 대해
- 회귀모형의 평가
- 회귀모형에서 이상치(outlier) 파악
- 다중회귀모델의 생성
- 다중 회귀모형의 진단
- 설명변수의 거듭제곱의 영향
- 설명변수 선택의 기준
- 최대우도 추정: AIC와 BIC
- 특징(변수) 선택
- 다중 공선성(Multicolinearity)
- 정규화된 회귀모델
- 교차검증(Cross-validation)
- 직교행렬과 주성분
- 데이터 행렬의 차원 축소
- 주성분분석(principal component analysis)
- 다항식 회귀(Polynomial Regression)
시계열 분석
Probability & Statistics
- Descriptive statistics
- Permuatation & Combiation
- Independence and Conditional Probability
- Probability and Expected Value
- Variance
- Skewness and Kurtosis
- Probability Inequalities & Moment Generating Functions
- Discrete probability distribution I : Bernoulli and Binomial
- Discrete probability distribution II : Geometric, Negative Binomial, Hypermatric, and Poisson
- Continuous Possibility Distribution:PDF
- Uniform and Normal distribution
- Exponential distribution
- Gamma , Chi square and F distribution
- Inferential Statistics: Standard Deviation and Standard Error
- Estimation
- Hypothesis test
- Comparison of two independent groups
- Covariance and correlation coefficient
- Normality Test
- Analysis of variance
- Regression Analysis: simple regression & regression coefficient
- Autocorrelation & Mean of Square Error
- Evaluation of regression coefficients, model & Estimation
- Multi-linear regression
댓글
댓글 쓰기