목록통계기반 데이터분석 (38)
59doit

조건부 추론나무 # 패키지 install.packages("rpart") library(rpart) install.packages("rpart.plot") library(rpart.plot) # sampling data(iris) str(iris) set.seed(1000) sampnum

K겹 교차 검정 샘플링으로 분류 분석하기 #1 k겹 교차 검정을 위한 샘플링 library(cvTools) cross

의사결정나무 CART(Classification and Regression Tree) : 가장 많이 쓰는 기법 C4.5 & C5.0 : CART와 다르게 node에서 다지분리(Multiple Split)이 가능 CHAID(Chi-squared Automatic Interaction Detection) : 범주형 변수에 적용 가능 1. 의사결정 트리(Decision Tree) 의사결정트리 방식은 나무(Tree)구조 형태로 분류 결과를 도출 (1) party 패키지 이용 분류분석 조건부 추론 나무 CART기법으로 구현한 의사결정나무의 문제점 1) 통계적 유의성에 대한 판단없이 노드를 분할하는데 대한 과적합(Overfitting) 발생 문제. 2) 다양한 값으로 분할 가능한 변수가 다른 변수에 비해 선호되는 ..

시계열분석 기법 시계열 자료의 분석 기법: 평활법, 시계열 요소 분해법, 회귀 분석법, ARIMA모형법 (1) 시계열 요소 분해법 시계열 요소 분해법: 시계열 자료의 4가지 변동요인을 찾아서 시각적으로 분석하는 기법 시계열 자료가 증가하거나 감소하는 경향이 있는지 파악 증가나 감소의 경향이 선형(linear)인지, 비선형(nonlinear)인지, S 곡선과 같은 성장곡선 인지 찾는 과정이 필요 1) 차분 후 일정한 값을 나타내면 선형의 패턴(대각선) 2) 로그변환 후 일정한 값을 나타내면 비선형의 패턴(U자, 역U자) 3) 로그변환 후 1차 차분결과가 일정한 값으로 나타나면 성장곡선의 패턴(S자) (2) 평활법 과거 자료의 불규칙한 변동을 제거하는 방법 (1) 이동평균(Mo..