목록통계기반 데이터분석 (38)
59doit
(2) 잘못 분류된 요인 제거로 변수 정제 특정 변수가 묶여질 것으로 예상되는 요인으로 묶이지 않는 경우 해당 변수를 제거하여 변수를 정제하는 방법 ex) 요인분석에 사용될 데이터 셋 가져오기 #1 spss데이터 셋 가져오기 install.packages("memisc") library(memisc) setwd("C:/Rwork/") data.spss

ex) 요인점수를 이용한 요인적재량 시각화 요인점수(요인 분석에서 요인의 추정된 값)를 얻기 위해서는 scores속성(scores=”regression”: 회귀분석으로 요인점수 계산) 설정 #1 Factor1과 Factor2 요인적재량 시각화 plot(result$scores[ , c(1:2)], main = "Factor1과 Factor2 요인점수 행렬") text(result$scores[ , 1], result$scores[ , 2], labels = name, cex = 0.7, pos = 3, col = "blue") #2 요인적재량 추가 points(result$loadings[ , c(1:2)], pch = 19, col = "red") text(result$loadings[ , 1], re..

요인분석 변수들의 상관성을 바탕으로 변수를 정제하여 상관관계 분석이나 회귀분석에서 설명변수(독립변수)로 사용된다. 다수의 변수를 대상으로 변수 간의 관계를 분석하여 공통 차원으로 축약하는 통계기법 1) 탐색적 요인분석: 요인 분석을 할 때 사전에 어떤 변수들끼리 묶어야 한다는 전제를 두지 않고 분석하는 방법 2) 확인적 요인 분석: 사전에 묶일 것으로 기대되는 항목끼리 묶였는지를 조사하는 방법 타당성: 측정 도구가 측정하고자 하는 것을 정확히 측정할 수 있는 정도 논문 작성을 위한 통계분석 방법에서 인구통계학적 분석(빈도분석, 교차분석 등)을 시행한 이후 통계량 검정 이전에 구성 타당성(Construct validity)검증을 위해서 요인분석(Factor Analysis) 시행 - 요인분석을 위한 전제조..

주성분분석 PCA 많은 변수로 구성된 데이터에 대해 주성분이라는 새로운 변수를 만들어 기존 변수보다 차원을 축소하여 분석을 수행 주성분 P1은 데이터 분산을 가장 많이 설명할 수 있는 것을 선택하고 P2는 P1과 수직인 주성분을 만들어 다중 공선성 문제를 해결 다중 공선성(MultiCollinearity): 독립변수 사이에 강한 상관관계가 나타나서 종속변수에 영향을 미치는 경우 완전 공선성: 독립 변수들 사이에 정확한 선형 관계가 존재하는 경우 다중 공선성 문제는 분석과 예측의 정확성을 위해서 피하거나 해결해야 한다 수학적으로 p-차원에 놓이게 되며 원래 변수의 선형결합 또는 회전 변환을 통해 p개의 새로운 좌표축을 형성. 데이터의 변동을 최대로 설명해주는 동시에 공분산 구조에 대한 해석을 용이하게 하도..