59doit
[ R ] 기술통계분석 연습문제 본문
반응형
descriptive.csv
0.01MB
1. descriptive.csv 데이터 셋을 대상으로 다음 조건에 맞게 빈도분석 및 기술통계량 분석 수행
1) 명목척도 변수인 학교유형(type), 합격여부(pass)변수에 대해 빈도분석을 수행하고 결과를 막대 그래프와 파이 차트로 시각화
data <- read.csv("C:/descriptive.csv", header = T) |
typeA <- table(data$type) barplot(typeA) ![]() pie(typeA) ![]() passA <- table(data$pass) barplot(passA) ![]() pie(passA) ![]() |
2) 비율척도 변수인 나이 변수에 대해 요약치(평균, 표준편차)와 비대칭도(왜도와 첨도) 통계량을 구하고, 히스토그램을 작성하여 비대칭도 통계량 설명
library("moments") age <- data$age range(age) # 40 69 mean(age) # 53.88 sd(age) # 6.813247 skewness(age) # 0.3804892 kurtosis(age) # 1.866623 |
3) 나이 변수에 대한 밀도분포 곡선과 정규분포 곡선으로 정규분포 검정
hist(age, freq=F)![]() lines(density(age), col='blue') ![]() x <- seq(0, 70, 0.1) curve(dnorm(x, mean(age), sd(age)), col='red', add=T) ![]() |
2. MASS 패키지에 있는 Animals 데이터 셋을 이용하여 각 단계에 맞게 기술통계량을 구하시오.
1) MASS패키지 설치와 메모리 로딩
library(MASS) |
2) R 의 기본함수를 이용하여 brain 컬럼을 대상으로 다음의 제시된 기술통계량 구하기
brain <- Animals$brain range(brain) # 0.4 5712.0 mean(brain) # 574.5214 min(brain) # 0.4 max(brain) # 5712 median(brain) # 137 sd(brain) # 1334.929 var(brain) # 1782036 sqrt(var(brain)) # 1334.929 |
반응형
'통계기반 데이터분석' 카테고리의 다른 글
[ R ] 집단간 차이분석 - 세 집단 검정 #3 (0) | 2022.11.23 |
---|---|
[ R ] 집단간 차이분석 - 두 집단 검정 #2 (0) | 2022.11.23 |
[ R ] 집단간 차이분석 - 추정과 검정 #1 (0) | 2022.11.23 |
[ R ] 기술통계분석 #2 (0) | 2022.11.22 |
[ R ] 기술통계분석 #1 (0) | 2022.11.22 |