59doit

[ R ] 기술통계분석 연습문제 본문

통계기반 데이터분석

[ R ] 기술통계분석 연습문제

yul_S2 2022. 11. 22. 15:29
반응형

descriptive.csv
0.01MB

 

 

 1. descriptive.csv 데이터 셋을 대상으로 다음 조건에 맞게 빈도분석 및 기술통계량 분석 수행

1) 명목척도 변수인 학교유형(type), 합격여부(pass)변수에 대해 빈도분석을 수행하고 결과를 막대 그래프와 파이 차트로 시각화

data <- read.csv("C:/descriptive.csv", header = T)
typeA <- table(data$type)
barplot(typeA)




pie(typeA)




passA <- table(data$pass)
barplot(passA)


pie(passA)



 

 

2) 비율척도 변수인 나이 변수에 대해 요약치(평균, 표준편차)와 비대칭도(왜도와 첨도) 통계량을 구하고, 히스토그램을 작성하여 비대칭도 통계량 설명

library("moments")

age <- data$age

range(age) 
# 40 69

mean(age)
# 53.88

sd(age) 
# 6.813247

skewness(age)
# 0.3804892

kurtosis(age) 
# 1.866623


 

3) 나이 변수에 대한 밀도분포 곡선과 정규분포 곡선으로 정규분포 검정

 

hist(age, freq=F)


lines(density(age), col='blue')



x <- seq(0, 70, 0.1)
curve(dnorm(x, mean(age), sd(age)), col='red', add=T)



 

 

 

 2. MASS 패키지에 있는 Animals 데이터 셋을 이용하여 각 단계에 맞게 기술통계량을 구하시오.

1) MASS패키지 설치와 메모리 로딩

library(MASS)

 

 

2) R 의 기본함수를 이용하여 brain 컬럼을 대상으로 다음의 제시된 기술통계량 구하기

brain <- Animals$brain

range(brain) 
# 0.4 5712.0

mean(brain)
# 574.5214

min(brain)
# 0.4

max(brain)
# 5712

median(brain)
# 137

sd(brain)
# 1334.929

var(brain)
# 1782036

sqrt(var(brain))
# 1334.929

 

반응형
Comments