목록Programming/R (31)
59doit
(4) 컬럼으로 데이터 정렬 데이터 셋의 특정 컬럼을 기준으로 오름차순 또는 내림차순으로 정렬하는 arrange()함수 사용 arrange(dataframe, 컬럼1, 컬럼2, …) #default는 오름차순 arrange(dataframe, desc(컬럼1, …)) #desc()함수로 지정하는 경우 내림차순 ex ) 단일 객체의 오름차순 정렬 library(dplyr) csvgrade % arrange(math) # id class math eng sci # 1 2 2 20 60 80 # 2 5 2 40 30 90 # 3 1 1 50 50 70 # 4 4 3 50 80 90 # 5 10 1 60 80 60 # 6 3 3 80 70 90 # 7 6 2 80 90 80 # 8 8 3 80 90 70 # 9..
install.packages("dplyr") library(dplyr) dplyr 패키지 활용 dplyr 패키지는 데이터프레임 자료구조를 갖는 데이터를 처리하는데 적합한 패키지 (1) 파이프 연산자(%>%)를 이용한 함수 적용 데이터프레임을 조작하는데 필요한 함수를 순차적으로 적용할 경우 사용할 수 있는 연산자 dataframe %>% 함수1() %>% 함수2() %>% 연산자는 인수를 함수에 편하게 적용할 수 있다. %>% 연산자의 >(라이트 앵글 브래킷) 기호는 방향의 의미로 왼쪽에 있는 인자를 오른쪽에 있는 함수에 집어넣는 것이 파이프라인의 기능이다. %>% 연산자를 사용하면 여러 가지 함수를 한 번에 사용할 수 있다. %>% 함수의 큰 장점은 한 번에 한 줄로 코드를 사용할 수 있으므로 함수를 ..

주요 내장함수 (1) 기술통계량 처리 관련 내장함수 min(vec), max(vec), range(vec), mean(vec), median(vec), sum(vec), sort(x), order(x): 벡터의 정렬된 값의 index를 보여주는 함수 rank(x), sd(x), summary(x), table(x), sample(x,y): x범위에서 y만큼 sample데이터를 생성하는 함수 ex ) 행/컬럼 단위의 합계와 평균 구하기 library(RSADBE) data("Bug_Metrics_Software") Bug_Metrics_Software[ , , 1] # Bugs # Software Bugs NT.Bugs Major Critical H.Priority # JDT 11605 10119 1135..