목록Programming (97)
59doit

코딩 변경 코딩 변경: 최초 코딩 내용을 용도에 맞게 변경하는 작업 코딩 변경 목적: 데이터의 가독성, 척도 변경, 역 코딩 (1) 가독성을 위한 코딩 변경 일반적으로 데이터는 디지털화하기 위해서 숫자로 코딩 ex ) 가독성을 위해 resident 컬럼을 대상으로 코딩 변경 dataset2$resident2[dataset2$resident == 1]

EDA 탐색적 자료분석(Exploratory Data Analysis): - 수집한 자료를 다양한 각도에서 관찰하고 이해하는 과정 - 그래프나 통계적 방법을 이용하여 자료를 직관적으로 파악하는 과정 (1) EDA 필요성 자료의 분포와 통계 파악 : 자료의 특성 이해 잠재적인 문제 발견 : 기존의 가설 수정 또는 새로운 방향의 가설 설정 (1) EDA 과정 단계별 EDA 수행과정 1. 분석의 목적과 변수의 특징 확인 2. 자료 확인 및 전처리: 결측치, 이상치 3. 자료의 각 변수 관찰: 통계조사, 시각화 4. 변수 간의 관계에 초점을 맞춰 패턴 발견: 상관관계, 시각화 도구로 변수간의 패턴 발견 자료 이해 (1) 데이터 셋 보기 데이터의 분포 현황을 통해 데이터의 유형과 결측치(NA), 극단치(outli..
reshape2 reshape패키지의 기본 골격만을 대상으로 개발된 패키지 melt()함수와 dcast/acast()함수를 적용하여 집단변수를 통해서 데이터의구조를 유연하게 변경해주는 기능을 제공 (1) 긴 형식을 넓은 형식으로 변경 dcast()함수: 긴 형식(Long format)의 데이터를 넓은 형식(Wide format)으로 변경 ex ) reshape2 패키지 설치와 데이터 가져오기 install.packages("reshape2") library(reshape2) data
(9) 데이터프레임 병합 서로 다른 데이터프레임을 대상으로 공통 컬럼을 이용하여 하나의 데이터프레임을 병합하는 join() 함수 ex ) inner_join 함수 inner_join(df1, df2, x) ex ) left_join left_join(df1, df2, x) ex ) right_join right_join(df1, df2, x) ex ) full_join full_join(df1, df2, x) (9) 데이터프레임 합치기 서로 다른 데이터프레임을 대상으로 행 단위 또는 열 단위로 합치는 함수 bind관련 함수 - bind_rows(df1, df2) - bind_cols(df1, df2) ex ) 세로 결합 library(dplyr) a