목록Q. (39)
59doit
speech_park.txt 에는 박근혜 전 대통령의 대선 출마 선언문이 들어있습니다. # 텍스트 불러오기 speechtxt % as_tibble() speech_df Q1. speech_park.txt 를 불러와 분석에 적합하게 전처리한 다음 띄어쓰기 기준으로 토큰화하세요. library(tidytext) word_space % unnest_tokens(input = value, output = word, token = "words") word_space Q2. 가장 자주 사용된 단어 20개를 추출하세요. top20 % count(word,sort = T) %>% filter(str_count(word)>1) %>% head(20) top20 Q3. 가장 자주 사용된 단어 20개의 빈도를 나타낸 막대 ..

제공된 데이터에서 빈도수가 2회 이상 단어를 이용하여 단어 구름으로 시각화 하시오 (1) 텍스트 데이터 가져오기 Zelenskydata

(의사결정트리- CART) 1. iris 데이터를 이용하여 CART 기법 적용(rpart()함수 이용)하여 분류분석 하시오. (1) 데이터 가져오기 & 샘플링 (2) 분류모델 생성 (3) 테스트 데이터를 이용하여 분류 (4) 예측정확도 # 패키지 설치 및 불러오기 install.packages("rpart") library(rpart) library(rpart.plot) # 1 데이터 가져오기 & 샘플링 data

1. tranExam.csv 파일을 대상으로 중복된 트랜잭션 없이 1-2컬럼만 single형식으로 트랜잭션 객체를 생성하시오. # 1단계: 트랜잭션 객체 생성 및 확인 # 2단계: 각 items별로 빈도수 확인 # 3단계: 파라미터(supp = 0.3, conf = 0.1)를 이용하여 규칙(rule)생성 # 4단계: 연관규칙 결과 보기 1) 트랜잭션 객체 생성 및 확인 setwd("C:/") tranExam {2} 0.6 0.6000000 1.0 1.0000000 3 # [3] {} => {3} 0.6 0.6000000 1.0 1.0000000 3 # [4] {} => {1} 0.8 0.8000000 1.0 1.0000000 4 # [5] {4} => {1} 0.4 1.0000000 0.4 1.25000..