목록텍스트마이닝 (23)
59doit
# # # # 1. 웹 문서 요청과 파싱 관련 패키지 설치 및 로딩 install.packages("httr") library(httr) install.packages("XML") library(XML) # 2. 웹 문서 요청 url " web
R 3.6.3 에서 사용 R 3.6.3 설치 https://cran.r-project.org/mirrors.html Java 설치 https://www.java.com/ko/ Rtools https://cran.rstudio.com/bin/windows/Rtools/ Rtools35.exe 다운로드 & 설치 install.packages("tm") library(tm) install.packages("multilinguer") 실행 에러로 아래 이용하여 설치완료 # install.packages("cli") # install.packages("rlang") # install.packages("magrittr") 설치 library(multilinguer) install_jdk() install.packa..
텍스트분석 데이터 마이닝(data mining)은 구조적인 데이터(정형 데이터)를 대상으로 유용하고 가치 있 는 패턴을 추출하는 것이다. 반면에 텍스트 마이닝(text mining)은 자연어로 구성된 비구조 적인 데이터(비정형 데이터)를 대상으로 개체명(인명, 지역명 등), 패턴 혹은 단어-문장 관 계 정보를 추출하는 것이다. 텍스트 수집을 위한 주요 기술 Crawling - SNS, 뉴스, 웹 정보 등 인터넷상에서 제공되는 웹 문서·정보 수집 - URL 링크를 따라가며 반복적으로 수집 Scraping - 크롤러와 달리, 하나의 웹사이트(혹은 문서)에 대하여 정보 수집 FTP - TCP/IP 프로토콜을 활용하는 인터넷 서버로부터 각종 파일을 송수신 - 보안을 강화하기 위해 SFTP 사용 고려 - 서버 간..