59doit
데이터 에듀 ADsP 03.데이터분석 본문
1절
2. 데이터 마이닝의 모델링에 대한 설명이다 설명이 가장 잘못된것은?
X-> 모델링 방법은 여러 가지가 있으므로 모델링 시 반드시 다양한 옵션을 줘서 모델링을 수행하여 최고의 성과를 도출하여야 한다.
>>> 반드시 다양한 옵션 X -> 충분한 시간이 있으면 다양한 옵션을 줘서 시도하는 것이다.
O->데이터 마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야한다.
O->분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2 비율로 상황에 맞게 실시한다.
O->성능에 집착하면 분석 모델링의 주목적인 실무 적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단한다.
3. 데이터 마이닝에서 활용하는 평가기준
정확도, 정밀도, 디텍트 레이트 등의 값으로 판단한다.
cf) 시뮬레이션 에서는 Throughout, Average Waiting Time, Average Queue Length, Time in System 등의 지표가 활용된다
6. 최근의 시각화의 발전 형태가 아닌것은?
X-> 통계소프트웨어의 기초통계정보를 액셀에서 그래프화
>> 최근 시각화 기술의 발전된 형태가 아니라 기존의 기술이다.
O->텍스트 마이닝에서의 워드 클라우드를 통한 그래프화
O-> SNA 에서 집단의 특성과 관계를 그래프화
O-> polygon, heatmap, mosaic graph 등의 그래프 작업
2절 R
7. R 코드 수행한 결과에 대한 설명으로 옳은 것은?
> c(2,4,6,8)+c(1,3,5,7,9)
O-> 경고메시지와 함께 결과가 출력된다
>> 두객체의 길이가 서로 배수관계에 있지 않습니다 라는 경고 메시지가 뜨고 결과도 출력된다.
8. R의 데이터 구조와 저장형식에 관한 설명으로 가장 부적절한것은?
X->행렬을 as.vector함수에 입력하면 행 방향으로 1행부터 차례로 원소를 나열하는 벡터가 생성된다.
>>> 행방향 x > 열방향
O->as.numeric함수에 논리형 벡터를 입력하며 TRUE 에 대응하는 원소는 1, FALSE에 대응하는 원소는 0인 숫자형 벡터로 변형된다.
O-> 숫자형 행렬에서 원소 중 하나를 문자형으로 변경하게 되면 해당 행렬의 모든 원소가 문자형으로 변경된다.
O->데이터 프레임은 각 열로 서로 다른 데이터 타입을 가질수있다.
11. R에서 제공하는 데이터 가공, 처리를 위한 패키지의 설명으로 가장 부적절한것은?
X-> data.table 패키지는 데이터 프레임 처리함수인 ddply 함수를 제공한다.
>>> data.table 패키지는 큰 데이터를 탐색, 연산, 병합하는데 유용
ddply 는 plyr패키지에서 지원한다.
O->reshape 패키지는 melt 와 cast이용하여 데이터를 재구성할 수 있다.
O->sqldf패키지는 R에서 표준 SQL명령을 실행하고 결과를 가져올 수 있다.
O->plyr패키지는 데이터의 분리,결합 등 필수적인 데이터 처리 기능을 제공한다.
12. R코드를 수행한 결과로 적절한것은?
> "+"(2,3)
>> 숫자 5가 출력된다.
16. R 코드의 결과로 적절한 것은?
>s <- c("Monday","Tuesday","Wednesday")
>substr(s,1,2)
>>> "Mo","Tu","We"
18.★ R 코드의 출력결과는?
25.★ R 코드의 출력결과는?
>f<-function(x,a) return((s-a)^2)
>f(1:2,3)
>>>> 4 1
27. ★출력결과는?
x<-1:100
sum(x>50)
>>>50
3절 데이터마트
2. 변수를 조합해 변수명을 만들고 변수들을 시간, 상품 등의 차원에 결합해 다양한 요약변수와 파생변수를 쉽게 생성하여 데이터마트를 구성할 수 있는 패키지는 무엇인가?
>> reshape
: 데이터를 원하는 형태로 바꿔주는 melt함수와 원하는 부분만 선택하는 cast함수로 구성되어있다.
cf) rattle:
12. 다음중 결측값을 처리하는 방법에 대한 설명 중 부적절한것은?
X->다중대치법은 단순대치법을 한번하지 않고 m번 대치를 통해 m가사정적 완전 자료를만들어서 분석하는 방법이다. 추정량의 과소추정이나 계산의 난해성 문제가 보완된 방법이다.
>>> 추정량의 표준오차의 과소추정이나 계산의 난해성 문제가 보안된 방법이다.
O->complete Analysis는 불완전 자료를 모두 삭제하고 완전한 관측치만을 자료를 분석하는 방법이다. 그러나 부분적 관측자료를 사용하므로 통계적 추론의 타당성 문제가있다.
O->평균대치법은 자료의 평균값으로 결측값을 대치하여 불완전한 자료를 완전한 자료로 만들어 분석하는 방법이다.
O->단순확률대치법은 평균대치법에서 추정량 표준오차의 과서 추정문제를 보완하고자 고안된 방법이다.
14. 이상값 검색을 활용한 응용시스템으로 적절한것은?
>> 부정사용방지 시스템
**
이상값을 검색하면 한 집단에서 매우 크거나, 매우 작으면 의심되는 대상이므로 부정사용방지 시스템에 활용이 가능하다
**
'ADsP > 오답정리' 카테고리의 다른 글
ADsP 모의고사 2회 (0) | 2022.10.18 |
---|---|
ADsP 모의고사 1회 (0) | 2022.10.18 |
데이터에듀 ADsP 03.데이터분석 (0) | 2022.10.17 |
데이터 에듀 ADsP 02.데이터분석기획 (1) | 2022.10.15 |
데이터 에듀 ADsP 01.데이터의 이해 (0) | 2022.10.14 |