59doit

ADsP 26회 기출 본문

ADsP/오답정리

ADsP 26회 기출

yul_S2 2022. 10. 18. 14:42
반응형

7. 데이터 사이언스는 데이터처리와 관련된 IT영역, 분석적 영역, 그리고 비즈니스 컨설팅 영역을 포괄하고 있다. 다음 중 세개의 영역과 다른 영역에 속하는 하나는?
X-> 데이터시각화 
>>비즈니스 분석의 영역
O-> 데이터웨어하우징
O-> 분산컴퓨팅
O-> 파이썬 프로그래밍
>> 데이터처리와 관련된 IT 영역

**
관련된 IT영역 :  
분석적 영역 : 
비즈니스 컨설팅 영역 : 
**


8. 빅데이터와 데이터 사이언스에 대한 설명으로 부적절한것은?
X-> 데이터 사이언스는 정형화된 실험데이터를 대상으로한다.
>> 정형,반정형,비정형 데이터를 모두 대상으로 분석을 수행한다.
O-> 기업의 빅데이터 분석은 기업 분석 문화의 영향을 받는다
O-> 미래가치 패러다임의 변화에서 빅데이터 분석활용 능력은 핵심적인 역할을 한다
O-> 데이터 사이언스에서 시각화와 효과적인 커뮤니케이션은 중요한 요소이다





13. 분석 기회 발굴의 범위를 확장 할 때에 고려해야 하는 내용으로 부적절한것은?
X-> 역량의 재해석 관점에서는 내부 역량 보다는 파트너와 네트워크를 집중적으로 분석하여 분석기회를 탐색한다.
>> 내부역량을 집중적으로 분석하여 분석 기회를 탐색하며, 파트너와 네트워크를 통해 분석기회를 추가적으로 도출할 수 있다.

O->거시적 관점의 메가트랜드에서는 현재의 조직 및 해당 산업에 폭넓게 영향을 미치는 사회 경제적 요인을 사회기술경제환경정치영역으로 나누어서 좀 더 폭넓게 기회 탐색을 수행한다.
O-> 시장의 니즈 탐색 관점에서는 현재 수행하고 있는 사업에서의 직접 고객뿐만 아니라 고객과 접촉하는 역할을 수행하는 채널 및 고객의 구매와 이사결정에 영향을 미치는 영향자들에 대한 폭넓은 관점을 바탕으로 분석 기회를 탐색한다
O->경쟁자 확대 관점에서는 현재수해하고 있는 사업 영역의 직접 경쟁사 및 제품 서비스 뿐만아니라 대체재와 신규진입자 등으로 관점을 확대하여 탐색한다



16. ★다음중 빅데이터 분석 방법론 중 시스템 구현에 대한 설명 중 가장 부적절한 것은?
X->정보보안영역과 코딩은 시스템 구현단계에서 주요 고려사항이다.
O->시스템 구현단계에는 설계 및 구현, 시스템 테스트 및 운영으로 이루어져 있다
O->시스템 설계서를 바탕으로 BI패키지를 활용하거나 새롭게 프로그램 코딩을 통하여 시스템을 구축한다
O->정보 보호 및 시스템 성능은 구현단계에 해당되지 않는다



20. A,B로 구성된 데이터 1000개 중 결측치 비율이 각각 5%라고 한다. 독립인 A,B 데이터의 결측값을 제거한다고 할 때 삭제되는 데이터의 비율로 가장 알맞은것은?



32. 판별분석에 대한 설명 중 틀린것은?
X->거리측정을 위해 피어슨 상관계수를 이용하고 구분선이 평균대비 거리가 동일하다
>>거리측정을 위해 마할라노비스 이용
O->로지스틱 회귀분석과 비슷하며 프로파일링에 사용되는 분석이다
O->고객 그룸을 나누거나 자연과학, 금융, 마케팅 등에 활용된다.
O->판별분석에서는 선형 분류함수를 적용해야하며, 피셔의 선형 분류함수 등이있다.




33 ★주성분분석은 P개의 변수들을 중요한 m(p)개의 주성분으로 표현하여 전체 변동을 설명하는 방법을 사용한다. 주성분개수(m)를 선택하는 방법에 대한 설명으로 부적절한것은?
X-> 평균 고유값 방법은 고유값들의 평균을 구한 후 고유값이 평균값 이상이 되는 주성분을 제거하는방법이다.
>> 제거x > 설정o
O->전체 변이 공헌도 방법은 전체 변이의 70~90%정도가 되도록 주성분의 수를 결정한다.
O->Scree graph를 이용하는 방법은 고유값의 크기순으로 산점도를 그린 그래프에서 감소하는 추세가 원만해지는 지점에서 1을 뺀 개수를 주성분의 개수로 선택한다.
O->주성분은 주성분을 구성하는 변수들의 계수 구조를 파악하여 적절하게 해서되어야 하며, 명확하게 정의된 해석방법이 있는것은 아니다.




34.____________

summary 는 요약통계 확인할 수 있는것이므로 각 변수가 유의한 차이가 있는지는 확인 할 수 없다.










35. ★다음 중 누적분포함수에 대한 설명 중 부적절한것은?
X->모든 확률변수에 대해 확률밀도(질량)함수는 존재하지만, 누적분포함수가 존재하지 않는 확률변수도있다
>>모든 확률변수에 대해 누적분포함수는 존재하지만, 확률밀도(질량)함수가 존재하지 않는 확률변수도있다

O-> a< x <= b라는 구간사건의 확률을 누적분포함수로 표현하면 P(a,b)=F(b)-F(a)이다.
O->누적분포함수는 non-decreasing function이며 우측연속이다
O->확률변수X의 누적분포 함수 중 연속형 확률 변수는 적분을 통해 구할 수 있다.




37. _____________












주관식
1. 비즈니스 측면에서 일반적으로 ' 공동 활용의 목적으로 구축된 유무형의 구조물'을 의미한다. 각종 사용자 데이터나 M2M센서 등에서 수집된 데이터를 가공 처리 저장해두고 이 데이터에 접근할 수 있도록 API를 공개한다. 그러면 다양한 3rd-party 사업자들이 비즈니스에 필요한 정보를 추출해 활용하게 되고 빅데이터는 그 자체로 이 역할을 수행하게된다.
>> 플랫폼





4. (   )란 전사차원의 모든 데이터에 대하여 정책 및 지침, 표준화,운용조직 및 책임등의 표준화된 관리체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는 것을 말한다. 특히 마스터 데이터, 메타데이터, 데이터 사전은 (     )의 중요한 관리대상이다.
>> 데이터 거버넌스



5. 배깅에 랜덤과정을 추가한 방법이다. 원 자료로부터 붓스트랩 샘플을 추출하고, 각 붓스트랩 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하나, 각 노드마다 모두 예측변수 안에서 최적의 분할을 선택하는 방법 대신 예측변수를 임의로 추출하고 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용한다
>> 랜덤포레스트



▶데이터 사이언티스트 소프트스킬 
창의적사고 설득력있는 스토리텔링 커뮤니케이션 능력

하스드킬
이론적 지식, ____


▶ 분석테크닉
소셜네트워크분석:핀테크기업에서 대출제공시 활용
기계학습:대규모데이터 처리분석할때 분석 인프라와 많은 시간 소요
뷴류 또는 예측모형:개인신용도평가에 많이활용

빅데이터 가치산정이 어려운 이유
데이터 활용방식
새로운 가치 창출
분석 기술 발전



경쟁자 확대 관점에서 보았을 때 포함되는 영역
: 대체제, 경쟁자, 신규진입자



결측치
default값으로 기록되어도 그 값이 실제 default와 동일한 값이 입력되는 등의 경우가 있으므로 해당 값을 임의로 결측치로 변경하면 안된다.
결측치가 20% 이상인 경우에는 해당 변수를 제거하고 분석해야한다.

반응형

'ADsP > 오답정리' 카테고리의 다른 글

ADsP 28회 기출  (0) 2022.10.19
ADsP 27회 기출  (0) 2022.10.18
ADsP 모의고사 2회  (0) 2022.10.18
ADsP 모의고사 1회  (0) 2022.10.18
데이터에듀 ADsP 03.데이터분석  (0) 2022.10.17
Comments