59doit
ADsP 27회 기출 본문
1. 기업의 성과와 분석의 활용에 대한 설명 중 부적절한것은?
X->성과가 우수한 기업들도 일상 업무에 데이터 분석을 활용하지는 못하고있다.
O->성과가 높은 기업과 낮은 기업은 분석에 대한 태도에서 큰 차이가 있다.
O->성과가 낮은 기업들은 실시간 분석 역량을 갖추고 있는 비율이 높지 않다.
O->성과가 높은 기업들도 가치 분석적 통찰력을 갖추고 있는 비율이 높지않다.
4. 아래와 같은 비즈니스 문제가 있다면, 각 문제를 해결하기 위해 주로 사용되는 기법과 연결이 적절하지 않은것은?
X-> 택배차량을 어떻게 배치하는것이 비용측면에서 가장 효율적인가? - 유형분석
>> 유형분석 X -> 유전자알고리즘
O-> 맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많다.- 연관규칙학습
O->고객의 만족도가 충성도에 어떤 영향을 미치는가? - 회귀분석
O-> 친분관계가 승진에 어떤 영향을 미치는가 - 소셜 네트워크분석
6. 데이터 이용과 분석에 대한 용어와 의미를 서로 연결한것.
OLTP : 데이터베이스의 데이터를 수시로 갱신하는 프로세싱으로 호스트 컴퓨터가 데이터 베이스를 액세스하고, 바로 처리 결과를 돌려보내주는 형태
OLAP : 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어
Business Intelligence : 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
Business Analytics : 경영 의사 결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법
데이터마이닝 : 대용량 데이터로부터 의미있는 관계, 규칙, 패턴을 찾는과정
10. CRISP-DM 방법론의 분석절차에서 위대한 실패가 발생할 수 있는 단계
Evaluation -> business understanding
**
평가를 통해 모델에 대한 평가를 파악하며 이때, 모형개발이 잘못되었을때 다시 business understanding 단계로 돌아간다.
**
13. CRISP-DM 방법론의 데이터 준비단계에 해당하지 않은 것은?
X-> 데이터탐색
O-> 데이터 통합
O-> 데이터 정제
O-> 데이터 포맷팅
16. 분석과제 발굴중 틀린것은?
X->하향식접근법은 사물을 있는그대로 인식하는 'WHAT'관점에서 보아야한다
>>
사물을 있는그대로 인식하는 'WHAT'관점에서 접근 : 상향식
분석적으로 사물을 인식하려는'WHY'관점에서 접근 : 하향식
O->디자인 사고는 상향식 접근방식과 하향식 접근방식을 반복적으로 수행하는 의사결정 방식이다
O->상향식접근방식의 데이터 분석은 비지도 학습방법에 의해 수행된다
O->하향식접근법은 문제탐색, 문제정의, 해결방안 탐색, 타당성 검토의 순서로 진행된다
39. ★시계열 분석에 대해 가장 부적절한 것은?
X-> 지수평활법은 복잡한 식 없이 단순히 과거 자료의 평균을 구해서 미래를 예측하는 방법이다.
>> 모든시계열 자료를 사용하여 평균을 구해 미래를 예측하는 방법이다.
O->ARMA 모형은 약한 정상성을 가진 확률적 시계열을 표현하는데 사용한다
O->정상시계열은 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖는다
O->AR모형은 자기상관함수가 빠르게 감소하고 부분자기함수는 어느 시점에서 절단점을 가진다
주관식
1. ( ㄱ )은 어떤 현상에 대하여 현상을 발생시킨 원인과 그 결과 사이의 관계를 말하고 ( ㄴ )는 어떤 두 현상이 관계가 있음을 말하지만 어느 쪽이 원인이지 알수없다.
ㄱ : 인과관계, ㄴ: 상관관계
5.loadings를 통해 각 변수*주성분값 + ...
7. BIC 값이 가장 큰 지점이 최적의 군집수가 위치
데이터란 용어는 1646년 영국 문헌에 처음으로 등장한 것으로 알려져있다.
데이터는 객관적 사실이라는 존재적 특성을 갖는다
데이터는 정성과 정량의 유형으로 구성되어있다.
정성 : 언어,문자 / 정량 : 수치, 도형, 기호
메타데이터 : 데이터에 관한 구조화된 데이터로서 다른 데이터를 설명해주는 데이터
신경망 : 인공지능 기술의 발전과 함께 주목받고 있는 딥러닝 기법에 기반을 두는 모형
순서척도 : 측정대상의 특성이 가지는 서열관계를 관측하는 척도, 즉 관찰대상이 가지고 있는 속성의 크기를 측정하여 순서대로 대상의 순위를 나타내는 척도
활성화함수 : 신경망 모형에서 output을 결정하며 선형 또는 곡선으로 출력해주는 것
하드스킬:이론적지식, 분석기술에 대한 숙련
소프트스킬:통찰력있는분석, 설득력있는전달, 다분야간 협력
▶캔버스 채널이란?
______
비즈니스모델 캔버스의 채널에 대한 기능:고객에게 밸류 프로포지션을 전달한다.
구매고객에 대한 A/S를 제공한다
기업이 제공하는 상품이나 서비스에 대한 고객의 이해를 높여준다
분석과제 기획시 고려사항
★데이터 분석을 위해서는 데이터확보가 우선적 / 정형화필수사항X
데이터 분석을 통하여 가치가 창출될 수 있는 적절한 활용방안과 활용가능한 유즈케이스탐색
분석을 수행함에 있어 발생하는 장애요인들에 대한 사전 계획 수립 필요
데이터 분석을 내재화하기 위해서는 교육 등 변화관리방안 고려
데이터거버넌스
전사차원의 모든 데이터에 대해 정책 및 지침, 표준화, 운영 조직, 책임 등의 표준화된 관계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는것
기업은 데이터의 가용성,유용성,통합성,보완성,안정성을 확보할수있다
마스터데이터,메타데이터, 데이터사전은 데이터 거버넌스의 중요관리 대상이다
★데이터 거버넌스는 독자적으로 수행되고있지만 전사차원의 it거버넌스나 EA의 구성요소로 구축되는 경우도 있다
CRISP-DM 방법론
업무이해
데이터이해 : 데이터탐색, 품질, 기술, 수집
데이터준비
모델링 : 모델평가
평가 : 적용성평가
전개
**준비단계에서는 데이터셋 선택, 데이터정제, 분석용 데이터셋 편성, 데이터 통합, 데이터 포맷팅 작업을 수행한다.
분석우선순위 평가기준
시급성 : 가치
난이도 : 크기 다양성 속도
분석과제발굴 방법: 상향식,하향식
상향식 접근방법 : 사물을 있는 그대로 인식하는 'WHAT'관점에서 보아야한다.
하향식 접근방법 : 분석적으로 사물을 인식하려는'WHY'관점에서 접근한다
**최적의 의사결정은 두 접근 방식이 상호보완관계에 있을 때 가능하다
>> 디자인사고 : 상향식의 발산단계와 하양식 수렴단계를 반복적으로 수행하는 식
변수의 25%가 ~~ 보다 큰값을 가진다 -> " 3rd Ou " 봐야함***◈30번
교호관계가 없다 : 두 선이 크로스 되는 지점이 없다는 뜻
공분산
: X,Y 방향의 선형성
cov(X,Y) = E [ (X-m)(Y-m) ]
X,Y가 독립이면 cov(X,Y)-0이다.
공분산은 -1,1보다 클수있다
<-> -1 ≤ 상관계수 ≤1
의사결정나무 : 분산의 감소량을 최대화 하는 기준의 최적분리에 의해서 자식마디를 형성한다.
지니 지수 값이 클수록 이질적이며 수순도가 낮다고 할 수 있다.
카이제곱 통계량의 p-value는 그 값이 작을수록 자식노드내의 이질성이 크다는것
랜덤포레스트는 의사결정나무모형의 특징인 분산이 크다는 점을 고려하여 배깅보다 더 많은 무작위성을 추가한 방법으로 약한 학습기들을 생성하고 이를 선형결합해 최종 학습기를 만드는 방법이다.
부스팅은 예측력이 약한 모형들을 결합하여 강한 예측모형을 만드는 방법이다.
정상시계열
정상시계열은 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖는다
항상 그 평균값으로 회귀하려는 경향이 있으며 그 평균값 주변에서의 변동은 대체로 일정한 폭을 갖는다.
정상시계열이 아닌경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시길 일반화 할 수 없다.
ARMA모형은 약한 정상성을 가진 확률적 시계열을 표현하는데 사용
지수평활법 : 모든시계열자료에서 사용
이동평균법 : 일정기간 평균이동
'ADsP > 오답정리' 카테고리의 다른 글
ADsP 29회 기출 (0) | 2022.10.19 |
---|---|
ADsP 28회 기출 (0) | 2022.10.19 |
ADsP 26회 기출 (0) | 2022.10.18 |
ADsP 모의고사 2회 (0) | 2022.10.18 |
ADsP 모의고사 1회 (0) | 2022.10.18 |