59doit
ADsP 모의고사 1회 본문
1. 데이터베이스의 특징으로 부적절한것은?
X-> 데이터베이스는 검색기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색 할 수 있다.
>> 데이터베이스의 일반적인 특징: 통합된 데이터, 저장된 데이터, 공용데이터, 운영데이터이다.
O-> 데이터 베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어있다.
O-> 데이터 베이스는 통합된 데이터다
O->★데이터베이스는 변화하는 데이터로 데이터의 삽입, 삭제, 갱신을 한다고 하더라도 항상 현재의 정확한 데이터를 유지해야한다.
7. 사물끼리 정보를 주고 받는 사물인터넷 시대를 빅데이터의 관점에서 바라볼때 다음 중 사물인터넷의 의미로 가장 적절한것은?
모든것의 데이터화 datafication
14. 분석 프로젝트 영역별 주요 관리 항목이 아닌것은?
X->가격
O->품질
O->시간
O->자원
35. K-means 군집분석과 계층적 군집분석의 차이를 잘못설명한것은?
X-> K-means 군집분석은 동일한 거리계산법을 적용하면 몇 번을 시행해도 동일한 결과가 나온다.
>> K-means 군집분석은 다른군집으로 이동해 재배치 하기 때문에 동일한 결과가 나오지 않는다
O-> K-means 군집분석은 계층적 군집분석과는 달리 한 개체가 처음 속한 군집에서 다른 군집으로 이동해 재배치 될 수 있다.
O-> K-means 군집분석은 초기값에 대한 의존이 커서 초기값을 어떻게 하느냐에 따라 군집이 달라질수있다.
O-> ★계층적 군집분석은 동일한 거리계산법을 적용하면 몇번을 시행해도 동일한 결과가 나온다.
주관식
1. 개인의 사생활 침해를 방지하고 통계 응답자의 비밀사항은 보호하면서 통계자료의 유용성을 최대한 확보할수있는 데이터변환방법은?
>>마스킹
2. 데이터( )이란 데이터 베이스 내의 데이터에 대한 정확성 일관성 유효성 신뢰성을 보장하기 위해 데이터 변경 또는 수정시 여러가지 제한을 두어 데이터의 정확성을 보증하는 것이다.
>> 무결성
3. 데이터분석기획을 위해서 데이터 분석 수준진단이 필요하다. 분석준비도와 분석 성숙도를 통해 데이터 분석수준을 진단하게되는데, 분석준비도 6개의 영역 중 2가지를 적으시오
>> 업무, 인력/조직, 기법, 데이터, 문화, 인프라
9. 동시에 구매될 가능성이 큰 상품군을 찾아내는 연관성 측정에 시간이라는 개념을 포함시켜 순차적인 구매 가능성이 큰 상품군을 찾아내는 데이터 마이닝 기법은?
>> 순차분석
성공적인 분석을 위해서 고려해야 할 요소
데이터에 대한 고려, 활용가능한 유즈케이스 탐색, 분석수행에 있어 발생하는 장애요소들에 대한 사전계획 수립
하향식접근방법의 과정
문제탐색 - 문제정의 - 해결방안 탐색 - 타당성검토
:기업내/외부 환경을 포괄하는 비즈니스 모델과 외부 사례를 기반으로 문제를 탐색
식별된 비즈니스 문제를 데이터의 문제로 변화하여 정의한다
도출된 분석 문제나 가설에 대한 대안을 과제화하기 위해 타당성을 평가한다.
분석과제 관리 프로세스에 대한 설명
발굴단계 : 분석아이디어 발굴, 분석과제 후보제안 분석과제 확정프로세스
과제수행단계 : 팀구성, 분석과제 식별, 분석과제 진행관리, 결과 공유 프로세스
분석과제 중에 발생된 시사점과 분석결과물이 풀(pool)로 관리되고 공유된다.
->확정된 분석과제 풀로관리 X
분석조직의 유형
기능형
분산형
집중형 : 전사 분석업무를 별도의 분석전담 조직에서 담당 , 전략적 중요도에 따라 분석 조직이 우선 순위를 정해서 진행 가능, 현업 업무부서의 분석업무와 이중화/ 이원화 가능성 높음
모분산의추론
F분포 : 이표본에 의한 분산비 검정은 두표본의 분산이 동일한지를 비교하는 검정으로 검정통계량이 F분포를 따름
카이제곱분포 : 표본의 분산
모분산의 추론의 대상이 되는 경우는 모집단의 변동성 또는 퍼짐의 정도에 관심이 있을때이다.
★모집단이 정규분포를 따르지 않더라도 중심극한 정리를 통해 정규 모집단으로부터의 모분산에 대한 검정을 유사하게 시행 할 수 있다
피어슨 상관계수 : 등간척도로 측정된 두 변수간의 상관계수 확인
스피어만 상관계수 : 서열척도로 측정된 두변수간의 상관계수 확인
상관계수가 0이면 두 변량 X,Y사이에 선형관계가 없다.
R에서 상관계수를 구하기 위해서는 cor( ) 함수 또는 rcorr( )함수를 사용한다.
>rcorr( )함수를 사용하면 type인자를 통해 피어슨, 스피어만 상관계수를 선택 할 수 있다.
결정계수
종속변수에 미치는 영향이 적더라도 독립변수가 추가되면 결정계수는 변한다.
값이 클수록 실제 관찰치를 예측하는데 정확성이 높아진다.
시계열
시계열이 정상시계열인지 비정상 시계열인지 판단하기 위해 폭발적인 추세를 보익나 시간에 따라 분산이 변화하는지 관찰해야한다
데이터마이닝 모델링방법중 분류 방법으로 활용되는 R패키지
rpart , party , marginTree , tree, randomForest, MapTree, rpartOrdinal
'ADsP > 오답정리' 카테고리의 다른 글
ADsP 26회 기출 (0) | 2022.10.18 |
---|---|
ADsP 모의고사 2회 (0) | 2022.10.18 |
데이터에듀 ADsP 03.데이터분석 (0) | 2022.10.17 |
데이터 에듀 ADsP 03.데이터분석 (0) | 2022.10.17 |
데이터 에듀 ADsP 02.데이터분석기획 (1) | 2022.10.15 |