59doit
ADsP 31회 기출 본문
11. 현재의 비즈니스 모델 및 유사/동종사례 탐색을 통해서 빠짐없이 도출한 분석 기회들을 구체적인 과제로 만들기 전에 ( )로 표기하는 것이 필요하다. 풀어야 할 문제에 대한 상세설명 및 해당 문제 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 ( )를 활용하도록 한다
>> 분석 유즈 케이스
22. 비계층적 군집방법의 기법인 K-means clustering의 경우 이상값에 민감하여 군집 경계의 설정이 어렵다는 단점이 존재한다. 이러한 단점을 극복하기 위해 등장한 비계층적 군집방법은?
>> K-medoids Clustering
24. 일반적으로 학습모형의 유연성이 클수록 분산은 ( ), 평향은 ( ).
>> 높고, 낮다
33. 노드의 연결정도 중심성은?
연결정도는 해당 노드에 직접 연결되어 있는 노드 또는 링크의 수
37. 아래의 데이터 마이닝 분석예제 중 비지도 학습을 수행해야 하는 예제는?
가)우편물에 인쇄된 우편번호 판별 분석을 통해 우편물을 자동으로 분류
나)고객의 과거 거래 구매 패턴을 분석하여 고객이 구매하지 않은 상품을 추천
다)동일 차종의 수리 보고서 데이터를 분석하여 차량 수리에 소요되는 시간 예측
라)상품을 구매할 때 그와 유사한 상품을 구매한 고객들의 구매 데이터 분석하여 쿠폰발행
마)고장난 비행기들의 수리 이력 데이터를 분석하여 수리시간 추정
지도 : 가(인쇄된,),다(보고서),마(수리이력데이터)
비지도 : 나,라
**
지도 : 문제 정답을 알려주고 인공지능 학습시키기
비지도 : 답을알려주지 않고 인공지는 학습시키기,원하지 않은 값이 나올수있음
**
26.
X-> >> Estimate 값인 회귀계수는 intercept의 회귀계수와의 차이를 의미한다.
O-> 더미변수는 intercept 의 독립변수명의 뒤에 숫자 붇은거 보면 확인할수있음
O-> ★★★★ y절편 :
O-> p-value 보면 회귀식의 통계적 유의미함 볼수있음
주관식
2. 조직 내 구성원들이 축적하고 있는 노하우 등 암묵적 지식을 형식지로 표출화 될 수 있도록 지원하는 등, 조직의 경쟁력 향상을 위해 지식자원을 체계화하고 원활하게 공유가 될 수 있도록 지원하는 시스템
>> KMS(지식경영시스템)
4. 데이터 분석 도입의 수준을 파악하기 위한 분석 준비도의 6가지 구성요소 중 하나로써 운영시스템 데이터 통합, 빅데이터 분석환경, 통계분석환경 등을 진단하는 구성요소는 무엇인가?
>> IT인프라
5. 베이즈 정리와 특징에 대한 조건부 독립을 가설로 하는 알고리즈믕로 클래스에 대한 사전정보와 데이터로부터 추출된 정보를 결합하고 베이즈 정리를 이용하여 특정 데이터가 특정 클래스에 속하는지를 분류하는 알고리즘
>> 나이브 베이즈 분류
7. 텍스트 마이닝에서 어근에 차이가 있더라도 관련이 있는 단어들을 동일한 어간으로 매핑이 될 수 있도록 정해진 규칙에 따라 단어에서 어간을 분리하여 공통 어간을 가지는 단어를 묶는 작업
>> 스테밍
328
차분:평균이 일정하지 않은 시계열은 차분을 통해 정상화함
분산:분산이 일정하지 않은 경우 변환을 통해 정상화
정상성 : 평균일정(시점의존x), 분산일정(시점의존x), 공분산(시차의존, 시점(t,s)의존NO)
차분 : 자료가 추세를 보이는 경우에는 현 시점의 자료값에서 전 시점의 자료를 빼는 방법을 통해 비정상시계열을 정상시계열로 바꾸어 주는 방법
사물인터넷 - 데이터화
데이터베이스의 특징
데이터의 무결성 유지, 프로그래밍 생산성향상, 데이터의 중복성 최소화
**종속성과 중복성은 배제한다. >> 데이터 종속성이란 응용프로그램별로 데이터를 별도 관리한다.
SCM(공급망관리) : 원자재 조달에서 마지막 단계인 제품 배송에 이르기까지 제품 또는 서비스와 관련된 상품, 데이터 및 재정의 흐름을 관리
ERP(전사적 자원관리) : 조직이 회계, 조달, 프로젝트 관리, 리스크 관리와 규정 준수, 공급망 운영 등 일상적인 비즈니스 활동을 관리하는 데 사용하는 소프트웨어 유형을 의미
KMS(키관리서비스) : 호스트 서버에서 Windows Server 및 기타 Windows 제품의 설정 및 정품 인증에 필요한 제품 키를 가져옴
KMS(지식 관리 시스템) : 지식을 체계화하여 비즈니스와 사용자에게 즉시 사용 가능한 솔루션을 공유함으로써 기업 경쟁력을 향상하기 위한 기업 정보 시스템
ERD는 운영중인 데이터베이스와 일치하기 위하여 철저한 변경관리가 필요하다.
ERP : 기업내부 데이터 베이스 중 기업 전체가 경영자원을 효과적으로 이용하기 위해 통합적으로 관리하고 경영의 효율화를 기하기 위한 수단으로 정보의 통합을 위해 기업의 모든 자원을 최적으로 관리하기 위한 기업 경영 정보시스템
집중형 : 조직내 별도의 분석 전담조직을 독립적으로 구정 > 분석업무 중복 또는 이원화
기능형 : 분석전담조직 구성 X, 해당부서에서 직접 분석 수행 > 과거실적에 국한된 분석 수행 가능성이높음
분산형 : 분석 조직의 입력을 현업부서에 배치하여 분석업무를 수행 > 업무과다 이원화
분석조직은 분석 전문인력뿐만 아니라 도메인 전문가 IT인력, 변화관리 및 교육담당 인력으로 구성되어야 효율적인 운영이 가능하다
★프로토타이핑 방법론의 기본적인 프로세스
가설생성, 디자인에 대한 실험, 실제환경 테스트 결과에서 통찰 도출 및 가설확인
프로토타이핑: 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해 보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법
완전하지 못하다 해도 신속하게 해결책이나 모형을 제시함으러써, 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화 할수 있음 > 상향식 접근방식
나선형방법 : 반복적으로 위험분석을 수행하여 위험을 관리하며 순환적으로 개선
층화추출법 : 기준에 따라 서로 상이한 소집단으로 나누고 각각의 소집단으로부터 일정한 표본을 무작위로 추출하는 표본추출방법
vs
계통추출법 : 단순랜덤추출법의 변형된 방식으로 번호를 부여한 샘플을 나열하여 K개씩 (K=N/n)n개의 구간으로 나누고 첫 구간(1,2,...,K)에서 하나를 임의로 선택한 후 K개씩 띄어서 n개의 표본을 선택한다. = 임의의 위치에서 K번째 항목을 추출하는 방법
다중공선성
: 문제 해결하기 위해 중요하지 않으면서 다른 변수와 상관성이 높은 변수를 제거
★표본수가 증가해도 VIF에서 일반 결정계수는 크게 변하지 않는다
구조적 다중공선성의 문제가 있는 경우에는 데이터의 평균 중심을 변화한다
VIF (분산팽창요인) : 결정계수에 영향받음, 독립변수가 종속변수를 얼마나 잘 설명하는가를 보여줌>> 회귀식의 기울기와는 상관없음
'ADsP > 오답정리' 카테고리의 다른 글
ADsP 33회 기출 (0) | 2022.10.21 |
---|---|
ADsP 32회 기출 (0) | 2022.10.21 |
ADsP 30회 기출 (0) | 2022.10.19 |
ADsP 29회 기출 (0) | 2022.10.19 |
ADsP 28회 기출 (0) | 2022.10.19 |