데이터 에듀 ADsP 01.데이터의 이해
06. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공,분석 하는 과정은?
정답 : ③ 표출화
①연결화 : 형식지) 언어 기호 숫자로 표출화된 지식을 개인의 지식으로 연결화
②내면화 : 암묵지) 개인에게 축적된 내면화된 지식
④공통화 : 암묵지) 내면화된 지식을 조직의 지식으로 공통화
09. 다음 중 글로벌 기업의 빅데이터 활용 사례로 그 연결이 부적절한 것은?
② 라쿠텐 : 이용자의 콘텐츠 기호를 파악하여 새로운 영화를 추천해주는 Cinematch 시스템 운영
>> Cinematch 시스템은 넷플릭스에서 개발한 영화 추천 알고리즘이다
① 구글 - 실시간 자동 번역 시스템을 통한 의사소통의 불편해소
③ 월마트 - 소셜 미디어를 통해 고객 소비 패턴을 분석하는 월마트랩 운영
④ 자라 - 일일 판매량을 실시간 데이터 분석으로 상품 수요를 예측
11. 데이터 웨어하우스는 기업 내의 의사결정지원 어플리케이션에 정보 기반을 제공하는 하나의 통합된 데이터 저장 공간을 말한다. 데이터 웨어하우스의 고유한 특성이 아닌것은?
① 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요하다.
② 데이터들은 전사적 차원에서 일관된 형식으로 정의된다 -> 통합
③ 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다 -> 시계열
④ 특정 주제에 따라 데이터들이 분류, 저장, 관리된다 -> 주제지향성
>> 데이터의 주제지향성, 데이터통합, 데이터의 시계열성, 데이터의 비휘발성 특성을 갖는다
12. 주요 데이터 분석 기술에 대한 설명으로 부적절한것은?
④ deep learning - 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술
>> 딥러닝은 다층 구조 형태의 신경망을 바탕으로 하는 머신러닝의 한 분야이다
대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술은 데이터 마이닝 이다.
① OLAP - 다차원의 데이터를 대화식으로 분석하기 위한 기술
② Business Inteligence - 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
③ Business Analytics - 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법
13. 특정산업의 일차원적 분석사례를 나열한 것, 특정산업으로 적절한 것은?
에너지
14. 기업내부 데이터 베이스인 고객관리에 대한 설명으로 적절한 것은?
④ 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향
23. 빅데이터가 만들어 내는 변화와 가장 거리가 먼 것은?
③데이터 양이 증가하고 유형이 복잡해짐에 따라 수많은 데이터 중에서 분석에 필요한 데이터를 선정하기 위해 정교한 표본조사 기번의 중요성이 대두되고있다.
>> 데이터 수집비용의 감소와 클라우드 컴퓨팅 기술의 발전으로 데이터 처리비용이 감소하게 되었다. 이로인해 표본을 조사하는 기존의 지식발견 방식에서 전수조사를 통해 샘플링이 주지 못하는 패턴이나 정보를 발견하는 방식으로 데이터 활용방법이 변화되었다.
①가치가 있을 것이라고 예상되는 특정한 정보만 모아서 처리하는 것이 아니라 가증한 한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아내는 방식이 중요해진다
②데이터의 규모가 증가함에 따라 사소한 몇 개의 오류 데이터는 분석 결과에 영향을 미치지 않기 때문에 데이터세트에 포함하여 분석해도 상관없는 경우가 많아진다
④인과관계의 규명 없이 상관관계 분석 결과만으로도 인사이트를 얻고 이를 바탕으로 수익을 창출할 수 있는 기회가 점차 늘어나고 있다
25. 데이터의 가치 측정이 어려운 이유로 적절하지 않은 것은?
② 빅데이터 전문 인력의 증가로 다양한 곳에서 빅데이터가 활용되고 있기 때문
>> x
①데이터 재사용의 일반화로 특정 데이터를 언제 누가 사용했는지 알기 힘들기 때문
③분석기술의 발전으로 과거에 분석이 불가능 햇던 데이터를 분석할 수 있게 되었기 때문
④빅데이터는 기존에 존재하지 않던 새로운 가치를 창출하기 때문
**
데이터활용방식 : 재사용, 재조합, 다목적용 개발①
새로운 가치창출④
분석기술발전③
**
26. 사생활 침해를 막기 위해 개인정보를 무작위 처리하는 등 데이터가 본래 목적 외에 가공되고 처리되는 것을 방지하는 기술은?
난수화
30. 핀테크 분야에서 빅데이터 활용이 가장 핵심적인 분야인 것은?
신용평가
>> 간편결제, 블록체인 아님
32. 딥러닝을 활용하기 위해 다양한 오픈소스가 개발되어 제공되고 있다. 관련이 없는것은?
③Anaconda
>> 파이썬 프로그램의 머신러닝 기능을 강화해주는 소프트웨어다
①Caffe
②Tensorflow
④Theano
>> 딥러닝의 소프트웨어
36. 데이터화(datafication) 현상에 큰 영향을 미치는 기술로 적절한 것은?
사물인터넷(Internet of Things)
38. 데이터 사이언스는 데이터 처리와 관련된 IT영역, 분석적 영역, 비즈니스 컨설팅 영역을 포괄하고 있다. 다음중 다른영역에 속하는 하나는?
① 데이터 시각화
>> 비즈니스 컨설팅 영역
② 데이터 웨어하우징
③ 분산 컴퓨팅
④ 파이썬 프로그래밍
>> 데이터 처리 관련된 IT 영역
41. 데이터 사이언스에 대한 설명으로 가장 부적절한것은?
② 주로 분석의 정확성에 초점을 두고 진행한다.
>> 통찰력 있는 분석에 초점을 둔다
① 데이터로부터 의미있는 정보를 추출하는 학문이다
③ 정형데이터 뿐만 아니라 다양한 데이터 대상으로 한다.
④ 기존의 통계학과는 달리 총체적 접근법을 사용한다
44. ( ) 는 데이터 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 것이며 지식을 도축하기 위한 재료가 된다
정보
45. 기업의 의사결정 과정을 지원하기 위한 주제중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합
데이터훼어하우스
46. 별도로 정제하지 않은 자연스로운 상태의 아주 큰 데이터 세트인 ( )을/를 기업들이 구현하는 것
데이터레이크
47. ( ) 데이터는 지역별 매출액, 영업이익률, 판매량과 같이 수치로 명확하게 표현되는 데이터로, 양이 크게 증가하더라도 DBMS에 저장,검색,분석하여 활용하기가 용이하다.
정량적데이터
<-> 사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터 베이스 관리 시스템 : 객체지향 DBMS
49.
플랫폼