1.
- "커피를 구매하는 사람이 탄산음료를 더 많이 사는가?" → 연관분석: 변수 간의 주목할 만한 상관관계가 있는지 찾아냄
- 기계학습은 훈련 데이터로 학습 → 알려진 특성을 활용해 '예측'하는 것. (e.g. 스팸 메일 필터링, 학습 추천, 영화 추천)
2.
- "개인정보 활용에 대한 동의제를 (사용자에 대한) 책임제로 전환" → 사생활 침해에 대한 통제방안
- 책임원칙 훼손 위기는 '예측 알고리즘의 희생양'에 관한 내용 → 통제 방안은 '예측이 아닌 실제 결과에 대해 처벌하는 것'
- '책임'이라는 워딩에 속지 말 것
3.
- "다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어" → OLAP
OLAP는 Online Analytical Processing의 약어로 최종 사용자가 다차원 정보에 직접 접근하여 대화식(마치 컴퓨터와 직접 대화하는 것처럼)으로 정보를 분석하고 의사결정을 지원하는 시스템이다.
간단히 말하면, 어떠한 의사결정을 하려고 하는데 필요한 정보를 얻어 도움을 받을 수 있고 정보를 분석할 수 있는 일종의 툴이다.
출처: https://straw961030.tistory.com/122
- OLTP(On-Line Transaction Processing, 온라인 거래 처리)는 네트워크 여러 이용자가 실시간으로 DB 데이터 갱신 or 조회하는 단위 작업 처리 (e.g. 은행 입출금 처리)
4.
- 딥러닝에 활용되는 오픈소스는 Theano, TensorFlow, Keras, Torch, Caffe 등
- Anaconda는 패키지 관리와 디플로이를 단순케 할 목적의 파이썬과 R 배포판
5.
비정형 데이터 형태로 저장, 분석을 하고 언어나 문자 등으로 기술되는 데이터 유형 = 정성(적) 데이터
6.
- "빅데이터를 효율적으로 분석하고 사용하고자 다양한 영역의 Raw 데이터(가공되지 않은 데이터)를 한 곳에 모아서 저장하는 저장소" = 데이터 레이크
- 데이터 레이크에 있는 데이터는 분석을 위해 필요할 때 변환되며, 데이터가 사용 준비 상태가 될 때까지 원시 상태로 보관
- 데이터 웨어하우스는 업무 분석을 위한 데이터베이스 → 사용자들이 필요로 하는 정보 추출해서 가공
- DW(OLAP)는 의사 결정을 지원할 수 있는 분석 정보를 제공한다는 것이 DB(OLTP)와의 차이점이자 특징
- DW는 의사결정에 필요한 주제와 관련된 데이터만 유지, 데이터마트(DM)는 주로 구체적인 특정 부서나 프로젝트 등의 작은 단위의 분석을 요구할 때에 사용하는 개념
'생계 > 데이터 분석' 카테고리의 다른 글
ADsP 15회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.05 |
---|---|
ADsP 14회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.03 |
[1과목] 데이터 이해 - 기타 개념, 용어 정리 (0) | 2022.11.01 |
'[1과목] 데이터 이해 - [3장] 가치 창조를 위한 데이터 사이언스와 전략 인사이트 - [03] 빅데이터 그리고 데이터 사이언스의 미래' 정리 (0) | 2022.10.21 |
'[1과목] 데이터 이해 - [3장] 가치 창조를 위한 데이터 사이언스와 전략 인사이트 - [02] 전략 인사이트 도출을 위한 필요 역량' 정리 (0) | 2022.10.20 |
댓글