728x90
1.
- "데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터" = 메타 데이터
데이터 사전(Data Dictionary)이란?
- 데이터 사전은 데이터베이스에 저장되어 있는 모든 데이터 개체들의 정보를 유지, 관리하는 시스템으로, 시스템 카달로그라고도 한다.
- 데이터 사전에는 '데이터에 관한 데이터(Data About Data)'가 저장되어 있다고 하여 데이터 사전을 메타 데이터라고도 한다.
메타 데이터(metadata)란?
- 데이터(data)에 관한 데이터이다.
- 어떤 목적을 가지고 만들어진 데이터 (Constructed data with a purpose)
- 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터이다.
- 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다.
- 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다.
출처: https://www.guriland.com/100
2.
"암묵지와 형식지의 상호 작용" = SECI 모델, 지식 나선활동(Creative Route)
1. 공통화(Socialization): 암묵지를 다른 사람에게 알려줌
2. 표출화(Externalization): 암묵지를 책, 교본 형식으로 전환
3. 연결화(Combination): 책, 교본에 내가 알고 있는 새로운 지식 추가
4. 내면화(Internalization): 만들어진 형식지를 학습하여 개인 암묵지로 흡수
출처: https://rihankim.tistory.com/10
3.
- OLAP = "다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어"
- BI(Business Intelligence) = "데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구"
- BA(Business Analytics) = "경영 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법"
BI(Business Intelligence)
- 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
- 기업 DW에 저장된 데이터 접근 → 경영 의사결정에 필요한 정보 획득 및 활용
BA(Business Analytics)
- 데이터를 분석해 미래를 예측하는 예측 분석, 특정 접근법을 적용했을 때 발생할 수 있는 일을 내다보는 처방적 분석 가능
- 고급 분석이라고도 불림 → 의사결정을 위한 통계적이고 수학적인 분석에 초점
출처: https://rihankim.tistory.com/13
- 데이터마이닝 = "대용량 데이터로부터 의미 있는 관계, 규칙, 패턴을 찾는 과정"
1. 데이터 사이언스 의미와 역할
- 데이터 사이언스는 데이터로부터 의미 있는 정보를 추출하는 학문
- 통계학이 정형화된 실험 데이터를 분석 대상으로 하는 것과 달리, 데이터 사이언스는 정형과 비정형을 막론하고 다양한 매체에서 생성되는 숫자, 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 총체적 접근법 사용
- 데이터 마이닝은 주로 분석에 초점을 두나, 데이터 사이언스는 분석 뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 모두 포괄 → 전략적 통찰 추구, 비즈니스 핵심 이슈 해결, 사업 성과 견인 역할
- 데이터 사이언스는 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문 지식을 종합한 학문
출처: https://rihankim.tistory.com/32
- 딥러닝 = 여러 층을 가진 인공신경망(Artificial Neural Network) 사용 → 머신러닝 학습 수행
딥 러닝(Deep Learning)
- 여러 층을 가진 인공신경망(Artificial Neural Network) 사용 → 머신러닝 학습 수행
- 대표적 분석 방법으로 LSTM, Autoencoder, RNN 등이 있음
출처: https://rihankim.tistory.com/65
4.
"SQL의 SELECT 절에서만 사용 가능한 집계함수로 어떠한 데이터 타입에도 사용이 가능한 것은?" = COUNT
집계함수는 SELECT 절에서만 사용 가능
- COUNT( ): 전체 개수 집계(수치형, 문자형 가능)
- MAX( ): 최대값 반환(수치형 가능)
- MIN( ): 최소값 반환(수치형 가능)
- SUM( ): 합계 반환(수치형 가능)
- AVG( ): 평균값 반환(수치형 가능)
- VARIANCE( ): 분산 반환(수치형 가능)
- STDDEV( ): 표준편차 반환(수치형 가능)
출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기', 에이아이에듀(2022)
5.
SELECT * FROM My_Table WHERE AGE ( ) 20 AND 24 → 빈 칸에 알맞은 구문 BETWEEN
SQL ~어디서부터 ~어디까지의 데이터를 출력하는 형식
SELECT * FROM [테이블명] WHERE [컬럼명] BETWEEN [조건1] AND [조건2]
출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기', 에이아이에듀(2022)
6.
- "데이터 속에 숨겨진 가치를 발견하고 새로운 발전기회를 만들어 내기 위한 능력" = 소프트 스킬
Soft Skill (대인 관계 기술과 연관이 깊은 정량화하기 어려운, 주관적인 스킬)
- 통찰력 있는 분석: 창의적 사고, 호기심(문제의 이면 파악, 질문 수립, 검증 가능한 가설 수립), 논리적 비판
- 설득력 있는 전달: 스토리텔링, Visualization
- 다분야 간 협력: 커뮤니케이션
출처: https://rihankim.tistory.com/32
728x90
'생계 > 데이터 분석' 카테고리의 다른 글
ADsP 17회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.06 |
---|---|
ADsP 16회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.05 |
ADsP 14회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.03 |
ADsP 13회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.02 |
[1과목] 데이터 이해 - 기타 개념, 용어 정리 (0) | 2022.11.01 |
댓글