728x90
1. 데이터베이스 정의
- 데이터베이스: 동시에 복수의 적용 업무, 복수 이용자의 요구에 대응할 수 있도록 편성된 데이터의 집합
- 데이터베이스 관리시스템(DBMS): 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어
- DB와 DBMS를 함께 일컬어 '데이터베이스 시스템'이라고 칭한다.
2. 데이터베이스 특징
- 통합된 데이터(intergrated data): 동일 내용 데이터 중복 없음
- 저장된 데이터(stored data): 컴퓨터가 접근 가능한 저장매체에 저장됨
- 공용 데이터(shared data): 여러 사용자가 공동 이용할 수 있음
- 변화되는 데이터(changed data): 데이터 추가, 삭제, 갱신으로 항상 변화함
3. 데이터베이스 특성
- 정보의 축적 및 전달 측면: 기계가독성, 검색가능성, 원격조작성을 갖는다.
- 정보이용 측면: 이용자가 신속하고 경제적으로 정보를 찾아낼 수 있다.
- 정보관리 측면: 체계적으로 축적하고 갱신이 용이하다.
- 정보기술발전 측면: 정보처리, 검색, 관리 등 네트워크 발전 기술을 견인할 수 있다.
- 경제﹒산업적 측면: 인프라로서 경제, 산업, 사회 활동의 효율성을 제고한다.
4. DBMS(데이터베이스 관리시스템) 발전 과정
- 1세대
- 네트워크 DBMS, 계층 DBMS → 복잡하고 변경 어려움
- 2세대
- 관계형(Relation) DBMS → DB를 2차원 구조 테이블 형태(e.g. 엑셀)로 구성 (오라클, 액세스, MySQL)
- 3세대
- 객체지향(Objected) DBMS
- 멀티미디어 데이터 확산 → 관계형 데이터 모델 표현 어려움
- 같은 행위를 갖는 객체는 한 클래스에 속하며, 클래스 연산을 나타내기 위해 메소드 함수 정의
- 객체관계 DBMS (ORDBMS) → 기존 RDBMS에 객체 지향형 모델 장점 선별하여 RDBMS에 통합한 모델
- 객체지향(Objected) DBMS
- 4세대
- NoSQL DBMS, NewSQL DBMS → 데이터 구조를 미리 정해두지 않기 때문에 비정형 데이터 저장 및 처리
※ RDBMS vs ODBMS
구분 | RDBMS | ODBMS |
장점 | - 검증된 시스템 - 대규모 정보처리 가능 |
- 복잡한 정보 구조의 모델링 가능 |
단점 | - 제한된 형태의 정보만 처리 가능 - 복잡한 정보 구조의 모델링 어려움 |
- 사용자 정의 타입 및 비정형 복합 정보 타입 지원 가능 |
※ 데이터 유형 분류
데이터 유형 | 특징 | 데이터 종류 |
정형 데이터 | - RDBMS의 고정된 필드에 저장 - 데이터 스키마 지원 |
- RDB - 스프레드시트 |
반정형 데이터 | - 데이터 속성인 메타데이터를 가지며, 일반적으로 스토리지에 저장되는 데이터 파일 | - HTML - JSON - 웹 문서 |
비정형 데이터 | - 형태나 구조가 복잡한 이미지, 동영상 같은 멀티미디어 데이터 | - 소셜 데이터 - 문서 이미지 - 오디오, 비디오 |
※ 스키마와 인스턴스
- 스키마(schema): DB의 구조와 제약 조건을 기술
상품 아이디 | 카테고리 | 상품명 | 상품가격 | 상품재고 |
문자형 | 숫자형 | 문자형 | 숫자형 | 숫자형 |
- 인스턴스(instance): 특정 시점의 DB 내용
5. 데이터베이스 설계 절차
- 요구조건 분석 / 명세서 작성
- 개념적 설계: E-R 다이어그램 작성 → 정보를 구조화하여 추상적 개념으로 표현
*ER 다이어그램(Entity-Relation Diagram): 데이터들의 관계를 나타낸 도표 (참조) - 논리적 설계: 테이블 설계
- 물리적 설계: 데이터 구조화 → 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환
6. 데이터웨어하우스(Data Warehouse, DW)
- 정의
- 업무 분석을 위한 데이터베이스 → 사용자들이 필요로 하는 정보 추출해서 가공
- 데이터베이스 관련자들이 데이터 저장은 잘 하지만 활용은 미진하므로 저장된 데이터를 보다 효율적으로 활용하기 위한 의도
- DB와 DW 비교 (→ 2개의 상호간 특징 구분이 포인트)
- 데이터베이스
- OLTP(On-Line Transaction Processing) 데이터를 저장하는 자료저장소
- OLTP: 네트워크 여러 이용자가 실시간으로 DB 데이터 갱신 or 조회하는 단위 작업 처리 (e.g. 은행 입출금 처리)
- 데이터웨어하우스
- OLAP(On-Line Analytical Processing) 데이터를 저장하는 자료저장소
- OLAP: 정보 위주의 처리 분석, 의사 결정에 활용할 수 있는 정보 제공 (e.g. 판매 추이, 구매성향 파악, 재무회계 분석)
- DW는 의사 결정을 지원할 수 있는 분석 정보를 제공한다는 것이 DB와의 차이점이자 특징
- 데이터베이스
- DW 특징
- 데이터의 주제지향성: 의사결정에 필요한 주제와 관련된 데이터만 유지
- 데이터의 통합성: 여러 DB에서 추출한 데이터를 통합하여 저장 → 데이터의 일관된 상태 유지
- 데이터의 시계열성: 과거와 현재의 데이터 동시에 유지 → 데이터 간 시간적 관계나 동향 분석하여 의사결정에 반영할 수 있도록 함 → 시간에 따른 변경을 항상 반영하고 있어야 함
- 데이터의 비휘발성: 삽입, 삭제, 수정 작업이 일어나는 DB와 달리 DW는 검색 작업만 가능한 읽기 전용의 데이터 유지
- 데이터마트(DM)
- Data Warehouse와 유사한 개념이지만 그보다는 작은 하위 집합으로 주로 구체적인 특정 부서나 프로젝트 등의 작은 단위의 분석을 요구할 때에 사용하는 개념 → DW의 완전한 논리 하위 집합
7. 데이터베이스 언어 SQL
- SQL(Structure Query Language)은 관계 데이터베이스를 위한 표준 질의어로 많이 사용하는 언어
- SQL은 기능에 따라 3가지로 나눈다.
- 데이터 정의어(DDL, Data Definition Language): 테이블을 생성, 변경, 제거하는 기능 제공
- 데이터 조작어(DML, Data Manipulation Language): 데이터를 검색, 삽입, 수정, 삭제하는 기능 제공
- 데이터 제어어(DCL, Data Control Language): 보안을 위해 데이터 접근 및 사용권한을 사용자별로 부여하거나 취소하는 기능 제공
출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기'
728x90
'생계 > 데이터 분석' 카테고리의 다른 글
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [03] 비즈니스 모델' 정리 (0) | 2022.10.14 |
---|---|
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [02] 빅데이터의 가치와 영향' 정리 (0) | 2022.10.13 |
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [01] 빅데이터의 이해' 정리 (0) | 2022.10.13 |
'[1과목] 데이터 이해 - [1장] 데이터의 이해 - [03] 데이터베이스 활용' 정리 (0) | 2022.10.07 |
'[1과목] 데이터 이해 - [1장] 데이터의 이해 - [01] 데이터와 정보' 정리 (0) | 2022.10.06 |
댓글