본문 바로가기
생계/데이터 분석

'[1과목] 데이터 이해 - [1장] 데이터의 이해 - [02] 데이터베이스 정의와 특징' 정리

by Rihan 2022. 10. 6.
728x90

1. 데이터베이스 정의

  • 데이터베이스: 동시에 복수의 적용 업무, 복수 이용자의 요구에 대응할 수 있도록 편성된 데이터의 집합
  • 데이터베이스 관리시스템(DBMS): 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어
  • DB와 DBMS를 함께 일컬어 '데이터베이스 시스템'이라고 칭한다.

 

2. 데이터베이스 특징

  1. 통합된 데이터(intergrated data): 동일 내용 데이터 중복 없음
  2. 저장된 데이터(stored data): 컴퓨터가 접근 가능한 저장매체에 저장됨
  3. 공용 데이터(shared data): 여러 사용자가 공동 이용할 수 있음
  4. 변화되는 데이터(changed data): 데이터 추가, 삭제, 갱신으로 항상 변화함

 

3. 데이터베이스 특성

  1. 정보의 축적 및 전달 측면: 기계가독성, 검색가능성, 원격조작성을 갖는다.
  2. 정보이용 측면: 이용자가 신속하고 경제적으로 정보를 찾아낼 수 있다.
  3. 정보관리 측면: 체계적으로 축적하고 갱신이 용이하다.
  4. 정보기술발전 측면: 정보처리, 검색, 관리 등 네트워크 발전 기술을 견인할 수 있다.
  5. 경제﹒산업적 측면: 인프라로서 경제, 산업, 사회 활동의 효율성을 제고한다.

 

4. DBMS(데이터베이스 관리시스템) 발전 과정

  1. 1세대
    • 네트워크 DBMS, 계층 DBMS → 복잡하고 변경 어려움
  2. 2세대
    • 관계형(Relation) DBMS → DB를 2차원 구조 테이블 형태(e.g. 엑셀)로 구성 (오라클, 액세스, MySQL)
  3. 3세대
    • 객체지향(Objected) DBMS
      • 멀티미디어 데이터 확산 → 관계형 데이터 모델 표현 어려움
      • 같은 행위를 갖는 객체는 한 클래스에 속하며, 클래스 연산을 나타내기 위해 메소드 함수 정의
    • 객체관계 DBMS (ORDBMS) → 기존 RDBMS에 객체 지향형 모델 장점 선별하여 RDBMS에 통합한 모델
  4. 4세대
    • NoSQL DBMS, NewSQL DBMS → 데이터 구조를 미리 정해두지 않기 때문에 비정형 데이터 저장 및 처리

※ RDBMS vs ODBMS

구분 RDBMS ODBMS
장점 - 검증된 시스템
- 대규모 정보처리 가능
- 복잡한 정보 구조의 모델링 가능
단점 - 제한된 형태의 정보만 처리 가능
- 복잡한 정보 구조의 모델링 어려움
- 사용자 정의 타입 및 비정형 복합 정보 타입 지원 가능

※ 데이터 유형 분류

데이터 유형 특징 데이터 종류
정형 데이터 - RDBMS의 고정된 필드에 저장
- 데이터 스키마 지원
- RDB
- 스프레드시트
반정형 데이터 - 데이터 속성인 메타데이터를 가지며, 일반적으로 스토리지에 저장되는 데이터 파일 - HTML
- JSON
- 웹 문서
비정형 데이터 - 형태나 구조가 복잡한 이미지, 동영상 같은 멀티미디어 데이터 - 소셜 데이터
- 문서 이미지
- 오디오, 비디오

※ 스키마와 인스턴스

  • 스키마(schema): DB의 구조와 제약 조건을 기술
상품 아이디 카테고리 상품명 상품가격 상품재고
문자형 숫자형 문자형 숫자형 숫자형
  • 인스턴스(instance): 특정 시점의 DB 내용

 

 

5. 데이터베이스 설계 절차

  1. 요구조건 분석 / 명세서 작성
  2. 개념적 설계: E-R 다이어그램 작성 → 정보를 구조화하여 추상적 개념으로 표현
    *ER 다이어그램(Entity-Relation Diagram): 데이터들의 관계를 나타낸 도표 (참조)
  3. 논리적 설계: 테이블 설계
  4. 물리적 설계: 데이터 구조화 → 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환

 

6. 데이터웨어하우스(Data Warehouse, DW)

  1. 정의
    • 업무 분석을 위한 데이터베이스 → 사용자들이 필요로 하는 정보 추출해서 가공
    • 데이터베이스 관련자들이 데이터 저장은 잘 하지만 활용은 미진하므로 저장된 데이터를 보다 효율적으로 활용하기 위한 의도
  2. DB와 DW 비교 (→ 2개의 상호간 특징 구분이 포인트)
    • 데이터베이스
      • OLTP(On-Line Transaction Processing) 데이터를 저장하는 자료저장소
      • OLTP: 네트워크 여러 이용자가 실시간으로 DB 데이터 갱신 or 조회하는 단위 작업 처리 (e.g. 은행 입출금 처리)
    • 데이터웨어하우스
      • OLAP(On-Line Analytical Processing) 데이터를 저장하는 자료저장소
      • OLAP: 정보 위주의 처리 분석, 의사 결정에 활용할 수 있는 정보 제공 (e.g. 판매 추이, 구매성향 파악, 재무회계 분석)
    • DW는 의사 결정을 지원할 수 있는 분석 정보를 제공한다는 것이 DB와의 차이점이자 특징
  3. DW 특징
    1. 데이터의 주제지향성: 의사결정에 필요한 주제와 관련된 데이터만 유지
    2. 데이터의 통합성: 여러 DB에서 추출한 데이터를 통합하여 저장 → 데이터의 일관된 상태 유지
    3. 데이터의 시계열성: 과거와 현재의 데이터 동시에 유지 → 데이터 간 시간적 관계나 동향 분석하여 의사결정에 반영할 수 있도록 함 → 시간에 따른 변경을 항상 반영하고 있어야 함
    4. 데이터의 비휘발성: 삽입, 삭제, 수정 작업이 일어나는 DB와 달리 DW는 검색 작업만 가능한 읽기 전용의 데이터 유지
  4. 데이터마트(DM)
    1. Data Warehouse와 유사한 개념이지만 그보다는 작은 하위 집합으로 주로 구체적인 특정 부서나 프로젝트 등의 작은 단위의 분석을 요구할 때에 사용하는 개념 → DW의 완전한 논리 하위 집합

 

7. 데이터베이스 언어 SQL

  1. SQL(Structure Query Language)은 관계 데이터베이스를 위한 표준 질의어로 많이 사용하는 언어
  2. SQL은 기능에 따라 3가지로 나눈다.
    1. 데이터 정의어(DDL, Data Definition Language): 테이블을 생성, 변경, 제거하는 기능 제공
    2. 데이터 조작어(DML, Data Manipulation Language): 데이터를 검색, 삽입, 수정, 삭제하는 기능 제공
    3. 데이터 제어어(DCL, Data Control Language): 보안을 위해 데이터 접근 및 사용권한을 사용자별로 부여하거나 취소하는 기능 제공

 

 

 

출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기'

728x90

댓글