본문 바로가기
생계/데이터 분석

ADsP 26회 기출문제 - [1과목] 체크 포인트

by Rihan 2022. 11. 12.
728x90

1.

- '총계처리'는 데이터 총합 값을 보여준다는 뜻

- '가명처리' 과정에 범주화도 포함될 수 있음(e.g. 35세 → 30대)

- 마찬가지로 '데이터 삭제'에도 범주화 개념 들어가기도 함(e.g. 주민등록번호 → 90년대생)

개인정보 비식별 기술

1.가명처리
- 주요 식별요소를 다른 값으로 대체 → 개인 식별 곤란하게
- e.g. 홍길동, 35세, 서울 거주, 한국대 재학→ 임꺽정. 30대, 서울 거주, 국제대 재학

2. 총계처리 or 평균값 대체
- 데이터 총합 값을 보임으로써 개별 데이터 값을 보이지 않도록
- e.g. A 180cm, B 170cm, C 160cm, D 150cm→ 물리학과 학생 키 합 660cm, 평균 키 165cm

3. 데이터 값 삭제
- 데이터셋에 구성된 값 중 필요 없는 값 또는 개인식별에 중요한 값 삭제
- e.g. 홍길동, 35세, 서울 거주, 한국대 졸업 → 35세, 서울 거주
- e.g. 주민등록번호 901206-1234567 → 90년대생, 남자

4. 범주화
- 데이터 값을 범주 값으로 변환하여 명확한 값 감춤
- e.g. 홍길동, 35세 → 홍씨, 30-40세

5. 데이터 마스킹
- 주요 개인식별자가 보이지 않도록 처리하여 개인 식별 못하도록
- e.g. 홍**, 35세, 서울 거주, **대학 재학

출처: https://rihankim.tistory.com/24

 

2.

개인 신용도 평가에 가장 많이 활용되는 빅데이터 기술은 '머신러닝' (회귀 또는 로지스틱 회귀)

 

 

3.

"공동 활용의 목적으로 구축된 유무형의 구조물" = '플랫폼'

728x90

댓글