728x90
1.
- '총계처리'는 데이터 총합 값을 보여준다는 뜻
- '가명처리' 과정에 범주화도 포함될 수 있음(e.g. 35세 → 30대)
- 마찬가지로 '데이터 삭제'에도 범주화 개념 들어가기도 함(e.g. 주민등록번호 → 90년대생)
개인정보 비식별 기술
1.가명처리
- 주요 식별요소를 다른 값으로 대체 → 개인 식별 곤란하게
- e.g. 홍길동, 35세, 서울 거주, 한국대 재학→ 임꺽정. 30대, 서울 거주, 국제대 재학
2. 총계처리 or 평균값 대체
- 데이터 총합 값을 보임으로써 개별 데이터 값을 보이지 않도록
- e.g. A 180cm, B 170cm, C 160cm, D 150cm→ 물리학과 학생 키 합 660cm, 평균 키 165cm
3. 데이터 값 삭제
- 데이터셋에 구성된 값 중 필요 없는 값 또는 개인식별에 중요한 값 삭제
- e.g. 홍길동, 35세, 서울 거주, 한국대 졸업 → 35세, 서울 거주
- e.g. 주민등록번호 901206-1234567 → 90년대생, 남자
4. 범주화
- 데이터 값을 범주 값으로 변환하여 명확한 값 감춤
- e.g. 홍길동, 35세 → 홍씨, 30-40세
5. 데이터 마스킹
- 주요 개인식별자가 보이지 않도록 처리하여 개인 식별 못하도록
- e.g. 홍**, 35세, 서울 거주, **대학 재학
출처: https://rihankim.tistory.com/24
2.
개인 신용도 평가에 가장 많이 활용되는 빅데이터 기술은 '머신러닝' (회귀 또는 로지스틱 회귀)
3.
"공동 활용의 목적으로 구축된 유무형의 구조물" = '플랫폼'
728x90
'생계 > 데이터 분석' 카테고리의 다른 글
ADsP 25회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.12 |
---|---|
ADsP 23회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.11 |
ADsP 22회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.11 |
ADsP 21회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.08 |
ADsP 20회 기출문제 - [1과목] 체크 포인트 (0) | 2022.11.06 |
댓글