본문 바로가기
생계/데이터 분석

'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [04] 위기 요인과 통제 방안' 정리

by Rihan 2022. 10. 17.
728x90
중요 사항
1) 빅데이터 시대 위기 요인과 통제 방안
2) 개인정보 비식별 기술

 

1. 위기 요인 및 통제 방안

  1. 사생활 침해
    • 위기 요인: 주변 정보 수집 센서 수 증가, 특정 데이터가 본래 목적 외 가공 처리되어 2~3차 목적으로 활용될 가능성 → 사생활 침해 및 사회, 경제적 위협
    • 통제 방안: 사생활 침해 문제를 개인정보 제공자의 동의를 통해 해결하기 보다, 개인정보 사용자에게 책임을 지움으로써 개인정보 사용 주체가 보다 적극적인 보호 장치를 강구하게 하는 효과
  2. 책임 원칙의 훼손
    • 위기 요인: 빅데이터 분석의 정확도가 증가한만큼 분석 대상이 되는 사람들이 예측 알고리즘의 희생양이 될 가능성 (e.g. 영화 마이너리티 리포트의 범죄 예측 프로그램)
    • 통제 방안: 기존의 책임 원칙 보강 및 강화 → 예측이 아닌 실제 결과에 대해 처벌
  3. 데이터의 오용
    • 위기 요인: 빅데이터는 과거 데이터에 의존 → 미래 예측이 틀릴 수 있음 → 데이터에 대한 잘못된 인사이트로 인해 비즈니스에 직접 손실 유발 가능성
    • 통제 방안: 알고리즘에 대한 접근권 보장, 객관적인 인증 방안 도입 의견, 알고리즘의 부당함 반증 방법 명시 공개 요구

 

2. 데이터 3법 주요 개정 내용

  1. 데이터 3법: 개인정보보호법, 정보통신망법, 신용정보법
  2. 마이데이터 산업
    • 금융위원회 허가 → 개인의 동의 하에 타 기업에 저장된 개인정보 활용 가능
    • 개인은 통합 데이터를 이용한 맞춤형 금융서비스 제공받고, 기업은 새로운 비즈니스 모델 실행 가능
  3. 달라진 개인정보 보호법 (2020년 8월 5일 시행)
    1. 개인정보 판단 기준 명확화: '살아있는 개인에 관한 정보' 외 '개인정보를 가명처리한 정보'는 통계 작성, 과학적 연구, 공익적 기록 보존 등의 목적으로 동의 없이 처리 가능
    2. 수집목적과 합리적 관련 범위 내에서 활용 확대: 당초 수집 목적과 합리적으로 관련된 범위 내에서 정보주체의 동의 없이 개인정보 이용, 제공 가능 (정보주체에게 불이익이 발생하는지 여부, 암호화 등 안전성 확보 조치 여부 등 고려사항)
    3. 개인정보보호 추진 체계 효율화: 분야별 감독기구가 상이 → 개인정보보호 위원회로 감독기구 일원화
    4. 개인정보처리자 책임 강화: 가명처리 및 결합 시 안전성 확보에 필요한 기술적, 관리적 및 물리적 조치 의무, 재식별 금지 의무, 위반시 벌칙 조항 신설

 

3. 개인정보 처리단계별 보호

  1. 개인정보
    • 살아있는 개인에 관한 정보
    • 성명, 주민등록번호 및 영상을 통하여 개인을 알아볼 수 있는 정보
  2. 개인정보의 수집﹒이용
    • 개인정보수집: 정보주체로부터 직접 이름, 주소, 전화번호 등의 모든 형태의 개인 정보를 취득
    • 정보원칙: 개인 정보는 정보 주체로부터 직접 수집이 원칙, 필요한 경우 제 3자(국가 기관, 신용평가 기관), 공개된 자료원(인터넷, 전화번호부) 등에서 수집, 이용 가능
  3. 개인 정보의 수집 및 수집 목적 내 이용이 가능한 경우
    • 정보 주체의 동의를 받는 경우
    • 법률에 특별한 규정이 있거나 법령상 의무를 준수하기 위해
    • 명백히 정보주체 등의 급박한 생명, 신체, 재산의 이익을 위해 필요한 경우
    • 정보주체의 권리보다 우선하는 개인정보처리자의 정당한 이익 달성을 위하여 필요한 경우
  4. 개인정보 수집﹒이용 동의 시 필수 고지 사항
    1. 개인정보의 수집﹒이용 목적
    2. 수집하려는 개인정보의 항목
    3. 개인 정보의 보유 및 이용 기간
    4. 동의를 거부할 권리 및 동의 거부에 따른 불이익 내용
  5. 개인정보의 수집 제한
    • 목적에 필요한 범위에서 최소한의 개인정보만을 적법하게 수집
    • 필요 최소한의 정보 외에 개인정보 수집에 동의하지 않는다는 이유로 재화 또는 서비스의 제공 거부할 수 없음
  6. 민감정보﹒고유식별정보 처리 제한
    • 예외적으로 정보주체에게 별도 동의를 얻거나, 법령에서 구체적으로 허용된 경우에 한하여 처리 가능
    • 민감정보: 사상﹒신념, 노동조합﹒정당의 가입 및 탈퇴, 정치적 견해, 건강﹒성생활 등에 관한 정보, 유전정보, 범죄경력
    • 고유식별 정보: 주민등록번호, 외국인등록번호, 여권번호, 운전면허번호
  7. 데이터 비식별화
    • 비식별화는 특정 개인을 알아볼 수 없도록 하는 일련의 조치 → 정보의 일부 또는 전부를 삭제 또는 대체, 다른 정보와 쉽게 결합하지 못하도록 조치
    • 개인정보 수집은 1) 적법한 절차에 따라 최소한의 정보만 수집, 2) 데이터 처리 과정에서 반드시 필요한 개인정보만 사용, 3) 데이터 사용 목적 달성 후 파기, 4) 개인정보 재활용을 위해 보관 시에는 다른 개인정보와 분리하여 관리
    • 개인정보 이름, 주민등록번호 등 식별자는 원칙적으로 삭제 조치하지만, 데이터 이용 시 반드시 필요한 식별자는 마스킹 처리, 가명 처리 등 비식별 조치 후 활용
    • 개인정보 비식별 기술
      1. 가명처리
        • 주요 식별요소를 다른 값으로 대체 → 개인 식별 곤란하게
        • e.g. 홍길동, 35세, 서울 거주, 한국대 재학
          → 임꺽정. 30대, 서울 거주, 국제대 재학
      2. 총계처리 or 평균값 대체
        • 데이터 총합 값을 보임으로써 개별 데이터 값을 보이지 않도록
        • e.g. A 180cm, B 170cm, C 160cm, D 150cm
          → 물리학과 학생 키 합 660cm, 평균 키 165cm
      3. 데이터 값 삭제
        • 데이터셋에 구성된 값 중 필요 없는 값 또는 개인식별에 중요한 값 삭제
        • e.g. 홍길동, 35세, 서울 거주, 한국대 졸업 → 35세, 서울 거주
        • e.g. 주민등록번호 901206-1234567 → 90년대생, 남자
      4. 범주화
        • 데이터 값을 범주 값으로 변환하여 명확한 값 감춤
        • e.g. 홍길동, 35세 → 홍씨, 30-40세
      5. 데이터 마스킹
        • 주요 개인식별자가 보이지 않도록 처리하여 개인 식별 못하도록
        • e.g. 홍**, 35세, 서울 거주, **대학 재학

 

 

 

출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기

728x90

댓글