본문 바로가기
생계/데이터 분석

'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [03] 비즈니스 모델' 정리

by Rihan 2022. 10. 14.
728x90
중요 사항
1) 빅데이터 활용 기법

 

  1. 빅데이터 활용 사례
    1. 기업 활용 
      • 구글 검색(로그 데이터 활용 기존 페이지랭크 개선)
      • 월마트 구매패턴 분석 (연관규칙)
    2. 정부 활용
      • 환경 탐색(실시간 교통정보, 기후 정보)
      • 상황 분석(소셜미디어, CCTV, 통화기록)
    3. 개인 활용
      • 정치인 사회관계망분석을 통한 유세
  2. 빅데이터 활용 기법
    1. 연관규칙학습(Association rule learning) = 연관분석
      • 변수 간의 주목할 만한 상관관계가 있는지 찾아냄
      • e.g. 슈퍼마켓에서 상관관계가 높은 상품을 함께 진열(우유와 기저귀)
    2. 유형분석(Classification tree Analysis)
      • "사용자가 어떤 특성을 가진 집단에 속하는가?"와 같은 문제를 해결
      • e.g. 온라인 수강생들을 특성에 따라 분류
    3. 유전 알고리즘(Genetic algorithms)
      • 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 매커니즘을 통해 점진적으로 진화시켜나가는 방법
      • e.g. 연료 효율적인 차를 개발하기 위해 어떻게 원자재와 엔지니어링을 결합해야 하는가?
      • e.g. 최대 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?
      • e.g. 응급실에서 의사를 어떻게 배치하는 것이 가장 효율적인가?
    4. 기계학습(Machine learning)
      • 훈련 데이터로부터 학습한 알려진 특성을 활용해 '예측'하는 일에 초점
      • e.g. 이메일 스팸 메일 필터링, 사용자 기호에 맞는 학습 추천, 넷플릭스 영화 추천 시스템
    5. 회귀분석(Regression Analysis)
      • 두 변수간의 관계 파악: 독립변수 변화 → 종속변수가 어떻게 변하는지
        • "회귀(regression)의 사전적 의미는 'go back to an earlier and worse condition(옛날의 대표적인 상태로 돌아감)'을 의미한다.

          예를 들어, 남자의 평균 Height는 175cm 라 하자. 세대를 거듭할때마다, 높은 Height + 낮은 Height 사람들 혹은 보통 Height + 보통 Height 사람들이 다양하게 결혼하여 자녀를 낳을 것이다. 

          결국에는 남자들의 평균 Height는 175cm으로 회귀하려는 경향을 보일 것이다. 

          회귀의 기본 원리는 다음과 같이 선형 회귀모델의 직선과 실제 값 사이의 차를 뜻하는 residual error를 최소화 시키는 것이다.위 예와 같이 적용한다면, X값에 따라 여러 Y값들이 나오겠지만, 결국에는 추론된 직선으로 회귀할 것이다."

          - 출처: https://bioinformaticsandme.tistory.com/70
      • e.g. 사용자의 만족도가 충성도에 어떤 영향을 미치는지, 이웃들과 그 규모가 집값에 어떤 영향을 미치는지, 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는지
    6. 감정분석(Sentiment Analysis)
      • 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석
      • e.g. 호텔 고객 코멘트 기반 서비스 개선, 소셜미디어에 나타난 의견을 바탕으로 고객 니즈 파악
    7. 소셜 네트워크 분석(Social network analysis) = 사회관계망분석(SNA)
      • 특정인과 다른 사람이 몇 촌 정도의 관계인지를 파악
      • 영향력 있는 오피니언 리더를 찾아내고, 고객들 간 소셜 관계를 파악

 

 

 

출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기

728x90

댓글