728x90
중요 사항
1) 빅데이터 활용 기법
- 빅데이터 활용 사례
- 기업 활용
- 구글 검색(로그 데이터 활용 기존 페이지랭크 개선)
- 월마트 구매패턴 분석 (연관규칙)
- 정부 활용
- 환경 탐색(실시간 교통정보, 기후 정보)
- 상황 분석(소셜미디어, CCTV, 통화기록)
- 개인 활용
- 정치인 사회관계망분석을 통한 유세
- 기업 활용
- 빅데이터 활용 기법
- 연관규칙학습(Association rule learning) = 연관분석
- 변수 간의 주목할 만한 상관관계가 있는지 찾아냄
- e.g. 슈퍼마켓에서 상관관계가 높은 상품을 함께 진열(우유와 기저귀)
- 유형분석(Classification tree Analysis)
- "사용자가 어떤 특성을 가진 집단에 속하는가?"와 같은 문제를 해결
- e.g. 온라인 수강생들을 특성에 따라 분류
- 유전 알고리즘(Genetic algorithms)
- 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 매커니즘을 통해 점진적으로 진화시켜나가는 방법
- e.g. 연료 효율적인 차를 개발하기 위해 어떻게 원자재와 엔지니어링을 결합해야 하는가?
- e.g. 최대 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?
- e.g. 응급실에서 의사를 어떻게 배치하는 것이 가장 효율적인가?
- 기계학습(Machine learning)
- 훈련 데이터로부터 학습한 알려진 특성을 활용해 '예측'하는 일에 초점
- e.g. 이메일 스팸 메일 필터링, 사용자 기호에 맞는 학습 추천, 넷플릭스 영화 추천 시스템
- 회귀분석(Regression Analysis)
- 두 변수간의 관계 파악: 독립변수 변화 → 종속변수가 어떻게 변하는지
- "회귀(regression)의 사전적 의미는 'go back to an earlier and worse condition(옛날의 대표적인 상태로 돌아감)'을 의미한다.
예를 들어, 남자의 평균 Height는 175cm 라 하자. 세대를 거듭할때마다, 높은 Height + 낮은 Height 사람들 혹은 보통 Height + 보통 Height 사람들이 다양하게 결혼하여 자녀를 낳을 것이다.
결국에는 남자들의 평균 Height는 175cm으로 회귀하려는 경향을 보일 것이다.
회귀의 기본 원리는 다음과 같이 선형 회귀모델의 직선과 실제 값 사이의 차를 뜻하는 residual error를 최소화 시키는 것이다.위 예와 같이 적용한다면, X값에 따라 여러 Y값들이 나오겠지만, 결국에는 추론된 직선으로 회귀할 것이다."
- 출처: https://bioinformaticsandme.tistory.com/70
- "회귀(regression)의 사전적 의미는 'go back to an earlier and worse condition(옛날의 대표적인 상태로 돌아감)'을 의미한다.
- e.g. 사용자의 만족도가 충성도에 어떤 영향을 미치는지, 이웃들과 그 규모가 집값에 어떤 영향을 미치는지, 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는지
- 두 변수간의 관계 파악: 독립변수 변화 → 종속변수가 어떻게 변하는지
- 감정분석(Sentiment Analysis)
- 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석
- e.g. 호텔 고객 코멘트 기반 서비스 개선, 소셜미디어에 나타난 의견을 바탕으로 고객 니즈 파악
- 소셜 네트워크 분석(Social network analysis) = 사회관계망분석(SNA)
- 특정인과 다른 사람이 몇 촌 정도의 관계인지를 파악
- 영향력 있는 오피니언 리더를 찾아내고, 고객들 간 소셜 관계를 파악
- 연관규칙학습(Association rule learning) = 연관분석
출처: 김계철 지음, '2023 ADsP 한 권으로 끝내기
728x90
'생계 > 데이터 분석' 카테고리의 다른 글
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [05] 미래의 빅데이터' 정리 (0) | 2022.10.17 |
---|---|
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [04] 위기 요인과 통제 방안' 정리 (0) | 2022.10.17 |
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [02] 빅데이터의 가치와 영향' 정리 (0) | 2022.10.13 |
'[1과목] 데이터 이해 - [2장] 데이터의 가치와 미래 - [01] 빅데이터의 이해' 정리 (0) | 2022.10.13 |
'[1과목] 데이터 이해 - [1장] 데이터의 이해 - [03] 데이터베이스 활용' 정리 (0) | 2022.10.07 |
댓글