728x90 분류분석1 ADsP 22회 기출문제 - [1과목] 체크 포인트 1. 데이터 사이언티스트가 효과적인 분석 모델 개발을 위해 고려해야 하는 사항으로 가장 부적절한 것 = '모델 범위 바깥의 요인까지 판단하는 것' 2. 빅데이터 정의 오답: "빅데이터는 기존의 작은 데이터 처리 분석으로는 얻을 수 없었던 통찰과 가치를 하둡(Hadoop)을 기반으로 하는 대용량 분산처리 기술을 통해 창출하는 새로운 방식이다." → 하둡(Hadoop)은 분산처리 기술을 의미하는 것일 뿐, 그것이 빅데이터를 의미하지는 않는다. 4. 하둡의 구성요소 - 하둡은 하나의 성능 좋은 컴퓨터를 이용하여 데이터를 처리하는 대신, 적당한 성능의 범용 컴퓨터 여러 대를 클러스터화하고, 큰 크기의 데이터를 클러스터에서 병렬로 동시에 처리하여 처리 속도를 높이는 것을 목적으로 한다. - 하둡의 코어 프로젝트가.. 2022. 11. 11. 이전 1 다음 728x90