DHP (Dynamic Hadoop Provisioning)
On-Demand 방식의 간단한 APIs 호출 방식으로 최적화된 컨테이너 기반 하둡 클러스터를 제공합니다.
DHP
-
데이터 노드
실행 중인 클러스터 데이터 노드에 대한 수평 확장(Scale-out), 수평 감소(Scale-in) 기능을 제공
추가/삭제 -
리소스 지정 하둡 클러스터 생성
사용자가 정의한 하둡 리소스 설정에 의해 클러스터 생성 가능 -
S3 연계
생성된 하둡 클러스터와 S3의 자동 연계를 통해 뛰어난 확장성과 내구성을 제공
-
애플리케이션
사용자별 Hive, Spark Job 에 대한 자동 실행 기능을 제공
단계 실행(추후)
제품소개
DHP
DHP는 클라우드 상에서 데이터 분석에 필요한 빅데이터 프레임워크인 Apache 하둡을 간편하게 실행시킬 수 있는 서비스를 제공합니다.
사용자는 온프라미스 형태의 하둡 구성을 위한 별도의 리소스 생성 없이, 제공되는 이미지 기반의 하둡 클러스터를 자유롭게 생성/삭제하고 이를 통해 보다 빠르게 비즈니스 분석업무를 처리할 수 있는 기회를 얻을 수 있습니다.
Why DHP?
- 신속성
- 별도의 인프라 구축 없이 하둡 클러스터를 신속하게 구성하고, 개발자는 데이터 분석을 위한 Biz 요건 개발에만 집중할 수 있습니다.
-
- 비용 효율적
- 하둡 플랫폼을 도입하는 데 있어 소모되는 비용 및 기술적 문제들을 클라우드 상에서 손쉽게 구성함으로써 CAPEX(설비투자) / OPEX(운영비용) 측면에서 비용을 절감시킬 수 있습니다.
-
- 다양한 하둡 에코 시스템 제공
- 데이터 처리를 위해 다양한 하둡 에코 시스템 (Oozie/Hive/Spark 등)을 빠르게 생성 및 회수할 수 있습니다.
-
활용사례
Use Case
-
탄력적이고 다양한 분석 환경
Batch/Realtime Pipeline을 위한 탄력적인 분석 환경 제공
-
유연한 데이터 분석
Batch Pipeline을 통한 RDB 데이터 분석
-
User Specific
사용자 정의 Hive 애플리케이션 실행
-
Sandbox Hadoop Cluster
기업 내 Data Scientist를 위한 Sandbox용 하둡 클러스터 사용
-
Interactive 데이터 분석
HDP와 Pyspark-jupyter Notebook을 활용한 Interactive 데이터 분석
관련제품 및 리소스
-
Analytics
- ML Modeler 머신러닝을 코딩없이 사용할 수 있는 Web기반 분산 병렬 모델링 도구입니다.
-
Analytics
- DL Modeler Cloud 환경에서 코딩없이 딥러닝 분석 서비스를 이용할 수 있는 플랫폼입니다.
-
Analytics
- Realtime Pipeline Streaming 기반 데이터를 수집, 처리, 분석할 수 있는 실시간 Workflow Designer입니다.