Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

닫기닫기 버튼
CTA

비활성 데이터의 가치를 최대화

동영상 동영상 버튼 재생

클라우드 시작할 준비가 되셨습니까?

READ THE BLOG
HORTONW0RKS DATA PLATFORM (HDP®)

HORTONW0RKS DATA PLATFORM(HDP®)

HDP는 중앙 집중화된 아키텍처(YARN)를 기반으로 한 업계 유일의 안전한 엔터프라이즈급 오픈 소스 Apache™ Hadoop® 배포입니다. HDP는 비활성 데이터의 모든 요구사항을 해결하고, 실시간 고객 애플리케이션의 이점을 제공하며, 의사결정과 혁신을 가속화하는 강력한 분석 기능을 제공합니다.

Powering the Future of Data
구독 시작
거버넌스 통합
데이터 라이프사이클 및 관리
데이터 워크플로
운영
프로비저닝, 관리 및 모니터
스케줄링
보안
관리 인증 권한 부여 감사 데이터 보호
데이터 액세스
  • 스크립트
  • Pig
S T
HDFSHadoop Distributed File System
데이터 관리

Hortonworks Data Platform의 초석

YARN and Hadoop Distributed File System(HDFS)은 Hortonworks Data Platform(HDP)의 초석이 되는 요소입니다. HDFS는 대규모 Data Lake를 위해 확장 가능하고, 내결함성이 있고, 비용 효율적인 스토리지를 제공하며, YARN은 여러 작업을 동시에 처리할 수 있게 하는 중앙 집중식 아키텍처를 제공합니다. YARN을 사용하면 리소스를 관리할 수 있고 접속 가능한 아키텍처를 제공받을 수 있어 다양한 방식으로 데이터에 액세스할 수 있습니다.

추가 정보:

데이터 관리

다양한 워크로드를 위한 위한 데이터 스트리밍, 프로세싱 및 분석 엔진

Hortonworks Data Platform에는 여러 가지 방식으로 동일한 데이터와 동시에 상호 작용할 수 있게 해주는 다양한 범위의 프로세싱 엔진이 포함되어 있습니다. 즉, 애플리케이션이 배치에서 대화식 SQL 또는 NoSQL을 통한 짧은 대기 시간으로의 액세스까지 최상의 방식으로 데이터와 상호 작용할 수 있습니다. 또한, 데이터 과학, 검색 및 스트리밍에 대한 새로운 사용 사례가 Apache Spark, Storm, Kafka를 통해 지원됩니다.

데이터 액세스

정책에 따라 데이터 로드 및 관리

HDP는 데이터 거버넌스 및 통합을 위한 강력한 도구를 사용하여 데이터 액세스 및 관리를 확장합니다. HDP는 Hadoop의 데이터 플로우를 관리하기 위한 안정적이고, 반복 가능하며, 단순한 프레임워크를 제공합니다. 소스에서 스키마 또는 메타데이터를 자동으로 쉽게 적용하는 도구 세트와 함께 이 제어 구조는 Hadoop을 최신 데이터 아키텍처에 성공적으로 통합하는 데 있어 반드시 필요합니다.

Hortonworks는 다수의 주요 데이터 관리 제공업체와 엔지니어링 제휴를 맺음으로써 자사의 도구가 HDP를 통해 작동 및 통합되도록 했습니다.

추가 정보:

데이터 관리 및 통합

인증, 권한 부여 및 데이터 보호

보안은 HDP의 여러 계층에 통합되어 있습니다. 인증, 권한 부여, 계정 및 데이터 보호에 대한 주요 기능을 통해 이러한 주요 요구사항 전반에 걸쳐 HDP 보안을 지원할 수 있습니다. 모든 엔터프라이즈 Hadoop 기능에서의 접근방식과 일관되게 HDP를 사용하여 현재 보안 솔루션을 통합 및 확장할 수 있으므로 최신 데이터 아키텍처에서 일관되고 안전한 하나의 보안 방법을 제공할 수 있습니다.

추가 정보:

보안

Hadoop 운영에 대해 추측하기

운영 팀은 더 광범위한 엔터프라이즈 데이터 에코시스템 내에서 Hadoop 클러스터를 배포, 모니터링 및 관리합니다. Apache Ambari는 이런 작업 환경을 단순화합니다. Ambari는 Hortonworks Data Platform을 프로비저닝, 관리, 모니터링 및 보안을 위한 오픈 소스 관리 시스템입니다. 이를 통해 Hadoop을 엔터프라이즈 환경에 완벽하게 맞출 수 있습니다.

추가 정보:

작업

클라우드 환경에서 Hadoop 클러스터를 프로비저닝 및 관리

Hortonworks Data Platform에 포함되고 Apache Ambari를 기반으로 하는 Cloudbreak를 통해 Amazon Web Services, Microsoft Azure, Google Cloud Platform 및 OpenStack을 포함한 모든 클라우드 환경에서 클러스터의 프로비저닝을 단순화할 수 있습니다. 그리고 워크로드 변경에 따라 클라우드 리소스 사용을 최적화할 수 있습니다.

추가 정보:

클라우드

HORTONWORKS DATA PLATFORM 2.6의 새로운 기능

관리자

혁신 및 성능

  • 최신 데이터 과학 기능의 이용. Spark 2.1, Spark 1.6.3, Zeppelin 0.7 및 Livy REST API에서 제공되는 기계 학습 알고리즘에 대한 광범위한 지원이 제공됩니다.
  • Hive LLAP for Production. 동적 런타임 필터링으로 10배나 빠른 조인 성능을 얻을 수 있습니다.
  • ACID 규정 준수. 증분 업데이트를 통해 마이크로 배치/스트리밍에서 Hive 데이터 웨어하우스로 변경하고 속도를 대폭 개선합니다.
  • BI 도구용 Sub-second 쿼리 성능. 먼저 SQL 기반 분석 데이터베이스에 데이터를 저장함으로써 고객은 이제 Hadoop에서 데이터를 복제할 필요가 없습니다.
관리자

엔터프라이즈 지원

  • Ranger 보안 정책 내보내기/가져오기. 보안 정책을 대량으로 특정 환경 간에 이동하여 생산성을 강화합니다.
  • 에코시스템 전반에서 태그 기반 정책 지원 확대. HDFS, Kafka 및 HBase에 대한 보안 워크플로 범위를 기반으로 분류할 수 있습니다.
  • 행/열 보안. Spark 및 Hive를 포함한 Hadoop 스택 레벨마다 세분화된 데이터 액세스 제어를 구현합니다.
  • Kafka와 Spark Streaming 연결에 대한 SSL 지원. Spark Streaming과 Kafka에 대해 안전한 환경을 제공합니다.
관리자

사용 편이성

  • 서비스 자동 시작. 클러스터 노드를 다시 시작하거나 예기치 않은 데몬이 있을 경우 자동으로 시작되어야 하는 서비스 및 구성 요소를 손쉽게 구성합니다.
  • 간소화된 로그 순환 구성. 모든 구성 요소에 대한 백업 파일의 크기와 수를 빠르게 구성합니다.
  • HDFS TopN 사용자 및 작업 시각화. NameNode에서 가장 자주 수행되는 작업과 해당 작업을 수행한 사용자에 대한 가시성을 얻을 수 있습니다.
  • PySpark(Spark Python API) 및 SparkR에 대한 패키지 지원: R 언어가 포함된 Spark를 사용하는 데이터 과학자는 이제 해당 Spark 작업이 포함된 즐겨찾는 R 패키지를 배포할 수 있습니다.
HDP 다운로드

Hortonworks Sandbox와 함께 최신 HDP 기능을 사용해 보거나, 프로덕션 환경에 맞게 HDP를 설정하고, 클러스터를 설치 및 구성합니다.

HDP 추가 기능

많이 사용하는 BI 도구를 사용하여 연결하거나 검색 쿼리 등을 강화하는 HDP 추가 기능을 확인해보세요.

고객이 될 준비가 되셨나요?