이메일로 Hortonworks의 새 업데이트를 받으세요.

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

Sign up for the Developers Newsletter

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

* I understand I can unsubscribe at any time. I also acknowledge the additional information found in Hortonworks Privacy Policy.
닫기닫기 버튼
CTA

Maximize the Value of Data-at-Rest to Deliver Big Data Analytics

동영상 동영상 버튼 재생

시작할 준비가 되셨습니까?

블로그 읽기
Hortonworks Data Platform (HDP®)

Hortonworks Data Platform (HDP®)

HDP는 중앙 집중화된 아키텍처(YARN)를 기반으로 한 업계 유일의 안전한 엔터프라이즈급 오픈 소스 Apache™ Hadoop® 배포입니다. HDP는 비활성 데이터의 모든 요구사항을 해결하고, 실시간 고객 애플리케이션의 이점을 제공하며, 의사결정과 혁신을 가속화하는 강력한 빅 데이터 분석 기능을 제공합니다.

Powering the future of data
구독 시작

Powerful Insights Whether in the Data Center or in the Cloud

여러 환경 전반에서 유연하고 효율적이며 이동 가능한 데이터 인사이트를 확보합니다.

Hortonworks에서는 동일하게 업계 최고 수준의 오픈 소스 플랫폼을 실행하기 위한 유연성을 제공하므로 사용자는 데이터 센터뿐만 아니라 선택한 공용 클라우드에서도 데이터 인사이트를 얻을 수 있습니다. Microsoft Azure, Amazon Web Services, Google Cloud Platform 등 사용하는 클라우드 환경에 관계없이 조직에서 클라우드의 민첩성을 활용하는 동시에 온프레미스 워크로드를 실행하여 데이터 중심적인 하이브리드 엔터프라이즈를 실현할 수 있습니다. 고객은 Hortonworks의 엔터프라이즈에 최적화된 첨단 데이터 아키텍처를 사용하여 데이터 센터와 클라우드에서 일관된 경험을 누릴 수 있습니다.

거버넌스 통합

데이터 라이프사이클 및 관리

Data Workflow

운영

프로비저닝, 관리 및 모니터

스케줄링

보안

관리 인증 권한 부여 감사 데이터 보호

데이터 액세스

  • 스크립트
  • Pig
S T
HDFS
HDFS(Hadoop Distributed File System)

데이터 관리

HDP 다운로드

최신 HDP 기능을 사용해 보고 생산 환경에 적합하게 HDP를 준비하세요.

HDP 추가 기능

많이 사용되는 BI 도구에 연결하는 데 사용되는 HDP 추가 기능을 확인해 보세요.

HDP 플랫폼 보안

HDP의 보안을 위해 적용한 프로세스를 확인해 보세요.

Hortonworks Data Platform의 초석

YARN과 Hadoop Distributed File System(HDFS)은 비활성 데이터를 위한 Hortonworks Data Platform(HDP)의 초석이 되는 요소입니다. HDFS는 대규모 Data Lake를 위해 확장 가능하고, 내결함성이 있고, 비용 효율적인 스토리지를 제공하며, YARN은 여러 작업을 동시에 처리할 수 있게 하는 중앙 집중식 아키텍처를 제공합니다. YARN을 사용하면 리소스를 관리할 수 있고 접속 가능한 아키텍처를 제공받을 수 있어 다양한 방식으로 데이터에 액세스할 수 있습니다.

추가 정보:

데이터 관리

다양한 워크로드를 위한 위한 데이터 스트리밍, 프로세싱 및 분석 엔진

Hortonworks Data Platform에는 여러 가지 방식으로 동일한 데이터와 동시에 상호 작용할 수 있게 해주는 다양한 범위의 프로세싱 엔진이 포함되어 있습니다. 즉, 빅 데이터 분석 애플리케이션이 배치에서 대화식 SQL 또는 NoSQL을 통한 짧은 대기 시간으로의 액세스까지 최상의 방식으로 데이터와 상호 작용할 수 있습니다. 또한, 데이터 과학, 검색 및 스트리밍에 대한 새로운 사용 사례가 Apache Spark, Storm, Kafka를 통해 지원됩니다.

데이터 액세스

정책에 따라 데이터 로드 및 관리

HDP는 데이터 거버넌스 및 통합을 위한 강력한 도구를 사용하여 데이터 액세스 및 관리를 확장합니다. HDP는 Hadoop의 데이터 플로우를 관리하기 위한 안정적이고, 반복 가능하며, 단순한 프레임워크를 제공합니다. 소스에서 스키마 또는 메타데이터를 자동으로 쉽게 적용하는 도구 세트와 함께 이 제어 구조는 Hadoop을 최신 데이터 아키텍처에 성공적으로 통합하는 데 있어 반드시 필요합니다.

Hortonworks는 다수의 주요 데이터 관리 제공업체와 엔지니어링 제휴를 맺음으로써 자사의 도구가 HDP를 통해 작동 및 통합되도록 했습니다.

추가 정보:

데이터 관리 및 통합

인증, 권한 부여 및 데이터 보호

보안은 HDP의 여러 계층에 통합되어 있습니다. 인증, 권한 부여, 계정 및 데이터 보호에 대한 주요 기능을 통해 이러한 주요 요구사항 전반에 걸쳐 HDP 보안을 지원할 수 있습니다. 모든 엔터프라이즈 Hadoop 기능에서의 접근방식과 일관되게 HDP를 사용하여 현재 보안 솔루션을 통합 및 확장할 수 있으므로 최신 데이터 아키텍처에서 일관되고 안전한 하나의 보안 방법을 제공할 수 있습니다.

추가 정보:

보안

Hadoop 운영에 대해 추측하기

운영 팀은 더 광범위한 엔터프라이즈 데이터 에코시스템 내에서 Hadoop 클러스터를 배포, 모니터링 및 관리합니다. Apache Ambari는 이런 작업 환경을 단순화합니다. Ambari는 Hortonworks Data Platform을 프로비저닝, 관리, 모니터링 및 보안을 위한 오픈 소스 관리 시스템입니다. 이를 통해 Hadoop을 엔터프라이즈 환경에 완벽하게 맞출 수 있습니다.

추가 정보:

작업

클라우드 환경에서 Hadoop 클러스터를 프로비저닝 및 관리

Hortonworks Data Platform에 포함되고 Apache Ambari를 기반으로 하는 Cloudbreak를 사용하면 Amazon Web Services, Microsoft Azure, Google Cloud Platform 및 OpenStack을 포함한 모든 클라우드 환경에서 간편한 프로비저닝과 Hadoop 클러스터 관리가 가능합니다. 그리고 워크로드 변경에 따라 클라우드 리소스 사용을 최적화할 수 있습니다.

추가 정보:

클라우드

What's New in Hortonworks Data Platform 2.6

관리자

혁신 및 성능

  • 최신 데이터 과학 기능 이용. Spark 2.1, Spark 1.6.3, Zeppelin 0.7 및 Livy REST API에서 제공되는 머신 러닝 알고리즘이 폭넓게 지원됩니다.
  • Hive LLAP for Production. 동적 런타임 필터링으로 10배나 빠른 조인 성능을 얻을 수 있습니다.
  • ACID 규정 준수. 증분 업데이트를 통해 마이크로 배치/스트리밍에서 Hive 데이터 웨어하우스로 변경하고 속도를 대폭 개선합니다.
  • BI 도구용 Sub-second 쿼리 성능. 먼저 SQL 기반 분석 데이터베이스에 데이터를 저장함으로써 고객은 이제 Hadoop에서 데이터를 복제할 필요가 없습니다.
관리자

엔터프라이즈 지원

  • Ranger 보안 정책 내보내기/가져오기. 보안 정책을 대량으로 특정 환경 간에 이동하여 생산성을 강화합니다.
  • 에코시스템 전반에서 태그 기반 정책 지원 확대. HDFS, Kafka 및 HBase에 대한 보안 워크플로 범위를 기반으로 분류할 수 있습니다.
  • 행/열 보안. Spark 및 Hive를 포함한 Hadoop 스택 레벨마다 세분화된 데이터 액세스 제어를 구현합니다.
  • Kafka와 Spark Streaming 연결에 대한 SSL 지원. Spark Streaming과 Kafka에 대해 안전한 환경을 제공합니다.
관리자

사용 편이성

  • 서비스 자동 시작. 클러스터 노드를 다시 시작하거나 예기치 않은 데몬이 있을 경우 자동으로 시작되어야 하는 서비스 및 구성 요소를 손쉽게 구성합니다.
  • 간소화된 로그 순환 구성. 모든 구성 요소에 대한 백업 파일의 크기와 수를 빠르게 구성합니다.
  • HDFS TopN 사용자 및 작업 시각화. NameNode에서 가장 자주 수행되는 작업과 해당 작업을 수행한 사용자에 대한 가시성을 얻을 수 있습니다.
  • PySpark(Spark Python API) 및 SparkR에 대한 패키지 지원: R 언어가 포함된 Spark를 사용하는 데이터 과학자는 이제 해당 Spark 작업이 포함된 즐겨찾는 R 패키지를 배포할 수 있습니다.
고객이 될 준비가 되셨나요?