Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

닫기닫기 버튼
CTA

Enterprise Spark Big Data Solutions At Scale

HORTONWORKS, 엔터프라이즈 배포를 위해 SPARK 제공

클라우드 Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

개요



Hortonworks는 엔터프라이즈 규모 확장을 위해 Apache Spark의 강력한 성능을 활용하고, 오픈 엔터프라이즈 Apache Hadoop® 기능과 Apache Spark의 메모리 내 분석 기능을 통합하여 조직적 가치를 극대화합니다.

Spark, 플랫폼의 구성 요소로서 더 나은 역할 수행
Spark는 인증된 YARN 준비 완료 앱으로, Hortonworks Data Platform의 구성 요소입니다. 메모리와 CPU가 많이 사용되는 Spark 기반 애플리케이션은 YARN 지원 클러스터에 배포된 다른 워크로드와 함께 사용할 수 있습니다. Spark는 외부 데이터 소스에 대해 최고의 지원을 제공하고, YARN의 클러스터에서 직접 실행할 수 있습니다. 또한 이는 엔터프라이즈에서 데이터 분석을 수행하고자 하는 위치입니다. 이러한 접근 방식으로 전용 Spark 클러스터를 만들고 관리해야 할 필요성이 없어지고, 단일 클러스터 내에서 보다 효율적인 리소스 활용이 가능해집니다.

엔터프라이즈급 보안 및 거버넌스를 요구하는 Spark
Spark는 HDP 플랫폼의 구성 요소로서 HDP 스택의 다른 구성 요소와 같은 거버넌스, 보안 및 관리 정책을 이용했습니다. Spark는 빅 데이터 에코시스템에서 가장 빠르게 이동하는 프로젝트 중 하나이고, 해당 라이브러리는 서로 다른 성숙도 수준에 머물러 있습니다. Hortonworks에서는 Spark 프로젝터의 각 구성 요소를 조사, 검증, 확인한 후 지원합니다. 이러한 접근 방식은 고객을 위해 가치를 추가하는 데 있어 매우 중요합니다.

노트북을 통해 Spark 및 데이터 과학의 사용 및 공유를 더욱 손쉽게 수행
웹 기반 노트북에서는 Hadoop 및 Spark에 데이터 수집, 탐색, 시각화, 공유 및 협업 기능을 제공합니다. Hortonworks에서는 Apache Zeppelin에 상당한 비용을 투자하고 있으며, 보안, 안정성, R 지원 및 사용 편의성을 추가하여 Zeppelin이 생산용으로서 준비를 갖추도록 할 계획입니다.


통합된 Apache Spark 및 Hadoop을 제공하여 Spark 구동 Agile Analytic 워크플로를 방대한 데이터 세트 및 Hadoop의 경제성과 결합합니다. 기업은 Hortonworks를 활용하여 업계 최고의 보안, 거버넌스 및 운영 기능을 갖춘 Apache Spark를 구축할 수 있습니다.

SPARK에 대한 HORTONWORKS의 주안점은 무엇입니까?

Hortonworks는 Spark 1.6을 릴리스하면서 고객이 데이터 과학을 가속화하고 원활한 데이터 액세스를 유지하고 핵심적인 혁신을 이루도록 돕기 위해 최선을 다하고 있습니다.

Spark는 오픈 엔터프라이즈 Hadoop의 구성 요소로서, 엔터프라이즈급 가치를 위해 Spark를 확장하도록 조직의 역량을 높여 줍니다.

관리자

데이터 과학 가속화

Apache Zeppelin을 강화하고 추가 Spark 알고리즘 및 패키지에 기여함으로써 데이터 과학 생산성을 향상하여 핵심 솔루션의 개발을 용이하게 합니다.

예: Magellan 프로젝트 - Apache Spark의 지리 공간 분석, 지리 공간 쿼리를 지원하고 Spark를 기반으로 구축하여 지리 공간 데이터를 대규모로 처리하는 어려운 문제를 해결하는 지리 공간 분석에 대한 오픈 소스 라이브러리

관리자

원활한 데이터 액세스

Spark SQL에서는 SQL 및 Data Frame API를 제공하여 구조화된 데이터에 액세스하는 한편 Spark 스트리밍을 통해 개발자가 확장 가능하고 처리량이 높으며, 내결함성이 우수한 라이브 데이터 스트림의 스트림 처리를 손쉽게 구축할 수 있도록 합니다.

Hortonworks에서는 YARN, HDFS, Hive, HBase 및 ORC에 대한 Spark의 통합을 개선하고 있습니다. 특히 새 데이터 소스 API를 통해 데이터 액세스를 보다 최적화할 수 있다고 믿고 있습니다.

관리자

핵심적인 혁신

HDFS 메모리 계층을 통해 RDD 공유 사용

추가 기계 학습 알고리즘에 기여

Spark의 엔터프라이즈 보안, 거버넌스, 운영 및 준비성 강화

CTA

탁월한 모든 Spark 혁신에 대해 알아보려면

APACHE SPARK 페이지를 확인해 보세요.

페이지 보기

APACHE SPARK AT SCALE을 시작하는 방법

최신 웨비나 'Hadoop을 통한 Spark at Scale' 듣기

시작할 준비가 되셨습니까?