뉴스레터

이메일로 Hortonworks의 새 업데이트를 받으세요.

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

AVAILABLE NEWSLETTERS:

Sign up for the Developers Newsletter

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

* 저는 언제든지 구독을 해지할 수 있다는 점을 이해합니다. 또한 저는 Hortonworks이 개인정보 보호정책에 추가된 정보를 확인하였습니다.
닫기닫기 버튼
CTA

Hortonworks 데이터 스튜어드 스튜디오

엔터프라이즈 Data Lake에 퍼져있는 데이터를 이해하고, 보호하고, 통제하세요

현대적인 방법을 채택하여 데이터를 관리

백서 다운로드

개요

Data Steward Studio(DSS)는 사용자들이 엔터프라이즈 Data Lake에 널리 퍼져 있는 데이터를 이해하고, 보호하고, 통제하도록 강력하게 지원하는 DataPlane 서비스입니다. 기업들은 DSS를 활용하여 보유 중인 데이터의 무결성을 정밀하게 파악하고 평가함으로써 기업 전반에 걸쳐 안전하게 협업하고 데이터를 민주화(democratize)할 수 있습니다.

DSS를 통해 엔터프라이즈는 하이브리드 Data Lake에 분산된 데이터에 대한 지식을 컨텍스트화할 수 있으며, 이를 통해 실용적인 통찰력을 얻고 비즈니스 운영에 관한 의미 있는 행동을 취할 수 있게 됩니다.

video img동영상 버튼

Data Steward Studio

장점

data lake에 산재한 데이터의 발견 및 분류

DSS는 여러 Data Lake에 분산된 데이터에 대한 작업 파이프라인으로 실행할 수 있는 뛰어난 프로파일러가 특징입니다. 고객들은 Data Lake에 프로파일러 에이전트를 설치하여 다양한 데이터 프로필 유형을 생성하도록 특정한 일정을 수립할 수 있습니다. 데이터 스튜어드는 DSS를 활용하여 다음을 실행할 수 있습니다.

  • 민감도 및 배포 특성을 기반으로 한 엔터프라이즈 데이터에 대한 이해
  • 매일 추가되는 테이블의 개수를 파악할 수 있는 가시성 확보
  • 파티션 개수, 생성 횟수, 테이블 크기, 열 개수, 입력 및 출력 형식을 비롯한 운영 메트릭 수신
블로그: 비즈니스 가치를 창출하기 위해 하이브리드 Data Lake 이해하기!
블로그: Forrester, Big Data Fabric Wave에서 Hortonworks가 보인 막강한 성과를 인정하다
다수의 Data Lake에 걸쳐 있는 데이터 소스 찾기
엔터프라이즈 데이터 이해하기

DSS는 Apache Atlas로 추적한 특정 데이터 자산과 관련한 모든 메타데이터를 제공합니다. DSS를 사용해 데이터 스튜어드는 다음을 수행할 수 있습니다.

  • 데이터 출처, 기원, 계보 및 영향에 대한 종단 간 가시성 확보
  • 데이터 생성 및 수정 과정 이해
  • 업스트림 계보 및 다운스트림 영향의 시각화
  • 스키마와 데이터가 시간에 따라 진화하는 방법 파악
웨비나: GDPR 규정 준수는 데이터 거버넌스와 함께 시작됩니다 – 라이브 패널
엔터프라이즈 데이터 이해하기
규정 준수

DSS는 Apache Ranger를 통해 특정한 데이터 자산과 관련한 감사 이벤트를 모두 표시합니다. DSS를 사용해 내부 및 외부 감사관은 다음의 역량을 확보합니다.

  • 포렌식 감사 및 규정 준수 관점에서 어떤 데이터에 누가 접근했는지에 대한 가시성 파악
  • 접근 패턴 가시화, 이상 식별, 적합한 통제 메커니즘 확보
  • 가장 최근의 원시 감사 이벤트와 액세스 및 액세스 결과 유형별로 감사 요약본 보기
백서: GDPR 규정 준수는 데이터 거버넌스와 함께 시작됩니다
규정 준수
비즈니스에 사용 가능한 신뢰받는 데이터 생성

DSS를 통해 데이터 소비자와 스튜어드는 Asset Collections를 생성하여 비즈니스 정의를 기반으로 각기 다른 데이터 자산을 그룹화할 수 있습니다. Asset Collections를 소비자 프로필, 영업 자산, 재무, PII 및 HR 데이터와 같이 유형별로 생성할 수 있습니다. Asset Collections를 생성함으로써, 데이터 스튜어드와 데이터 소비자는 다음 작업이 가능합니다.

  • 데이터 사용, 보존, 
및 복원 전략 자동화
  • 비즈니스 분류, 목적, 보호, 관련성에 따라 데이터를 자산 컬렉션에 따라 정리
  • 태그, 속성 양상 및 자유 텍스트를 사용해 Data Lake에서 데이터 검색
  • 직관적인 대시보드를 통해 자산 컬렉션에서 데이터 자산을 전반적으로 살펴보기
보도 자료: 클라우드와 온프레미스 Data Lake 전반에 걸쳐 엔터프라이즈를 지원하는 Data Steward Studio
비즈니스에 사용 가능한 신뢰받는 데이터 생성