이메일로 Hortonworks의 새 업데이트를 받으세요.

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

닫기닫기 버튼
CTA

제약 산업 및 임상 시험 분야를 위한
빅 데이터

클라우드 Hortonworks는 리더입니다. Forrester Wave를 읽어보세요.

보고서 다운로드

액세스할 수없는 데이터에 대한 해결 방법 찾기

필요한 데이터가 사일로에 숨겨져 있거나 액세스할 수 없는 수십억 달러 규모의 약물 테스트 데이터의 경우에는 어떻게 합니까? 10억 개의 장기 기록을 보고 어떻게 약물에 대한 생물학적 반응을 파악할까요? 제약 업계 연구자들은 Hortonworks의 통합 변환 데이터에 관한 고급 빅 데이터 분석을 이용해 제약 데이터를 전체적으로 볼 수 있습니다.

갇혀 있던 제약 산업 데이터의 힘 활용

빅 데이터 통합, 제약 빅 데이터 분석, 사내외 협업, 포트폴리오 결정 지원, 더 효율적인 임상 실험, 더 빠른 출시 기간, 수율 개선, 안전 개선은 전 세계 제약 회사에서 제약 빅 데이터의 힘을 모두 활용함으로써 얻는 엄청난 이익의 빙산의 일각에 불과합니다.

이용 사례

Merck, 백신 수율 최적화: “황금 배치(Golden Batch)”를 향한 노력

Merck는 제조 데이터를 분석하여 "황금 배치(golden batch)"를 얻는 데 가장 중요한 예측 변수를 분리해 냄으로써 백신 수율을 최적화했습니다. Merck의 리더들은 오랫동안 린(Lean) 제조에 의존하여 생산량을 늘리고 비용을 절감해 왔지만, 수율을 점진적으로 높이는 방법을 찾기가 점점 어려워졌습니다. 이들은 비용을 더욱 절감하고 수율을 개선할 수 있는 새로운 통찰력을 얻기 위해 Open Enterprise Hadoop에 대해 조사했습니다. Merck는 백신 하나에 대해 10년 동안 축적되어 온 255개의 배치에 대한 기록에서 데이터를 검색하기 위해 Hortonworks와 손을 잡았습니다. 16개의 유지보수 및 건물 관리 시스템에 분산되어 있던 이 데이터에는 교정 설정, 기압, 온도 및 습도에 대한 정밀한 센서 데이터가 포함되어 있었습니다. 모든 데이터를 Hortonworks Data Platform으로 모으고 150억 회의 연산을 처리한 후에, Merck는 10년 동안 갖고 있던 질문에 대한 새로운 답을 얻었습니다. Merck 팀은 수백 가지의 변수 중에서 수율을 최적화하는 변수를 가려낼 수 있었습니다. 그 후 회사는 이렇게 얻은 지식을 다른 백신에 적용하면서 양질의 약품을 최대한 저렴한 가격으로 제공하는 데 집중해 왔습니다. InformationWeek의 Doug Henschen이 Merck의 George Llado를 인터뷰한 영상을 보십시오.


전체 약품 제조 공정의 낭비 최소화

One Hortonworks pharmaceutical customer uses HDP for a single view of its supply chain and their self-declared “War on Waste”. The operations team added up the ingredients going into making their drugs, and compared that with the physical product they shipped. They found a big gap between the two and launched their War on Waste, using HDP big data analytics to identify where those valuable resources were going. Once it identifies those root causes of waste, real-time alerts in HDP notify the team when they are at risk of exceeding pre-determined thresholds.


중개 연구: 과학 연구를 개인별 맞춤 약품으로 전환

The goal of Translational Research is to apply the results of laboratory research towards improving human health. Hadoop empowers researchers, clinicians, and analysts to unlock insights from translational data to drive evidence-based medicine programs. The data sources for translational research are complex and typically locked in data siloes, making it difficult for scientists to obtain an integrated, holistic view of their data. Other challenges revolve around data latency (the delay in getting data loaded into traditional data stores), handling unstructured and semi-structured types of data, and bridging lack of collaborative analysis between translation and clinical development groups. Researchers are turning to Open Enterprise Hadoop as a cost-effective, reliable platform for managing big data in clinical trials and performing advanced analytics on integrated translational data. HDP allows translational and clinical groups to combine key data from sources such as: Omics (genomics, proteomics, transcription profiling, etc) Preclinical data Electronic lab notebooks Clinical data warehouses Tissue imaging data Medical devices and sensors File sources (such as Excel and SAS) Medical literature Through Hadoop, analysts can build a holistic view that helps them understand biological response and molecular mechanisms for compounds or drugs. They’re also able to uncover biomarkers for use in R&D and clinical trials. Finally, they can be assured that all data will be stored forever, in its native format, for analysis with multiple future applications.


차세대 시퀀싱

IT 시스템으로는 차세대 시퀀싱(NGS) 데이터를 경제적으로 저장하고 처리할 수 없습니다. 예를 들어 기본 시퀀싱 결과는 큰 이미지 형식으로 되어 있어 오랫동안 저장하려면 너무 많은 비용이 듭니다. 포인트 솔루션은 유연하지 못하기 때문에 분석 방법의 변화에 보조를 맞출 수 없고, 종종 맞춤 개조하고 유지하는 데 많은 비용이 필요합니다. Open Enterprise Hadoop은 데이터 과학자와 연구 학자들이 NGS 데이터에서 얻은 통찰력을 모두 이용하면서 신뢰할 수 있는 경제적인 플랫폼에 결과의 원본을 보존할 수 있도록 지원하여 이런 문제를 극복합니다. NGS 과학자들은 Apache Spark 같은 HDP 구성 요소를 통해 얻을 수 있는 대규모 처리 및 분석 기능의 이점을 발견하고 있습니다. 제약 산업의 연구 학자들은 Hadoop을 사용하여 TCGA , GENBank 및 EMBL 같은 외부 유전 데이터 출처에서 다양한 유형의 데이터를 쉽게 수집합니다. 연구 학자들이 Hadoop용으로 특별히 제작된 최첨단 생물 정보학 도구를 이용할 수 있다는 것도 NGS와 관련된 HDP의 분명한 장점입니다. 이런 도구를 사용하면 다양한 NGS 데이터 형식을 분석하고 판독값을 분류하고 결과를 합칠 수 있습니다. 따라서 다음을 통해 NGS를 한 단계 격상시킬 수 있습니다. 큰 NGS 데이터 세트의 일괄 처리. 내부 및 공개 제공되는 외부 시퀀스 데이터 통합. 큰 이미지 파일을 원본 형식으로 저장하는 영구적인 데이터 저장소. 상당한 데이터 처리 및 저장 비용 절감.

실제 데이터를 사용하여 실제 증거를 제공하는 HDP

RWE(실제 증거)는 개선 사항을 건강 결과와 치료로 수량화할 것을 약속하지만, 이 데이터는 대규모로 제공되어야 합니다. 높은 데이터 저장 및 처리 비용, 정형 및 비정형 데이터의 병합 문제, 그리고 즉시 분석 가능한 데이터를 얻기 위한 정보학 리소스에 대한 지나친 의존도는 모두 RWE의 발전 속도를 더디게 하는 원인이 되었습니다. 그러나 여러 RWE 그룹은 Hadoop을 사용해 클레임, 처방전, 전자 의료 기록, HIE 및 소셜 미디어를 포함한 주요 데이터 출처를 결합하여 RWE를 전체적인 관점에서 볼 수 있습니다. 제약 업계의 빅 데이터 분석으로 분석가들은 SAS®, R®, TIBCO™ Spotfire® 또는 Tableau® 같은 경제적이고 익숙한 도구를 통해 갇혀 있던 진정한 통찰력을 모두 이용하고 고급 인사이트를 제공하고 있습니다. Hadoop을 사용한 RWE는 다음을 통해 가치를 제공합니다. • 다양한 환자 집합에 걸쳐 건강 리소스 이용 최적화 • 비용/품질의 취사선택에 대한 총체적인 시각 • 치료 경로 분석 • 경쟁 가격 연구 • 부수 약품 분석 • 질병의 지리적 및 인구통계적 확산에 근거한 임상 실험 대상 선정 • 파이프라인 약품 후보의 우선 순위 결정 • 효능 기준 가격 계약에 사용 가능한 메트릭 • 약품 복용 충실도 연구 • 준법 감사에 대비한 영구적인 데이터 저장​

이전 연구에서 얻은 원시 데이터에 영구적으로 액세스

HDP는 실제 데이터를 사용하여 실제 증거 제공
RWE(실제 증거)는 개선 사항을 건강 결과와 치료로 수량화할 것을 약속하지만, 이 데이터는 대규모로 제공되어야 합니다. 높은 데이터 저장 및 처리 비용, 정형 및 비정형 데이터의 병합 문제, 그리고 즉시 분석 가능한 데이터를 얻기 위한 정보학 리소스에 대한 지나친 의존도는 모두 RWE의 발전 속도를 더디게 하는 원인이 되었습니다. 그러나 여러 RWE 그룹은 Hadoop을 사용해 클레임, 처방전, 전자 의료 기록, HIE 및 소셜 미디어를 포함한 주요 데이터 출처를 결합하여 RWE를 전체적인 관점에서 볼 수 있습니다. 분석가들은 SAS:registered: ,R:registered:, TIBCO:tm: Spotfire:registered: 또는 Tableau:registered: 같은 경제적이고 익숙한 도구를 통해 갇혀 있던 진정한 통찰력을 모두 이용하고 고급 분석 통찰력을 제공하고 있습니다. Hadoop을 사용한 RWE는 다양한 환자 집합에 걸쳐 건강 리소스 이용 최적화, 비용/품질의 취사선택에 대한 총체적인 시각, 치료 경로 분석, 경쟁 가격 연구, 부수 약품 분석, 질병의 지리적 및 인구통계적 확산에 근거한 임상 실험 대상 선정, 파이프라인 약품 후보의 우선 순위 결정, 효능 기준 가격 계약에 사용 가능한 메트릭, 약품 복용 충실도 연구 및 준법 감사에 대비한 영구적인 데이터 저장을 통해 가치를 제공합니다.

시작할 준비가 되셨습니까?