Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics information and knowledge of Big Data.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

닫기닫기 버튼
CTA

제약 산업 및 임상 시험 분야를 위한
빅 데이터

클라우드 Hortonworks는 리더입니다. Forrester Wave를 읽어보세요.

보고서 다운로드

액세스할 수없는 데이터에 대한 해결 방법 찾기

What happens when the data you need is hidden in silos, or when billions of dollars are riding on drug testing data you can’t access? How do you see a long-term view of 10 billion records to understand biological response to drugs? Researchers in the pharmaceutical industry turn to Hortonworks for advanced big data analytics on integrated translational data and to gain a holistic view of their pharmaceutical data.

갇혀 있던 제약 산업 데이터의 힘 활용

Big Data integration, pharmaceutical big data analytics, internal and external collaboration, portfolio decision support, more efficient clinical trials, faster time to market, improved yields, improved safety - these are just a few of the benefits pharmaceutical companies around the world achieve by tapping into the full power of their pharma big data.

이용 사례

Merck, 백신 수율 최적화: “황금 배치(Golden Batch)”를 향한 노력

Merck는 제조 데이터를 분석하여 "황금 배치(golden batch)"를 얻는 데 가장 중요한 예측 변수를 분리해 냄으로써 백신 수율을 최적화했습니다. Merck의 리더들은 오랫동안 린(Lean) 제조에 의존하여 생산량을 늘리고 비용을 절감해 왔지만, 수율을 점진적으로 높이는 방법을 찾기가 점점 어려워졌습니다. 이들은 비용을 더욱 절감하고 수율을 개선할 수 있는 새로운 통찰력을 얻기 위해 Open Enterprise Hadoop에 대해 조사했습니다. Merck는 백신 하나에 대해 10년 동안 축적되어 온 255개의 배치에 대한 기록에서 데이터를 검색하기 위해 Hortonworks와 손을 잡았습니다. 16개의 유지보수 및 건물 관리 시스템에 분산되어 있던 이 데이터에는 교정 설정, 기압, 온도 및 습도에 대한 정밀한 센서 데이터가 포함되어 있었습니다. 모든 데이터를 Hortonworks Data Platform으로 모으고 150억 회의 연산을 처리한 후에, Merck는 10년 동안 갖고 있던 질문에 대한 새로운 답을 얻었습니다. Merck 팀은 수백 가지의 변수 중에서 수율을 최적화하는 변수를 가려낼 수 있었습니다. 그 후 회사는 이렇게 얻은 지식을 다른 백신에 적용하면서 양질의 약품을 최대한 저렴한 가격으로 제공하는 데 집중해 왔습니다. InformationWeek의 Doug Henschen이 Merck의 George Llado를 인터뷰한 영상을 보십시오.


전체 약품 제조 공정의 낭비 최소화

One Hortonworks pharmaceutical customer uses HDP for a single view of its supply chain and their self-declared “War on Waste”. The operations team added up the ingredients going into making their drugs, and compared that with the physical product they shipped. They found a big gap between the two and launched their War on Waste, using HDP big data analytics to identify where those valuable resources were going. Once it identifies those root causes of waste, real-time alerts in HDP notify the team when they are at risk of exceeding pre-determined thresholds.


중개 연구: 과학 연구를 개인별 맞춤 약품으로 전환

The goal of Translational Research is to apply the results of laboratory research towards improving human health. Hadoop empowers researchers, clinicians, and analysts to unlock insights from translational data to drive evidence-based medicine programs. The data sources for translational research are complex and typically locked in data siloes, making it difficult for scientists to obtain an integrated, holistic view of their data. Other challenges revolve around data latency (the delay in getting data loaded into traditional data stores), handling unstructured and semi-structured types of data, and bridging lack of collaborative analysis between translation and clinical development groups. Researchers are turning to Open Enterprise Hadoop as a cost-effective, reliable platform for managing big data in clinical trials and performing advanced analytics on integrated translational data. HDP allows translational and clinical groups to combine key data from sources such as: Omics (genomics, proteomics, transcription profiling, etc) Preclinical data Electronic lab notebooks Clinical data warehouses Tissue imaging data Medical devices and sensors File sources (such as Excel and SAS) Medical literature Through Hadoop, analysts can build a holistic view that helps them understand biological response and molecular mechanisms for compounds or drugs. They’re also able to uncover biomarkers for use in R&D and clinical trials. Finally, they can be assured that all data will be stored forever, in its native format, for analysis with multiple future applications.


차세대 시퀀싱

IT systems cannot economically store and process next generation sequencing (NGS) data. For example, primary sequencing results are in large image format and are too costly to store over the long term. Point solutions have lacked the flexibility to keep up with changing analytical methodologies, and are often expensive to customize and maintain. Open Enterprise Hadoop overcomes those challenges by helping data scientists and researchers unlock insights from NGS data while preserving the raw results on a reliable, cost-effective platform. NGS scientists are discovering the benefits of large-scale processing and analysis delivered by HDP components such as Apache Spark. Pharmaceutical researchers are using Hadoop to easily ingest diverse data types from external sources of genetic data, such as TCGA , GENBank , and EMBL. Another clear advantage of HDP for NGS is that researchers have access to cutting-edge bioinformatics tools built specifically for Hadoop. These enable analysis of various NGS data formats, sorting of reads, and merging of results. This takes NGS to the next level through: Batch processing of large NGS data sets Integration of internal with publically available external sequence data Permanent data storage for large image files, in their native format Substantial cost savings on data processing and storage.

실제 데이터를 사용하여 실제 증거를 제공하는 HDP

Real-World Evidence (RWE) promises to quantify improvements to health outcomes and treatments, but this data must be available at scale. High data storage and processing costs, challenges with merging structured and unstructured data, and an over-reliance on informatics resources for analysis-ready data have all slowed the evolution of RWE. With Hadoop, RWE groups are combining key data sources, including claims, prescriptions, electronic medical records, HIE, and social media, to obtain a full view of RWE. With big data analytics in the pharmaceutical industry, analysts are unlocking real insights and delivering advanced insights via cost-effective and familiar tools such as SAS® ,R®, TIBCO™ Spotfire®, or Tableau®. RWE through Hadoop delivers value with optimal health resource utilization across different patient cohorts, a holistic view of cost/quality tradeoffs, analysis of treatment pathways, competitive pricing studies, concomitant medication analysis, clinical trial targeting based on geographic & demographic prevalence of disease, prioritization of pipelined drug candidates, metrics for performance-based pricing contracts, drug adherence studies, and permanent data storage for compliance audits.

이전 연구에서 얻은 원시 데이터에 영구적으로 액세스

HDP는 실제 데이터를 사용하여 실제 증거 제공
RWE(실제 증거)는 개선 사항을 건강 결과와 치료로 수량화할 것을 약속하지만, 이 데이터는 대규모로 제공되어야 합니다. 높은 데이터 저장 및 처리 비용, 정형 및 비정형 데이터의 병합 문제, 그리고 즉시 분석 가능한 데이터를 얻기 위한 정보학 리소스에 대한 지나친 의존도는 모두 RWE의 발전 속도를 더디게 하는 원인이 되었습니다. 그러나 여러 RWE 그룹은 Hadoop을 사용해 클레임, 처방전, 전자 의료 기록, HIE 및 소셜 미디어를 포함한 주요 데이터 출처를 결합하여 RWE를 전체적인 관점에서 볼 수 있습니다. 분석가들은 SAS:registered: ,R:registered:, TIBCO:tm: Spotfire:registered: 또는 Tableau:registered: 같은 경제적이고 익숙한 도구를 통해 갇혀 있던 진정한 통찰력을 모두 이용하고 고급 분석 통찰력을 제공하고 있습니다. Hadoop을 사용한 RWE는 다양한 환자 집합에 걸쳐 건강 리소스 이용 최적화, 비용/품질의 취사선택에 대한 총체적인 시각, 치료 경로 분석, 경쟁 가격 연구, 부수 약품 분석, 질병의 지리적 및 인구통계적 확산에 근거한 임상 실험 대상 선정, 파이프라인 약품 후보의 우선 순위 결정, 효능 기준 가격 계약에 사용 가능한 메트릭, 약품 복용 충실도 연구 및 준법 감사에 대비한 영구적인 데이터 저장을 통해 가치를 제공합니다.

시작할 준비가 되셨습니까?