Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

닫기닫기 버튼
CTA

제약 산업 및 임상 시험 분야를 위한
빅 데이터

클라우드 Hortonworks는 리더입니다. Forrester Wave를 읽어보세요.

보고서 다운로드

Finding the cure for inaccessible data

What happens when the data you need is hidden in silos, or when billions of dollars are riding on drug testing data you can’t access? How do you see a long-term view of 10 billion records to understand biological response to drugs? Researchers turn to Hortonworks for advanced analytics on integrated translational data and to gain a holistic view of their pharmaceutical data.

갇혀 있던 제약 산업 데이터의 힘 활용

빅 데이터 통합, 사내외 협업, 포트폴리오 결정 지원, 더 효율적인 임상 실험, 더 빠른 출시 기간, 수율 개선, 안전 개선은 전 세계 제약 회사에서 데이터의 힘을 모두 활용함으로써 얻는 엄청난 이익의 빙산의 일각에 불과합니다.

이용 사례

Merck, 백신 수율 최적화: “황금 배치(Golden Batch)”를 향한 노력

Merck는 제조 데이터를 분석하여 "황금 배치(golden batch)"를 얻는 데 가장 중요한 예측 변수를 분리해 냄으로써 백신 수율을 최적화했습니다. Merck의 리더들은 오랫동안 린(Lean) 제조에 의존하여 생산량을 늘리고 비용을 절감해 왔지만, 수율을 점진적으로 높이는 방법을 찾기가 점점 어려워졌습니다. 이들은 비용을 더욱 절감하고 수율을 개선할 수 있는 새로운 통찰력을 얻기 위해 Open Enterprise Hadoop에 대해 조사했습니다. Merck는 백신 하나에 대해 10년 동안 축적되어 온 255개의 배치에 대한 기록에서 데이터를 검색하기 위해 Hortonworks와 손을 잡았습니다. 16개의 유지보수 및 건물 관리 시스템에 분산되어 있던 이 데이터에는 교정 설정, 기압, 온도 및 습도에 대한 정밀한 센서 데이터가 포함되어 있었습니다. 모든 데이터를 Hortonworks Data Platform으로 모으고 150억 회의 연산을 처리한 후에, Merck는 10년 동안 갖고 있던 질문에 대한 새로운 답을 얻었습니다. Merck 팀은 수백 가지의 변수 중에서 수율을 최적화하는 변수를 가려낼 수 있었습니다. 그 후 회사는 이렇게 얻은 지식을 다른 백신에 적용하면서 양질의 약품을 최대한 저렴한 가격으로 제공하는 데 집중해 왔습니다. InformationWeek의 Doug Henschen이 Merck의 George Llado를 인터뷰한 영상을 보십시오.


전체 약품 제조 공정의 낭비 최소화

Hortonworks의 한 제약 업체 고객은 HDP를 사용하여 단일 뷰를 통해 자사 공급망과 자칭 "낭비와의 전쟁"을 지켜볼 수 있습니다. 운영 팀은 약품 제조에 사용되는 성분의 양을 모두 더해서 실제 제품 출고량과 비교했습니다. 회사는 둘 사이에 커다란 차이가 있음을 알게 되어 낭비와의 전쟁을 시작했으며, HDP를 사용하여 소중한 자원이 어디로 가는지 확인했습니다. 낭비의 근본 원인이 확인되면 미리 정해진 임계값을 초과할 위험이 있을 때 HDP의 실시간 경보로 팀에게 알립니다.


중개 연구: 과학 연구를 개인별 맞춤 약품으로 전환

중개 연구의 목표는 실험실의 연구 결과를 응용하여 인체 건강을 개선하는 것입니다. 연구 학자, 임상 의학자 및 분석가는 Hadoop을 통해 중개 데이터에서 얻은 통찰력을 모두 이용하여 증거에 입각한 약품 프로그램을 추진할 수 있는 역량을 얻습니다. 중개 연구에 사용되는 데이터의 출처는 복잡하고 일반적으로 데이터 사일로에 갇혀 있기 때문에 과학자가 데이터를 통합하여 총체적으로 보기는 어렵습니다. 그 외에 데이터 지연 시간(데이터를 기존 방식의 데이터 저장소에 로드하는 데 발생하는 지연), 정형 데이터 또는 준정형 데이터 유형의 취급, 그리고 변환 및 임상 개발 그룹 간 협업적 분석의 결여 해소를 둘러싼 문제도 있습니다. 통합된 중개 데이터에 대한 고급 분석을 수행하는 데 사용 가능한 경제적이고 신뢰할 수 있는 플랫폼을 찾는 연구 학자들은 Open Enterprise Hadoop으로 고개를 돌리고 있습니다. 변환 및 임상 그룹은 HDP를 사용하여 체학(유전체학, 단백질 체학, 표시 자료 수집 등) 임상 전 데이터 전자 실험실 노트북 임상 데이터 웨어하우스 세포 조직 이미징 데이터 의료 기기 및 센서 파일 출처(Excel 및 SAS 등) 의학 문헌과 같은 데이터 출처에서 주요 데이터를 모아서 합칠 수 있습니다. 분석가는 Hadoop을 사용하여 합성물 또는 약품에 대한 생물적 반응과 분자 기구를 이해하는 데 도움이 되는 총체적인 뷰를 만들 수 있습니다. 이들은 연구 개발 및 임상 실험에 사용할 생물 지표를 밝혀낼 수도 있습니다. 마지막으로, 이들은 모든 데이터가 영원히 원본 형식으로 보관되므로 향후 여러 응용 분야에서 분석에 사용할 수 있다는 사실에 안심할 수 있습니다.


차세대 시퀀싱

IT 시스템으로는 차세대 시퀀싱(NGS) 데이터를 경제적으로 저장하고 처리할 수 없습니다. 예를 들어 기본 시퀀싱 결과는 큰 이미지 형식으로 되어 있어 오랫동안 저장하려면 너무 많은 비용이 듭니다. 포인트 솔루션은 유연하지 못하기 때문에 분석 방법의 변화에 보조를 맞출 수 없고, 종종 맞춤 개조하고 유지하는 데 많은 비용이 필요합니다. Open Enterprise Hadoop은 데이터 과학자와 연구 학자들이 NGS 데이터에서 얻은 통찰력을 모두 이용하면서 신뢰할 수 있는 경제적인 플랫폼에 결과의 원본을 보존할 수 있도록 지원하여 이런 문제를 극복합니다. NGS 과학자들은 Apache Spark 같은 HDP 구성 요소를 통해 얻을 수 있는 대규모 처리 및 분석 기능의 이점을 발견하고 있습니다. 제약 산업의 연구 학자들은 Hadoop을 사용하여 TCGA , GENBank 및 EMBL 같은 외부 유전 데이터 출처에서 다양한 유형의 데이터를 쉽게 수집합니다. 연구 학자들이 Hadoop용으로 특별히 제작된 최첨단 생물 정보학 도구를 이용할 수 있다는 것도 NGS와 관련된 HDP의 분명한 장점입니다. 이런 도구를 사용하면 다양한 NGS 데이터 형식을 분석하고 판독값을 분류하고 결과를 합칠 수 있습니다. 따라서 다음을 통해 NGS를 한 단계 격상시킬 수 있습니다. 큰 NGS 데이터 세트의 일괄 처리. 내부 및 공개 제공되는 외부 시퀀스 데이터 통합. 큰 이미지 파일을 원본 형식으로 저장하는 영구적인 데이터 저장소. 상당한 데이터 처리 및 저장 비용 절감.

실제 데이터를 사용하여 실제 증거를 제공하는 HDP

Real-World Evidence (RWE) promises to quantify improvements to health outcomes and treatments, but this data must be available at scale. High data storage and processing costs, challenges with merging structured and unstructured data, and an over-reliance on informatics resources for analysis-ready data have all slowed the evolution of RWE. With Hadoop, RWE groups are combining key data sources, including claims, prescriptions, electronic medical records, HIE, and social media, to obtain a full view of RWE. Analysts are unlocking real insights and delivering advanced analytic insights via cost-effective and familiar tools such as SAS® ,R®, TIBCO™ Spotfire®, or Tableau®. RWE through Hadoop delivers value with optimal health resource utilization across different patient cohorts, a holistic view of cost/quality tradeoffs, analysis of treatment pathways, competitive pricing studies, concomitant medication analysis, clinical trial targeting based on geographic & demographic prevalence of disease, prioritization of pipelined drug candidates, metrics for performance-based pricing contracts, drug adherence studies, and permanent data storage for compliance audits.

이전 연구에서 얻은 원시 데이터에 영구적으로 액세스

HDP Uses Real-World Data to Deliver Real-World Evidence
Real-World Evidence (RWE) promises to quantify improvements to health outcomes and treatments, but this data must be available at scale. High data storage and processing costs, challenges with merging structured and unstructured data, and an over-reliance on informatics resources for analysis-ready data have all slowed the evolution of RWE. With Hadoop, RWE groups are combining key data sources, including claims, prescriptions, electronic medical records, HIE, and social media, to obtain a full view of RWE. Analysts are unlocking real insights and delivering advanced analytic insights via cost-effective and familiar tools such as SAS:registered: ,R:registered:, TIBCO:tm: Spotfire:registered:, or Tableau:registered:. RWE through Hadoop delivers value with optimal health resource utilization across different patient cohorts, a holistic view of cost/quality tradeoffs, analysis of treatment pathways, competitive pricing studies, concomitant medication analysis, clinical trial targeting based on geographic & demographic prevalence of disease, prioritization of pipelined drug candidates, metrics for performance-based pricing contracts, drug adherence studies, and permanent data storage for compliance audits.

시작할 준비가 되셨습니까?