이메일로 Hortonworks의 새 업데이트를 받으세요.

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

Sign up for the Developers Newsletter

한 달에 한 번 빅 데이터와 관련한 최신 인사이트, 동향, 분석 정보, 지식을 받아 보세요.

CTA

시작하기

클라우드

시작할 준비가 되셨습니까?

Sandbox 다운로드

어떤 도움이 필요하십니까?

* 저는 언제든지 구독을 해지할 수 있다는 점을 이해합니다. 또한 저는 Hortonworks이 개인정보 보호정책에 추가된 정보를 확인하였습니다.
닫기닫기 버튼
CTA

제약 산업 및 임상 시험 분야를 위한
빅 데이터

Hortonworks는 리더입니다. Forrester Wave를 읽어보세요.

보고서 다운로드

Finding the Cure for Inaccessible Data

필요한 데이터가 사일로에 숨겨져 있거나 액세스할 수 없는 수십억 달러 규모의 약물 테스트 데이터의 경우에는 어떻게 합니까? 10억 개의 장기 기록을 보고 어떻게 약물에 대한 생물학적 반응을 파악할까요? 제약 업계 연구자들은 Hortonworks의 통합 변환 데이터에 관한 고급 빅 데이터 분석을 이용해 제약 데이터를 전체적으로 볼 수 있습니다.

갇혀 있던 제약 산업 데이터의 힘 활용

빅 데이터 통합, 제약 빅 데이터 분석, 사내외 협업, 포트폴리오 결정 지원, 더 효율적인 임상 실험, 더 빠른 출시 기간, 수율 개선, 안전 개선은 전 세계 제약 회사에서 제약 빅 데이터의 힘을 모두 활용함으로써 얻는 엄청난 이익의 빙산의 일각에 불과합니다.

이용 사례

Merck, 백신 수율 최적화: “황금 배치(Golden Batch)”를 향한 노력

Merck는 제조 데이터를 분석하여 "황금 배치(golden batch)"를 얻는 데 가장 중요한 예측 변수를 분리해 냄으로써 백신 수율을 최적화했습니다. Merck의 리더들은 오랫동안 린(Lean) 제조에 의존하여 생산량을 늘리고 비용을 절감해 왔지만, 수율을 점진적으로 높이는 방법을 찾기가 점점 어려워졌습니다. 이들은 비용을 더욱 절감하고 수율을 개선할 수 있는 새로운 통찰력을 얻기 위해 Open Enterprise Hadoop에 대해 조사했습니다. Merck는 백신 하나에 대해 10년 동안 축적되어 온 255개의 배치에 대한 기록에서 데이터를 검색하기 위해 Hortonworks와 손을 잡았습니다. 16개의 유지보수 및 건물 관리 시스템에 분산되어 있던 이 데이터에는 교정 설정, 기압, 온도 및 습도에 대한 정밀한 센서 데이터가 포함되어 있었습니다. 모든 데이터를 Hortonworks Data Platform으로 모으고 150억 회의 연산을 처리한 후에, Merck는 10년 동안 갖고 있던 질문에 대한 새로운 답을 얻었습니다. Merck 팀은 수백 가지의 변수 중에서 수율을 최적화하는 변수를 가려낼 수 있었습니다. 그 후 회사는 이렇게 얻은 지식을 다른 백신에 적용하면서 양질의 약품을 최대한 저렴한 가격으로 제공하는 데 집중해 왔습니다. InformationWeek의 Doug Henschen이 Merck의 George Llado를 인터뷰한 영상을 보십시오.


전체 약품 제조 공정의 낭비 최소화

Hortonworks의 한 제약 업체 고객은 HDP를 사용하여 단일 뷰를 통해 자사 공급망과 자칭 "낭비와의 전쟁"을 지켜볼 수 있습니다. 운영 팀은 약품 제조에 사용되는 성분의 양을 모두 더해서 실제 제품 출고량과 비교했습니다. 회사는 둘 사이에 커다란 차이가 있음을 알게 되어 낭비와의 전쟁을 시작했으며, HDP 빅 데이터 분석을 사용하여 소중한 자원이 어디로 가는지 확인했습니다. 낭비의 근본 원인이 확인되면 미리 정해진 임계값을 초과할 위험이 있을 때 HDP의 실시간 경보로 팀에게 알립니다.


중개 연구: 과학 연구를 개인별 맞춤 약품으로 전환

중개 연구의 목표는 실험실의 연구 결과를 응용하여 인체 건강을 개선하는 것입니다. 연구 학자, 임상 의학자 및 분석가는 Hadoop을 통해 중개 데이터에서 얻은 통찰력을 모두 이용하여 증거에 입각한 약품 프로그램을 추진할 수 있는 역량을 얻습니다. 중개 연구에 사용되는 데이터의 출처는 복잡하고 일반적으로 데이터 사일로에 갇혀 있기 때문에 과학자가 데이터를 통합하여 전체적으로 보기는 어렵습니다. 그 외에 데이터 지연 시간(데이터를 기존 방식의 데이터 저장소에 로드하는 데 발생하는 지연), 정형 데이터 또는 준정형 데이터 유형의 취급, 그리고 변환 및 임상 개발 그룹 간 협업적 분석의 결여 해소를 둘러싼 문제도 있습니다. 연구 학자들은 이제 임상 실험에서 빅 데이터를 관리하고 통합된 중개 데이터에 대한 고급 분석을 수행하는 데 사용 가능한 경제적이고 신뢰할 수 있는 플랫폼으로 Open Enterprise Hadoop에 의지하고 있습니다. 변환 및 임상 그룹은 HDP를 사용하여 체학(유전체학, 단백질 체학, 표시 자료 수집 등) 임상 전 데이터 전자 실험실 노트북 임상 데이터 웨어하우스 세포 조직 이미징 데이터 의료 기기 및 센서 파일 출처(Excel 및 SAS 등) 의학 문헌과 같은 데이터 출처에서 주요 데이터를 모아서 합칠 수 있습니다. 분석가는 Hadoop을 사용하여 합성물 또는 약품에 대한 생물적 반응과 분자 기구를 이해하는 데 도움이 되는 전체적인 뷰를 만들 수 있습니다. 이들은 연구 개발 및 임상 실험에 사용할 생물 지표를 밝혀낼 수도 있습니다. 마지막으로, 이들은 모든 데이터가 영원히 원본 형식으로 보관되므로 향후 여러 응용 분야에서 분석에 사용할 수 있다는 사실에 안심할 수 있습니다.


차세대 시퀀싱

IT 시스템으로는 차세대 시퀀싱(NGS) 데이터를 경제적으로 저장하고 처리할 수 없습니다. 예를 들어 기본 시퀀싱 결과는 큰 이미지 형식으로 되어 있어 오랫동안 저장하려면 너무 많은 비용이 듭니다. 포인트 솔루션은 유연하지 못하기 때문에 분석 방법의 변화에 보조를 맞출 수 없고, 종종 맞춤 개조하고 유지하는 데 많은 비용이 필요합니다. Open Enterprise Hadoop은 데이터 과학자와 연구 학자들이 NGS 데이터에서 얻은 통찰력을 모두 이용하면서 신뢰할 수 있는 경제적인 플랫폼에 결과의 원본을 보존할 수 있도록 지원하여 이런 문제를 극복합니다. NGS 과학자들은 Apache Spark 같은 HDP 구성 요소를 통해 얻을 수 있는 대규모 처리 및 분석 기능의 이점을 발견하고 있습니다. 제약 산업의 연구 학자들은 Hadoop을 사용하여 TCGA , GENBank 및 EMBL 같은 외부 유전 데이터 출처에서 다양한 유형의 데이터를 쉽게 수집합니다. 연구 학자들이 Hadoop용으로 특별히 제작된 최첨단 생물 정보학 도구를 이용할 수 있다는 것도 NGS와 관련된 HDP의 분명한 장점입니다. 이런 도구를 사용하면 다양한 NGS 데이터 형식을 분석하고 판독값을 분류하고 결과를 합칠 수 있습니다. 따라서 다음을 통해 NGS를 한 단계 격상시킬 수 있습니다. 큰 NGS 데이터 세트의 일괄 처리. 내부 및 공개 제공되는 외부 시퀀스 데이터 통합. 큰 이미지 파일을 원본 형식으로 저장하는 영구적인 데이터 저장소. 상당한 데이터 처리 및 저장 비용 절감.

실제 데이터를 사용하여 실제 증거를 제공하는 HDP

RWE(실제 증거)는 개선 사항을 건강 결과와 치료로 수량화할 것을 약속하지만, 이 데이터는 대규모로 제공되어야 합니다. 높은 데이터 저장 및 처리 비용, 정형 및 비정형 데이터의 병합 문제, 그리고 즉시 분석 가능한 데이터를 얻기 위한 정보학 리소스에 대한 지나친 의존도는 모두 RWE의 발전 속도를 더디게 하는 원인이 되었습니다. 그러나 여러 RWE 그룹은 Hadoop을 사용해 클레임, 처방전, 전자 의료 기록, HIE 및 소셜 미디어를 포함한 주요 데이터 출처를 결합하여 RWE를 전체적인 관점에서 볼 수 있습니다. 제약 업계의 빅 데이터 분석으로 분석가들은 SAS®, R®, TIBCO™ Spotfire® 또는 Tableau® 같은 경제적이고 익숙한 도구를 통해 갇혀 있던 진정한 통찰력을 모두 이용하고 고급 인사이트를 제공하고 있습니다. Hadoop을 사용한 RWE는 다음을 통해 가치를 제공합니다. • 다양한 환자 집합에 걸쳐 건강 리소스 이용 최적화 • 비용/품질의 취사선택에 대한 총체적인 시각 • 치료 경로 분석 • 경쟁 가격 연구 • 부수 약품 분석 • 질병의 지리적 및 인구통계적 확산에 근거한 임상 실험 대상 선정 • 파이프라인 약품 후보의 우선 순위 결정 • 효능 기준 가격 계약에 사용 가능한 메트릭 • 약품 복용 충실도 연구 • 준법 감사에 대비한 영구적인 데이터 저장​

이전 연구에서 얻은 원시 데이터에 영구적으로 액세스

HDP는 실제 데이터를 사용하여 실제 증거 제공
RWE(실제 증거)는 개선 사항을 건강 결과와 치료로 수량화할 것을 약속하지만, 이 데이터는 대규모로 제공되어야 합니다. 높은 데이터 저장 및 처리 비용, 정형 및 비정형 데이터의 병합 문제, 그리고 즉시 분석 가능한 데이터를 얻기 위한 정보학 리소스에 대한 지나친 의존도는 모두 RWE의 발전 속도를 더디게 하는 원인이 되었습니다. 그러나 여러 RWE 그룹은 Hadoop을 사용해 클레임, 처방전, 전자 의료 기록, HIE 및 소셜 미디어를 포함한 주요 데이터 출처를 결합하여 RWE를 전체적인 관점에서 볼 수 있습니다. 분석가들은 SAS:registered: ,R:registered:, TIBCO:tm: Spotfire:registered: 또는 Tableau:registered: 같은 경제적이고 익숙한 도구를 통해 갇혀 있던 진정한 통찰력을 모두 이용하고 고급 분석 통찰력을 제공하고 있습니다. Hadoop을 사용한 RWE는 다양한 환자 집합에 걸쳐 건강 리소스 이용 최적화, 비용/품질의 취사선택에 대한 총체적인 시각, 치료 경로 분석, 경쟁 가격 연구, 부수 약품 분석, 질병의 지리적 및 인구통계적 확산에 근거한 임상 실험 대상 선정, 파이프라인 약품 후보의 우선 순위 결정, 효능 기준 가격 계약에 사용 가능한 메트릭, 약품 복용 충실도 연구 및 준법 감사에 대비한 영구적인 데이터 저장을 통해 가치를 제공합니다.

시작할 준비가 되셨습니까?