基因組學領域已經成熟階段,DNA測序項目已達到人口規模。雖然許多組織投資大型基因組數據集,如英國生物庫,很少有專業知識或適當的技術架構將這些大量的原始DNAseq數據轉化為可操作的見解。
Regeneron,一家領先的生物技術公司致力於創造治療創新,建立了一個世界上最全麵的基因數據庫和超過500000的外顯。在他們的旅程將這些數據轉化為新穎的治療觀點,Regeneron遇到了許多挑戰。例如,如何啟用快速、準確的查詢從> 300 b數據點嗎?如何加快小說對tb量級統計測試數據?
在這個會話中,Regeneron將分享他們麵臨的挑戰建立世界上最大的基因數據庫,如何克服這些挑戰和一個可伸縮的高性能信息基礎設施由Apache火花™,磚和AWS和關鍵的經驗教訓。
加入這個網絡研討會學習: