極道生物數據平臺

方案概述

測序儀下機數據經過分數據機之后,會存儲到BIOSTACK Data Space數據空間中。在數據存儲的過程中(一邊寫,一邊修改),會通過左側的黃色圖標的Metahunter動態的將元數據,提交到消息總線上去了,消息總線會把這些信息傳遞給后端數據特征庫集群,數據特征庫集群實際上是由數據庫(關系型或數據倉庫),甚至是搜索引擎,如Elastic Search,組成的。在計算分析的過程中,通過數據特征生成的數據集,會作為一個有效的輸入,注入到計算集群中去。計算集群在經過調度計算資源(CPUmemory),以及調度數據的位置之后完成一次分析,而分析完的結果也會再反向注入到數據特征庫集群來豐富數據特征。



榮之聯極道生物數據平臺部署架構圖



主要功能

1)    高速分數據機:可完成下機數據的格式轉化;將轉化后的數據分配到極道存儲平臺(AnnaAlamo;其中數據格式的轉化效率極高,以 Hiseq X10 下機數據為例,分數據效率是普通 bcl2fastq 5-6 !

2)    BIOSTACK數據空間即存儲平臺:極道的數據空間包含 Anna 存儲和 Alamo-D,分別應對高 IOPS 和高帶寬的需求。同時多集群能夠實現統一部署、統一管理。

3)    BIOSTACK數據管理平臺:存儲系統端內置的“Metahunter”模塊,智能追蹤數據和元數據的變化,在服務器端通過 MetaView 自動提取數據特征信息,使得用戶無需關心數據的存儲路徑,通過數據特征就能實現快速數據發現、數據組合、多維度數據觀察,極大的提升了用戶數據管理的效率。

4)    BIOSTACK分布式計算平臺:Bioflow 計算調度系統,采用全分布式架構設計,能夠多個調度協同工作,消除了傳統集群調度器自身的瓶頸,同時聯合同構、異構集群,實現跨多個計算集群、存儲集群調度生物作業任務,保證無論是后端集 群規模還是調度器本身都不會限制整體生物信息分析計算系統的擴展能力; docker 封裝應用程序,免除應用部署難題;通過 bioflow 封裝流程,免除用戶 編寫流程的煩惱。

5)    可視化流程分析和報告輸出:榮之聯極道BIOSTACK生物數據分析云平臺支持自主發布分析工具,用戶不需要再命令行下編寫腳本,通過可視化界面填寫參數,就可以生成自己專屬的工具,并在流程編輯中,通過鼠標拖拽的方式,將工具串成流程,全力支持企業定制化自有流程。

方案價值

1) 一體化設計,工廠預集成,“插電即用”

?  BioStack采用工廠預集成方式,在出廠前完成軟硬件系統的測試和調優,所以整體性能更加優異,也更加穩定可靠。

?  BioStack真正做到了端到端產品級的解決方案,無需復雜的系統部署和軟件調試,真正做到開箱插電即用。

2) 嵌入優化的分析流程、數據集和參數

?  BioStack包括了行業主流的基因組分析軟件、生物信息流程,確保輸出的結果符合實驗和數據分析的要求 ;

?  預先配置的專業數據集,幫助真正實現本地數據分析的快捷性、可靠性和操作標準化,減少復雜數據集導入的繁瑣及相應人為錯誤的引入。

3) 分布式計算與存儲突破集群規模瓶頸

?  BioStack采用分布式存儲系統來解決生物信息數據空間和數據持久化的問題,使得空間和性能可以根據業務需要,彈性擴展;

?  BioStackBioflow作為分布式計算、調度引擎可以讓多個集群在一起,統一的調度,讓用戶看起來是一個集群一樣。可以啟動多個調度隊列和調度實例,多調度器之間相互協作,突破單一調度器的性能瓶頸。

4) BioStack統一管理系統,應用操作簡單直觀

?  BioStack中集成了常用的生物信息分析軟件、數據集和流程,用戶無需自行安裝配置軟件以及數據集,大幅節省了用戶配置軟件的時間。分析軟件的流程化和分析結果可視化,為基因組研究提供了一站式的解決方案。這在提高工作效率的同時,也降低了對分析和操作人員的門檻需求,擺脫了傳統繁瑣的命令行操作,真正實現了“傻瓜化”的操作方式。

?  所有軟件、數據集和流程均可在Web界面下直接操作,其中流程部分可以實現一鍵式的運行,為用戶提供極大便利。

5) 可視化流程組織和報告輸出

?  BIOSTACK支持自主發布分析工具,用戶不需要再命令行下編寫腳本,通過可視化界面填寫參數,就可以生成自己專屬的工具,并在流程編輯中,通過鼠標拖拽的方式,將工具串成流程,全力支持企業定制化自有流程。


客戶案例

相關新聞

產品推薦

極道極道生物數據平臺
上海时时彩哪里有卖