首頁 > 快訊 > 世間印象 > 承啓生物實現純國產硬件高性能分析大規模基因測序數據

承啓生物實現純國產硬件高性能分析大規模基因測序數據

來源:男爵風    閱讀: 1.27W 次
字號:

用手機掃描二維碼 在手機上繼續觀看

手機查看

日前,承啓生物首 次實現了在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據,其速度與當前基於主流Intel和AMD處理器的臺式機和服務器相當。這實現了精 準醫學基因測序領域的純國產流程實用化,在這一領域中國徹 底擺脫了“卡脖子”問題。

承啓生物實現純國產硬件高性能分析大規模基因測序數據

大規模測序,又稱新一代測序、二代測序,將DNA或RNA打斷成許多小片段進行平行測序,一次測序即可得到幾百萬至幾億個小片段的核酸片段序列信息,在生物學研究、疾病診斷、流行病溯源等領域有着廣泛的應用。但產生的海量數據必須經過大量運算才能得到有生物學意義的結論,通常這需要很強算力的計算機或服務器才能在數小時內給出結果。

然而,高性能CPU和GPU高度依賴進口,不但有被國外斷供“卡脖子”的危險,而且進口CPU還可能存在後門,有泄密風險。在政府等對安全性要求極高的場合,以往一直沒有純國產計算機能滿足大規模測序的分析需求,這是由於國產CPU難以滿足需求。

承啓一直在生物信息國產化處理領域做努力,經過深入調研發現,兆芯開先CPU架構的整數性能理論上比較優 秀,實際應用時需要軟件的特定優化才能發揮其全部性能潛力,因此選擇了兆芯開先CPU作爲FANSe算法適配優化的目標。

承啓生物自研的FANSe算法是目前唯 一規模化商用的純國產高性能大規模測序比對算法,2020年其曾創下單機5分鐘分析完一個30X人全基因組測序數據集的世界紀錄,並一直保持至今。算法完全自研帶來了顯著的優勢,可以任意根據CPU的特性而進行特別優化,而依賴於國外知識產權的傳統算法則難以做到。

承啓生物在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據

日前,FANSe算法在純國產平臺上運行成功,CPU是兆芯開先KX-U6780A,固態硬盤來自長江存儲,內存芯片來自長鑫。與之對比的是一臺雙Intel E5V3 (共28核56線程)的服務器,都部署在承啓基因測序分析雲平臺上。在常見的轉錄組、翻譯組、細菌菌羣宏基因組等應用中,純國產計算機的性能僅比服務器慢1%~12%,使用中幾乎感覺不到其性能差異。這也是純國產計算設備在大規模測序數據處理上第 一次在實際應用性能上幾乎追平國際主流服務器。

此前,承啓生物和華大智造聯合發佈了國產大規模測序的全流程,將測序儀、試劑、分析算法等全面實現國產化,不依賴國外知識產權,有力地捍衛了中國精 準醫學的自主權。

如今,承啓再進一步,憑藉專門優化的FANSe算法,將純國產計算設備的應用性能提高到比肩國際主流的水平,標誌着中國的基因測序的安全性和自主可控達到一個全新的高度,不僅能支撐諸多精 準醫學應用,更能在檢驗檢疫、流行病控制、生物戰防治、法醫鑑定等直接關係到國家安全的方面大顯身手。

深圳承啓生物科技有限公司簡介

承啓生物是基於自主核心技術“多組學+信息學”提供醫學服務、IVD及治療方案的綜合性精 準醫學平臺,致力於用生物醫學前沿科技爲人們提供精 準醫療及健康管理解決方案。旗下有四家國家高新技術企業以及一家持牌臨檢中心。

承啓生物擁有完全自主研發並獲得國際高度認可的超高精度基因測序數據分析FANSe算法。該FANSe算法於2020年創造了算法準確度和速度的世界紀錄,被作爲國際人類蛋白質組計劃核心支柱的推薦算法。承啓生物還建立了國內第 一個全自主基因檢測流程,在基因組、轉錄組、翻譯組、蛋白質組、代謝組全組學層次均有精 準的自主技術,該流程被作爲國家醫學生命組學質量控制標準的藍本。(文章來源:互聯網)

社會萬象
國際快訊
人間冷暖
奇聞趣事
世間印象
閒談
歷史名人
民間故事

每日精選

最新文章