首頁 > 環(huán)保節(jié)能

AI加入疫情研究一線,用深度學(xué)習(xí)算法尋找肺炎病毒宿主

來源:環(huán)保節(jié)能網(wǎng)
時(shí)間:2024-08-19 23:37:57
熱度:

AI加入疫情研究一線,用深度學(xué)習(xí)算法尋找肺炎病毒宿主原創(chuàng) 機(jī)器之能 機(jī)器之能武漢新型冠狀病毒肺炎的疫情仍在不斷擴(kuò)散。隨著確診人數(shù)的增多,需要盡快確定可能感染武漢2019年新型冠狀病

原創(chuàng) 機(jī)器之能 機(jī)器之能
武漢新型冠狀病毒肺炎的疫情仍在不斷擴(kuò)散。隨著確診人數(shù)的增多,需要盡快確定可能感染武漢2019年新型冠狀病毒(2019-nCoV)的潛在宿主與中間宿主,切斷病毒傳播鏈。
近期一篇研究論文指出,基于深度學(xué)習(xí)的病毒宿主預(yù)測方法,檢測出蝙蝠和水貂可能是新型冠狀病毒的兩個(gè)潛在宿主,其中水貂可能為中間宿主。這種方式區(qū)別于其他傳統(tǒng)檢測方法,可視為AI技術(shù)在病毒檢測中的重大突破。
基于AI技術(shù)的深度學(xué)習(xí)推測病毒宿的方法已經(jīng)有所應(yīng)用,可以減少病毒檢測過程中的重復(fù)工作,或可視為AI在對抗疫情的重要突破。
近期一篇研究論文指出,基于深度學(xué)習(xí)的病毒宿主預(yù)測方法,檢測出蝙蝠和水貂可能是新型冠狀病毒的兩個(gè)潛在宿主,其中水貂可能為中間宿主。這種方式區(qū)別于其他傳統(tǒng)檢測方法,可視為AI技術(shù)在病毒檢測中的重大突破。
北京大學(xué)工學(xué)院教授朱懷球團(tuán)隊(duì)一篇題為《深度學(xué)習(xí)算法預(yù)測新型冠狀病毒的宿主和感染性》的研究發(fā)于1月25日表于bioRxiv預(yù)印版平臺。
該研究提出一種基于深度學(xué)習(xí)的病毒宿主預(yù)測方法,用于檢測以DNA序列為輸入的病毒能感染哪種宿主,并將其應(yīng)用于武漢2019年新型冠狀病毒(2019-nCoV)。
為了構(gòu)建病毒宿主預(yù)測VHP模型,朱懷球團(tuán)隊(duì)使用了雙路卷積神經(jīng)網(wǎng)絡(luò)(BiPathCNN),其中每個(gè)病毒序列分別由其堿基和密碼子的一個(gè)熱矩陣表示。
所謂雙路卷積神經(jīng)網(wǎng)絡(luò)(BiPathCNN),即針對相同構(gòu)造的卷積神經(jīng)網(wǎng)絡(luò)輸入同樣的數(shù)據(jù)集也會提取到不同特征的情況,為利用該差異挖掘圖像的深層特征,提出一種雙路卷積神經(jīng)網(wǎng)絡(luò)模型的圖像分類算法。
考慮到輸入序列長度的差異,該研究分別建立了兩個(gè)BiPathCNN(BiPathCNN-A和BiPathCNN-B),分別用于預(yù)測100bp到400bp和400bp到800bp的病毒序列宿主。
北京大學(xué)工學(xué)院副院長朱懷球教授
朱懷球團(tuán)隊(duì)將病毒的宿主分為五類,包括植物、細(xì)菌、無脊椎動物、脊椎動物和人類。
在病毒序列的實(shí)際應(yīng)用中,通過輸入病毒核苷酸序列,VHP將輸出每種宿主類型,分別反映每種宿主類型內(nèi)的感染性。
研究推測,與感染其他脊椎動物的冠狀病毒相比,蝙蝠冠狀病毒與新型冠狀病毒具有更相似的感染模式。此外,通過比較所有宿主在脊椎動物上的病毒傳染模式,發(fā)現(xiàn)水貂病毒的傳染性模式更接近新型冠狀病毒。
研究表明,新型冠狀病毒的6個(gè)基因組都極有可能感染人類。預(yù)測結(jié)果提示,新型冠狀病毒具有與嚴(yán)重急性呼吸綜合征冠狀病毒(SARS-CoV)、蝙蝠SARS樣冠狀病毒(Bat SARS-like CoV)和中東呼吸綜合征冠狀病毒(MERS-CoV)一樣強(qiáng)大的病毒感染力。
基于AI技術(shù)的深度學(xué)習(xí)推測病毒宿的方法已經(jīng)有所應(yīng)用,可以減少病毒檢測過程中的重復(fù)工作,或可視為AI在對抗疫情的重要突破。
2018年11月,英國格拉斯哥大學(xué)研究團(tuán)隊(duì)發(fā)布了一項(xiàng)最新人工智能研究報(bào)告:科學(xué)家借助全新的機(jī)器學(xué)習(xí)算法,可以從基因?qū)用骖A(yù)測埃博拉和寨卡等病毒的天然宿主,從而采取措施預(yù)防這些病毒傳播到人類身上。
目前而言,人類對疾病的認(rèn)知程度相當(dāng)有限,由于病毒與疾病種類的復(fù)雜程度,現(xiàn)階段還很難用人工智能完全替代,大部分情況下,AI在處理復(fù)雜數(shù)據(jù)過程中占據(jù)優(yōu)勢,得出的結(jié)論無法得到完全保證,最后的診斷與判定最終仍需要人來確認(rèn)。
附北京大學(xué)工學(xué)院教授朱懷球團(tuán)隊(duì)發(fā)表論文的主要內(nèi)容
報(bào)告名稱:深度學(xué)習(xí)算法預(yù)測新型冠狀病毒的宿主和感染性
報(bào)告版本:報(bào)告于1月25日發(fā)表至醫(yī)學(xué)研究論文預(yù)印本發(fā)布平臺 medRxiv
研究發(fā)現(xiàn):
研究推測,與感染其他脊椎動物的冠狀病毒相比,蝙蝠冠狀病毒與新型冠狀病毒具有更相似的感染模式。此外,通過比較所有宿主在脊椎動物上的病毒傳染模式,發(fā)現(xiàn)水貂病毒的傳染性模式更接近新型冠狀病毒。
研究表明,新型冠狀病毒的6個(gè)基因組都極有可能感染人類。預(yù)測結(jié)果提示,新型冠狀病毒具有與嚴(yán)重急性呼吸綜合征冠狀病毒(SARS-CoV)、蝙蝠SARS樣冠狀病毒(Bat SARS-like CoV)和中東呼吸綜合征冠狀病毒(MERS-CoV)一樣強(qiáng)大的病毒感染力。
研究方法:
研究使用基于深度學(xué)習(xí)算法開發(fā)的VHP(Virushost prediction,病毒宿主預(yù)測)方法報(bào)告了2019-nCoV宿主的預(yù)測結(jié)果。2018年之前發(fā)布的病毒序列數(shù)據(jù)用于構(gòu)建訓(xùn)練集,而2018年之后發(fā)布的則用于測試。用于訓(xùn)練和測試的數(shù)據(jù)集包括所有DNA病毒的基因組、所有RNA病毒的編碼序列及其在GenBank中的宿主信息。在VHP對2019-nCoV的預(yù)測結(jié)果中,數(shù)值反映了新病毒的感染性,得分模式和p值模式反映了新病毒的感染性模式。
隨著全基因組序列的在線發(fā)布,朱懷球團(tuán)隊(duì)預(yù)測了2019-nCoV的潛在宿主,以及NCBI refseq中的其他44種冠狀病毒和GenBank中的4種蝙蝠SARS樣冠狀病毒。結(jié)果表明,2019年nCoV的6個(gè)基因組均具有很高的感染人類的可能性(p值<0.05)。
除此之外,大多數(shù)報(bào)告的人類感染性冠狀病毒的p值均為VHP法預(yù)測的最低值。2019-nCoV和其他人類冠狀病毒的相似概率說明了2019-nCoV的高風(fēng)險(xiǎn)。
VHP方法以及算法的驗(yàn)證:
為了構(gòu)建VHP模型,朱懷球團(tuán)隊(duì)使用了雙路卷積神經(jīng)網(wǎng)絡(luò)(BiPathCNN),其中每個(gè)病毒序列分別由其堿基和密碼子的一個(gè)熱矩陣表示。
考慮到輸入序列長度的差異,分別建立了兩個(gè)BiPathCNN(BiPathCNN-A和BiPathCNN-B)用于預(yù)測100bp到400bp和400bp到800bp的病毒序列宿主。
用于訓(xùn)練和測試的數(shù)據(jù)集包括所有DNA病毒的基因組、所有RNA病毒的編碼序列及其在GenBank中的宿主信息。為了開發(fā)新病毒潛在宿主類型預(yù)測的方法專家,使用2018年之前發(fā)布的病毒序列數(shù)據(jù)構(gòu)建訓(xùn)練集,而使用2018年之后發(fā)布的病毒序列數(shù)據(jù)進(jìn)行測試。
將病毒的宿主分為五類,包括植物、細(xì)菌、無脊椎動物、脊椎動物和人類。
表2詳細(xì)列出了這五種類型中包含的宿主子類型。在病毒序列的實(shí)際應(yīng)用中,通過輸入病毒核苷酸序列,VHP將輸出每種宿主類型,分別反映每種宿主類型內(nèi)的感染性。此外,VHP提供了5個(gè)p值,用于統(tǒng)計(jì)感染與非感染事件的區(qū)別。
為了評估VHP的性能,朱懷球團(tuán)隊(duì)比較了blast和VHP的AUC(曲線下面積)。比較結(jié)果表明,VHP的平均AUC較高(見表3)。
本報(bào)告中預(yù)測了2019年nCoV感染人類的可能性,并暗示了2019年nCoV的風(fēng)險(xiǎn)。
報(bào)告也顯示,VHP模型可以在公共衛(wèi)生服務(wù)中發(fā)揮重要作用,為預(yù)防可能感染人類的新型病毒提供強(qiáng)有力的幫助,從而提供可靠的預(yù)測宿主和感染人類的潛力。

原標(biāo)題:《AI加入疫情研究一線!用深度學(xué)習(xí)算法尋找肺炎病毒宿主》
閱讀原文