AI預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)形狀不是單一結(jié)構(gòu)

2021-08-18 16:07:28

近日,美國(guó)華盛頓大學(xué)和英國(guó)DeepMind公司分別公布了多年工作的成果:先進(jìn)的建模程序,可以預(yù)測(cè)蛋白質(zhì)和一些分子復(fù)合物的精確三維原子結(jié)構(gòu)。其中一個(gè)研究小組報(bào)告說(shuō),他們已經(jīng)使用最新開(kāi)發(fā)的人工智能(AI)程序預(yù)測(cè)了來(lái)自人類和20種模式生物的35萬(wàn)種蛋白質(zhì)結(jié)構(gòu)——如大腸桿菌、酵母和果蠅。未來(lái)幾個(gè)月里,他們計(jì)劃將所有已編目的蛋白質(zhì)列入模型蛋白質(zhì)名單,大約有1億個(gè)分子。

“這是相當(dāng)驚人的。”美國(guó)馬里蘭大學(xué)蛋白質(zhì)專家John Moult說(shuō),他每?jī)赡昱e辦一次名為“關(guān)鍵的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法”(CASP)的比賽。Moult表示,幾十年來(lái),結(jié)構(gòu)生物學(xué)家一直夢(mèng)想有一天,計(jì)算機(jī)模型能增加從X射線晶體學(xué)等實(shí)驗(yàn)方法中獲得的極精確蛋白質(zhì)形狀的數(shù)量。“我從沒(méi)想過(guò)這個(gè)夢(mèng)想會(huì)成真。”Moult說(shuō)。

這一名為AlphaFold的模型是DeepMind公司研究人員的成果,DeepMind是一家隸屬于谷歌母公司Alphabet的英國(guó)AI公司。2020年,AlphaFold“橫掃”了CASP。但是DeepMind研究人員沒(méi)有透露繪制蛋白質(zhì)形狀的理論細(xì)節(jié),特別是AlphaFold的底層計(jì)算機(jī)代碼。

這種情況已開(kāi)始改變。7月15日,華盛頓大學(xué)的Minkyung Baek和David Baker研究小組報(bào)告說(shuō),他們創(chuàng)建了一個(gè)名為RoseTTAFold的高度精確的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)程序,并公開(kāi)發(fā)布了該程序。相關(guān)成果在線發(fā)表于《科學(xué)》。與此同時(shí),《自然》發(fā)表了一篇由DeepMind研究人員Demis Hassabis和John Jumper撰寫(xiě)的論文,公布了AlphaFold的細(xì)節(jié)。

兩個(gè)程序都使用AI在龐大的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中識(shí)別折疊模式。這些程序通過(guò)考慮蛋白質(zhì)中相鄰氨基酸相互作用的基本物理和生物學(xué)規(guī)則,計(jì)算出未知蛋白質(zhì)最可能的結(jié)構(gòu)。論文顯示,Baek和Baker使用RoseTTAFold創(chuàng)建了一個(gè)包含數(shù)百個(gè)G蛋白偶聯(lián)受體(一類常見(jiàn)的藥物靶點(diǎn))的結(jié)構(gòu)數(shù)據(jù)庫(kù)。

而DeepMind研究人員創(chuàng)造了35萬(wàn)個(gè)預(yù)測(cè)結(jié)構(gòu),是以前實(shí)驗(yàn)方法得到的結(jié)果的兩倍多。研究人員表示,AlphaFold產(chǎn)生了近44%的人類蛋白質(zhì)結(jié)構(gòu),涵蓋了人類基因組編碼的近60%的氨基酸。AlphaFold確定許多其他人類蛋白質(zhì)是“無(wú)序的”,這意味著它們的形狀不是單一結(jié)構(gòu)。

此外,DeepMind與歐洲分子生物學(xué)實(shí)驗(yàn)室合作共建了一個(gè)新的蛋白質(zhì)預(yù)測(cè)數(shù)據(jù)庫(kù),可以在網(wǎng)上免費(fèi)訪問(wèn)。“能提供這種服務(wù)真是太棒了。” Baker說(shuō),“這真的會(huì)加快研究步伐。”因?yàn)榈鞍踪|(zhì)的3D結(jié)構(gòu)在很大程度上決定了它的功能,所以這一數(shù)據(jù)庫(kù)便于生物學(xué)家厘清數(shù)千種未知蛋白質(zhì)是如何工作的。

標(biāo)簽: AI 預(yù)測(cè) 蛋白質(zhì) 形狀

關(guān)閉
新聞速遞