從AlphaGo到AlphaFold,什么是AI工具的最佳用法?
2024-11-17
應(yīng)用到了更多領(lǐng)域。
一方面,AlphaFold的結(jié)構(gòu)解析能力極大解放了生物學(xué)家們的研究:有研究團(tuán)隊(duì)還在搜索另一個(gè)包含從海洋和廢水中提取的DNA序列的數(shù)據(jù)庫(kù),試圖發(fā)現(xiàn)新的食塑酶。通過(guò)讓AlphaFold快速預(yù)測(cè)數(shù)千個(gè)蛋白的結(jié)構(gòu),該團(tuán)隊(duì)希望能更好地理解酶是如何通過(guò)演化擁有分解塑料的能力,并能進(jìn)一步優(yōu)化它們。
哈佛大學(xué)演化生物學(xué)家SergeyOvchinnikov認(rèn)為,這種將任何蛋白編碼基因序列轉(zhuǎn)化為可靠結(jié)構(gòu)的能力,對(duì)于演化研究來(lái)說(shuō)非常有用。研究人員通過(guò)比較基因序列來(lái)確定不同物種的生物體與它們基因之間的親緣關(guān)系。而對(duì)于親緣關(guān)系較遠(yuǎn)的基因來(lái)說(shuō),這種比較可能無(wú)法發(fā)現(xiàn)演化近親,因?yàn)檫@些序列已經(jīng)變了很多。但通過(guò)比較變化速度比基因序列更慢的蛋白質(zhì)結(jié)構(gòu),研究人員或許能揭示之前沒(méi)注意到的古代關(guān)系。
另一方面,AlphaFold還是個(gè)絕佳的實(shí)驗(yàn)工具,AlphaFold能提供一個(gè)初步預(yù)測(cè),之后再由實(shí)驗(yàn)驗(yàn)證或優(yōu)化。比如,來(lái)自X射線晶體學(xué)的原始數(shù)據(jù)以衍射X射線的圖樣呈現(xiàn)。一般來(lái)說(shuō),科學(xué)家需要對(duì)蛋白質(zhì)結(jié)構(gòu)有個(gè)初步猜測(cè),才能解釋這些圖樣。而AlphaFold的預(yù)測(cè)讓大部分X射線圖樣不再需要這些方法。
另外,AlphaFold不僅改變了科學(xué)家測(cè)定蛋白質(zhì)結(jié)構(gòu)的方式。一些研究人員還在利用這些工具打造全新的蛋白質(zhì)。華盛頓大學(xué)生物化學(xué)家、蛋白質(zhì)設(shè)計(jì)和結(jié)構(gòu)預(yù)測(cè)領(lǐng)域帶頭人DavidBaker表示,深度學(xué)習(xí)徹底改變了他們團(tuán)隊(duì)設(shè)計(jì)蛋白質(zhì)的方式。Baker的團(tuán)隊(duì)讓AlphaFold和另一個(gè)AI工具RoseTTAFold來(lái)設(shè)計(jì)新的蛋白。他們改寫(xiě)了人工智能的代碼,讓軟件在得到隨機(jī)氨基酸序列的情況下,對(duì)它們進(jìn)行優(yōu)化,直到合成出能被這些神經(jīng)網(wǎng)絡(luò)識(shí)別為蛋白的東西。
2021年12月,Baker的研究團(tuán)隊(duì)報(bào)告了他們?cè)诩?xì)菌中表達(dá)了129種這些幻想蛋白,發(fā)現(xiàn)其中約1/5的蛋白會(huì)折疊成類似他們預(yù)測(cè)的結(jié)構(gòu)。而這是這種網(wǎng)絡(luò)能用來(lái)設(shè)計(jì)蛋白質(zhì)的首個(gè)證明。
基于此,今年7月21日,來(lái)自華盛頓大學(xué)等機(jī)構(gòu)的科學(xué)家們?cè)赟cience雜志上發(fā)布了一款新的AI軟件,該軟件能夠?yàn)樽匀唤缰猩胁淮嬖诘牡鞍踪|(zhì)繪制結(jié)構(gòu)。更重要的是,科學(xué)家們已經(jīng)利用這一軟件創(chuàng)造出潛在用于工業(yè)反應(yīng)、癌癥治療、甚至用于預(yù)防呼吸道合胞病毒(RSV)感染的候選疫苗的原始化合物。
雖然AlphaFold的出現(xiàn)推動(dòng)了巨大進(jìn)展,但科學(xué)家認(rèn)為有必要說(shuō)明它的局限性:一些研究人員嘗試將AlphaFold應(yīng)用于會(huì)破壞蛋白天然結(jié)構(gòu)的各類突變,包括與早期乳腺癌有關(guān)的一個(gè)突變,這些嘗試證實(shí)了AlphaFold還無(wú)法預(yù)測(cè)新的突變對(duì)蛋白質(zhì)的影響,因?yàn)闆](méi)有演化上相關(guān)的序列可以用來(lái)研究。
并且,AlphaFold無(wú)法很好地處理會(huì)在不同構(gòu)象中呈現(xiàn)不同結(jié)構(gòu)的蛋白。這些預(yù)測(cè)是針對(duì)單獨(dú)的結(jié)構(gòu),而許多蛋白質(zhì)其實(shí)會(huì)與配體一起發(fā)揮功能,如DNA和RNA、脂肪分子、鐵等礦物質(zhì)。
目前,AlphaFold掀起的革命會(huì)走向何方依然無(wú)法預(yù)見(jiàn),但每一天,AlphaFold都顯示出推動(dòng)的巨大力量。EMBL-EBI的計(jì)算生物學(xué)家JanetThornton認(rèn)為AlphaFold帶來(lái)的最大轉(zhuǎn)變之一,可能是讓生物學(xué)家更愿意接受計(jì)算機(jī)和理論的研究方法。換言之,真正的變革是人們思維方式的變化,這其實(shí)就是AI工具的最佳用法。AlphaFold所彰顯的意義,是科技的力量。
試想一下,在未來(lái),如果把人工智能AlphaFold與生成式對(duì)抗網(wǎng)絡(luò)Insilico結(jié)合起來(lái),再加上量子計(jì)算領(lǐng)域可預(yù)期的突破,我們就將真正走出制藥的迷霧,連同生物領(lǐng)域的百年來(lái)的困惑,而走向一條未來(lái)生物學(xué)的坦途。