漸凍人癥,這個(gè)陪伴了傳奇物理學(xué)家史蒂芬 · 霍金終生的罕見病,也已經(jīng)困擾了醫(yī)生和生物科學(xué)家數(shù)十年的時(shí)間。
而答案可能就在核孔蛋白 ( neucleoporins ) 上。具體來說,學(xué)者們認(rèn)為漸凍人癥和核孔蛋白組成的核孔復(fù)合體有著極強(qiáng)的關(guān)聯(lián),而這個(gè)復(fù)合體控制著細(xì)胞核與細(xì)胞質(zhì)之間的物質(zhì)傳遞。如果能夠進(jìn)一步了解核孔蛋白,我們就有可能找到根治漸凍人癥的答案。
然而想得到這個(gè)答案并不容易:核孔復(fù)合體由超過 1000 條 30 多種不同的核孔蛋白組成,這些蛋白質(zhì)以極其復(fù)雜的方式相互交錯(cuò)在一起;更別提單條蛋白的大小可能只有數(shù)納米,即便通過最先進(jìn)的顯微鏡技術(shù)也很難進(jìn)行有效的觀察,給生物學(xué)者造成了極大的障礙。
2019 年,剛加入哈佛大學(xué)吳皓實(shí)驗(yàn)室的 Pietro Fontana,就領(lǐng)到了核孔蛋白這個(gè)天文級(jí)難題。
他不是第一個(gè)嘗試吃螃蟹的人,前人在這件事上已經(jīng)用盡了各種研究手段,付諸數(shù)十年的心血。但是 Fontana 有強(qiáng)援在手:AlphaFold,由英國(guó)人工智能科研公司 DeepMind 開發(fā)的蛋白質(zhì)預(yù)測(cè)模型。
沒過多久,在 AlphaFold 的幫助下,F(xiàn)ontana 的研究就取得了關(guān)鍵性的進(jìn)展:他們不僅成功預(yù)測(cè)出了之前沒有被探究清楚的一批核孔蛋白的結(jié)構(gòu),還首次繪制出了核孔復(fù)合體的胞質(zhì)環(huán) ( cytoplasmic ring ) 的模型圖。這一研究在今年剛剛獲得《科學(xué)》期刊刊登。

AlphaFold 協(xié)助預(yù)測(cè)的核孔蛋白組成的胞質(zhì)環(huán) 圖片來源:DOI: 10.1126/science.abm9326
這一歷史性的生物信息學(xué)突破,為攻克像漸凍人癥等罕見、難治的神經(jīng)退行性疾病疾病,重新點(diǎn)亮了希望。
" 我認(rèn)為 AlphaFold 已經(jīng)完全改變了結(jié)構(gòu)生物學(xué)," Fontana 表示。
有意思的是,這么個(gè)如此重要的發(fā)現(xiàn)和研究,其實(shí)對(duì)于 AlphaFold 來說倒像是一件 " 順手 " 的事。
蛋白質(zhì)數(shù)據(jù)庫(kù)實(shí)現(xiàn)千倍擴(kuò)容,成為 " 蛋白質(zhì)宇宙 "
這么說是因?yàn)椋航刂聊壳暗厍蛏弦阎乃猩锟偣?2.14 億種蛋白質(zhì),其結(jié)構(gòu)都已經(jīng)被 AlphaFold 預(yù)測(cè)出來了。
值得一提的是,DeepMind 的研究進(jìn)展速度之快,AlphaFold 的效果之好,已經(jīng)遠(yuǎn)超 " 令人震驚 " 的水平。
首先,去年該公司首次發(fā)布并開源了 AlphaFold 模型,當(dāng)時(shí)它只預(yù)測(cè)出了人類的 98%,以及其它大約 1 萬種生物的部分蛋白質(zhì),條數(shù)只有 100 萬左右——當(dāng)時(shí)這一研究已經(jīng)入選了《自然》年度十大科學(xué)事件。
僅一年后,這個(gè)數(shù)據(jù)庫(kù)就實(shí)現(xiàn)了 200 倍擴(kuò)容:

圖片來源:DeepMind
更厲害的是,現(xiàn)在這個(gè)數(shù)據(jù)庫(kù)已經(jīng)覆蓋了動(dòng)物、植物、細(xì)菌、真菌等幾乎所有已經(jīng)被科學(xué)記錄的物種,總計(jì)大約 100 萬種。其中 80% 的的預(yù)測(cè)結(jié)構(gòu)結(jié)果的置信度已經(jīng)足以支持研究實(shí)驗(yàn)的水平,更是有 35% 的結(jié)果置信度為高。

圖片來源:DeepMind
此次 AlphaFold 放出的 " 全量蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)數(shù)據(jù)庫(kù) ",和之前人類手工測(cè)量的數(shù)據(jù)庫(kù)相比,更是實(shí)現(xiàn)了 1000 倍的擴(kuò)容。在此之前通過標(biāo)準(zhǔn)實(shí)驗(yàn)方式測(cè)量出的蛋白質(zhì)結(jié)構(gòu),都存放在 " 蛋白質(zhì)數(shù)據(jù)銀行 " ( PDB ) 計(jì)劃的數(shù)據(jù)庫(kù)里,今天這個(gè)數(shù)據(jù)庫(kù)的條目只有 19 萬條。
這簡(jiǎn)直是為結(jié)構(gòu)生物學(xué),生物信息學(xué)、醫(yī)藥開發(fā)等領(lǐng)域,送上了一份驚天大禮包——更別提數(shù)據(jù)庫(kù)還是完全免費(fèi)、開放、可搜索的:

這一最新版的 AlphaFold 數(shù)據(jù)庫(kù),可以說其中超過 99% 的蛋白質(zhì)結(jié)構(gòu)在此之前都是未知的。而現(xiàn)在人類對(duì)于蛋白質(zhì)結(jié)構(gòu)的知識(shí)突然獲得了 200 倍的增長(zhǎng),可想而知未來的更多生物學(xué)和醫(yī)學(xué)進(jìn)展將會(huì)更加頻繁,許多肆虐幾百年的疾病有望得到 " 根治 ",許多存在了幾十年的生物學(xué)難題也將得到破解。
斯克里普斯研究所(世界頂級(jí)醫(yī)學(xué)研究機(jī)構(gòu))創(chuàng)始人 Eric Topol 直言:
"AlphaFold 照亮了幾乎整個(gè)蛋白質(zhì)宇宙。"

幾分鐘破解世界級(jí)生物難題
很多細(xì)菌都能引發(fā)人類疾病,為了壓制細(xì)菌人類發(fā)明了抗生素。然而作為一種微生物,細(xì)菌自己能通過自然選擇進(jìn)化的方式獲得抵抗抗生素的能力。結(jié)果就是一些人們以為 " 無害 " 的,已經(jīng)被攻克的病原體,突然就重新成為了人類的大敵。比如麻風(fēng)病,接種疫苗只有有限預(yù)防效果,現(xiàn)在仍然在全球傳播,感染數(shù)十萬人,且需要長(zhǎng)期服藥治療。
而兩位來自美國(guó)科羅拉多大學(xué)博爾德分校的生物學(xué)家,希望通過最 " 治本 " 的方式試圖解決抗生素抗藥性。該校生物化學(xué)系教授 Marcelo Sousa 透露,他們的研究目標(biāo)是定位到那些促使產(chǎn)生抗藥性的酶鏈,了解這些酶的蛋白質(zhì)結(jié)構(gòu),然后進(jìn)行 " 定點(diǎn)精確打擊 "。
然而分離和提純這些酶已經(jīng)非常艱難,就算提純出來,研究者發(fā)現(xiàn)想要了解它們的結(jié)構(gòu)更是難上加難。
由于預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的工作,在過去需要通過 X 射線晶體衍射、冷凍電鏡等實(shí)驗(yàn)室技術(shù),基本上只能人工進(jìn)行,Sousa 等人在這一研究上已經(jīng)花了十年的時(shí)間,不知道還要多久——如果不是因?yàn)?AlphaFold 的出現(xiàn)。

研究團(tuán)隊(duì)成員 Marcelo Sousa 和 Megan Mitchel 圖片來源:DeepMind
通過 AlphaFold 提供的基準(zhǔn)預(yù)測(cè)模型,結(jié)合團(tuán)隊(duì)已經(jīng)從提純的酶晶體上獲得的數(shù)據(jù),團(tuán)隊(duì)在這些酶的序列和結(jié)構(gòu)預(yù)測(cè)上大獲成功。在 AlphaFold 的幫助下,不僅預(yù)測(cè)速度有了極大提升,預(yù)測(cè)結(jié)果的準(zhǔn)確程度更是十分準(zhǔn)確。
" 這個(gè)難題花了我們 10 年的時(shí)間都沒有做到,現(xiàn)在居然只用 30 分鐘就解決了,"Sousa 對(duì) AlphaFold 贊嘆不已。接下來,團(tuán)隊(duì)可以繼續(xù)通過 AlphaFold 預(yù)測(cè)出的結(jié)果,進(jìn)一步研究這條酶鏈在抗藥性形成中所扮演的角色,并且找到突破口。
" 我們已經(jīng)了解了這個(gè)鏈條當(dāng)中的各種酶,現(xiàn)在我們只要能夠打破其中一環(huán),就可以破解整個(gè)抗藥性的難題," 研究人員 Megan Mitchel 表示。
Sousa 則表示,AlphaFold 將對(duì)新藥發(fā)現(xiàn)帶來巨大的積極效果。

Marcelo Sousa 展示 AlphaFold 預(yù)測(cè)出的目標(biāo)酶蛋白質(zhì)結(jié)構(gòu) 圖片來源:DeepMind
這只是 AlphaFold 將要幫助解決的一件 " 小事 "。據(jù) DeepMind 透露,目前全球已經(jīng)有超過 50 萬研究人員在使用 AlphaFold 數(shù)據(jù)庫(kù),這些前所未有的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)數(shù)據(jù),已經(jīng)被用于尋找包括漸凍人等不治之癥的治療方案、徹底解決麻風(fēng)病和血吸蟲病的肆虐、發(fā)現(xiàn)新藥、保護(hù)種植業(yè)、開發(fā)高效降解塑料垃圾的殺手锏等。
" 我們希望這個(gè)數(shù)據(jù)庫(kù)能夠幫助無數(shù)更多的科學(xué)家,并且在科學(xué)探索上開啟全新的道路,"DeepMind 創(chuàng)始人兼 CEO Demis Hassabis 表示,
" 就像數(shù)學(xué)是物理學(xué)的完美解釋語言一樣,我們相信 AI 是應(yīng)對(duì)生物學(xué)復(fù)雜動(dòng)態(tài)問題的完美工具。"
附錄:AlphaFold 大事記
以下內(nèi)容均來自于 DeepMind 網(wǎng)站:
2016 年:一個(gè)隊(duì)伍成為明星,另一個(gè)隊(duì)伍開始組建
當(dāng)年,DeepMind 的圍棋 AI 程序 AlphaGo 在首爾的一場(chǎng)挑戰(zhàn)賽中,擊敗了傳奇的圍棋選手李世乭。在 DeepMind 公司內(nèi)部,這一關(guān)鍵性事件證明了該公司的 AI 技術(shù)已經(jīng)足夠先進(jìn),有可能應(yīng)用到解決其它科學(xué)挑戰(zhàn)當(dāng)中,比如蛋白質(zhì)折疊這一存在了 50 年的挑戰(zhàn)當(dāng)中。
不久之后,DeepMind 就在內(nèi)部建立了一個(gè)小型團(tuán)隊(duì),開始嘗試使用深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。

圖片來源:DeepMind
2018 年:AlphaFold 性能的首次公開測(cè)試
AlphaFold 的性能在 CASP13 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽中排名第一,相關(guān)的方法隨后發(fā)表在《自然》期刊上。DeepMind 在內(nèi)部擴(kuò)充了 AlphaFold 團(tuán)隊(duì),正式開始了打造這個(gè)創(chuàng)新的新系統(tǒng)。

圖片來源:DeepMind
2020 年:解決了生物學(xué) 50 年難題
AlphaFold 在 CASP14 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽中再次以三倍的巨大優(yōu)勢(shì)勝出,并且準(zhǔn)確性已經(jīng)接近于 X 射線晶體衍射、冷凍電鏡等標(biāo)準(zhǔn)實(shí)驗(yàn)方法。更厲害的是,在這次比賽上,AlphaFold 得到 CASP 舉辦方認(rèn)定,破解了 50 年都未曾解開的蛋白質(zhì)折疊難題。《自然》期刊直接評(píng)價(jià)這一事件 " 改變了一切 "。
同年 12 月,Demis Hassabis 和 AlphaFold 項(xiàng)目主管 John Jumper 公開承諾,將對(duì)外開放 AlphaFold。

圖片來源:CASP
2021 年:一邊創(chuàng)造歷史,一邊全面開源
DeepMind 在去年兌現(xiàn)了開放 AlphaFold 的承諾。該公司在《自然》發(fā)表論文,公開了 AlphaFold 研發(fā)過程中采用的詳細(xì)方法,并且開源了相關(guān)代碼,提供了 60 頁詳細(xì)補(bǔ)充資料。
去年 7 月, DeepMind 再次發(fā)表論文,展示 AlphaFold 已經(jīng)成功預(yù)測(cè)了整個(gè)人類蛋白質(zhì)組。這一發(fā)表讓已知的高置信度人類蛋白質(zhì)結(jié)構(gòu)數(shù)量翻了一倍。該公司和歐洲分子生物學(xué)實(shí)驗(yàn)室 ( EMBL-EBI ) 合作公開了數(shù)據(jù)庫(kù),包括人類蛋白質(zhì)組以及另外 20 種模式生物(受到廣泛研究的生物)的蛋白質(zhì)組,總共超過 35 萬條。

圖片來源:DeepMind

圖片來源:DeepMind
去年 10 月,DeepMind 發(fā)布了一個(gè)修改版的子模型,名為 "AlphaFold-Multimer",抓木門用于蛋白質(zhì)復(fù)合物的結(jié)構(gòu)預(yù)測(cè)。隨后在 11 月,該公司將相關(guān)子模型代碼整合到 AlphaFold 二代代碼當(dāng)中,顯著提高了多鏈蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)準(zhǔn)確度。
同年 12 月,DeepMind 向 AlphaFold 數(shù)據(jù)庫(kù)當(dāng)中增加了超過 40 萬條蛋白質(zhì)結(jié)構(gòu)。
2022 年:數(shù)據(jù)庫(kù)持續(xù)幾何級(jí)增長(zhǎng)
今年 1 月,DeepMind 宣布已經(jīng)有超過 30 萬研究者使用了 AlphaFold 數(shù)據(jù)庫(kù),并且添加了超過 27 個(gè)蛋白質(zhì)組,總計(jì)超過 19 萬條蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)數(shù)據(jù)。這次添加的重要性在于其中 17 個(gè)蛋白質(zhì)組都和被忽視熱帶疾病有關(guān),影響全球十多億人。
7 月(本次),DeepMind 將 AlphaFold 數(shù)據(jù)庫(kù)從近 100 萬條擴(kuò)展到 2.14 億條,覆蓋了人類已知的絕大多數(shù)蛋白質(zhì)(也即 UniProt 蛋白質(zhì)數(shù)據(jù)庫(kù)的大部分內(nèi)容)

* 注:封面圖來自于 DeepMind,版權(quán)屬于原作者。如果不同意使用,請(qǐng)盡快聯(lián)系我們,我們會(huì)立即刪除。
原文地址:http://www.myzaker.com/article/62e87a7f8e9f0974d047a96c
轉(zhuǎn)載請(qǐng)注明:照亮整個(gè)蛋白質(zhì)宇宙:DeepMind“順手”放的大招,要一舉攻克漸凍人癥 | 快導(dǎo)航網(wǎng)