欧美成人黄色小视频,国产人妖乱国产精品人妖,国产性天天综合网,台湾佬中文娱乐久久久

蛋白質(zhì)宇宙來(lái)了!AlphaFold把幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)完了

前沿科技 3年前 (2022) 虛像
7 0 0

原文作者:Ewen Callaway

DeepMind 的 AI 工具 AlphaFold 確定了約 2 億個(gè)蛋白質(zhì)的結(jié)構(gòu),范圍覆蓋地球上幾乎所有已知生物

從現(xiàn)在起,確定幾乎所有已知蛋白質(zhì)的 3D 結(jié)構(gòu)就和用谷歌(Google)搜索一樣簡(jiǎn)單了。

研究人員用 AlphaFold ——革命性的人工智能(AI)網(wǎng)絡(luò)——預(yù)測(cè)了 100 萬(wàn)個(gè)物種體內(nèi)約 2 億個(gè)蛋白質(zhì)的結(jié)構(gòu),范圍幾乎囊括地球上所有已知蛋白質(zhì)。

這些轉(zhuǎn)儲(chǔ)數(shù)據(jù)將在 DeepMind 和歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲生物信息研究所(EMBL-EBI)共同建立的一個(gè)數(shù)據(jù)庫(kù)中免費(fèi)公開(kāi)。負(fù)責(zé)開(kāi)發(fā) AlphaFold 的 DeepMind 是谷歌位于倫敦的一家 AI 公司;而 EMBL-EBI 是位于英國(guó)劍橋近郊的一個(gè)政府間組織。

"本質(zhì)上,你可以理解為它覆蓋了整個(gè)蛋白質(zhì)宇宙,"DeepMind 的 CEO Demis Hassabis 在新聞發(fā)布會(huì)上說(shuō),"我們正處在數(shù)字生物學(xué)新時(shí)代的開(kāi)端。"

蛋白質(zhì)宇宙來(lái)了!AlphaFold把幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)完了

圖中為 AlphaFold 預(yù)測(cè)的蛋黃前體——卵黃蛋白原蛋白的結(jié)構(gòu)。來(lái)源:DeepMind

蛋白質(zhì)的 3D 構(gòu)象或稱結(jié)構(gòu)決定了它在細(xì)胞中的功能。大部分藥物的設(shè)計(jì)都需要用到結(jié)構(gòu)信息,而構(gòu)建蛋白質(zhì)氨基酸的準(zhǔn)確排列圖譜往往是發(fā)現(xiàn)蛋白質(zhì)如何工作的第一步。

DeepMind 利用名為深度學(xué)習(xí)的 AI 技術(shù)開(kāi)發(fā)了 AlphaFold 網(wǎng)絡(luò),一年前上線的 AlphaFold 數(shù)據(jù)庫(kù)共有 35 萬(wàn)個(gè)預(yù)測(cè)結(jié)構(gòu),覆蓋了來(lái)自人、小鼠和 19 種其他被大量研究生物的幾乎全部蛋白質(zhì)。在那之后,這個(gè)數(shù)據(jù)庫(kù)擴(kuò)大到了約 100 萬(wàn)個(gè)結(jié)構(gòu)。

倫敦大學(xué)學(xué)院計(jì)算生物學(xué)家 Christine Orengo 說(shuō):" 我們都在等待這個(gè)寶貴資源的公開(kāi)。"Orengo 利用 AlphaFold 數(shù)據(jù)庫(kù)尋找新的蛋白家族。" 把所有數(shù)據(jù)都替我們預(yù)測(cè)好簡(jiǎn)直不能再棒了。"

高質(zhì)量結(jié)構(gòu)

就在去年 AlphaFold 的公開(kāi)在生命科學(xué)領(lǐng)域引發(fā)轟動(dòng)后,領(lǐng)域內(nèi)的研究人員紛紛開(kāi)始利用這一工具。AlphaFold 能對(duì)蛋白質(zhì)的 3D 結(jié)構(gòu)進(jìn)行非常準(zhǔn)確的預(yù)測(cè)。它還能對(duì)它的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估,讓研究人員知道哪些信息是可靠的。傳統(tǒng)上,科研人員一直在用 X 射線晶體學(xué)和冷凍電鏡這種耗時(shí)且成本高昂的實(shí)驗(yàn)技術(shù)解析蛋白質(zhì)的結(jié)構(gòu)。

EMBL-EBI 表示,在這些逾 2.14 億個(gè)結(jié)構(gòu)預(yù)測(cè)中,約 35% 的預(yù)測(cè)結(jié)果被認(rèn)為準(zhǔn)確度很高,即和實(shí)驗(yàn)解析的結(jié)構(gòu)一樣可靠。另有 45% 的預(yù)測(cè)被認(rèn)為置信度足夠高,在很多情況下都能使用。

AlphaFold 預(yù)測(cè)的許多結(jié)構(gòu)都很可靠,能在很多情況下替代實(shí)驗(yàn)解析的結(jié)構(gòu)。其他情況下,研究人員會(huì)用 AlphaFold 的預(yù)測(cè)結(jié)果驗(yàn)證和解讀實(shí)驗(yàn)數(shù)據(jù)。不可靠的預(yù)測(cè)結(jié)果一望即知,其中一些源于蛋白質(zhì)固有的無(wú)序性質(zhì),這種無(wú)序意味著蛋白質(zhì)本身沒(méi)有固定的形狀,至少在沒(méi)有其他分子的情況下是無(wú)序的。

幾天前發(fā)布的這 2 億個(gè)預(yù)測(cè)結(jié)構(gòu)基于 UNIPROT 數(shù)據(jù)庫(kù)中的序列。科學(xué)家可能對(duì)這些蛋白質(zhì)中的一些形狀已經(jīng)有概念了,它們不是在實(shí)驗(yàn)解析結(jié)構(gòu)的數(shù)據(jù)庫(kù)中,就是與這類數(shù)據(jù)庫(kù)中的其他蛋白類似,巴塞羅那 Josep Carreras 白血病研究所的計(jì)算生物學(xué)家 Eduard Porta Pardo 說(shuō)。

蛋白質(zhì)宇宙來(lái)了!AlphaFold把幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)完了

DeepMind 的 CEO Demis Hassabis 說(shuō) AlphaFold 的新數(shù)據(jù)覆蓋了 " 整個(gè)蛋白質(zhì)宇宙 "。來(lái)源:Jung Yeon-Je/AFP/Getty

但 Porta 表示,這些結(jié)構(gòu)一般集中在人、小鼠,和其他哺乳動(dòng)物的蛋白質(zhì)上,而 AlphaFold 的數(shù)據(jù)覆蓋了更多不同的生物體,所以將極大地增進(jìn)我們的認(rèn)知。Porta 說(shuō):" 這個(gè)資源太無(wú)敵了。我會(huì)在公布的第一時(shí)間下載它。"

由于 AlphaFold 公開(kāi)已有一年,所以研究人員已經(jīng)能夠預(yù)測(cè)他們想要的任何蛋白質(zhì)的結(jié)構(gòu)。但很多人也表示,把預(yù)測(cè)的結(jié)構(gòu)集中到一個(gè)數(shù)據(jù)庫(kù)可以節(jié)省研究人員不少時(shí)間、金錢和麻煩。" 這是可以去除的另一個(gè)準(zhǔn)入門(mén)檻,"Porta 說(shuō)," 我用過(guò)很多 AlphaFold 模型,但我從來(lái)沒(méi)有自己運(yùn)行過(guò) AlphaFold。"

EMBL 在德國(guó)漢堡的結(jié)構(gòu)建模師 Jan Kosinski 過(guò)去一年一直在運(yùn)行 AlphaFold,他已經(jīng)等不及看到這次的擴(kuò)展了。他的團(tuán)隊(duì)用三周時(shí)間預(yù)測(cè)了一個(gè)病原體的蛋白質(zhì)組——蛋白質(zhì)組是指某個(gè)生物體的全部蛋白質(zhì)集合。他在發(fā)布會(huì)上說(shuō):" 現(xiàn)在我們只要把所有模型都下載下來(lái)就可以了。"

23TB

把近乎所有已知蛋白都收入數(shù)據(jù)庫(kù)也能推動(dòng)新的研究。Orengo 的團(tuán)隊(duì)之前就在用 AlphaFold 的數(shù)據(jù)庫(kù)尋找新的蛋白質(zhì)家族,他們現(xiàn)在將把這個(gè)研究放到更大的尺度上。她的團(tuán)隊(duì)還將利用這個(gè)擴(kuò)展后的數(shù)據(jù)庫(kù)理解具有有益性質(zhì)的蛋白質(zhì)的演化,比如消化塑料的能力,或是具有能誘導(dǎo)癌癥一類的有害的性質(zhì)。在數(shù)據(jù)庫(kù)中找出這些蛋白質(zhì)的遠(yuǎn)親可以了解這些性質(zhì)的源頭。

首爾大學(xué)計(jì)算生物學(xué)家 Martin Steinegger 協(xié)助開(kāi)發(fā)了 AlphaFold 基于云的版本,他對(duì)數(shù)據(jù)庫(kù)的擴(kuò)大感到十分激動(dòng)。但他說(shuō),研究人員可能仍然需要自己跑 AlphaFold。越來(lái)越多的人將 AlphaFold 用來(lái)確定蛋白質(zhì)的相互作用,而數(shù)據(jù)庫(kù)中并不包含這類預(yù)測(cè)信息。對(duì)從土壤、海洋和其他 " 宏基因組 " 來(lái)源的遺傳物質(zhì)進(jìn)行測(cè)序從而確定的微生物蛋白也不包含在該數(shù)據(jù)庫(kù)中。

Steinegger 說(shuō),對(duì)擴(kuò)展后的 AlphaFold 數(shù)據(jù)庫(kù)的一些更高級(jí)的運(yùn)用可能也需要下載它全部 23TB 的內(nèi)容,而這對(duì)許多團(tuán)隊(duì)來(lái)說(shuō)是不切實(shí)際的。基于云的儲(chǔ)存也很燒錢。Steinegger 與人共同開(kāi)發(fā)了一個(gè)軟件工具,名為 FoldSeek,可以快速找到結(jié)構(gòu)相似的蛋白質(zhì),這應(yīng)該能大大減少 AlphaFold 的數(shù)據(jù)量。

即使 AlphaFold 數(shù)據(jù)庫(kù)已經(jīng)包含了幾乎全部的已知蛋白,但它仍需要根據(jù)新發(fā)現(xiàn)的生物體進(jìn)行更新。AlphaFold 的預(yù)測(cè)準(zhǔn)確度也會(huì)在獲得新的結(jié)構(gòu)信息后進(jìn)一步提升。Hassabis 說(shuō),DeepMind 承諾會(huì)長(zhǎng)期維護(hù)該數(shù)據(jù)庫(kù),他說(shuō)他每年都能看到更新。

他希望 AlphaFold 數(shù)據(jù)庫(kù)能給生命科學(xué)帶來(lái)持久的影響。"這將需要我們徹底轉(zhuǎn)變思考方式。"

原文地址:http://www.myzaker.com/article/62eb60b88e9f094f881c0981

相關(guān)文章

主站蜘蛛池模板: 武城县| 紫金县| 北宁市| 阳原县| 车致| 万全县| 壶关县| 屯门区| 普安县| 虞城县| 金坛市| 印江| 高青县| 罗甸县| 子长县| 宿州市| 平山县| 普兰店市| 婺源县| 平果县| 西昌市| 麻江县| 南充市| 从化市| 西和县| 乌拉特后旗| 仙桃市| 丹阳市| 唐山市| 丰台区| 马尔康县| 舟曲县| 宜城市| 东海县| 孟村| 休宁县| 华亭县| 高要市| 日土县| 东兴市| 兴义市|