日本一道本高清一区二区-色妞熟女午夜福利在线视频-欧美成人情激情免费看-老司机午夜精品免费视频

加快打造原始創(chuàng)新策源地,加快突破關(guān)鍵核心技術(shù),努力搶占科技制高點(diǎn),為把我國建設(shè)成為世界科技強(qiáng)國作出新的更大的貢獻(xiàn)。

——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求

面向世界科技前沿、面向經(jīng)濟(jì)主戰(zhàn)場、面向國家重大需求、面向人民生命健康,率先實(shí)現(xiàn)科學(xué)技術(shù)跨越發(fā)展,率先建成國家創(chuàng)新人才高地,率先建成國家高水平科技智庫,率先建設(shè)國際一流科研機(jī)構(gòu)。

——中國科學(xué)院辦院方針

首頁 > 科研進(jìn)展

科學(xué)家設(shè)計(jì)出基于圖表示學(xué)習(xí)和蛋白質(zhì)語言模型的深度生成算法

2024-12-11 中國科學(xué)技術(shù)大學(xué)
【字體:

語音播報

近日,中國科學(xué)技術(shù)大學(xué)認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室教授劉淇指導(dǎo)的博士研究生張載熙,聯(lián)合美國哈佛大學(xué)醫(yī)學(xué)院教授Marinka Zitnik課題組,設(shè)計(jì)了基于圖表示學(xué)習(xí)和蛋白質(zhì)語言模型的深度生成算法PocketGen,生成了與小分子結(jié)合的蛋白質(zhì)口袋序列和空間結(jié)構(gòu)。實(shí)驗(yàn)驗(yàn)證顯示,PocketGen在生成成功率和效率方面均超過傳統(tǒng)方法。相關(guān)研究成果以Efficient Generation of Protein Pockets with PocketGen為題,發(fā)表在《自然-機(jī)器智能》(Nature Machine Intelligence)上。

研發(fā)適用于科學(xué)發(fā)現(xiàn)任務(wù)的人工智能算法如功能蛋白質(zhì)設(shè)計(jì)是重要的研究方向。在藥物發(fā)現(xiàn)和生物醫(yī)療領(lǐng)域,設(shè)計(jì)與小分子結(jié)合的功能蛋白質(zhì)具有積極意義。而基于能量優(yōu)化和模板匹配的傳統(tǒng)方法計(jì)算速度慢、成功率低?;谏疃葘W(xué)習(xí)的模型存在分子-蛋白質(zhì)復(fù)雜相互作用建模難、序列-結(jié)構(gòu)依賴關(guān)系學(xué)習(xí)難等問題。因此,亟待發(fā)展高效、高成功率且能夠準(zhǔn)確反映物理化學(xué)規(guī)律的蛋白質(zhì)口袋生成算法。

該團(tuán)隊(duì)在前期蛋白質(zhì)口袋生成工作FAIR和PocketFlow的基礎(chǔ)上,研發(fā)出PocketGen。PocketGen可以基于蛋白質(zhì)框架和結(jié)合小分子生成蛋白質(zhì)口袋序列和結(jié)構(gòu)。PocketGen主要由雙層圖Transformer編碼器和蛋白質(zhì)預(yù)訓(xùn)練語言模型組成。受蛋白質(zhì)固有的層級結(jié)構(gòu)啟發(fā),雙層圖Transformer編碼器包括氨基酸層級編碼器和原子層級編碼器,學(xué)習(xí)不同細(xì)粒度的相互作用信息,更新氨基酸/原子表示和坐標(biāo)。在蛋白質(zhì)預(yù)訓(xùn)練語言模型中,PocketGen高效微調(diào)ESM2模型,輔助氨基酸序列預(yù)測。具體方法為PocketGen固定大部分模型層不變,僅微調(diào)部分適應(yīng)層參數(shù),計(jì)算序列-結(jié)構(gòu)信息交叉注意力,增強(qiáng)序列-結(jié)構(gòu)一致性。實(shí)驗(yàn)顯示,PocketGen模型親和力和結(jié)構(gòu)合理性等指標(biāo)超過傳統(tǒng)方法,在計(jì)算效率方面亦有大幅提高。

進(jìn)一步,該研究在芬太尼和艾必克等小分子結(jié)合蛋白質(zhì)口袋設(shè)計(jì)任務(wù)中進(jìn)行驗(yàn)證,并與生成模型RFDiffusion、RFDiffusionAA等比較,驗(yàn)證了PocketGen的有效性。同時,研究將PocketGen產(chǎn)生的注意力矩陣與基于第一性原理和力場模擬分析軟件得到的結(jié)果進(jìn)行對比展示,發(fā)現(xiàn)基于深度學(xué)習(xí)的PocketGen具有較好可解釋性。

上述成果推進(jìn)了深度生成模型用于功能蛋白質(zhì)設(shè)計(jì),為進(jìn)一步剖析蛋白質(zhì)設(shè)計(jì)規(guī)律并開展生物實(shí)驗(yàn)驗(yàn)證奠定了基礎(chǔ),展現(xiàn)了人工智能方法在解決藥物研發(fā)和生物工程領(lǐng)域重要科學(xué)問題方面的優(yōu)勢。

研究工作得到國家自然科學(xué)基金等的支持。

論文鏈接

(a)利用PocketGen進(jìn)行蛋白質(zhì)序列-結(jié)構(gòu)共同設(shè)計(jì);(b)雙層圖Transformer編碼器;(c)蛋白質(zhì)預(yù)訓(xùn)練語言模型用于序列預(yù)測及高效微調(diào)技術(shù)

左側(cè)為薛定諤軟件分析的蛋白質(zhì)-小分子相互作用關(guān)系圖;右側(cè)是PocketGen兩個注意力矩陣頭的熱圖,與左側(cè)相互關(guān)系成功對應(yīng)。

打印 責(zé)任編輯:侯茜

掃一掃在手機(jī)打開當(dāng)前頁

© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002

地址:北京市西城區(qū)三里河路52號 郵編:100864

電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)

  • © 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864

    電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)

  • © 1996 - 中國科學(xué)院 版權(quán)所有
    京ICP備05002857號-1
    京公網(wǎng)安備110402500047號
    網(wǎng)站標(biāo)識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864
    電話:86 10 68597114(總機(jī))
       86 10 68597289(總值班室)