日本一道本高清一区二区-色妞熟女午夜福利在线视频-欧美成人情激情免费看-老司机午夜精品免费视频

加快打造原始創(chuàng)新策源地,加快突破關鍵核心技術,努力搶占科技制高點,為把我國建設成為世界科技強國作出新的更大的貢獻。

——習近平總書記在致中國科學院建院70周年賀信中作出的“兩加快一努力”重要指示要求

面向世界科技前沿、面向經(jīng)濟主戰(zhàn)場、面向國家重大需求、面向人民生命健康,率先實現(xiàn)科學技術跨越發(fā)展,率先建成國家創(chuàng)新人才高地,率先建成國家高水平科技智庫,率先建設國際一流科研機構(gòu)。

——中國科學院辦院方針

首頁 > 科研進展

研究開發(fā)出細胞身份鑒定新型AI引擎

2025-07-02 北京基因組研究所
【字體:

語音播報

隨著單細胞和空間組學技術的快速發(fā)展,公開可共享數(shù)據(jù)量已突破億級大關。然而,技術平臺產(chǎn)生的差異、復雜疾病狀態(tài)、跨物種研究帶來的批次效應和離群細胞等,對數(shù)據(jù)解讀構(gòu)成挑戰(zhàn)。面對動輒百萬規(guī)模的離群細胞,傳統(tǒng)的“先聚類、后注釋”分析方法難以快速、精準且可解釋地將這些“身份不明”的細胞映射到參考細胞圖譜上,進而制約單細胞數(shù)據(jù)在跨大規(guī)模人群隊列研究、多模態(tài)信息整合以及物種間保守性探索等領域的應用潛力。因此,亟需高效實現(xiàn)細胞的數(shù)字化表征、整合與解析。

針對上述問題,中國科學院北京基因組研究所(國家生物信息中心)研究員蔣嵐團隊聯(lián)合新加坡國立大學教授劉鈿渤、加拿大麥吉爾大學教授李岳,研發(fā)了一款高效、泛化且可解釋的有監(jiān)督細胞表征和解析模型——CellMemory。該模型受全局工作空間理論啟發(fā),對傳統(tǒng)Transformer架構(gòu)進行改造,即植入低維記憶空間并通過Cross-Attention機制將高維基因特征壓縮、競爭及廣播。研究顯示,該模型可提高計算效率3至5倍,并顯著增強模型泛化能力,無需預訓練即可實現(xiàn)單細胞數(shù)據(jù)跨平臺與物種整合。同時,記憶空間可為CellMemory帶來分層式“可讀窗口”。其中,L1 (Gene Level)為面對特定細胞,研究可知單個基因?qū)δ繕思毎碚鞯呢暙I分數(shù);L2(Gene Program Level)為模型在記憶空間中,自動歸納協(xié)調(diào)的共表達/共調(diào)控模式。多層可解釋性為理解模型決策邏輯與探索表型關聯(lián)細胞狀態(tài)提供了可靠解決方案,即“高準確性 + 強可解釋性”。

進一步,研究人員將CellMemory與3個單細胞基礎大模型、16個任務專用模型在1500萬細胞上進行比較?;鶞试u測結(jié)果顯示,CellMemory在人群尺度的單細胞數(shù)據(jù)整合、超高分辨率細胞狀態(tài)注釋等任務中均取得了State-of-the-Art級別的表現(xiàn)。同時,面對59張共含400萬細胞、338個細胞亞群的MERFISH小鼠腦空間組學切片,與基于傳統(tǒng)transformer架構(gòu)預訓練的單細胞基礎大模型相比,CellMemory在95%的空間切片上展現(xiàn)領先的注釋表現(xiàn),準確率較傳統(tǒng)機器學習方法提升30%,證明了CellMemory較好的泛化能力。

當前,將疾病細胞與健康細胞比對存在挑戰(zhàn)。得益于準確與可解釋的細胞表征,研究人員利用CellMemory在多個癌癥隊列單細胞圖譜中解析疾病復雜性。例如,在肺腺癌隊列中,該模型基于參考圖譜定位到MSLN+?CAPN8+的肺泡2型過渡態(tài)細胞,并觀測到其顯著的拷貝數(shù)變異,提示肺腺癌或利用肺泡2型細胞可塑性獲得侵襲能力。同時,在混合表型急性白血病、髓母細胞瘤等數(shù)據(jù)中,該模型基于健康參考圖譜,揭示了不同患者潛在的異質(zhì)性起源,為耐藥和預后研究提供了高分辨率數(shù)據(jù)解析基礎,展示出CellMemory在離群細胞推斷場景中較好的表征能力。

從“序列搜索”到“亞群搜索”,參考映射正在重塑單細胞數(shù)據(jù)分析的技術范式。得益于較好的泛化能力與高效的計算效率,CellMemory有望成為覆蓋病理、時空及物種等多維度細胞參考圖譜建設與臨床精準診療的關鍵引擎。

近日,相關研究成果以CellMemory: hierarchical interpretation of out-of-distribution cells using bottlenecked transformer為題,發(fā)表在《基因組生物學》(Genome Biology)上。研究工作得到科學技術部、中國科學院等的支持。

論文鏈接?

CellMemory模型架構(gòu)與應用場景

打印 責任編輯:閆文藝

掃一掃在手機打開當前頁

© 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

地址:北京市西城區(qū)三里河路52號 郵編:100864

電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

  • © 1996 - 中國科學院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864

    電話: 86 10 68597114(總機) 86 10 68597289(總值班室)

  • © 1996 - 中國科學院 版權(quán)所有
    京ICP備05002857號-1
    京公網(wǎng)安備110402500047號
    網(wǎng)站標識碼bm48000002

    地址:北京市西城區(qū)三里河路52號 郵編:100864
    電話:86 10 68597114(總機)
       86 10 68597289(總值班室)