——習(xí)近平總書(shū)記在致中國(guó)科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國(guó)科學(xué)院辦院方針
語(yǔ)音播報(bào)
近日,中國(guó)科學(xué)院上海藥物研究所研究員陳勛團(tuán)隊(duì)聯(lián)合日本京都大學(xué)、加拿大麥吉爾大學(xué)科研人員,通過(guò)開(kāi)發(fā)基于進(jìn)化的轉(zhuǎn)座子注釋新方法,并結(jié)合系統(tǒng)發(fā)育分析、大規(guī)模平行報(bào)告系統(tǒng)及多組學(xué)等技術(shù),在單堿基水平上揭示了內(nèi)源性逆轉(zhuǎn)錄病毒序列和功能在不同物種間的差異進(jìn)化。
人體內(nèi)病毒組包括感染性病毒、整合到人基因組中的外源病毒以及內(nèi)源性逆轉(zhuǎn)錄病毒等多種類(lèi)型。內(nèi)源性逆轉(zhuǎn)錄病毒序列是轉(zhuǎn)座子重復(fù)序列的一種,占據(jù)了人基因組的8%,其來(lái)源于百萬(wàn)年前感染人類(lèi)祖先的逆轉(zhuǎn)錄病毒,因在漫長(zhǎng)的進(jìn)化過(guò)程中被“捕獲”而保留在基因組中。多種古老病毒能夠感染并被“捕獲”,其中包括在不同進(jìn)化階段感染人類(lèi)祖先的HERV-E、HERV-K及HERV-H等多種類(lèi)型。根據(jù)序列差異,這些內(nèi)源性逆轉(zhuǎn)錄病毒序列可被分為500多個(gè)亞家族。
通常,完整的內(nèi)源性逆轉(zhuǎn)錄病毒序列包括gag、pol及env三個(gè)核心基因結(jié)構(gòu)域,以及兩端具有重要調(diào)控功能的長(zhǎng)末端重復(fù)序列(LTRs)。大多數(shù)內(nèi)源性逆轉(zhuǎn)錄病毒序列在進(jìn)化過(guò)程中,因突變、重組等失去原有功能。因此,內(nèi)源性逆轉(zhuǎn)錄病毒序列曾被學(xué)界認(rèn)為是基因組中無(wú)功能的“垃圾”序列。然而,大量研究表明,內(nèi)源性逆轉(zhuǎn)錄病毒尤其是LTR區(qū)域富集了眾多轉(zhuǎn)錄因子結(jié)合位點(diǎn),可作為順式作用元件調(diào)控鄰近基因表達(dá),并參與先天免疫等多個(gè)基因表達(dá)調(diào)控網(wǎng)絡(luò)與生物學(xué)過(guò)程。因此,內(nèi)源性逆轉(zhuǎn)錄病毒在癌癥、發(fā)育及感染性疾病等多種人類(lèi)疾病中發(fā)揮重要作用,準(zhǔn)確注釋內(nèi)源性逆轉(zhuǎn)錄病毒序列是其功能與進(jìn)化研究的基礎(chǔ)。但目前,主要依賴(lài)序列比對(duì)的注釋方法存在局限性,使人基因組內(nèi)源性逆轉(zhuǎn)錄病毒序列數(shù)據(jù)庫(kù)中存在大量注釋錯(cuò)誤。
為解決上述問(wèn)題,研究人員開(kāi)發(fā)了轉(zhuǎn)座子序列注釋新方法。該方法利用系統(tǒng)發(fā)育分析,將序列相近但被誤分至不同亞家族的序列進(jìn)行整合和重新注釋。研究人員針對(duì)76個(gè)進(jìn)化上較年輕的內(nèi)源性逆轉(zhuǎn)錄病毒亞家族,成功應(yīng)用該方法糾正了其中26個(gè)亞家族近三分之一的序列注釋錯(cuò)誤。同時(shí),研究以MER11家族為例,結(jié)合系統(tǒng)發(fā)育分析與表觀基因組學(xué)數(shù)據(jù),揭示了MER11A/B/C亞家族中大量注釋錯(cuò)誤,并利用新方法進(jìn)行了校正。研究人員鑒定出四個(gè)新的亞家族:MER11_G1、G2、G3、G4?;谶@些更準(zhǔn)確的注釋信息,研究人員能夠?qū)ER11家族表觀遺傳修飾特征進(jìn)行更精細(xì)的分組研究并追溯其進(jìn)化歷史。
進(jìn)一步,研究人員利用大規(guī)模平行報(bào)告系統(tǒng)技術(shù)實(shí)驗(yàn)驗(yàn)證了來(lái)自人、大猩猩及獼猴基因組中共7000多條內(nèi)源性逆轉(zhuǎn)錄病毒MER11序列的轉(zhuǎn)錄調(diào)控活性,并在單堿基分辨率水平上揭示了與之相關(guān)的SOXs等轉(zhuǎn)錄因子結(jié)合位點(diǎn)序列及其進(jìn)化規(guī)律。研究顯示,研究人員在進(jìn)化上較年輕的MER11序列中鑒定出人類(lèi)與大猩猩特有的SOXs結(jié)合位點(diǎn)序列。該SOXs結(jié)合位點(diǎn)序列由靈長(zhǎng)類(lèi)物種進(jìn)化過(guò)程中單堿基缺失事件產(chǎn)生,并顯著增強(qiáng)了其調(diào)控活性。
該研究建立了內(nèi)源性逆轉(zhuǎn)錄病毒等轉(zhuǎn)座子分類(lèi)、注釋、進(jìn)化以及生物學(xué)功能研究的新方法。利用這一方法,科研人員能夠更準(zhǔn)確地追蹤同一內(nèi)源性逆轉(zhuǎn)錄病毒序列及其功能演化歷史,且獲得的精準(zhǔn)的內(nèi)源性逆轉(zhuǎn)錄病毒注釋信息將顯著提升后續(xù)序列和功能鑒定可靠性,有助于學(xué)界系統(tǒng)性研究?jī)?nèi)源性逆轉(zhuǎn)錄病毒在腫瘤發(fā)生、發(fā)育調(diào)控、免疫相關(guān)疾病中的生物學(xué)作用及其進(jìn)化。同時(shí),該方法也可被用于深入研究流感等病原體的突變模式、演化動(dòng)態(tài)及功能特征。下一步,研究團(tuán)隊(duì)將結(jié)合系統(tǒng)發(fā)育學(xué)、多組學(xué)及人工智能等前沿技術(shù),全面解析內(nèi)源性逆轉(zhuǎn)錄病毒的復(fù)雜生物學(xué)功能,探討其中的隱藏靶點(diǎn),并研究其在人類(lèi)免疫系統(tǒng)中的重要作用。
相關(guān)研究成果以A phylogenetic approach uncovers cryptic endogenous retrovirus subfamilies in the primate lineage為題,發(fā)表在《科學(xué)進(jìn)展》(Science Advances)上。
基于進(jìn)化的轉(zhuǎn)座子序列注釋新方法
新注釋的MER11亞家族揭示了表觀遺傳圖譜的演化過(guò)程
在靈長(zhǎng)類(lèi)譜系中內(nèi)源性逆轉(zhuǎn)錄病毒能通過(guò)堿基變異獲得物種特異的功能性基序
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)