Cell Host & Microbe | 從“序列檢索”到“結(jié)構(gòu)檢索”——腸道微生物組功能研究新范式
人類腸道微生物組蘊藏著上千萬個基因,這些基因所編碼的蛋白質(zhì)在人體的代謝、免疫等過程中發(fā)揮重要作用,也是開發(fā)疾病治療新技術(shù)的重要資源庫。然而,微生物蛋白質(zhì)的進(jìn)化多樣性,給基于序列同源的功能推斷方法帶來了挑戰(zhàn)。例如,在腸道噬菌體基因組中,有超過75%的蛋白無法注釋功能。此外,腸道細(xì)菌中廣泛存在宿主同工酶,但是這些酶與其真核同源基因蛋白的序列同源性很低,往往難以被識別。與序列相比,蛋白質(zhì)的三維結(jié)構(gòu)在進(jìn)化中往往更為保守,這為解析腸道微生物的功能暗物質(zhì)提供了新的研究思路——通過結(jié)構(gòu)信息來推測蛋白質(zhì)功能。腸道微生物的功能研究亟需從“序列檢索”走向“結(jié)構(gòu)檢索”的新范式。
2025年11月26日,中國科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國重點實驗室、合成生物學(xué)研究所(以下簡稱“深圳先進(jìn)院合成所”)戴磊研究員課題組聯(lián)合北京大學(xué)汪鍇研究員、香港中文大學(xué)李煜教授的合作團(tuán)隊在Cell Host & Microbe發(fā)表了題為"Exploring Functional Insights into the Human Gut Microbiome via the Structural Proteome"的研究論文。該研究建立了人體腸道微生物的蛋白質(zhì)結(jié)構(gòu)組數(shù)據(jù)庫和結(jié)構(gòu)檢索方法,顯著提高了對噬菌體蛋白、菌源宿主同工酶等功能暗物質(zhì)的預(yù)測能力大幅提高了噬菌體蛋白、菌源宿主同工酶的功能識別能力?;谶@一方法,研究團(tuán)隊成功驗證了腸道致病菌的噬菌體裂解酶,并首次揭示了腸道細(xì)菌的褪黑素合成途徑。
構(gòu)建人體腸道微生物蛋白質(zhì)結(jié)構(gòu)組數(shù)據(jù)庫
首先,研究團(tuán)隊構(gòu)建了人體腸道微生物蛋白質(zhì)結(jié)構(gòu)組數(shù)據(jù)庫 (human Gut Microbial Protein Structure database,https://www.gmpsdb.cn/)。該數(shù)據(jù)庫涵蓋968個腸道細(xì)菌和1255個腸道噬菌體基因組所編碼的約270萬個蛋白結(jié)構(gòu)(圖1)。
噬菌體蛋白的結(jié)構(gòu)聚類與功能驗證
由于噬菌體基因組的快速進(jìn)化,大部分噬菌體編碼的蛋白難以通過序列比對進(jìn)行注釋。研究團(tuán)隊采用結(jié)構(gòu)比對和聚類方法,研究噬菌體蛋白的功能注釋和進(jìn)化規(guī)律,發(fā)現(xiàn)許多噬菌體蛋白與已知功能蛋白之間存在結(jié)構(gòu)相似度,可以大幅提高噬菌體蛋白的功能推斷能力(圖2)。
噬菌體裂解酶是一種噬菌體編碼的溶菌酶,能夠高效切割細(xì)菌細(xì)胞壁。通過系統(tǒng)分析噬菌體裂解酶的結(jié)構(gòu)多樣性,研究團(tuán)隊發(fā)現(xiàn)其存在結(jié)構(gòu)域重排的進(jìn)化機制。進(jìn)而選取人體腸道致病菌噬菌體來源的裂解酶,通過合成生物學(xué)技術(shù),成功驗證了其針對人體腸道致病菌的裂解活性(圖3)。此外,一部分噬菌體裂解酶具有很高的物種靶向性,有望成為微生物組精準(zhǔn)編輯的平臺技術(shù)。
腸道菌源-宿主同工酶的結(jié)構(gòu)檢索與功能驗證
研究團(tuán)隊進(jìn)一步將結(jié)構(gòu)檢索的方法拓展至腸道菌源的宿主同工酶。前期研究發(fā)現(xiàn),腸道細(xì)菌編碼的酶能模擬宿主酶的功能,參與疾病的發(fā)生發(fā)展過程。通過結(jié)構(gòu)檢索,研究團(tuán)隊在青春雙歧桿菌(Bifidobacterium adolescentis)、多形擬桿菌(Bacteroides dorei)中發(fā)現(xiàn)了參與褪黑素合成的關(guān)鍵酶,首次揭示了腸道微生物的褪黑素合成途徑(圖4)。
動物實驗表明,菌源酶能夠顯著調(diào)節(jié)宿主體內(nèi)的褪黑素水平,進(jìn)而影響腸道生理與疾病狀態(tài)(圖5)。
最后,研究團(tuán)隊開發(fā)了人工智能方法Dense Enzyme Retrieval(DEER),能夠快速、高效識別同工酶,其性能顯著優(yōu)于現(xiàn)有的基于序列或結(jié)構(gòu)比對的方法(圖6)。DEER的模型訓(xùn)練運用了融合結(jié)構(gòu)信息的蛋白質(zhì)語言模型及對比學(xué)習(xí)技術(shù),實現(xiàn)了對酶功能的準(zhǔn)確預(yù)測;DEER模型的推理運用了密集檢索技術(shù),實現(xiàn)不依賴比對的快速檢索;DEER模型的框架不僅適用于遠(yuǎn)源酶的挖掘,未來還可進(jìn)一步拓展到其他功能的蛋白研究。
綜上所述,本研究提出蛋白結(jié)構(gòu)檢索的微生物組功能研究范式,不僅建立了人體腸道微生物蛋白質(zhì)結(jié)構(gòu)組數(shù)據(jù)庫,還驗證了多種噬菌體裂解酶和菌源宿主同工酶的功能,為解析人體腸道微生物組的功能暗物質(zhì)提供了重要的工具和思路。
深圳先進(jìn)院合成所戴磊研究員是本研究的主要通訊作者,北京大學(xué)汪鍇研究員和香港中文大學(xué)李煜教授為共同通訊作者。深圳先進(jìn)院合成所助理研究員劉紅賓博士是本研究的第一作者,深圳先進(jìn)院合成所助理研究員沈俊濤博士、北京大學(xué)張志威博士、香港中文大學(xué)王久銘博士、深圳先進(jìn)院合成所張成辛研究員為論文的共同第一作者。北京大學(xué)姜長濤教授、智峪裕生科王晟博士、深圳先進(jìn)院合成所司同研究員和馬迎飛研究員對于本研究提供了重要支持。該項研究成果獲得國家重點研發(fā)計劃、國家自然科學(xué)基金等項目的資助。本研究獲得了深圳合成生物研究重大科技基礎(chǔ)設(shè)施和深圳合成生物學(xué)創(chuàng)新研究院公共技術(shù)平臺提供的支持。
戴磊課題組在定量生物學(xué)與合成生物學(xué)的交叉領(lǐng)域開展研究,致力于實現(xiàn)復(fù)雜微生物組在基因?qū)哟?、群落層次的功能預(yù)測和精準(zhǔn)編輯。近年來,以通訊作者(含共同) 在Cell Host & Microbe(2025,2023)、Nature Biomedical Engineering (in press)、 Nature Communications(2025,2024,2023)、The ISME Journal(2022)等期刊發(fā)表研究論文。課題組長期招收人工智能、合成生物學(xué)、微生物組學(xué)等相關(guān)專業(yè)博士后,聯(lián)系郵箱:lei.dai@siat.ac.cn。

原文鏈接:https://doi.org/10.1016/j.chom.2025.11.001

圖1.?人體腸道微生物的蛋白質(zhì)結(jié)構(gòu)組數(shù)據(jù)庫

圖2.?基于結(jié)構(gòu)聚類的噬菌體蛋白功能推斷

圖3.?針對人體腸道致病菌的噬菌體裂解酶活性驗證

圖4.?基于結(jié)構(gòu)檢索發(fā)現(xiàn)腸道菌的褪黑素合成酶

圖5.?菌源酶能夠顯著調(diào)節(jié)宿主體內(nèi)的褪黑素水平

圖6.基于人工智能DEER的腸道菌源宿主同工酶挖掘
附件下載: