Nature Machine Intelligence|DeepDirect:基于對抗學習指導突變以增強蛋白質親和力的設計框架
在生物醫(yī)學和生物技術的發(fā)展中,尤其在藥物設計、治療性蛋白質的開發(fā)和疫苗構建方面,蛋白質工程扮演了至關重要的角色。蛋白質工程的核心挑戰(zhàn)之一是理解和預測蛋白質的結構、功能與序列之間的復雜相互作用。
近年來,隨著生物信息學和計算生物學的進步,蛋白質序列到結構以及功能到序列的預測取得了顯著進展。這些突破為深入理解蛋白質的生物學功能和進行定向蛋白質設計提供了強大的工具。
然而,在藥物設計和蛋白質工程中,預測蛋白質或蛋白質復合體因突變而導致的親和力變化是一個特別具有挑戰(zhàn)性的問題,能夠準確預測突變?nèi)绾斡绊懙鞍踪|親和力的技術,將對疾病治療和生物醫(yī)學研究產(chǎn)生重要影響。
2月28日,中國科學院深圳先進技術研究院先進計算與數(shù)字工程研究所研究員、深圳理工大學(籌)計算機科學與控制工程學院杰出教授李金艷研究團隊在Nature Machine Intelligence上發(fā)表了題為“Generating mutants of monotone affinity towards stronger protein complexes through adversarial learning”的研究文章。該文章介紹了一種創(chuàng)新的模型DeepDirect,旨在通過對抗學習生成的突變方法,顯著改變蛋白質親和力的方向,為蛋白質生物工程、藥物設計等領域提供新的思路。
團隊展示了如何利用深度學習生成蛋白質突變,以優(yōu)化其功能和親和力,特別是在研究SARS-CoV-2 Omicron變種時的應用。這項工作不僅提供了一種高效的蛋白質改造策略,還為理解蛋白質動態(tài)和疾病進化提供了新的視角,對未來的生物醫(yī)藥研究具有重要意義。

論文截圖
DeepDirect模型由蛋白質序列突變生成器、兩個鑒別器和一個蛋白質復合體親和力變化預測器三個主要部分組成。突變生成器是DeepDirect架構中最重要的部分(見圖1和圖2a)。

DeepDirect突變生成器的概述(圖1)
生成器的輸入需要三種類型的數(shù)據(jù):蛋白質的氨基酸序列、蛋白質的結構/輔助數(shù)據(jù)和與蛋白質相關的噪聲(圖1a所示)。突變生成器與兩個鑒別器和親和力預測器一起,在新的兩階段對抗訓練過程中組織,使突變生成器能夠提取所需的特征。得益于其架構,突變生成器能夠確定突變位點和這些位點上的氨基酸替換(圖1b所示),從而朝向指定的親和力變化方向(圖1c所示)。

DeepDirect架構(圖2)
研究展示了DeepDirect在多個案例中的應用,包括Novavax疫苗構建的優(yōu)化和SARS-CoV-2?? Omicron刺突蛋白的進化路徑分析。結果顯示,DeepDirect在多個案例中的應用成功展示了其優(yōu)越性。在Novavax疫苗構建優(yōu)化和SARS-CoV-2?? Omicron刺突蛋白的進化路徑分析中,DeepDirect生成的突變序列與隨機突變相比,在體外顯示出超過一個數(shù)量級的結合自由能變化。特別是在Novavax–血管緊張素轉換酶相關羧肽酶疫苗構建的案例研究中,展示了其生成更強復合體的能力。
DeepDirect方法在解決蛋白質親和力方向顯著變化的突變生成問題中具有有效性和創(chuàng)新性,通過對抗學習過程動態(tài)標記蛋白質數(shù)據(jù)的“真實”側并生成偽數(shù)據(jù),構建了一個深度學習架構,有效地指導了突變的產(chǎn)生。這一方法不僅在蛋白質生物工程、藥物設計、抗體重新配方和治療性蛋白質藥物等領域展示了巨大的應用潛力,也為理解生物分子間的相互作用和蛋白質進化提供了新的視角。
該研究中,李金艷研究員為通訊作者;原悉尼科技大學計算機科學系、現(xiàn)澳大利亞Natexl公司的CEO??Tian Lan博士為一作;悉尼科技大學計算機科學系的博士生Shuquan Su、Pengyao??Ping,悉尼科技大學生物醫(yī)學工程系的Grorgy Hutvagner教授,新南威爾斯大學兒童癌癥研究院的Tao??Liu副教授,深圳理工大學(籌)計算機科學與控制工程學院潘毅教授作為合作作者參與該項研究工作。
附件下載: