Nature Protocols | 通用蛋白與核酸結(jié)構(gòu)比對新算法US-align
蛋白質(zhì)與核酸等生物大分子的三維結(jié)構(gòu)比對是結(jié)構(gòu)生物學和計算生物學中的核心任務之一,在功能注釋、藥物設計與進化研究中發(fā)揮著重要作用。近年來,深度學習結(jié)構(gòu)預測模型和實驗解析手段的迅猛發(fā)展,使高效、精準地對蛋白質(zhì)、核酸及其復合物結(jié)構(gòu)進行比對變得尤為關(guān)鍵。然而,現(xiàn)有大多數(shù)比對工具往往僅支持特定類型分子的比對,難以勝任跨分子、非序列順序、循環(huán)排列等復雜結(jié)構(gòu)的統(tǒng)一處理,限制了其在多樣化研究場景中的應用。
近日,中國科學院深圳先進技術(shù)研究院張成辛研究員、密歇根大學Lydia Freddolino教授、新加坡國立大學張陽教授團隊在Nature Protocols上發(fā)表研究論文“A graphic and command line protocol for quick and accurate comparisons of protein and nucleic acid structures with US-align”,系統(tǒng)介紹了他們開發(fā)的通用結(jié)構(gòu)比對工具US-align(https://zhanggroup.org/US-align/)。該算法支持蛋白質(zhì)、DNA、RNA及其復合物的快速統(tǒng)一比對,具備命令行、PyMOL插件和網(wǎng)頁服務器三種使用方式。
US-align算法構(gòu)建于張陽團隊早期提出的TM-score和TM-align基礎(chǔ)上,后者已廣泛用于蛋白質(zhì)結(jié)構(gòu)質(zhì)量評估和結(jié)構(gòu)比對任務。與之相比,US-align不僅支持蛋白,還擴展至核酸、蛋白–核酸復合物甚至小分子的比對,并于2022年以核心算法形式發(fā)表于Nature Methods。相較于2022年發(fā)表的純命令行版本,新的論文在US-align功能實用性和用戶體驗上有顯著擴展和增強:新增了循環(huán)排列結(jié)構(gòu)比對模塊,支持多結(jié)構(gòu)比對任務(圖1),增強了結(jié)果可視化能力。用戶可通過PyMOL插件(圖2)、網(wǎng)頁版服務器(圖3)或命令行執(zhí)行比對任務,命令行結(jié)果支持在PyMOL、UCSF ChimeraX、RasMol等多種分子可視化軟件中查看(圖4)。此外,作為一款可同時完成序列順序的結(jié)構(gòu)比對與非序列順序比對的算法,最新版本的US-align還創(chuàng)新性地開發(fā)一套全新的循環(huán)排列(Circular Permutation)結(jié)構(gòu)比對算法(圖5),是第一款基于TM-score打分函數(shù)的循環(huán)排列比對程序。此外,新版US-align還支持批量結(jié)構(gòu)比對,為三維結(jié)構(gòu)數(shù)據(jù)庫搜索提供便利。
US-align 是目前少數(shù)可同時處理單體、復合物、多結(jié)構(gòu)、序列和非序列順序比對,以及循環(huán)排列比對任務的通用結(jié)構(gòu)工具。它以統(tǒng)一的TM-score打分函數(shù)描繪蛋白與核酸結(jié)構(gòu)間的相似性,并配套多種可視化和批量處理功能,為科研人員提供了高效、靈活、直觀的結(jié)構(gòu)分析平臺。US-align最新版相比2022年的命令行版本進行了多重優(yōu)化,但目前對于構(gòu)象變化較大的蛋白與核酸結(jié)構(gòu),US-align尚未能進行有效的柔性結(jié)構(gòu)比對,開發(fā)新型的柔性結(jié)構(gòu)比對算法將是US-align平臺的未來研發(fā)方向之一。

圖1. US-align的算法流程圖(a)與可執(zhí)行的三維結(jié)構(gòu)比對任務,包括b, 單體結(jié)構(gòu)兩兩比對;c, 復合物結(jié)構(gòu)兩兩比對;d, 多結(jié)構(gòu)比對;e, 序列順序比對;f, 循環(huán)順序比對;g, 完全非序列順序比對;h, 部分非序列順序比對。

圖2. 通過PyMOL插件執(zhí)行US-align結(jié)構(gòu)比對任務。a, 比對前。b, 比對后。

圖3. 通過網(wǎng)頁服務器執(zhí)行US-align比對任務的網(wǎng)頁輸出。a, 單體RNA結(jié)構(gòu)的兩兩比對。b, 蛋白復合物的兩兩比對。c, RNA的多結(jié)構(gòu)比對。

圖4. US-align命令行程序兩兩比對結(jié)果(a)在PyMOL(b-f)、RasMol(g-k)與UCSF ChimeraX(l-p)分子可視化程序中不同風格的三維結(jié)構(gòu)展示。

圖5. US-align進行循環(huán)排列結(jié)構(gòu)比對的實例。

文章上線截圖
附件下載: