Nature Protocols | 通用蛋白與核酸結(jié)構(gòu)比對(duì)新算法US-align
蛋白質(zhì)與核酸等生物大分子的三維結(jié)構(gòu)比對(duì)是結(jié)構(gòu)生物學(xué)和計(jì)算生物學(xué)中的核心任務(wù)之一,在功能注釋、藥物設(shè)計(jì)與進(jìn)化研究中發(fā)揮著重要作用。近年來(lái),深度學(xué)習(xí)結(jié)構(gòu)預(yù)測(cè)模型和實(shí)驗(yàn)解析手段的迅猛發(fā)展,使高效、精準(zhǔn)地對(duì)蛋白質(zhì)、核酸及其復(fù)合物結(jié)構(gòu)進(jìn)行比對(duì)變得尤為關(guān)鍵。然而,現(xiàn)有大多數(shù)比對(duì)工具往往僅支持特定類型分子的比對(duì),難以勝任跨分子、非序列順序、循環(huán)排列等復(fù)雜結(jié)構(gòu)的統(tǒng)一處理,限制了其在多樣化研究場(chǎng)景中的應(yīng)用。
近日,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院張成辛研究員、密歇根大學(xué)Lydia Freddolino教授、新加坡國(guó)立大學(xué)張陽(yáng)教授團(tuán)隊(duì)在Nature Protocols上發(fā)表研究論文“A graphic and command line protocol for quick and accurate comparisons of protein and nucleic acid structures with US-align”,系統(tǒng)介紹了他們開(kāi)發(fā)的通用結(jié)構(gòu)比對(duì)工具US-align(https://zhanggroup.org/US-align/)。該算法支持蛋白質(zhì)、DNA、RNA及其復(fù)合物的快速統(tǒng)一比對(duì),具備命令行、PyMOL插件和網(wǎng)頁(yè)服務(wù)器三種使用方式。
US-align算法構(gòu)建于張陽(yáng)團(tuán)隊(duì)早期提出的TM-score和TM-align基礎(chǔ)上,后者已廣泛用于蛋白質(zhì)結(jié)構(gòu)質(zhì)量評(píng)估和結(jié)構(gòu)比對(duì)任務(wù)。與之相比,US-align不僅支持蛋白,還擴(kuò)展至核酸、蛋白–核酸復(fù)合物甚至小分子的比對(duì),并于2022年以核心算法形式發(fā)表于Nature Methods。相較于2022年發(fā)表的純命令行版本,新的論文在US-align功能實(shí)用性和用戶體驗(yàn)上有顯著擴(kuò)展和增強(qiáng):新增了循環(huán)排列結(jié)構(gòu)比對(duì)模塊,支持多結(jié)構(gòu)比對(duì)任務(wù)(圖1),增強(qiáng)了結(jié)果可視化能力。用戶可通過(guò)PyMOL插件(圖2)、網(wǎng)頁(yè)版服務(wù)器(圖3)或命令行執(zhí)行比對(duì)任務(wù),命令行結(jié)果支持在PyMOL、UCSF ChimeraX、RasMol等多種分子可視化軟件中查看(圖4)。此外,作為一款可同時(shí)完成序列順序的結(jié)構(gòu)比對(duì)與非序列順序比對(duì)的算法,最新版本的US-align還創(chuàng)新性地開(kāi)發(fā)一套全新的循環(huán)排列(Circular Permutation)結(jié)構(gòu)比對(duì)算法(圖5),是第一款基于TM-score打分函數(shù)的循環(huán)排列比對(duì)程序。此外,新版US-align還支持批量結(jié)構(gòu)比對(duì),為三維結(jié)構(gòu)數(shù)據(jù)庫(kù)搜索提供便利。
US-align 是目前少數(shù)可同時(shí)處理單體、復(fù)合物、多結(jié)構(gòu)、序列和非序列順序比對(duì),以及循環(huán)排列比對(duì)任務(wù)的通用結(jié)構(gòu)工具。它以統(tǒng)一的TM-score打分函數(shù)描繪蛋白與核酸結(jié)構(gòu)間的相似性,并配套多種可視化和批量處理功能,為科研人員提供了高效、靈活、直觀的結(jié)構(gòu)分析平臺(tái)。US-align最新版相比2022年的命令行版本進(jìn)行了多重優(yōu)化,但目前對(duì)于構(gòu)象變化較大的蛋白與核酸結(jié)構(gòu),US-align尚未能進(jìn)行有效的柔性結(jié)構(gòu)比對(duì),開(kāi)發(fā)新型的柔性結(jié)構(gòu)比對(duì)算法將是US-align平臺(tái)的未來(lái)研發(fā)方向之一。

圖1. US-align的算法流程圖(a)與可執(zhí)行的三維結(jié)構(gòu)比對(duì)任務(wù),包括b, 單體結(jié)構(gòu)兩兩比對(duì);c, 復(fù)合物結(jié)構(gòu)兩兩比對(duì);d, 多結(jié)構(gòu)比對(duì);e, 序列順序比對(duì);f, 循環(huán)順序比對(duì);g, 完全非序列順序比對(duì);h, 部分非序列順序比對(duì)。

圖2. 通過(guò)PyMOL插件執(zhí)行US-align結(jié)構(gòu)比對(duì)任務(wù)。a, 比對(duì)前。b, 比對(duì)后。

圖3. 通過(guò)網(wǎng)頁(yè)服務(wù)器執(zhí)行US-align比對(duì)任務(wù)的網(wǎng)頁(yè)輸出。a, 單體RNA結(jié)構(gòu)的兩兩比對(duì)。b, 蛋白復(fù)合物的兩兩比對(duì)。c, RNA的多結(jié)構(gòu)比對(duì)。

圖4. US-align命令行程序兩兩比對(duì)結(jié)果(a)在PyMOL(b-f)、RasMol(g-k)與UCSF ChimeraX(l-p)分子可視化程序中不同風(fēng)格的三維結(jié)構(gòu)展示。

圖5. US-align進(jìn)行循環(huán)排列結(jié)構(gòu)比對(duì)的實(shí)例。

文章上線截圖
附件下載: