Nature Biotechnol. | CRISmers+GRAPE-LM RNA適配體進(jìn)化新范式
核酸適配體(aptamer)由諾獎(jiǎng)得主Jack Szostak命名,是一類短的單鏈DNA(ssDNA)或RNA寡核苷酸,能夠折疊形成特定三維結(jié)構(gòu),并以“結(jié)構(gòu)分子”的方式高親和力結(jié)合蛋白或小分子,從而具備開發(fā)成為核酸藥物和診斷探針的潛力?(1, 2)。然而,適配體發(fā)現(xiàn)長期依賴指數(shù)富集的配體系統(tǒng)進(jìn)化技術(shù)(SELEX),通常需要多輪、強(qiáng)人工參與的篩選與優(yōu)化;更關(guān)鍵的是,在體外簡(jiǎn)化條件下獲得的適配體,親和力和特異性常常不高,限制了其開發(fā)成核酸藥物和探針的潛力?(3)。
王宇課題組在既往工作中提出CRISmers(CRISPR/Cas-based aptamers screening system),將適配體篩選從溶液和細(xì)胞表面體系推進(jìn)到細(xì)胞內(nèi)環(huán)境,使篩選過程天然包含內(nèi)源生物學(xué)機(jī)制,體現(xiàn)了內(nèi)源折疊構(gòu)象、相互作用特異性、充分的分子競(jìng)爭(zhēng)等關(guān)鍵變量,從源頭提升生物學(xué)相關(guān)性?(4, 5)。在CRISmers篩選體系中,每個(gè)細(xì)胞作為一個(gè)獨(dú)立的物理微單元,其作用類似于微流控液滴,能夠有效隔離不同分子間的交叉反應(yīng),從而顯著降低背景噪音。與此同時(shí),該系統(tǒng)以細(xì)胞存活等表型變化作為功能性的篩選輸出方式,相較于傳統(tǒng)的體外親和力篩選,其功能相關(guān)性也同時(shí)得到了顯著提升。這些工作此前發(fā)表于Advanced Science和Advanced Healthcare Materials。
不過,胞內(nèi)篩選不可避免面臨“遞送與細(xì)胞數(shù)量”帶來的通量上限:以CRISmers為代表的胞內(nèi)篩選體系,文庫規(guī)模受轉(zhuǎn)染/遞送效率與細(xì)胞攝入能力限制,可能錯(cuò)過大量潛在有效序列。也正是在這一瓶頸處,AI驅(qū)動(dòng)的“數(shù)字進(jìn)化”開始展現(xiàn)決定性價(jià)值。
2月6日,中國科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國重點(diǎn)實(shí)驗(yàn)室、合成生物學(xué)研究所王宇團(tuán)隊(duì)在Nature Biotechnology雜志進(jìn)一步提出GRAPE-LM(Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model),將“胞內(nèi)篩選數(shù)據(jù)”與“核酸語言模型”耦合為一條端到端的一輪式高效進(jìn)化路徑:模型以Transformer條件自編碼器為骨架,融合核酸語言模型,并由CRISmers在胞內(nèi)環(huán)境產(chǎn)生的篩選數(shù)據(jù)提供“活性引導(dǎo)”,實(shí)現(xiàn)RNA適配體的一輪進(jìn)化與生成?(6)。在GRAPE-LM中,活性引導(dǎo)機(jī)制將模型推向更高活性的方向,預(yù)訓(xùn)練核酸語言模型用于提出合理的高質(zhì)量候選序列。該框架在三類跨度顯著的靶標(biāo)上完成驗(yàn)證:人T細(xì)胞受體CD3ε、SARS-CoV-2刺突蛋白R(shí)BD,以及人源致癌轉(zhuǎn)錄因子c-Myc(胞內(nèi)無序蛋白)。
更重要的是,GRAPE-LM將“實(shí)驗(yàn)進(jìn)化”從傳統(tǒng)的多輪循環(huán),重構(gòu)為“物理進(jìn)化 + 數(shù)字優(yōu)化”的兩階段:第一階段由CRISmers在細(xì)胞內(nèi)完成一輪篩選,第二階段由語言模型在更大序列空間中進(jìn)行數(shù)字化優(yōu)化與外推;在三類靶標(biāo)上,僅用“一輪”即可獲得優(yōu)于既往SELEX 6–16輪所得到的適配體的先導(dǎo)序列。這種效率躍遷也體現(xiàn)在起始文庫需求上: CRISmers+GRAPE-LM路線可在約108規(guī)模的起始文庫上工作,而經(jīng)典SELEX常需要1014–1016量級(jí);換言之,前者僅需后者約百萬分之一到億分之一的初始文庫規(guī)模。
在CRISmers+GRAPE-LM的新范式中,CRISPR脫離了基因編輯的框架,在這里扮演的是“高保真胞內(nèi)RNA數(shù)據(jù)發(fā)動(dòng)機(jī)”,捕獲SELEX等體外方法難以復(fù)現(xiàn)的胞內(nèi)內(nèi)源生物學(xué)機(jī)制;而GRAPE-LM則通過外推有限起始文庫,補(bǔ)足CRISmers通量受限的短板,并且引導(dǎo)生成更高活性RNA適配體。
這一工作僅僅將CRISmers和GRAPE-LM兩個(gè)工具使用一次。面向未來,多輪迭代有望進(jìn)一步提升分子質(zhì)量和成藥性。此外,GRAPE-LM僅僅應(yīng)用了語言模型,物理模型的加入有望實(shí)現(xiàn)生成能力的進(jìn)一步加強(qiáng)。該技術(shù)路線也已成功用于多肽分子的高效發(fā)現(xiàn),并與某知名藥企合作開展藥物開發(fā)(未發(fā)表結(jié)果)。
在與王宇的通訊中,領(lǐng)域開創(chuàng)者Jack Szostak評(píng)價(jià)CRISmers和GRAPE-LM的工作“非常有創(chuàng)造性,令人印象深刻”(“very creative and impressive”)。在論文審稿過程中,審稿人評(píng)價(jià)該工作“超級(jí)創(chuàng)新”(“super innovative”),并被編輯團(tuán)隊(duì)選為亮點(diǎn)論文,邀請(qǐng)作者發(fā)表Research Briefing介紹論文成果和研究歷程(7)。同時(shí),Nature Biotechnology編輯團(tuán)隊(duì)發(fā)表評(píng)論,表達(dá)了對(duì)這項(xiàng)工作的“興奮”(“exciting”)。
深圳大學(xué)人工智能學(xué)院助理教授張軍和中國科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國重點(diǎn)實(shí)驗(yàn)室、合成生物學(xué)研究所助理研究員張菊為該論文的共同第一作者。中國科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國重點(diǎn)實(shí)驗(yàn)室、合成生物學(xué)研究所研究員王宇為通訊作者。天津大學(xué)藥學(xué)院教授張陽和助理教授張軍為共同通訊作者。唐少軒、劉傳承、蔡雨珊、曾浩、孟翔杰、柳貝為參與作者,對(duì)本項(xiàng)工作做出重要貢獻(xiàn)。本項(xiàng)工作得到了國家自然科學(xué)基金、重點(diǎn)研發(fā)計(jì)劃、深圳合成生物學(xué)創(chuàng)新研究院等項(xiàng)目的大力支持。
專家點(diǎn)評(píng)
李校堃院士(溫州醫(yī)科大學(xué))
核酸適配體作為一類重要的生物分子藥物,但其發(fā)現(xiàn)長期依賴SELEX等體外篩選范式,往往需要多輪迭代。王宇團(tuán)隊(duì)圍繞這一效率瓶頸,提出并發(fā)展出了CRISmers與GRAPE-LM的“胞內(nèi)篩選—AI進(jìn)化”一輪式高效路線:前者將CRISPR為分子支架,將親和力轉(zhuǎn)化為細(xì)胞層面的功能輸出,在單細(xì)胞隔離的體系中實(shí)現(xiàn)胞內(nèi)適配體篩選;后者以一輪篩選數(shù)據(jù)為活性引導(dǎo),借助生成式語言模型實(shí)現(xiàn)序列空間外推與快速優(yōu)化,從而在概念與方法學(xué)層面顯著刷新了適配體發(fā)現(xiàn)的效率邊界。
在技術(shù)邏輯上,該工作抓住了生物分子藥物開發(fā)的關(guān)鍵原則:真正決定候選可開發(fā)性的,是其在復(fù)雜生物學(xué)競(jìng)爭(zhēng)環(huán)境下的有效結(jié)合及由此產(chǎn)生的功能結(jié)果。CRISmers把篩選壓力前移到細(xì)胞內(nèi),使“生物學(xué)相關(guān)性”成為選擇的第一標(biāo)準(zhǔn);而GRAPE-LM進(jìn)一步解決了胞內(nèi)篩選通量受限的結(jié)構(gòu)性問題,將有限實(shí)驗(yàn)信號(hào)轉(zhuǎn)化為可擴(kuò)展的數(shù)字進(jìn)化能力,實(shí)現(xiàn)“一輪篩選即可獲得高質(zhì)量候選”的范式躍遷。
尤為值得積極評(píng)價(jià)的是,該體系在不同類型靶標(biāo)上展現(xiàn)出通用潛力,從病毒表面抗原到細(xì)胞表面受體,再到更具挑戰(zhàn)性的胞內(nèi)蛋白,均能形成可解釋、可復(fù)用的篩選與優(yōu)化路徑。這為生物分子藥物開發(fā)提供了可推廣的方法論:以“功能表型”為核心的胞內(nèi)選擇壓力,疊加“生成式外推”的序列設(shè)計(jì)能力,有望擴(kuò)展至多類分子(如適配體、非編碼RNA、肽類、以及蛋白類)的先導(dǎo)發(fā)現(xiàn)與定向優(yōu)化。
綜上所述,CRISmers與GRAPE-LM的結(jié)合不僅在技術(shù)上提高了適配體發(fā)現(xiàn)的成效,更在范式上推動(dòng)生物分子藥物從“體外親和力驅(qū)動(dòng)”走向“胞內(nèi)功能驅(qū)動(dòng) + AI加速進(jìn)化”。這一工作為生成式AI賦能生物分子藥物研發(fā)提供了高質(zhì)量范例,也為后續(xù)面向更多靶點(diǎn)和臨床轉(zhuǎn)化的系統(tǒng)化擴(kuò)展和應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
譚蔚泓院士(中國科學(xué)院杭州醫(yī)學(xué)研究所)
中國科學(xué)院深圳先進(jìn)院王宇團(tuán)隊(duì)提出的CRISmers與GRAPE-LM相結(jié)合的新范式,為加速適配體發(fā)現(xiàn)提供了一條獨(dú)特的路徑。該工作巧妙地構(gòu)建了一個(gè)“物理篩選”與“數(shù)字進(jìn)化”高效協(xié)同的閉環(huán)。其中,CRISmers系統(tǒng)的重要意義在于它將篩選環(huán)境從體外推進(jìn)到了活細(xì)胞內(nèi),從源頭上提升了候選分子的生物學(xué)相關(guān)性。同時(shí),它的篩選輸出是細(xì)胞生死這樣的功能事件,這與我們團(tuán)隊(duì)一直倡導(dǎo)的“功能篩選”理念高度契合。而GRAPE-LM的引入則讓適配體發(fā)現(xiàn)進(jìn)入了“AI驅(qū)動(dòng)”的模式。該模型將一次有限的胞內(nèi)實(shí)驗(yàn)數(shù)據(jù)作為引導(dǎo),在更大的序列空間中進(jìn)行智能探索與優(yōu)化,從而實(shí)現(xiàn)了向 “智能化的單輪設(shè)計(jì)進(jìn)化”的范式轉(zhuǎn)變。
這項(xiàng)工作的成功,不僅驗(yàn)證了AI大模型在生物分子設(shè)計(jì)中的巨大潛力,更重要的意義在于它為整個(gè)分子發(fā)現(xiàn)領(lǐng)域提出了一個(gè)新的思路。 它將CRISPR技術(shù)重新定位為一種“高保真數(shù)據(jù)發(fā)動(dòng)機(jī)”,這為獲取高質(zhì)量的生物活性數(shù)據(jù)開辟了新思路??梢灶A(yù)見,這種“高質(zhì)量實(shí)驗(yàn)數(shù)據(jù)驅(qū)動(dòng)AI設(shè)計(jì)”的模式,未來可被廣泛應(yīng)用于多肽、蛋白等其他功能分子的開發(fā)中。同時(shí),這項(xiàng)技術(shù)的潛力還有進(jìn)一步釋放的空間,例如引入物理模型以更精準(zhǔn)地預(yù)測(cè)結(jié)構(gòu),以及進(jìn)行多輪迭代以優(yōu)化成藥性。我對(duì)該技術(shù)的后續(xù)發(fā)展及其轉(zhuǎn)化應(yīng)用充滿期待。
伊成器(北京大學(xué))
王宇團(tuán)隊(duì)開發(fā)的CRISmers與GRAPE-LM技術(shù),精準(zhǔn)地?fù)糁辛水?dāng)前RNA適配體乃至更大范圍的RNA藥物開發(fā)領(lǐng)域的一個(gè)瓶頸:如何在復(fù)雜的細(xì)胞內(nèi)環(huán)境中,高效地獲得具有高親和力、高特異性及良好功能性的RNA分子。CRISmers系統(tǒng)的巧妙之處在于,它將篩選“考場(chǎng)”直接設(shè)于細(xì)胞內(nèi),使得候選適配體經(jīng)過了內(nèi)源環(huán)境的篩選,極大提升了候選分子的生物學(xué)相關(guān)性。而GRAPE-LM的引入,賦予了在復(fù)雜RNA序列空間中進(jìn)行“智能設(shè)計(jì)”的能力。
這項(xiàng)工作的意義,除了適配體篩選,也為開發(fā)多功能RNA藥物提供了新的思路,例如整合靶向結(jié)合模塊(如適配體)與治療性功能模塊(如siRNA,核酸修飾酶)的耦聯(lián)藥物。另外,內(nèi)源的RNA修飾機(jī)制(如m?A、Ψ等)是否參與其中尚屬未知,也有可能是胞內(nèi)CRISmers系統(tǒng)的另一獨(dú)特優(yōu)勢(shì)。

文章上線截圖

圖1:加速RNA適配體進(jìn)化的強(qiáng)大新范式
附件下載: