GigaScience | 深圳先進院開發(fā)多模態(tài)融合方法劃分質譜成像數(shù)據(jù)感興趣區(qū)域
近日,中國科學院深圳先進技術研究院醫(yī)工所傳感中心羅茜研究員在生物數(shù)據(jù)科學領域國際知名期刊GigaScience雜志上發(fā)表了題為“Delineating Regions-of-interest for Mass Spectrometry Imaging by Multimodally Corroborated Spatial Segmentation”的文章。該工作成功開發(fā)了一種多模態(tài)融合驗證的空間分割新方法,可以準確可靠地確定質譜成像數(shù)據(jù)的感興趣區(qū)域(regions-of-interest,ROIs)。
論文上線截圖
質譜成像(Mass Spectrometry Imaging, MSI)是一種具有空間分辨能力的新型分子組學技術,為研究人員提供了理解生物現(xiàn)象背后生化機制的新手段。它通過掃描收集組織切片上各個位置的完整質譜圖,可免標簽、高通量地同時獲得幾十到幾百個分子的空間分布信息,其能夠探測的分子種類包括蛋白質、肽、脂類和代謝物,具有靈敏度高和化學特異性強的特點。在MSI數(shù)據(jù)的統(tǒng)計分析過程中,一張完整的組織切片通常會被“虛擬地”劃分成許多感興趣區(qū)域(Regions-of-interest, ROIs),這些區(qū)域往往對應著不同的解剖學或病理學標簽。準確劃分ROI是挖掘空間分子組學數(shù)據(jù)的前提,對于發(fā)現(xiàn)疾病等因素引起的分子變化至關重要。然而,在現(xiàn)有的ROI劃分方法中,傳統(tǒng)手動方法依賴主觀判斷且耗時費力;而基于質譜間相似性聚類算法的空間分割(spatial segmentation)方法,雖然很大程度上實現(xiàn)了自動化,但其結果易受儀器噪聲和偽影影響,并且關鍵算法參數(shù)的選?。ㄈ缰苯記Q定空間分割顆粒度的聚類數(shù)/簇數(shù)K)仍存在一定的主觀性,導致其結果可靠性較差。
該研究報道了一種基于多模態(tài)融合思想的“半監(jiān)督”方法,即依靠“AI病理師”驗證空間分割得到的ROI結果:創(chuàng)新性地融合MSI中獲取的分子組分信息和H&E病理圖中獲取的組織形態(tài)信息,實現(xiàn)了從兩個相對獨立互補的生物信息源,交叉驗證ROI的劃分結果,有力保證了其生物學意義上的可靠性。深度卷積神經(jīng)網(wǎng)絡被作為視覺特征提取器,從H&E染色圖像中計算切片各位置的”組織形態(tài)學譜圖(Histomorphological Features,HF)”,根據(jù)不同位置間的組織形態(tài)譜相似性,通過聚類分析實現(xiàn)無監(jiān)督切片分區(qū)。通過Cohen's kappa系數(shù)評估基于MSI和基于組織學的兩組ROI間的相似性,選取可以最大化相似性的Kmeans聚類算法的關鍵參數(shù)——簇數(shù)K,將兩種模態(tài)判斷類別標簽一致的區(qū)域輸出,進而實現(xiàn)不同成像模態(tài)生成的ROI進行交叉驗證,令生成的ROI具有高可信度。
團隊開發(fā)多模態(tài)融合方法劃分質譜成像數(shù)據(jù)ROI方法用于小鼠腎組織樣本和原位種植腫瘤研究(圖3)發(fā)現(xiàn)ROI與ground truths完美呼應,且廣泛適用于不同類別的組織樣本。工作涉及的核心代碼與數(shù)據(jù)將完全開源共享,該方法為MSI為基礎空間代謝組學和蛋白質組學研究者,提供多模態(tài)數(shù)據(jù)融合技術方法,進一步發(fā)展臨床病理切片的細胞化學異質性研究。
深圳先進院醫(yī)工所傳感中心郭昂助理研究員為該論文的第一作者,羅茜研究員擔任論文的通信作者,博士研究生陳志宇和李芳副研究員提供MSI實驗技術支持。該研究獲得了國家自然科學基金委國家重大科研儀器研制項目、科技部重點研發(fā)計劃等項目的支持。
基于多模態(tài)融合方法的自動組織分區(qū)流程圖:(a) 基于MSI數(shù)據(jù)的分支;(b) 基于H&E染色組織圖像的分支 (以腎樣本為例)
基于多模態(tài)融合方法的自動組織分區(qū)結果圖:小鼠腎組織樣本、ROI劃分結果及不同ROI的特征分子
附件下載: