深圳先進院在GPGPU極限功耗測試程序自動生成關(guān)鍵技術(shù)研究方面取得重要進展
近日,中國科學院深圳先進技術(shù)研究院數(shù)字所異構(gòu)智能計算體系結(jié)構(gòu)與系統(tǒng)研究中心在GPGPU極限功耗測試程序自動生成關(guān)鍵技術(shù)研究方面取得重要進展,相關(guān)成果以Guser: A GPGPU Power Stressmark Generator為題被計算機體系結(jié)構(gòu)頂級會議IEEE HPCA(High Performance Computer Architecture)2024錄用為長文。深圳先進院碩士生單亞龍在數(shù)字所喻之斌研究員的指導下完成了該研究。
該項研究致力于準確評估通用計算GPU(GPGPU)的極限功耗,提出了一種GPGPU極限功耗測試程序自動生成方法, 為GPGPU供電和散熱系統(tǒng)的優(yōu)化設計提供依據(jù)。“Power stressmark”對于估計GPGPU 熱設計功耗 (TDP) 以確保高效的功耗控制至關(guān)重要。Guser是首個生成 GPGPU Power stressmark的系統(tǒng)方法。主要包括三個關(guān)鍵方法:首先,指令功耗分析,分析了每個算術(shù)指令在不同操作數(shù)數(shù)據(jù)寬度下的功耗行為、執(zhí)行時間、流水線利用率和硬件單元占用情況;其次,基于流水線的指令分組,用于將所有 PTX 指令分類為多個組;最后,量化功耗影響因子的重要性,用于選擇少量但重要的可調(diào)節(jié)參數(shù)。基于GPGPU Tesla T4(圖靈架構(gòu))和 Tesla A10(安培架構(gòu))的實驗表明,使用Guser為 T4 生成的 Power stressmark(T4-stresser)功耗達 109.3 瓦特,以及為 A10 生成的Power stressmark(A10-stresser)功耗達 238.7 瓦特,分別比當前最先進CPU Power stressmark方法高出 48.7% 和 73%。 此外,T4-stresser 和 A10-stresser 的功耗明顯高于當前主流的三個基準測試程序集(Cactus、Rodinia 和 Parboil)中任何基準測試所達到的功耗。
IEEE HPCA (High Performance Computer Architecture)是由IEEE舉辦的計算機體系結(jié)構(gòu)領(lǐng)域的頂級會議,與ASPLOS, ISCA, MICRO并稱為計算機體系結(jié)構(gòu)領(lǐng)域的“四大頂會”。 參會對象包括微體系結(jié)構(gòu)、云計算、計算機系統(tǒng)等領(lǐng)域的研究人員或?qū)W生。

Guser框架
指令功耗分析
Guser與基準測試程序?qū)Ρ?/p>
Guser與最先進CPU Power stressmark方法對比
附件下載: