近期,鄢貴海團隊研究成果在計算機體系結(jié)構(gòu)領域國際頂級期刊《IEEE Transactions on Computers》中發(fā)表。該研究主要圍繞KPU敏捷計算架構(gòu)展開,KPU具有超強異構(gòu)核集成和調(diào)度能力,在降低了規(guī)模限制的硬件成本和設計周期的同時,又可通過軟件編程實現(xiàn)不同功能的計算,具有較高的可擴展性和靈活性。中科馭數(shù)DPU芯片基于自研KPU架構(gòu)設計。以下是部分研究內(nèi)容:
————————
領域特定架構(gòu)技術(shù)顯著提升了計算性能。然而,隨著數(shù)據(jù)量呈指數(shù)增長以及應用類型的豐富,面向某一特定計算操作的加速器難以處理復雜的工作負載和應用需求,現(xiàn)有的加速器設計也難以滿足大規(guī)模數(shù)據(jù)計算需求。主要挑戰(zhàn)在于建立一個靈活的框架,能夠充分利用這些粗粒度的特定計算加速單元執(zhí)行復雜計算,同時避免硬件集成、編程、系統(tǒng)編譯和運行等引入的額外開銷。
核處理單元(Kernel Processing Unit, KPU)架構(gòu)基于“軟件定義加速器”方法實現(xiàn),是一種為加速特定領域核心功能計算而設計的協(xié)處理器架構(gòu),能夠有效解決“專用”的困境。KPU以功能核作為基本單元,直接對應用中計算密集型應用進行抽象核和高層綜合,實現(xiàn)以數(shù)據(jù)為中心的架構(gòu)“定制”。KPU具有超強異構(gòu)核集成和調(diào)度能力,一顆 KPU根據(jù)需求可以集成數(shù)十至數(shù)百個功能核。在運行機制上,KPU采用“數(shù)據(jù)驅(qū)動并行計算”的方式,運行過程中通過數(shù)據(jù)流來激活不同的功能核進行相應計算。通過高層次綜合,既實現(xiàn)了領域內(nèi)硬件的統(tǒng)一,降低了規(guī)模限制的硬件成本和設計周期,又能通過軟件編程實現(xiàn)不同功能的計算;特定需求只需要增刪功能核的種類和數(shù)量即可。在整體計算效率提升百倍的前提下,仍然具有非常高的可擴展性和靈活性。

基于KPU架構(gòu)的思想,面向數(shù)據(jù)庫的KPU-SQL架構(gòu)的核心是設計統(tǒng)一的接口以整合所有數(shù)據(jù)查詢操作。在硬件架構(gòu)方面,KPU-SQL集成了多個獨立設計的查詢操作計算單元,通過對這些特定功能計算核的充分優(yōu)化,最大程度上提升數(shù)據(jù)查詢性能。在數(shù)據(jù)管理方面,KPU-SQL集成一種高效數(shù)據(jù)管理系統(tǒng)(DMS)充分優(yōu)化數(shù)據(jù)流,利用流式計算方法最大化片上內(nèi)存帶寬的利用率。面向數(shù)據(jù)庫查詢這一典型的應用場景,設計KPU指令集架構(gòu)KISA,從查詢關鍵操作的層次抽象關鍵算子,實現(xiàn)KPU-SQL的并行編程。在上層軟件的支持方面,KPU-SQL提供了一個完整的軟件編程工具并充分優(yōu)化數(shù)據(jù)庫查詢操作執(zhí)行。設計了一種自適應卸載機制,充分協(xié)同CPU和加速器的計算能力,優(yōu)化執(zhí)行中的計算和數(shù)據(jù)傳輸開銷。在數(shù)據(jù)查詢標準測試集TPC的典型實驗中,KPU-SQL比通用CPU和GPU取得24.5倍和8.75倍性能提升。

審核編輯 黃宇
-
IEEE
+關注
關注
7文章
417瀏覽量
49998 -
數(shù)據(jù)庫
+關注
關注
7文章
4016瀏覽量
68325 -
DPU
+關注
關注
0文章
414瀏覽量
26956
發(fā)布評論請先 登錄
微電網(wǎng)標準體系解析:IEEE 1547與國標關鍵技術(shù)要求對比
有源晶振的核心技術(shù)優(yōu)勢與應用價值?
操作系統(tǒng)體系結(jié)構(gòu)
UPS電源核心技術(shù)深度解析:從拓撲結(jié)構(gòu)到智能管理的演進之路
遠心鏡頭核心技術(shù)解析與應用
解析SDD?探測器的核心技術(shù)及應用領域
UPS電源的核心技術(shù)是什么
深入解析Xray無損檢測核心技術(shù)與應用優(yōu)勢
便攜式高光譜相機的核心技術(shù)與應用優(yōu)勢
DPU核心技術(shù)論文再次登陸體系結(jié)構(gòu)領域旗艦期刊《IEEE Transactions on Computers》
評論