資料介紹
描述
“整個互聯(lián)網(wǎng)電子商務(wù)世界都是由圖分析驅(qū)動的”,因為圖結(jié)構(gòu)可以自然地代表許多重要應(yīng)用領(lǐng)域的數(shù)據(jù)集,例如社交網(wǎng)絡(luò)、網(wǎng)絡(luò)安全和機器學習。來自這些應(yīng)用程序的數(shù)據(jù)對高性能圖形處理提出了迫切的需求。
大量研究構(gòu)建基于 FPGA 的高效圖形處理加速器;但是,高級圖形應(yīng)用程序與底層 CPU-FPGA 平臺之間仍然存在差距,這需要開發(fā)人員了解硬件細節(jié)并進行大量編程(例如,使用硬件描述語言進行編程、調(diào)整管道和進行內(nèi)存優(yōu)化) . 這一差距在很大程度上阻礙了數(shù)據(jù)中心應(yīng)用程序開發(fā)人員采用 FPGA。
ThunderGP 有什么大不了的?
ThunderGP 通過為 FPGA 加速圖形處理帶來性能和可編程性來彌補上述差距,并已在FPGA'21中被接受。
ThunderGP 是 FPGA 上基于 HLS 的開源圖形處理框架,支持 Vitis 和 SDAccel 開發(fā)環(huán)境,適用于 Xilinx Alveo 平臺,如 U50、U200、U250 和 VCU1525。使用 ThunderGP,開發(fā)人員只需要編寫使用基于顯式高級語言 (C++) 且與硬件無關(guān)的 API 的高級函數(shù)。隨后,ThunderGP 在具有多個超級邏輯區(qū)域 (SLR) 的最先進 FPGA 平臺上自動生成高性能加速器并管理加速器的部署。

ThunderGP 的概述如圖 1 所示。我們簡要說明主要構(gòu)建塊如下。
- 內(nèi)置加速器模板。ThunderGP 采用 Gather-Apply-Scatter (GAS) 模型作為各種圖算法的抽象,并通過內(nèi)置的高并行和內(nèi)存高效的加速器模板來實現(xiàn)模型。
- 自動加速器生成。自動加速器生成可產(chǎn)生可合成的加速器,釋放底層 FPGA 平臺的全部潛力。除了內(nèi)置加速器模板外,它還采用圖形算法的分散、聚集和應(yīng)用階段(來自 GAS 模型)和 FPGA 平臺模型(例如,U50)的用戶定義函數(shù) (UDF) ) 來自開發(fā)人員作為輸入。
- 圖分區(qū)和調(diào)度。ThunderGP 采用基于目標頂點的垂直分區(qū)方法,無需引入邊緣排序等繁重的預(yù)處理操作,即可通過片上 RAM 實現(xiàn)頂點緩沖。
- 高級API。ThunderGP 提供了兩組基于 C++ 的 API:用于自定義圖形算法加速器的加速器 API (Acc-API) 和用于加速器部署和執(zhí)行的 Host-API。
有關(guān) GAS 模型、API 和 ThunderGP 設(shè)計的詳細信息,請參閱ThunderGP 技術(shù)報告(附件或GitHub 上)。
ThunderGP 的易用性如何?
我們進行了一個案例研究——使用 Vitis 2020.1 在 Alveo U50 板上進行 COVID-19 的傳播預(yù)測——以展示 ThunderGP 如何輕松應(yīng)用于現(xiàn)實生活中的圖形處理問題。
及時預(yù)測人口水平上隨時間變化的感染流行率對于部署適當?shù)姆怄i措施(例如隔離或社交距離)以減輕病毒傳播具有重要作用。當前的傳播預(yù)測模型一般由空間元胞自動機(CA)和時間易感感染清除(SIR)模型組成,其中單元代表一個居民區(qū)(如縣)并保持其狀態(tài)(如感染率)由 SIR 模型根據(jù)相鄰小區(qū)之間的傳輸進行更新。因此,傳播可以表述為一個圖處理問題,其中縣及其連接由圖表示,并且 SIR 通過圖中的傳播更新。
我們使用 ThunderGP 實現(xiàn)了三個傳播模型:CA-SIR [1]、CA-SEIR [2] 和 CA-SAIR [3] 模型。該數(shù)據(jù)集來自 COVID-19 影響分析平臺 [4],包含 3.1K 縣和 2.3M 連接。
在這里,我們展示了為清單 1 中的 CA-SAIR 模型實現(xiàn)加速器的示例。對于分散階段,每個縣(一個小區(qū))根據(jù)其感染率及其連接強度計算感染率以推送到相鄰縣它量化了縣際流動的數(shù)量和頻率。對于聚集階段,該縣會累積推到它的所有感染率。在申請階段,收集到的感染率用于計算感染率。注意apply階段涉及到很多用戶自定義參數(shù)(ThunderGP支持apply階段自定義參數(shù),詳見技術(shù)報告)。

圖 2 顯示了使用公共數(shù)據(jù)集進行預(yù)測一周后美國感染風險的可視化。結(jié)果與在 CPU 端執(zhí)行的開源 Python 程序 [3] 相匹配。

表 1 量化了 ThunderGP 在此任務(wù)上所涉及的開發(fā)工作,并顯示了與基于 Python 的 CPU 實現(xiàn)的性能比較[3]。根據(jù)結(jié)果??,使用 ThunderGP 解決這個問題的好處是雙重的。首先,ThunderGP 比基于 CPU 的解決方案實現(xiàn)了高達419 倍的加速。能夠在短時間內(nèi)預(yù)測傳播可以幫助對傳播狀況做出快速及時的反應(yīng)。其次,CA-SIR 模型隨著對病毒認識的不斷深入而快速發(fā)展。使用 ThunderGP,開發(fā)者只需編寫幾十行代碼用于加速預(yù)測通常一天,這最大限度地減少了開發(fā)工作。這個初步結(jié)果是有希望的,并且系統(tǒng)是開源的,我們相信可以進行更多的案例研究來進一步評估可編程性的改進。

[1] 馬富恩特斯等人。物理學 A:統(tǒng)計力學及其應(yīng)用,1999。
[2] 何塞 M Carcione 等人。基于確定性 seir 模型的 covid-19 流行病模擬。arXiv,2020 年。
[3] 周一望等。用于告知美國縣級 covid-19 風險的時空流行病學預(yù)測模型。哈佛數(shù)據(jù)科學評論,2020 年。
[4] 馬里蘭大學 COVID-19 影響分析平臺。https: //data.covid.umd.edu,2020-09-10。
ThunderGP 的效率如何?
如前所述,已有大量基于 FPGA 的圖形處理加速器的研究工作。在本章中,我們將與最先進的設(shè)計進行公平比較,以展示 ThunderGP 的效率。數(shù)據(jù)集和圖應(yīng)用請參考ThunderGP 技術(shù)報告。
我們首先將 ThunderGP 與最先進的基于 RTL 的工作:Hitgraph [1] 進行比較,如表 2 所示。性能指標是每秒百萬邊緣遍歷 (MTEPS)。所有的實現(xiàn)都基于四個 SLR,但不同之處在于 HitGraph 沒有考慮使用多個 SLR 的開銷,因為它的性能是基于模擬的,只是簡單地縮放到多個 SLR 的內(nèi)存帶寬。性能加速高達 2.9 倍。更重要的是我們讓設(shè)計在真實硬件上執(zhí)行。

然后我們將 ThunderGP 與基于 HLS 的框架進行比較:Chen 等人。[2] 和 GraphOps[3]。由于他們的實驗不是使用多個 SLR 進行的,因此內(nèi)存帶寬較少,為了進行公平比較,我們使用帶寬效率 (MTEPS/(GB/s)) 作為衡量標準。如表 3 所示,ThunderGP 比 GraphOps 實現(xiàn)了高達 29.2 倍的絕對加速和 12.3 倍的帶寬效率提升,比 Chen 等人實現(xiàn)了 5.2 倍的絕對加速和 2.4 倍的帶寬效率提升。

加速來自 ThunderGP 的先進設(shè)計。請查看技術(shù)報告了解更多設(shè)計細節(jié)。
[ 1 ]周世杰等.HitGraph:FPGA 上的高吞吐量圖處理框架。TPDS,2019 年。
[2] 陳新宇等。用于在基于 opencl 的 fpgas 上進行圖形處理的動態(tài)并行數(shù)據(jù)混洗。FPL,2019
[3] Tayo Oguntebi 等人。Graphops:用于圖形分析加速的數(shù)據(jù)流庫。FPGA,2016 年。
讓我們開始使用 ThunderGP!
到目前為止,您可能對 ThunderGP 感興趣!
不用擔心,我們在 GitHub 存儲庫中提供了使用 ThunderGP 的分步指南。
對于第一級使用,我們?yōu)橹恍枰獌?nèi)置圖形處理算法的用戶編寫指南。
對于二級使用,我們引導(dǎo)用戶使用系統(tǒng)提供的API為自己的應(yīng)用定制加速器。
查看 README https://github.com/Xtra-Computing/ThunderGP/tree/develop_u50 中的詳細說明。
?
- 使用Vivado高層次綜合(HLS)進行FPGA設(shè)計的簡介
- 如何使用HLS加速FPGA上的FIR濾波器
- 國產(chǎn)FPGA研究框架.zip
- FPGA圖像處理應(yīng)用詳細介紹 51次下載
- 基于STM32移植UCGUI圖形界面框架(3.9.0源碼版本) 0次下載
- FPGA在視頻處理中的應(yīng)用綜述 19次下載
- 基于FPGA和DSP的機載圖形顯示系統(tǒng) 36次下載
- 如何使用FPGA實現(xiàn)順序形態(tài)圖像處理器的硬件實現(xiàn) 8次下載
- 如何使用FPGA實現(xiàn)飛機座艙圖形顯示加速系統(tǒng)的設(shè)計 5次下載
- 終止通知:HLS-442_HLS440P_HPS-100_EN000135_1-00.pdf
- Matlab圖形處理的函數(shù)詳細資料說明 6次下載
- 基于DirectFB和Cairo的圖形處理 2次下載
- 基于FPGA的機載視頻圖形顯示系統(tǒng)設(shè)計 21次下載
- 使用Vivado高層次綜合 (HLS)進行FPGA設(shè)計的簡介 65次下載
- 圖形處理器的流執(zhí)行模型
- 如何使用AMD Vitis HLS創(chuàng)建HLS IP 1.5k次閱讀
- Vivado HLS設(shè)計流程 1.4k次閱讀
- 一種在HLS中插入HDL代碼的方式 1.9k次閱讀
- 使用VVAS調(diào)用HLS生成硬件加速器的主要流程 1.6k次閱讀
- VVAS調(diào)用HLS生成的硬件加速器的主要流程 1.4k次閱讀
- 雷達信號處理:FPGA還是GPU? 4.4k次閱讀
- Vitis HLS知識庫總結(jié) 4.6k次閱讀
- 如何利用HLS功能創(chuàng)建圖像處理解決方案 4.7k次閱讀
- XIlinx利用HLS進行加速設(shè)計進度 7.4k次閱讀
- 新思科技Synphony HLS解決方案 2k次閱讀
- FPGA設(shè)計中的HLS 工具應(yīng)用 7.7k次閱讀
- 基于FPGA處理器的C編譯指令 3.1k次閱讀
- 多核處理器會取代FPGA嗎? 1.3k次閱讀
- FPGA專家教您如何在FPGA設(shè)計中使用HLS 3.9k次閱讀
- 使用教程分享:在Zynq AP SoC設(shè)計中高效使用HLS IP(一) 4.2k次閱讀
下載排行
本周
- 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 1次下載 | 免費
- 2冷柜-電氣控制系統(tǒng)講解
- 13.68 MB | 1次下載 | 10 積分
- 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊
- 2.33 MB | 次下載 | 免費
- 4MDD品牌三極管S9012數(shù)據(jù)手冊
- 2.62 MB | 次下載 | 免費
- 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
- 0.60 MB | 次下載 | 3 積分
- 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
- 0.89 MB | 次下載 | 3 積分
- 7收音環(huán)繞擴音機 AVR-1507手冊
- 2.50 MB | 次下載 | 免費
- 8MS1000TA 超聲波測量模擬前端芯片技術(shù)手冊
- 0.60 MB | 次下載 | 免費
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費
- 2PC5502負載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費
- 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
- 7100W準諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
- 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊
- 1.81 MB | 1次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191439次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論