現(xiàn)代數(shù)據(jù)中心變得越來越難以管理。應(yīng)用程序和 PB 級日志數(shù)據(jù)之間有數(shù)十億條可能的連接路徑。靜態(tài)規(guī)則不足以適應(yīng)動態(tài)微服務(wù)的安全策略,而且人工已經(jīng)無法應(yīng)對數(shù)量龐大的日志數(shù)據(jù)的分析。
AI 是通往未來安全和自主管理式數(shù)據(jù)中心的唯一出路。
NVIDIA 融合加速器在業(yè)界率先推出 AI 增強型 DPU。它將 GPU 的強大計算能力與 DPU 的網(wǎng)絡(luò)加速和安全優(yōu)勢相結(jié)合,為 AI 增強型數(shù)據(jù)中心管理創(chuàng)造了統(tǒng)一平臺。融合加速器可將 AI 生成的規(guī)則應(yīng)用于數(shù)據(jù)中心網(wǎng)絡(luò)中的每個數(shù)據(jù)包,為實現(xiàn)實時安全和管理創(chuàng)造新的可能性。圖像展示了將 BlueField2 DPU 和 Ampere GPU 相結(jié)合的 NVIDIA 新型融合加速器。

圖 1.在標(biāo)準(zhǔn)模式下,BlueField-2 DPU 和 GPU 通過專用 PCIe 4.0 交換機連接以獲得完整帶寬,獨立于主機 PCIE 系統(tǒng)帶寬。
在 NVIDIA GTC 大會上,我們推出了兩款新型融合加速器。A100X 在單一模組中融合了 A100 Tensor Core GPU 和 NVIDIA BlueField-2 數(shù)據(jù)處理器。A30X 則融合了 A30 Tensor Core GPU 和相同的 BlueField-2 DPU。融合卡具有獨特的能力,除了BlueField-2 的卸載、隔離和加速網(wǎng)絡(luò)功能,進一步拓展到 AI 推理和訓(xùn)練功能。
兩款加速器都包含一個集成的 PCIe 交換機實現(xiàn)DPU 和 GPU 連接。集成交換機能夠消除對主機資源的爭用,實現(xiàn)線速 GPUDirect RDMA 性能。集成交換機還通過隔離 GPU 和網(wǎng)卡之間移動的數(shù)據(jù)來提高安全性。
AI 增強型 DPU
融合加速器支持兩種運行模式:
標(biāo)準(zhǔn)模式 – BlueField-2 DPU 和 GPU 分別獨立運行。
BlueField-X模式 – PCI 交換機進行了重新配置,GPU 將專用于 DPU,并且對于主機系統(tǒng)不可見。
在 BlueField-X 模式下,只有DPU 上運行的操作系統(tǒng)可見到GPU。BlueField-X 模式在業(yè)界首創(chuàng)了一種新型加速器類型:GPU 加速的 DPU。圖像展示了在 BlueField-X 模式下,主機服務(wù)器中的 CPU 連接到融合加速器。融合加速器的 PCIe 交換機連接到 CPU 和 DPU。而GPU 僅通過PCIe 交換機與 DPU連接。

圖 2.在 BlueField-X 模式下,x86 主機只能看到 BlueField-2 DPU,支持 DPU 在網(wǎng)絡(luò)數(shù)據(jù)上運行 AI 工作負(fù)載。
在 BlueField-X 模式下,GPU 可以對流經(jīng) DPU 的數(shù)據(jù)運行 AI 模型,成為“bump in the wire”。保障安全同時,無性能損耗。AI 模型無需消耗主機資源,實現(xiàn)完全加速。
BlueField-X 為網(wǎng)絡(luò)安全、數(shù)據(jù)中心管理和 I/O 加速解鎖新穎使用場景。例如,Morpheus 網(wǎng)絡(luò)安全框架使用機器學(xué)習(xí)對以往無法識別的安全威脅進行有效處理。Morpheus 通過 DPU 從數(shù)據(jù)中心的各個服務(wù)器獲取遙測數(shù)據(jù),并將其發(fā)送到配備 GPU 的服務(wù)器進行分析。
有了 BlueField-X,AI 模型可以在每個服務(wù)器的融合加速器上直接本地運行。這使 Morpheus 能夠更快地分析更多數(shù)據(jù),同時消除代價很高的數(shù)據(jù)移動,并縮小惡意攻擊面。由 BlueField-X 加速的 Morpheus 使用案例包括惡意軟件檢測、數(shù)據(jù)泄漏預(yù)防和動態(tài)防火墻規(guī)則創(chuàng)建等。
Morpheus 示例僅僅是BlueField-X實現(xiàn)加速的一種使用場景。我們的客戶經(jīng)常與我們分享一些我們尚未考慮到的新想法。為了對 AI 增強的網(wǎng)絡(luò)進行更多創(chuàng)造性的探索,我們現(xiàn)正推出 NVIDIA 融合加速器開發(fā)套件。
結(jié)合此開發(fā)套件,我們?yōu)橛幸鈽?gòu)建新一代加速 AI 網(wǎng)絡(luò)應(yīng)用的特定客戶和合作伙伴提供 A30X 加速器的搶先體驗計劃。在邊緣計算或數(shù)據(jù)中心管理中探索 BlueField-X 的新應(yīng)用場景。以下例子為您做參考:
透明視頻預(yù)處理 – Bump in the wire視頻預(yù)處理(解密、交錯、格式轉(zhuǎn)換等),以提高 IVA 吞吐量和攝像頭密度。
小基站RU 解決方案 – RAN 信號處理聚合加速器,以增加商業(yè) gNodeB 服務(wù)器上的用戶密度和吞吐量。
計算存儲 – Bump in the wire存儲加密、索引和哈希,為長期存儲主機數(shù)據(jù)準(zhǔn)備處理卸載昂貴的 CPU 資源。
作弊檢測 – 檢測流式游戲服務(wù)中的惡意游戲/作弊
開始使用 NVIDIA 融合加速器開發(fā)套件
NVIDIA 融合加速器開發(fā)套件包含有結(jié)合 CUDA 和 NVIDIA DOCA 的示例應(yīng)用程序,以及幫助您安裝、配置新型融合加速器的文檔。最重要的是,我們可以提供 A30X 及應(yīng)用支持來換取您的寶貴反饋。
關(guān)于作者
Jacob Liberman 是 NVIDIA 企業(yè)和邊緣加速集團的產(chǎn)品經(jīng)理。他利用 20 多年的技術(shù)計算經(jīng)驗提供高性能、云計算原生邊緣人工智能解決方案。此前,他曾在紅帽、 AMD 和戴爾擔(dān)任產(chǎn)品管理和工程職務(wù)。
Pete Lumbis 是 NVIDIA 以太網(wǎng)網(wǎng)絡(luò)技術(shù)營銷總監(jiān)。 Pete 幫助客戶構(gòu)建、設(shè)計、自動化和加速下一代數(shù)據(jù)中心網(wǎng)絡(luò)。皮特是 CCIE # 28677 和 CCDE 2012 :: 3 。
審核編輯:郭婷
-
amd
+關(guān)注
關(guān)注
25文章
5684瀏覽量
139980 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109757 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10253瀏覽量
91500 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3344瀏覽量
60262
發(fā)布評論請先 登錄
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
邊緣計算中的AI加速器類型與應(yīng)用
亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程
Cadence 借助 NVIDIA DGX SuperPOD 模型擴展數(shù)字孿生平臺庫,加速 AI 數(shù)據(jù)中心部署與運營
加速AI未來,睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)
Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案
粒子加速器?——?科技前沿的核心裝置
面向半定制AI基礎(chǔ)架構(gòu)的NVIDIA NVLink Fusion技術(shù)
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
是德科技推出AI數(shù)據(jù)中心構(gòu)建器
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本
Cadence 利用 NVIDIA Grace Blackwell 加速AI驅(qū)動的工程設(shè)計和科學(xué)應(yīng)用
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
利用NVIDIA融合加速器加速數(shù)據(jù)中心AI
評論