91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

集成32GB HBM2e內(nèi)存,AMD Alveo V80加速卡助力傳感器處理、存儲(chǔ)壓縮等

晶芯觀察 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2024-06-05 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自適應(yīng)SoC搭配HBM,可處理計(jì)算以及內(nèi)存密集型的工作負(fù)載,用于高性能計(jì)算、數(shù)據(jù)分析、金融科技、存儲(chǔ)壓縮等等。

突破網(wǎng)絡(luò)訪問(wèn)和內(nèi)存的瓶頸


此次Alveo V80為何采用HBM高速內(nèi)存,AMD 自適應(yīng)和嵌入式計(jì)算事業(yè)部( AECG )高級(jí)產(chǎn)品線經(jīng)理Shyam Chander分析,在傳統(tǒng)的處理器架構(gòu)中,無(wú)論是存儲(chǔ)器還是網(wǎng)絡(luò)訪問(wèn)都容易形成瓶頸。網(wǎng)絡(luò)接口只支持25G、100G,內(nèi)存采用DDR而FPGA的帶寬遠(yuǎn)高于內(nèi)存提供的帶寬。



那么Alveo V80針對(duì)于這兩個(gè)問(wèn)題進(jìn)行了優(yōu)化,帶來(lái)顯著的性能提升。內(nèi)存采用高帶寬存儲(chǔ)器HBM2e,提供820 GB/s 的存儲(chǔ)器帶寬,容量達(dá)32GB。網(wǎng)絡(luò)訪問(wèn)上采用QSFP56光纖模塊可以支持從10G到800G的帶寬,支持4X200G,以及4X10G/25G/40G/50G等不同工作模式。



這款加速卡采用全高、3/4 長(zhǎng)( FH?L )尺寸規(guī)格,由 AMD Versal HBM 自適應(yīng) SoC 提供支持,具備 2,600,000 個(gè) LUT 邏輯單元的 FPGA 架構(gòu)、10,848 個(gè) DSP 計(jì)算邏輯片以及 820 GB/s 的存儲(chǔ)器帶寬。



與前代產(chǎn)品 AMD Alveo U55C 計(jì)算加速卡相比,Alveo V80 的邏輯密度至高翻倍、存儲(chǔ)器帶寬至高翻倍且網(wǎng)絡(luò)帶寬可高至 4 倍,可以實(shí)現(xiàn)強(qiáng)大的計(jì)算集群,同時(shí)還能優(yōu)化卡、服務(wù)器數(shù)量以及機(jī)架空間。



Alveo V80還配有32GB DDR DIMM擴(kuò)展插槽,MCIO擴(kuò)展端口可直連NVMe驅(qū)動(dòng)器,實(shí)現(xiàn)存儲(chǔ)卡的連接。系統(tǒng)連接總線支持PCIe 5.0接口,可達(dá)64GB/秒傳輸速率。整卡功率300W,采用被動(dòng)散熱,總熱設(shè)計(jì)功耗TDP則取決于器件和服務(wù)器。

V80集成高帶寬網(wǎng)絡(luò)核心600G以太網(wǎng)和400G加密引擎,硬化基礎(chǔ)設(shè)施連接包括DDR控制器、支持DMA的PCIe 5.0、可編程片上網(wǎng)絡(luò)。Shyam Chander表示,基于這些硬化的功能,用戶沒(méi)有必要使用軟性的IP進(jìn)行部署。



通常來(lái)說(shuō),傳統(tǒng)的加速卡(如GPU)要與CPU進(jìn)行連接,這會(huì)限制能夠使用的加速卡的數(shù)量。但是V80能夠避開(kāi)CPU到加速卡的PCle瓶頸、低時(shí)延處理傳入的網(wǎng)絡(luò)數(shù)據(jù),消除分立式網(wǎng)絡(luò)接口卡、實(shí)現(xiàn)每服務(wù)器的卡數(shù)和計(jì)算密度最大化。同時(shí),按照需求以網(wǎng)絡(luò)限速的方式管理傳入的數(shù)據(jù),包括在線加密、數(shù)據(jù)包監(jiān)控、傳感器處理等等。

傳統(tǒng)架構(gòu)是固定的緩存層次用于數(shù)據(jù)的讀取和寫(xiě)入,不規(guī)則的訪問(wèn)模式會(huì)降低效率。而V80的自適應(yīng)計(jì)算,擁有靈活的架構(gòu),在計(jì)算附近分配內(nèi)存,從而降低延遲和低功耗,并可以靈活適應(yīng)自定義的數(shù)據(jù)類(lèi)型和數(shù)據(jù)遷移。

AMD同時(shí)提供設(shè)計(jì)示例AVED,可在GitHub上獲取,以及用戶可繼續(xù)使用 Vivado設(shè)計(jì)套件,從而硬件開(kāi)發(fā)者能夠更快地上手,助其縮短開(kāi)發(fā)上市時(shí)間。

大規(guī)模加速內(nèi)存密集型工作負(fù)載


Alveo V80加速卡可以應(yīng)對(duì)很多大數(shù)據(jù)工作負(fù)載,包括高性能計(jì)算,包括基因組學(xué)和傳感器處理、數(shù)據(jù)分析(像欺詐檢測(cè));金融科技,包括風(fēng)險(xiǎn)分析和算法交易;還有網(wǎng)絡(luò)安全,像數(shù)據(jù)包監(jiān)控;存儲(chǔ)壓縮,這是一個(gè)非常關(guān)鍵的工作負(fù)載。另外在AI計(jì)算領(lǐng)域,包括推薦引擎和大語(yǔ)言模型等等。因此可以幫助客戶大規(guī)模加速以上工作負(fù)載,可以加快數(shù)據(jù)處理的速度,同時(shí)還能夠進(jìn)行實(shí)時(shí)的洞見(jiàn)和分析。



以傳感器處理為例,聯(lián)邦科學(xué)與工業(yè)研究組織( CSIRO )是澳大利亞的國(guó)立研究組織,其參與建造了世界上最大的射電天文學(xué)天線陣列,該天線陣列目前包含 420 張 Alveo U55C 加速器卡用于處理無(wú)線電波,以研究早期宇宙并探索星系演化。

CSIRO計(jì)劃借助 Alveo V80 加速卡縮減占板面積與成本,并將所需加速卡的數(shù)量精簡(jiǎn)多達(dá) 66%,同時(shí)應(yīng)對(duì)來(lái)自望遠(yuǎn)鏡 131,000 個(gè)天線的新信號(hào)處理任務(wù)??紤]到卡、服務(wù)器、機(jī)架空間和功耗的潛在減少,每卡算力的躍升預(yù)計(jì)可帶來(lái)至高 20% 總擁有成本( TCO )下降。



還有具備壓縮與數(shù)據(jù)分析功能的服務(wù)器存儲(chǔ)節(jié)點(diǎn)的例子,通過(guò)Alveo V80進(jìn)行壓縮,利用FPGA架構(gòu)和AMD壓縮IP可擴(kuò)展存儲(chǔ)節(jié)點(diǎn),并可解壓縮,查詢加速等。



從總擁有成本的角度來(lái)分析,比如10Pb數(shù)據(jù)存儲(chǔ),沒(méi)有壓縮時(shí)需要55臺(tái)服務(wù)器,1303個(gè)SSD驅(qū)動(dòng)器,每年約427千瓦時(shí)的功耗。如果進(jìn)行壓縮,同樣10Pb數(shù)據(jù),只需要21臺(tái)服務(wù)器,504個(gè)SSD驅(qū)動(dòng)器,每年約233千瓦時(shí),使用42張AMD Alveo V80卡進(jìn)行壓縮,總擁有成本三年以上至高可以達(dá)到56%的降低,而且服務(wù)器的數(shù)量、服務(wù)器成本以及功耗也都有非常顯著的降低。



小結(jié):

市面上加速卡也有GPU、ASIC等,但這些加速卡各有所長(zhǎng)。Shyam Chander表示,相較而言GPU擅長(zhǎng)浮點(diǎn)、并聯(lián)、定點(diǎn),F(xiàn)PGA擅長(zhǎng)線上訪問(wèn)的實(shí)時(shí)處理,而且低時(shí)延、靈活應(yīng)變,有非常豐富的存儲(chǔ)器架構(gòu)資源。AMD Alveo系列產(chǎn)品主要針對(duì)內(nèi)聯(lián)網(wǎng)絡(luò)、實(shí)時(shí)處理比如傳感器的實(shí)時(shí)處理、金融科技的需求,他們的訴求點(diǎn)在于低時(shí)延和靈活應(yīng)變,F(xiàn)PGA的自適應(yīng)SoC就是極好的解決方案。

另外,HBM的價(jià)格雖然高于DDR,但是如果能夠正確地配置FPGA資源,最終就能實(shí)現(xiàn)高性價(jià)比的競(jìng)爭(zhēng)優(yōu)勢(shì)。在產(chǎn)品路線上,全面看待工作負(fù)載方面的要求,也在考慮引入HBM3等存儲(chǔ)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636357
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5684

    瀏覽量

    139976
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301441
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    431

    瀏覽量

    15836
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    HBM迎頭趕上!國(guó)產(chǎn)AI芯片飛躍

    HBM2e,單卡顯存80GB,片間帶寬400GB/s,接口規(guī)格是PCIe4.0×16,功耗400W;而H20的顯存和片間帶寬更強(qiáng),單卡
    的頭像 發(fā)表于 09-22 07:02 ?1.3w次閱讀
    <b class='flag-5'>HBM</b>迎頭趕上!國(guó)產(chǎn)AI芯片飛躍

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號(hào)計(jì)算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?389次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-<b class='flag-5'>E</b>芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開(kāi)發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計(jì)算場(chǎng)景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與LLM-8850PiHat轉(zhuǎn)接板組成。核心加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1040次閱讀
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter <b class='flag-5'>v</b>1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開(kāi)發(fā)板

    AWR2944P/AWR2E44P雷達(dá)傳感器芯片詳解

    AWR2944P/AWR2E44P雷達(dá)傳感器芯片詳解 在汽車(chē)?yán)走_(dá)應(yīng)用領(lǐng)域,高精度、高性能的傳感器是實(shí)現(xiàn)智能駕駛功能的關(guān)鍵。TI推出的AWR2944P、AWR
    的頭像 發(fā)表于 01-26 09:30 ?1341次閱讀

    高速信號(hào)處理設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100G光纖加速卡

    C6678, XCVU9P, ZU19EG開(kāi)發(fā)板,, 高速信號(hào)處理, 光纖加速卡, XCVU9P光纖加速卡
    的頭像 發(fā)表于 01-08 16:06 ?296次閱讀
    高速信號(hào)<b class='flag-5'>處理</b>設(shè)計(jì)方案:413-基于雙XCVU9P+C6678的100G光纖<b class='flag-5'>加速卡</b>

    JEDEC制定全新內(nèi)存標(biāo)準(zhǔn),將取代HBM?

    電子發(fā)燒友網(wǎng)綜合報(bào)道 隨著人工智能算力需求的指數(shù)級(jí)爆發(fā),數(shù)據(jù)中心對(duì)內(nèi)存的性能、容量與成本平衡提出了前所未有的嚴(yán)苛要求。HBM憑借1024-bit甚至2048-bit的超高位寬,成為AI加速卡的核心
    的頭像 發(fā)表于 12-17 09:29 ?1698次閱讀

    AMD Alveo MA35D加速器:開(kāi)啟大規(guī)模交互式流媒體新時(shí)代

    AMD Alveo MA35D加速器:開(kāi)啟大規(guī)模交互式流媒體新時(shí)代 在當(dāng)今全球視頻市場(chǎng)被直播主導(dǎo)的背景下,低延遲應(yīng)用不斷涌現(xiàn),對(duì)基礎(chǔ)設(shè)施和視頻處理技術(shù)的成本結(jié)構(gòu)及部署策略產(chǎn)生了深遠(yuǎn)影響
    的頭像 發(fā)表于 12-15 14:35 ?382次閱讀

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻
    的頭像 發(fā)表于 12-14 13:12 ?1591次閱讀
    昆侖芯R200 AI<b class='flag-5'>加速卡</b>技術(shù)規(guī)格解析

    邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級(jí)。其INT8算力達(dá)256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶
    的頭像 發(fā)表于 12-14 11:17 ?1920次閱讀
    邁向云端算力巔峰:昆侖芯K200 AI<b class='flag-5'>加速卡</b>全面解讀

    專(zhuān)為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致能效

    昆侖芯K100邊緣AI加速卡以75W超低功耗實(shí)現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理能效標(biāo)準(zhǔn)。其半高半長(zhǎng)設(shè)計(jì)搭載8GB HBM內(nèi)存與256
    的頭像 發(fā)表于 12-14 11:12 ?2934次閱讀
    專(zhuān)為邊緣而生:深度解析昆侖芯K100 AI<b class='flag-5'>加速卡</b>,釋放128 TOPS極致能效

    AI大算力的存儲(chǔ)技術(shù), HBM 4E轉(zhuǎn)向定制化

    在積極配合這一客戶需求。從HMB4的加速量產(chǎn)、HBM4E演進(jìn)到邏輯裸芯片的定制化HBM技術(shù)正在創(chuàng)新中發(fā)展。 ? HBM4
    的頭像 發(fā)表于 11-30 00:31 ?8475次閱讀
    AI大算力的<b class='flag-5'>存儲(chǔ)</b>技術(shù), <b class='flag-5'>HBM</b> 4<b class='flag-5'>E</b>轉(zhuǎn)向定制化

    AMD嵌入式處理器為您的應(yīng)用添能助力

    AMD 面向嵌入式應(yīng)用打造高性能、高能效處理器,全方位滿足網(wǎng)絡(luò)、存儲(chǔ)、汽車(chē)、工業(yè)、零售、醫(yī)療、測(cè)試與測(cè)量領(lǐng)域的各種需求。無(wú)論您的應(yīng)用是涉及 AI
    的頭像 發(fā)表于 07-07 14:09 ?1896次閱讀

    華強(qiáng)北TF回收 內(nèi)存卡回收

    、威剛TF,索尼TF、創(chuàng)見(jiàn)TF.......長(zhǎng)期大量回收內(nèi)存SD,回收全新內(nèi)存卡,收購(gòu)原
    發(fā)表于 05-21 17:48

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?747次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解

    MLU370-X8智能加速卡是全面升級(jí)的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長(zhǎng)雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe加速卡,適用于業(yè)內(nèi)最新的CPU平臺(tái)
    的頭像 發(fā)表于 04-24 17:57 ?5398次閱讀
    寒武紀(jì)基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產(chǎn)品手冊(cè)詳解