91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

<button id="ygy4o"></button>

<code id="ygy4o"></code>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

HyperAccel 是一家成立于 2023 年 1 月的韓國初創(chuàng)企業(yè)，致力于開發(fā) AI 推理專用型半導(dǎo)體器件和硬件，最大限度提升推理工作負載的存儲器帶寬使用，并通過將此解決方案應(yīng)用于大型語言模型來提高成本效率。HyperAccel 針對新興的生成式 AI 應(yīng)用提供超級加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個快速、高效且低成本的推理系統(tǒng)，加速了基于轉(zhuǎn)換器的大型語言模型（ LLM ）的推理，此類模型通常具有數(shù)十億個參數(shù)，例如 OpenAI 的 ChatGPT 和 Meta 的 Llama 3 等 Llama LLM。其 AI 芯片名為時延處理單元（ LPU ），是專門用于 LLM 端到端推理的硬件加速器。

項目挑戰(zhàn)

隨著 LLM 應(yīng)用的擴展，對高效、快速和具成本效益的推理解決方案的需求不斷上升。對于云服務(wù)提供商而言，快速且成本效益高的推理硬件對于托管高性能的生成式 AI 應(yīng)用并降低總擁有成本（ TCO ）至關(guān)重要。對于 AI 企業(yè)來說，一個直觀的軟件堆棧平臺是實現(xiàn)其應(yīng)用或模型無縫部署的必備條件。對于服務(wù)業(yè)務(wù)，提供全面的端到端解決方案也是必要的，有利于將最先進的 AI 技術(shù)集成到更有效和先進的服務(wù)中。

解決方案

HyperAccel 提出通過開發(fā)名為“Orion”的服務(wù)器來解決成本和性能問題，該服務(wù)器搭載了一個為 LLM 推理量身定制的專用處理器，基于多個高性能 AMD FPGA部署。Orion 充分利用每個 FPGA 的存儲器帶寬和硬件資源以獲得最高水平的性能。這種可擴展的架構(gòu)支持最新的 LLM，此類模型通常包含數(shù)十億個參數(shù)。

Orion 擁有 16 個時延處理單元（ LPU ），它們分布在兩個 2U 機架中，提供總共 7.36TB/s 的 HBM 帶寬和 14.4 萬個 DSP。LPU 能加速內(nèi)存和計算都非常密集的超大規(guī)模生成式 AI 工作負載。Orion 及其 256GB 的 HBM 容量支持多達千億參數(shù)的最先進 LLM。上圖展示了兩個 2U 機箱之一，配有 8 個 LPU。

下圖顯示了 LPU 架構(gòu)，其中矢量執(zhí)行引擎由 AMD Alveo U55C 高性能計算卡支持。Alveo U55C 卡具有高帶寬存儲器（ HBM2 ），解決了提供低時延AI 的最關(guān)鍵性能瓶頸——存儲器帶寬。此外，它們能夠?qū)?200 Gbps的高速網(wǎng)絡(luò)集成到單個小型板卡中，并且經(jīng)過精心設(shè)計可在任何服務(wù)器中部署。

反過來，每個 Alveo 加速卡都由 FPGA 架構(gòu)驅(qū)動。鑒于 FPGA 的大規(guī)模硬件并行性和靈活應(yīng)變的存儲器層次結(jié)構(gòu)，F(xiàn)PGA 固有的低時延特性非常適合 LLM 所需的實時 AI 服務(wù)。Alveo 卡采用了強大的 Virtex XCU55P UltraScale+ FPGA，可提供高達 38 TOPS 的 DSP 計算性能，有助于 AI 推理優(yōu)化，包括用于定點與浮點計算的 INT8。這款 FPGA 能夠根據(jù)客戶反饋調(diào)整其處理器（ LPU ）的架構(gòu)，例如，根據(jù)要求在Llama模型中實現(xiàn)一些非標(biāo)準的處理，進而提供靈活的解決方案，能夠適應(yīng)不斷變化的市場和 LLM 參數(shù)條件。

設(shè)計成效

Orion 的高性能和可擴展性是通過 LPU 實現(xiàn)的，由 AMD Alveo 加速卡和相關(guān)的 FPGA 以及HyperAccel 的可擴展同步鏈路（ ESL ）技術(shù)提供支持。這些技術(shù)最大限度提升了 P2P 傳輸中的存儲器帶寬使用，有利于靈活處理，同時消除了 P2P 計算的同步開銷 ESL 屬于為 LLM 推理中的數(shù)據(jù)傳輸優(yōu)化的通信鏈路。值得注意的是，Orion 在支持標(biāo)準 FP16 數(shù)據(jù)精度的硬件上保持了卓越的準確性。

HyperAccel Orion

的性能

針對時延進行優(yōu)化的 HyperAccel Orion 與基于轉(zhuǎn)換器的 LLM（如 GPT、Llama 和 OPT）無縫集成，能夠在 1.3B 模型上每秒生成超過 520 個令牌，在 7B 模型上每秒生成 175 個令牌。除了卓越的性能外，Orion 還展示了出色的能源效率，在 66B 模型上生成單個令牌只需 24 毫秒，而功耗僅為 600W。

HyperAccel LPU 的性能（來源：https://www.hyperaccel.ai）

HyperAccel Orion

—— 工作負載多樣性

Orion 提供端到端的解決方案服務(wù)，可作為云端服務(wù)部署。對于擁有專有 LLM 的AI 企業(yè)或存在內(nèi)部數(shù)據(jù)隱私與安全需求的專業(yè)部門，Orion 也能夠以本地解決方案的形式進行安裝。Orion 能夠處理以下工作負載/應(yīng)用：

客戶服務(wù)：通過虛擬聊天機器人和虛擬助手實時處理查詢，因此人工客服將有時間處理更復(fù)雜的問題。

人機界面：在自助服務(wù)終端、機器人和其它設(shè)備中支持與語言相關(guān)的功能，以增強客戶互動體驗。

文本生成：協(xié)助生產(chǎn)、總結(jié)和精煉復(fù)雜的文本內(nèi)容，為用戶提供便利。

語言翻譯：翻譯客戶查詢和回復(fù)信息，打破語言障礙，擴大企業(yè)的全球影響力。

問答：根據(jù)大量數(shù)據(jù)以及此前的互動和偏好記錄，定制針對個別客戶的回復(fù)，以提高客戶滿意度。

進一步了解AMD Virtex UltraScale+ FPGA和Alveo U55C 加速卡，請訪問產(chǎn)品專區(qū)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

FPGA

FPGA

+關(guān)注

關(guān)注
1660

文章
22412

瀏覽量
636374
amd

amd

+關(guān)注

關(guān)注
25

文章
5684

瀏覽量
139979
服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
14

文章
10253

瀏覽量
91500
AI

AI

+關(guān)注

關(guān)注
91

文章
39793

瀏覽量
301447

原文標(biāo)題：HyperAccel 借助 AMD 加速卡與 FPGA 打造全新 AI 推理服務(wù)器

文章出處：【微信號：賽靈思，微信公眾號：Xilinx賽靈思官微】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

Xilinx賽靈思官微
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot AMD推出 EPYC 嵌入式 2005 系列處理器滿足長期部署需求
Hot AMD 銳龍嵌入式 9000 系列為工業(yè)計算與自動化帶來下一代性能和效率

New AMD VEK385評估套件助力快速啟動第二代Versal AI Edge系列設(shè)計
New AMD Embedded TechDay 2026即將啟幕

精選推薦
更多

文章

資料

帖子

技術(shù)資訊 I 剛?cè)峤Y(jié)合印刷電路板設(shè)計

深圳(耀創(chuàng))電子科技有限公司
1天前

1770 閱讀

閃迪開源SPRandom：160小時變6.2小時，企業(yè)SSD測試迎革命性提速

章鷹觀察
1天前

3417 閱讀

開關(guān)電源限流保護電路的原理分析

電源聯(lián)盟
1天前

1366 閱讀

炮火，AI，全球飄零：逆潮中的伊朗開發(fā)者

腦極體
1天前

3506 閱讀

高壓放大器ATA-7025在量子點薄膜的非接觸無損原位檢測中的應(yīng)用

Aigtek安泰電子
2天前

1995 閱讀

嵌入式微處理系統(tǒng)教學(xué)材料

吳湛
4.5 MB

10積分

87下載

OpenCatapult低代碼DevOps自動化平臺

周必鏡
3.74 MB

免費

0下載

libFNR FNR參考實現(xiàn)

fansz
0.04 MB

2積分

4下載

WMZDailog iOS彈窗控件

學(xué)電超人
0.66 MB

免費

0下載

采用圖騰柱拓撲結(jié)構(gòu)的6.6kW OBC評估板SEC-6D6KW-OBC-TTP-GEVB數(shù)據(jù)手冊

7.54 MB

免費

14下載

【飛凌嵌入式RV1126B開發(fā)板】+基本功能測試篇（1）

jennyzhaojie
3天前

940 閱讀

【飛凌嵌入式RV1126B開發(fā)板】+初識篇

jennyzhaojie
4天前

975 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發(fā)板的詳細對比

行走的小派
4天前

1332 閱讀

OrangePi RV2 深度技術(shù)評測：RISC-V AI融合架構(gòu)的先行者

行走的小派
5天前

1656 閱讀

lab view NI6003搭建電路

jf_73763743
5天前

1627 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级