91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

行業(yè)觀察——邊緣AI芯片架構的思考:為何可擴展GPU架構值得關注

互聯網資訊 ? 來源:北京華興萬邦管理咨詢有 ? 作者:北京華興萬邦管理 ? 2025-04-18 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:北京華興萬邦管理咨詢有限公司 翔煜 商瑞

隨著大模型在不斷演進的同時將推理應用大規(guī)模推向邊緣和端點設備,以及物聯網智化、具身智能、AI智能體(AI Agent)和物理AI等新的AI應用場景和模式的快速涌現,AI賦能設備的主控芯片設計師正面臨著全新的挑戰(zhàn)。尤其是對于邊緣和端點設備,它們既可能成為大模型的承載設備,也可能是用智能去為應用提供更好的核心功能,新的產品定義方向使主芯片架構師不得不去思考,其芯片在如何應對大模型快速演進的同時,還能實現用智能手段賦能傳統(tǒng)應用和實現新興功能。

因此,在追求極致性能、功耗和面積(PPA)的模式之外,架構師們需要富有前瞻性地去選擇高性能、高靈活性、可升級和開發(fā)者(生態(tài))友好的架構。我們不妨先回顧AI發(fā)展的歷程,從感知AI到生成式AI,再到智能體AI和物理AI,其應用場景不斷拓展。在感知AI階段,Al技術在語音識別、深度推薦系統(tǒng)和醫(yī)學影像等領域取得顯著進展;生成式AI在數字營銷和內容創(chuàng)作方面發(fā)揮了重要作用;智能體AI為編程、客戶服務、患者護理提供助力;物理AI推動了自動駕駛汽車和通用機器人發(fā)展。

wKgZO2gA73OAWmsjAASaugnydGA085.png

伴隨著AI技術的發(fā)展,在傳統(tǒng)的CPU、GPUFPGA等計算技術之外,諸如TPU、NPU 和DPU等專門針對特定算法或者模型的新型硬件數據處理加速器也開始出現,它們帶來高效率因而在許多場景中得到了應用。與此同時,AI技術不斷向新的場景和應用廣泛滲透,使得面向特定模型和場景的NPU等架構難以應對模型的變化和場景的多樣化,從而使傳統(tǒng)的 靈活性更高的CPU和GPU架構依舊在計算領域占據重要地位。

但是,AI技術的進步和新場景的出現,正在迫使半導體知識產權(IP)提供商和芯片設計公司快速做出變化,無論是采用傳統(tǒng)架構的廠商,還是新的xPU提供商都需要尊重產業(yè)規(guī)律。華興萬邦亦認為,從技術經濟學和企業(yè)實際經營來看,高額的研發(fā)費用和市場營銷費用是多數芯片設計企業(yè)面臨的最重要費用,而靈活可擴展的架構可以覆蓋更廣的市場并可以實現更長的產品生命周期,它們是攤銷這些費用以提升盈利能力的重要手段。

架構創(chuàng)新迫在眉睫

Imagination Technologies中國業(yè)務發(fā)展負責人黃音在慕尼黑電子展AI技術創(chuàng)新論壇演講中分析道:“當前主芯片設計不僅需要芯片企業(yè)投入大量研發(fā)資源,更需要協(xié)調生態(tài)合作伙伴的技術路線。面對AI算法快速迭代的挑戰(zhàn),行業(yè)在探索創(chuàng)新架構的同時,仍需重視經過長期驗證的基礎計算架構價值。以GPU為例,其架構在保持高并行計算優(yōu)勢的同時,新一代設計正通過模塊化擴展能力(如可配置Shader集群、彈性內存子系統(tǒng))來適應不同AI工作負載需求。作為專注圖形計算領域的IP廠商,Imagination觀察到,理想的AI加速架構需要在三個維度取得平衡:支持細粒度并行的計算單元設計、滿足算法動態(tài)調整的可配置性,以及維持開發(fā)工具鏈的持續(xù)兼容性?!?/p>

wKgZO2gA73GAeQkGAAiK6llNXSE700.png

“擴展能力是Imagination GPU開發(fā)演進的方向:在具備強大的渲染能力的同時,融合AI并行計算能力,在邊緣AI的場景下能提供靈活又高效的算力。所以,Imagination將幫助芯片設計人員發(fā)現真正的破局點,幫助他們去構建一個可以持續(xù)適配模型和算法演進、以及支持新興應用的架構平臺——而不是為某個模型做一次性的‘專用硬件定制’,從而避免硬件(處理器)總是費力費錢跟著算法跑的問題?!秉S音補充道。

Imagination正在幫助客戶導入更加靈活的架構。以該公司不久前發(fā)布的Imagination DXTP GPU IP為例,它采用了先進的平衡架構,增加了緩存和系統(tǒng)級帶寬,實現了更高的持續(xù)性能,幾何吞吐量提高50%,不僅能夠輕松同時處理圖形和計算任務,而且其功率效率還較其前序產品提升了20%,為邊緣AI提供了理想的GPU平臺。DXTP GPU已經被全球知名科技公司采用,用于對AI 多數據類型處理、計算任務加速和本地內存的支持。

wKgZPGgA73CAHuMCAAKIutK_0Zs823.png

三個落地是成功的關鍵

當然,對于芯片設計師而言,這需要做到三個必須“落地”,即模型算法落地、垂直功能落地和開放生態(tài)落地。針對模型算法落地,Imagination的突破點是堅持構建一個通用可編程的并行架構平臺,并通過開放的編譯器和推理后端(backend),支持客戶軟硬件協(xié)同設計和提供適配路徑,幫助其客戶把諸如Transformer、Diffusion類模型和前沿算法快速落地到GPU上。為此該公司將幫助客戶認識到在算法不斷演化的時代,架構的“適配力”遠比一時的TOPS值更重要。

在垂直功能落地方面,Imagination在移動、汽車、云和桌面等領域深耕了數十年,積累了豐富的經驗和許多創(chuàng)新的支撐性技術,可以幫助客戶去避開其中的潛在風險和快速在領域內創(chuàng)造優(yōu)勢,這可以從該公司的D系列GPU IP的產品功能創(chuàng)新上可以看出其垂直領域功能落地能力。例如,DXT GPU是Imagination面向移動應用、高端游戲和專業(yè)圖形設計等應用推出的新一代GPU IP,它不僅率先在移動平臺上提供了可擴展的光線追蹤功能,還有2D雙速率紋理映射等多項可以提升處理速度和優(yōu)化內存帶寬的技術。

為了幫助桌面和數據中心客戶實現高性能的云端GPU創(chuàng)新解決方案,Imagination推出了DXD GPU IP,首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著提升了DXD與Windows平臺上的應用程序和游戲的兼容性。同時,Imagination的硬件虛擬化技術 HyperLane支持在單個GPU上安全且獨立地運行多個操作系統(tǒng),極大地提升了服務器的使用效率,降低了云游戲的運營成本,并為云游戲行業(yè)的發(fā)展帶來了創(chuàng)新的運營模式。

Imagination為汽車智駕芯片提供的專用IP是該公司支持芯片設計企業(yè)垂直功能落地的又一個典范,血的教訓換來了更加嚴格的安全法規(guī),使智駕芯片設計公司在算力、生態(tài)和生命周期之外,必須去認真去考慮功能安全性。為了幫助芯片設計企業(yè)滿足全球汽車智能化需求,Imagination推出了DXS系列GPU,該系列IP不僅為智能駕駛艙和先進駕駛輔助(ADAS)等應用所需SoC帶來匹配的算力,而且專為諸如汽車處理器等對功能安全性要求極為嚴苛的應用,開發(fā)了結合GPU的計算模式特點并大幅降低成本的分布式功能安全機制(DSM)并通過了ASIL-B認證。這為汽車和工業(yè)等越來越多需要GPU的圖形處理能力和計算能力的電子系統(tǒng)帶來了巨大的創(chuàng)新。

wKgZO2gA73GAANXqAALQdVGW_JY138.png

Imagination在支持客戶實現產業(yè)生態(tài)落地方面也同樣頗費心機,其GPU IP全面支持OpenCL、SYCL、Vulkan Compute等開放標準,與PyTorch、TensorFlow等主流框架完美兼容。如Imagination通過與安卓生態(tài)系統(tǒng)合作,優(yōu)化對LiteRT的支持,為開發(fā)者提供豐富工具和示例,便于開發(fā)高性能AI應用,充分展現了其GPU架構的適配能力。這種開放生態(tài)簡化了新硬件與設備的集成流程,避免供應商鎖定問題,使客戶能在不同平臺輕松部署。通過整合多方資源,Imagination可幫助客戶實現協(xié)同優(yōu)化,提升資源利用率和執(zhí)行效率,鞏固了其在GPU市場的領先地位,為企業(yè)應對AI算法和產品快速迭代提供堅實支持。

總結與展望

大模型的下沉、算法創(chuàng)新和邊緣及端側AI的崛起為基于 GPU的主控芯片帶來了新的發(fā)展契機,在AI一體機、新物聯網、智能安防和自動駕駛等領域已經出現了巨大的需求,這些設備對高性能的圖形處理和AI推理同時都有越來越多的需求,因此更靈活和可擴展的架構可以使芯片設計公司的產品覆蓋更廣泛的市場領域,同時可以擁有更長的產品生命周期,也就有了更高的潛在盈利能力。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135422
  • AI
    AI
    +關注

    關注

    91

    文章

    39754

    瀏覽量

    301344
  • AI芯片
    +關注

    關注

    17

    文章

    2126

    瀏覽量

    36765
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    OrangePi RV2 深度技術評測:RISC-V AI融合架構的先行者

    問題 4.獨特優(yōu)勢 4.1 RISC-V AI 融合架構 不同于外掛NPU,AI 算力集成于 CPU 核內,編程模型統(tǒng)一,減少數據搬運開銷 為邊緣A
    發(fā)表于 03-03 20:19

    Imagination Technologies:面向智能駕艙,打造高安全GPUAI融合計算架構

    隨著汽車智能化程度不斷提高,電子架構正朝著集中化方向發(fā)展,智能座艙與ADAS等功能對GPU算力和AI推理能力提出更高要求,同時系統(tǒng)還需滿足功能安全、長效周期、軟件定義等多重挑戰(zhàn)。2025年9月12日
    的頭像 發(fā)表于 09-23 08:43 ?752次閱讀
    Imagination Technologies:面向智能駕艙,打造高安全<b class='flag-5'>GPU</b>與<b class='flag-5'>AI</b>融合計算<b class='flag-5'>架構</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎: ①算力支柱②數據支柱③計算支柱 1)算力 與AI算力有關的因素: ①晶體管數量②晶體管速度③芯片架構芯片面積⑤制造工藝⑥芯片
    發(fā)表于 09-18 15:31

    適應邊緣AI全新時代的GPU架構

    電子發(fā)燒友網站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?47次下載

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    算法 5.2加速矩陣乘法的芯片架構 ①新的矩陣乘法器架構 ②基于RISC-V的矩陣乘法擴展指令集 ③用信息論的思想來減少AI推理計算量 三、
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM FPGA: 架構的主要特點:重構邏輯和路由,可以快速實現各種不同形式的神經網絡加速。 ASIC: 介紹了幾種ASIC AI
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場晉升新契機?

    職場、渴望在專業(yè)領域更進一步的人來說,AI 芯片與職稱評審之間,實則有著千絲萬縷的聯系,為職業(yè)晉升開辟了新的路徑。 AI 芯片領域細分與職稱對應 目前,
    發(fā)表于 08-19 08:58

    性能優(yōu)于HBM,超高帶寬內存 (X-HBM) 架構來了!

    和單芯片高達512 Gbit的容量,帶寬提升16倍,密度提升10倍,顯著突破了傳統(tǒng)HBM的局限性。 ? ? 關鍵特性和優(yōu)勢包括,擴展性,使GPU和內存之間的數據傳輸更快,從而實現更高
    的頭像 發(fā)表于 08-16 07:51 ?4901次閱讀
    性能優(yōu)于HBM,超高帶寬內存 (X-HBM) <b class='flag-5'>架構</b>來了!

    蘋芯科技存算一體創(chuàng)新架構,突破邊緣AI芯片技術困局

    25%,其中,邊緣計算芯片增速達35%。這一增長勢頭背后,是可穿戴、智能安防、智慧工業(yè)等場景對低功耗、低延遲、高隱私性計算的迫切需求。 ? 然而,行業(yè)高速發(fā)展的同時,傳統(tǒng)馮·諾依曼架構
    的頭像 發(fā)表于 07-17 08:01 ?1.2w次閱讀
    蘋芯科技存算一體創(chuàng)新<b class='flag-5'>架構</b>,突破<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>技術困局

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了
    發(fā)表于 06-18 19:31

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應用于人工智能、科學計算
    的頭像 發(fā)表于 05-30 10:36 ?1850次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構</b>深度解析

    又一顆國產GPU芯片成功點亮!6nm制程,自研TrueGPU架構

    GPU芯片G100采用6nm制程,基于自研的TrueGPU架構,這是全球首個融合高性能圖形渲染與AI推理能力的GPU
    發(fā)表于 05-29 00:48 ?2724次閱讀

    iTOP-3588S開發(fā)板四核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強 iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構主頻高達2.4GHZ
    發(fā)表于 05-15 10:36

    RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    推理任務,需額外部署GPU加速卡,導致成本與功耗飆升。 擴展性受限:老舊接口(如USB 2.0、百兆網口)無法支持5G模組、高速存儲等現代外設,升級困難。 開發(fā)周期長:BSP適配不完善,跨平臺AI
    發(fā)表于 04-15 10:48

    北京市最值得去的十家半導體芯片公司

    代提升2-3倍,廣泛應用于云計算與邊緣計算,2021年獨立后估值達130億元。 5. 奕斯偉(ESWIN) 領域 :RISC-V架構與生態(tài)鏈 亮點 :聚焦RISC-V+AI芯片,覆蓋計
    發(fā)表于 03-05 19:37