91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI廣泛應(yīng)用推動(dòng)并行計(jì)算崛起及創(chuàng)新GPU滲透率快速提升

互聯(lián)網(wǎng)資訊 ? 來(lái)源:Dennis Laudick ? 作者:Dennis Laudick ? 2025-06-11 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者: Imagination Technologies 的產(chǎn)品管理副總裁 Dennis Laudick

人工智能AI)在邊緣計(jì)算領(lǐng)域正經(jīng)歷著突飛猛進(jìn)的高速發(fā)展,根據(jù)IDC的最新數(shù)據(jù),全球邊緣計(jì)算支出將從2024年的2280億美元快速增長(zhǎng)到2028年的3780億美元*。這種需求的增長(zhǎng)速度,以及在智能制造、智慧城市等數(shù)十個(gè)行業(yè)中越來(lái)越多的應(yīng)用場(chǎng)景中出現(xiàn)的滲透率快速提升,也為執(zhí)行計(jì)算任務(wù)的硬件設(shè)計(jì)以及面對(duì)多樣化場(chǎng)景的模型迭代的速度帶來(lái)了挑戰(zhàn)。

AI不僅是一項(xiàng)技術(shù)突破,它更是軟件編寫、理解和執(zhí)行方式的一次永久性變革。傳統(tǒng)的軟件開發(fā)基于確定性邏輯和大多是順序執(zhí)行的流程,而如今這一范式正在讓位于概率模型、訓(xùn)練行為以及數(shù)據(jù)驅(qū)動(dòng)的計(jì)算。這并不是一時(shí)的潮流。AI 代表了計(jì)算機(jī)科學(xué)的一次根本性、不可逆的轉(zhuǎn)變 —— 從基于規(guī)則的編程,邁向自適應(yīng)的、基于學(xué)習(xí)的系統(tǒng),這些系統(tǒng)正逐步被集成到越來(lái)越廣泛的計(jì)算問(wèn)題與能力中。

這一轉(zhuǎn)變也對(duì)硬件提出了相應(yīng)的變革需求。在AI架構(gòu)和算法不斷演進(jìn)(并將持續(xù)演進(jìn))的時(shí)代,為狹窄定義任務(wù)而打造的高度專用芯片的舊模式已不再適用。為了滿足不斷變化的AI需求(尤其是在邊緣側(cè)),我們需要具備與工作負(fù)載同樣動(dòng)態(tài)、適應(yīng)能力強(qiáng)的計(jì)算平臺(tái)。

這正是通用并行處理器(即GPU)成為邊緣AI未來(lái)的關(guān)鍵所在,并開始取代專門的處理器,如神經(jīng)網(wǎng)絡(luò)處理器(NPU)。這不僅僅是性能上的考量——它關(guān)乎靈活性、可擴(kuò)展性,以及與未來(lái)軟件發(fā)展趨勢(shì)的同步。

Makimoto波動(dòng)理論與“靈活性”的回歸

要理解這一轉(zhuǎn)變,我們只需回顧“Makimoto波動(dòng)理論”:這是由日本工程師牧本次雄(Tsugio Makimoto)提出的一個(gè)概念,描述了計(jì)算產(chǎn)業(yè)在不同階段不斷在“標(biāo)準(zhǔn)化”與“定制化”之間擺動(dòng)的趨勢(shì),其背后是市場(chǎng)需求、技術(shù)創(chuàng)新和軟件復(fù)雜性等因素的持續(xù)變化。

(Makimoto波動(dòng)理論展現(xiàn)了計(jì)算產(chǎn)業(yè)在“靈活性”與“專用性”之間的歷史擺動(dòng)。而當(dāng)前AI的發(fā)展軌跡,標(biāo)志著計(jì)算正再次呈現(xiàn)出在“靈活性”和“通用平臺(tái)”之間的擺動(dòng)。)

這一模型與AI硬件的演變過(guò)程高度契合。在AI發(fā)展的早期階段,工作負(fù)載較為明確且穩(wěn)定,此時(shí)采用NPU等固定功能加速器是合理的。這類處理器對(duì)特定任務(wù)(例如使用CNN進(jìn)行圖像分類或目標(biāo)檢測(cè))進(jìn)行了深度優(yōu)化。

但如今AI已進(jìn)入高速演進(jìn)階段。我們已走出簡(jiǎn)單、靜態(tài)模型的時(shí)代,邁入混合網(wǎng)絡(luò)、Transformer架構(gòu)、基礎(chǔ)模型和持續(xù)創(chuàng)新的浪潮之中。為去年AI打造的定制硬件,根本無(wú)法跟上當(dāng)今的發(fā)展節(jié)奏。

正如我們?cè)诒疚囊婚_始所介紹的那樣,當(dāng)一個(gè)行業(yè)不得不去面對(duì)超高的增長(zhǎng)率,以及每天都在不斷出現(xiàn)的新應(yīng)用場(chǎng)景和為此而快速迭代的模型,使我們?cè)俅握驹诹恕癕akimoto拐點(diǎn)”上——從專用硬件,回歸到可擴(kuò)展、可適配的通用計(jì)算平臺(tái)。

AI是一個(gè)并行計(jì)算問(wèn)題,而非專用計(jì)算問(wèn)題

AI的本質(zhì)在于并行計(jì)算。深度學(xué)習(xí)嚴(yán)重依賴并發(fā)操作——矩陣運(yùn)算、張量乘法、向量計(jì)算——這些正是GPU天生擅長(zhǎng)的工作負(fù)載。能夠同時(shí)渲染數(shù)百萬(wàn)像素的架構(gòu),如今正好可以處理數(shù)百萬(wàn)神經(jīng)元的激活。

如今的通用GPU早已不僅僅用于圖形處理。它們擁有可編程管線、計(jì)算著色器,以及日益增強(qiáng)的AI中心化設(shè)計(jì),不僅能加速傳統(tǒng)負(fù)載,也能支持新興的AI工作負(fù)載,是邊緣AI中強(qiáng)大而靈活的計(jì)算引擎。

相比之下,像NPU這樣的專用處理器則難以應(yīng)對(duì)持續(xù)的變革。它們對(duì)特定操作進(jìn)行了優(yōu)化,而當(dāng)AI領(lǐng)域快速演進(jìn)時(shí),這些芯片便迅速被淘汰。顯然,面對(duì)這種全新的軟件范式,我們需要的是一種通用的、并行的、靈活的硬件平臺(tái)—— GPU。

為什么通用平臺(tái)在邊緣側(cè)更具優(yōu)勢(shì)

邊緣AI不僅需要性能,更需要適應(yīng)性、可重用性與較長(zhǎng)的生命周期;隨著AI處理器的設(shè)計(jì)越來(lái)越復(fù)雜,且隨著市場(chǎng)規(guī)模的擴(kuò)大會(huì)吸引更多的玩家,大家都爭(zhēng)相采用更先進(jìn)的工藝來(lái)實(shí)現(xiàn)性價(jià)比和功耗的優(yōu)化,以及在生態(tài)建設(shè)方面的大量花費(fèi),使得每個(gè)芯片項(xiàng)目的投入正變得越來(lái)越高。針對(duì)這些技術(shù)經(jīng)濟(jì)學(xué)挑戰(zhàn),現(xiàn)代GPU等通用并行處理器在這幾個(gè)方面均具備明顯優(yōu)勢(shì):

靈活性:可編程,能夠支持新的模型類型而無(wú)需更換硬件;

可擴(kuò)展性:可適配從物聯(lián)網(wǎng)IoT傳感器到智能攝像頭再到自動(dòng)駕駛汽車等各種邊緣設(shè)備;

軟件生態(tài)成熟:擁有豐富的開源工具與開發(fā)標(biāo)準(zhǔn)(如OpenCL、LiteRT和TVM);

可持續(xù)性:延長(zhǎng)產(chǎn)品生命周期,減少不斷重新設(shè)計(jì)芯片的需求。

簡(jiǎn)而言之,GPU的通用并行計(jì)算從架構(gòu)層面就為AI的持續(xù)演進(jìn)而設(shè)計(jì)。而GPU領(lǐng)域內(nèi)的本身創(chuàng)新也在快速驗(yàn)證這一趨勢(shì),例如Imagination在不久前發(fā)布的E系列GPU就具有突破性的高效并行處理架構(gòu),在提供卓越圖形性能的同時(shí),針對(duì)人工智能工作負(fù)載,其 INT8/FP8 算力可在 2 到 200 TOPS 之間擴(kuò)展。

展望未來(lái)

盡管有越來(lái)越多的證據(jù)說(shuō)明GPU具備的優(yōu)勢(shì),市場(chǎng)仍然習(xí)慣將AI加速與NPU或定制芯片劃等號(hào)。但正如圖形行業(yè)早年發(fā)現(xiàn),固定功能的圖形管線無(wú)法跟上游戲創(chuàng)新的節(jié)奏;如今AI行業(yè)也發(fā)現(xiàn):固定硬件無(wú)法匹配快速變化的軟件需求。

是時(shí)候重新教育整個(gè)生態(tài)了。邊緣AI的未來(lái)不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計(jì)算平臺(tái),它們能與智能軟件共同成長(zhǎng)并擴(kuò)展。諸如Imagination全新的E系列GPU,它為未來(lái)的邊緣應(yīng)用提供了一種通用且可編程的解決方案,涵蓋圖形渲染、桌面和智能手機(jī)等領(lǐng)域,可實(shí)現(xiàn)自然語(yǔ)言處理、工業(yè)計(jì)算機(jī)視覺(jué)以及自動(dòng)駕駛等應(yīng)用。

幾十年前,Makimoto就洞察了這一趨勢(shì)。如今,我們正在親身經(jīng)歷他的遠(yuǎn)見(jiàn)——順應(yīng)著通用性和靈活性的浪潮前行。GPU不再是追趕者,它已處于領(lǐng)先位置。

關(guān)于作者

Dennis Laudick擔(dān)任Imagination Technologies的產(chǎn)品管理副總裁。在加入公司之前,Dennis曾在Arm任職超過(guò)13年,擔(dān)任汽車、AI和GPU相關(guān)業(yè)務(wù)的產(chǎn)品與市場(chǎng)領(lǐng)導(dǎo)職務(wù)。在此之前,他還曾在多家半導(dǎo)體與OEM巨頭企業(yè)擔(dān)任高級(jí)管理崗位。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135409
  • 邊緣AI
    +關(guān)注

    關(guān)注

    0

    文章

    239

    瀏覽量

    6121
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為啥 AI 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    提到AI,大家常說(shuō)它“算得快”,其實(shí)是指AI能在眨眼間處理海量數(shù)據(jù)??伤鼮樯队羞@本事?答案就藏在“GPU+高速內(nèi)存+并行計(jì)算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?845次閱讀
    為啥 <b class='flag-5'>AI</b> <b class='flag-5'>計(jì)算</b>速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、內(nèi)存與<b class='flag-5'>并行計(jì)算</b>

    一文看懂AI大模型的并行訓(xùn)練方式(DP、PP、TP、EP)

    大家都知道,AI計(jì)算(尤其是模型訓(xùn)練和推理),主要以并行計(jì)算為主。AI計(jì)算中涉及到的很多具體算法(例如矩陣相乘、卷積、循環(huán)層、梯度運(yùn)算等),
    的頭像 發(fā)表于 11-28 08:33 ?1837次閱讀
    一文看懂<b class='flag-5'>AI</b>大模型的<b class='flag-5'>并行</b>訓(xùn)練方式(DP、PP、TP、EP)

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)

    問(wèn)題。因此,并行計(jì)算與加速技術(shù)在神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用中變得至關(guān)重要,它們能夠顯著提升神經(jīng)網(wǎng)絡(luò)的性能和效率,滿足實(shí)際應(yīng)用中對(duì)快速響應(yīng)和大規(guī)模數(shù)據(jù)處理的需求。神經(jīng)網(wǎng)絡(luò)并行
    的頭像 發(fā)表于 09-17 13:31 ?1115次閱讀
    神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>并行計(jì)算</b>與加速技術(shù)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機(jī)密計(jì)算⑤HBM FPGA: 架構(gòu)的主要特點(diǎn):可重構(gòu)邏輯和路由,可以快速實(shí)現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI芯片
    發(fā)表于 09-12 16:07

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評(píng)審中的競(jìng)爭(zhēng)力。例如,在芯片設(shè)計(jì)中引入新的
    發(fā)表于 08-19 08:58

    AI 邊緣計(jì)算網(wǎng)關(guān):開啟智能新時(shí)代的鑰匙?—龍興物聯(lián)

    ,這一過(guò)程常受網(wǎng)絡(luò)延遲和不穩(wěn)定的困擾。如今,借助 AI 邊緣計(jì)算網(wǎng)關(guān),數(shù)據(jù)處理任務(wù)下沉至網(wǎng)絡(luò)邊緣,在本地即可快速完成。以智能安防監(jiān)控為例,在
    發(fā)表于 08-09 16:40

    Axelera AI邊緣計(jì)算加速智能創(chuàng)新解決方案

    。AxeleraAI憑借其卓越的AI加速解決方案,致力于協(xié)助企業(yè)快速部署高性能、低功耗的邊緣計(jì)算平臺(tái),廣泛應(yīng)用于智慧城市、智慧交通及工業(yè)檢測(cè)
    的頭像 發(fā)表于 07-17 11:00 ?1094次閱讀
    Axelera <b class='flag-5'>AI</b>:<b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>加速智能<b class='flag-5'>創(chuàng)新</b>解決方案

    AI芯片:加速人工智能計(jì)算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專為
    的頭像 發(fā)表于 07-09 15:59 ?1526次閱讀

    并行計(jì)算崛起:為什么GPU將在邊緣AI中取代NPU

    。這并不是一時(shí)的潮流。AI代表了計(jì)算機(jī)科學(xué)的一次根本性、不可逆的轉(zhuǎn)變——從基于規(guī)則的編程,邁向自適應(yīng)的、基于學(xué)習(xí)的系統(tǒng),這些系統(tǒng)正逐步被集成到越來(lái)越廣泛計(jì)算問(wèn)題與
    的頭像 發(fā)表于 06-06 14:55 ?697次閱讀
    <b class='flag-5'>并行計(jì)算</b>的<b class='flag-5'>崛起</b>:為什么<b class='flag-5'>GPU</b>將在<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>中取代NPU

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的繁榮發(fā)展。 本次合作將聚焦以下兩大方向: 聯(lián)合打造面向AI應(yīng)用的高性能計(jì)算解決方案 ? 依托 Imagination GPU并行計(jì)算和能效
    發(fā)表于 05-21 09:40 ?1216次閱讀

    讀懂極易并行計(jì)算:定義、挑戰(zhàn)與解決方案

    GPU經(jīng)常與人工智能同時(shí)提及,其中一個(gè)重要原因在于AI與3D圖形處理本質(zhì)上屬于同一類問(wèn)題——它們都適用極易并行計(jì)算。什么是極易并行計(jì)算?極易并行計(jì)算
    的頭像 發(fā)表于 04-17 09:11 ?809次閱讀
    讀懂極易<b class='flag-5'>并行計(jì)算</b>:定義、挑戰(zhàn)與解決方案

    RK3588核心板在邊緣AI計(jì)算中的顛覆性優(yōu)勢(shì)與場(chǎng)景落地

    <50ms,漏檢降低至0.1%。 效率提升:產(chǎn)線檢測(cè)速度從120件/分鐘提升至300件/分鐘。 開發(fā)者價(jià)值 明遠(yuǎn)智睿提供完善的軟件代碼,一對(duì)一的技術(shù)指導(dǎo),開發(fā)者可快速二次開發(fā)落地
    發(fā)表于 04-15 10:48

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點(diǎn)。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計(jì)算任務(wù)提供了必要的帶寬保障。 800G光模塊如何解決DeepSeek大規(guī)模算力
    發(fā)表于 03-25 12:00

    Banana Pi 與瑞薩電子攜手共同推動(dòng)開源創(chuàng)新:BPI-AI2N

    ?-M33(200MHz),并集成 Renesas 獨(dú)有的 DRP-AI 加速器,支持 15 Sparse TOPS AI 計(jì)算能力,專為計(jì)算機(jī)視覺(jué)、
    發(fā)表于 03-12 09:43

    AI邊緣計(jì)算爆發(fā)增長(zhǎng),紫光國(guó)芯LPDDR助力低延遲應(yīng)用創(chuàng)新 | 貞光科技代理品牌

    引言近年來(lái),隨著物聯(lián)網(wǎng)(IoT)設(shè)備的激增和人工智能(AI)的廣泛應(yīng)用,邊緣計(jì)算作為一種新興的計(jì)算模式,正迅速
    的頭像 發(fā)表于 03-10 17:12 ?1066次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>爆發(fā)增長(zhǎng),紫光國(guó)芯LPDDR助力低延遲應(yīng)用<b class='flag-5'>創(chuàng)新</b> | 貞光科技代理品牌