91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

倪亞宇:面向端側(cè)智能應用,國科微打造更高效的NPU與工具鏈

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2026-04-03 10:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月1日,在2026中國IC領(lǐng)袖峰會“邊緣AI與算力芯片”垂直技術(shù)論壇上,國科微AI算法部部長倪亞宇發(fā)表題為《FlashAttention-4:新一代大模型推理NPU流水線范式設(shè)計》的主題演講。

wKgZPGnPJJaANhzSAAPFs7tf1RE06.jpeg

隨著大模型加速走向產(chǎn)業(yè)落地,推理效率、內(nèi)存帶寬與系統(tǒng)功耗成為端側(cè)部署的關(guān)鍵瓶頸。尤其在Transformer與大型語言模型持續(xù)演進的背景下,注意力機制(Attention)的高效實現(xiàn),已成為芯片架構(gòu)與工具鏈優(yōu)化的重要突破口。

倪亞宇表示,國科微正聚焦FlashAttention等前沿技術(shù)在NPU平臺上的落地探索,推動構(gòu)建更適合端側(cè)量產(chǎn)部署的NPU架構(gòu)與工具鏈,為自動駕駛、邊緣計算、智能終端及AIGC等場景提供高效能算力支撐。

NPU部署“滿血版”FlashAttention仍面臨挑戰(zhàn)

作為大模型中的核心計算結(jié)構(gòu)之一,注意力機制在實際運行中普遍面臨訪存開銷高、流水線效率受限等問題。FlashAttention的提出,為解決這一問題提供了新的路徑。

FlashAttention是由斯坦福大學Tri Dao等人于2022年提出的一種快速且內(nèi)存高效的精確注意力算法。它通過對注意力計算過程進行等價重構(gòu),通過分塊計算、在線Softmax、重計算與異步流水等方式,將中間計算過程保留在片上緩存中,減少外部存儲訪問帶寬壓力,顯著提升推理效率。

在剛剛過去的3月中旬,F(xiàn)lashAttention 4.0版本正式發(fā)布。倪亞宇指出,F(xiàn)lashAttention從1.0演進至4.0,在并行性、長序列支持、低精度計算及異步執(zhí)行等方面持續(xù)增強。但相較GPU,當前NPU在向量單元算力、異步流水排布、動態(tài)調(diào)度及超長上下文等能力上仍存差距。倪亞宇指出,要實現(xiàn)“滿血版”FlashAttention,需圍繞計算流水線、數(shù)據(jù)復用與系統(tǒng)帶寬進行協(xié)同設(shè)計。

wKgZO2nPJJeAC-ynAARFnfW13jQ55.jpeg

國科微NPU 4.0:構(gòu)建更高效的推理單元

自2020年起,國科微持續(xù)投入NPU自主研發(fā),形成從GKNPU 1.0到4.0的演進路線,產(chǎn)品能力向更高算力、更廣模型覆蓋與更優(yōu)能效比升級。目前,國科微AI視覺與車載AI系列芯片已搭載3.0版本NPU,支持0.5T至8T算力,支持視覺、音頻、時序等AI模型在端側(cè)芯片應用落地。

在GKNPU 4.0架構(gòu)設(shè)計中,國科微提出面向高效注意力計算的增強型脈動陣列架構(gòu),針對性擴展矩陣和向量計算能力,強化對大模型注意力機制中的關(guān)鍵操作的支持,壓縮數(shù)據(jù)搬運路徑與流水線開銷,增強片上閉環(huán)計算能力。該設(shè)計旨在減少對外部帶寬的依賴,提升推理鏈路執(zhí)行效率,有效應對大模型推理中的帶寬瓶頸、激活值碎片化及超長上下文的內(nèi)存壓力。

強化工具鏈,推動高效規(guī)?;渴?/p>

在NPU架構(gòu)演進的同時,國科微持續(xù)強化工具鏈能力。新一代GKToolchain 3.0面向端側(cè)異構(gòu)算力場景,重點提升硬件感知編譯、自動分塊、自動向量化、異步數(shù)據(jù)讀寫與計算流水編排能力,推動模型部署從“可適配”邁向“高效率、可規(guī)?;?。

同時,工具鏈圍繞動態(tài)內(nèi)存管理、投機推理加速等前沿方向持續(xù)演進,增強對長上下文管理及復雜推理流程的支撐能力,助力客戶高效完成從模型到芯片的部署閉環(huán)。

隨著AI應用從訓練側(cè)走向推理側(cè)、從云端走向終端,產(chǎn)業(yè)對算力平臺的要求正從“高峰值性能”轉(zhuǎn)向“高能效、可量產(chǎn)、易部署”的綜合能力。NPU在端側(cè)規(guī)?;涞刂芯邆滹@著的成本與功耗優(yōu)勢。

倪亞宇表示,國科微將持續(xù)堅持算法與硬件協(xié)同創(chuàng)新,圍繞大模型推理核心瓶頸,不斷完善NPU架構(gòu)、產(chǎn)品能力與工具鏈體系,推動端側(cè)智能計算平臺向更高性能、更低功耗、更強工程可落地方向演進,為客戶提供更具競爭力的算力方案。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4788

    瀏覽量

    98378
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40593

    瀏覽量

    302265
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    382

    瀏覽量

    21277
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    子公司榮獲“2026中IC設(shè)計成就獎”

    3月31日,2026中IC領(lǐng)袖峰會暨中國IC設(shè)計成就獎頒獎典禮在上海舉行。旗下全資子公司——杭州
    的頭像 發(fā)表于 04-02 16:52 ?865次閱讀
    <b class='flag-5'>國</b><b class='flag-5'>科</b><b class='flag-5'>微</b>子公司榮獲“2026中<b class='flag-5'>國</b>IC設(shè)計成就獎”

    slkor持續(xù)推進企業(yè)數(shù)字化升級,將產(chǎn)品數(shù)據(jù)成功導入創(chuàng)工業(yè)基礎(chǔ)資源庫及supply frame旗下Datasheet5平臺

    slkor持續(xù)推進企業(yè)數(shù)字化升級,將產(chǎn)品數(shù)據(jù)成功導入創(chuàng)工業(yè)基礎(chǔ)資源庫及supply frame旗下Datasheet5平臺,以及加入該平臺的“芯耀計劃”,實現(xiàn)了技術(shù)數(shù)據(jù)與產(chǎn)業(yè)
    發(fā)表于 03-18 10:55

    【新品發(fā)布】艾為重磅發(fā)布側(cè)AI高性能NPU語音芯片,打造智能語音體驗新標桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡(luò)智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡(luò)處理器),通過聲音模型訓練與NPU硬件結(jié)合,該芯片在AI降噪、AI人聲增強、
    的頭像 發(fā)表于 01-07 18:33 ?472次閱讀
    【新品發(fā)布】艾為重磅發(fā)布<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI高性能<b class='flag-5'>NPU</b>語音芯片,<b class='flag-5'>打造</b><b class='flag-5'>智能</b>語音體驗新標桿

    安謀科技:側(cè)NPU技術(shù)創(chuàng)新,拉動AI算力落地引擎

    X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。 ? 圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當時 ? 安謀科技周易X3 NPU IP
    的頭像 發(fā)表于 12-09 16:44 ?6030次閱讀
    安謀科技:<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>NPU</b>技術(shù)創(chuàng)新,拉動AI算力落地引擎

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布與谷歌聯(lián)合推出面向始終在線、超低能耗側(cè)大語言模型應用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?1190次閱讀
    芯原與谷歌聯(lián)合推出開源Coral <b class='flag-5'>NPU</b> IP

    力合PLC獲朵集團選用,打造新一代互聯(lián)互通酒店智能客控

    近期,朵集團正式發(fā)布智能客控招標公告,明確要各廠家客控方案“基于力合PLC客控模組的定制通訊協(xié)議方案”,覆蓋朵、朵S、薩和等全系列酒
    的頭像 發(fā)表于 11-01 07:03 ?1187次閱讀
    力合<b class='flag-5'>微</b>PLC獲<b class='flag-5'>亞</b>朵集團選用,<b class='flag-5'>打造</b>新一代互聯(lián)互通酒店<b class='flag-5'>智能</b>客控

    精彩亮相CPSE安博會2025,以視覺AI洞見未來

    通過此次CPSE安博會,不僅系統(tǒng)展示了從視覺AI到側(cè)計算的完整產(chǎn)品布局,更凸顯了以“圓鸮”AI ISP與自研
    的頭像 發(fā)表于 10-30 15:09 ?1025次閱讀
    <b class='flag-5'>國</b><b class='flag-5'>科</b><b class='flag-5'>微</b>精彩亮相CPSE安博會2025,以視覺AI洞見未來

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)天璣9500給出答案:行業(yè)首發(fā)將側(cè) AI 4K 文生圖帶到手機,引領(lǐng)移動影像與創(chuàng)造力的范式躍遷。 全新“超性能 + 超能效”雙 N
    的頭像 發(fā)表于 09-24 14:47 ?870次閱讀
    AI體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI新時代

    基于米爾瑞芯RK3576開發(fā)板的Qwen2-VL-3B模型NPU多模態(tài)部署評測

    關(guān)鍵詞:瑞芯 RK3576、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、側(cè)小語言模型(SLM)、多模態(tài) LLM、邊緣 AI 部署、開發(fā)板、RKLLM隨著大語言模型(LLM)技術(shù)的快速迭代,從云端集
    發(fā)表于 08-29 18:08

    側(cè)AI推理賦能效率革命,美格智能多領(lǐng)域落地打造行業(yè)范本

    產(chǎn)業(yè)進階:側(cè)AI推理助手成為應用剛需作為人工智能技術(shù)最普遍的產(chǎn)品形式之一,“AI助手”已成為各類軟件、終端的重要組成部分,成為AIAgent的主要外在呈現(xiàn)和功能入口。隨著
    的頭像 發(fā)表于 08-25 17:06 ?4074次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI推理賦能效率革命,美格<b class='flag-5'>智能</b>多領(lǐng)域落地<b class='flag-5'>打造</b>行業(yè)范本

    兩款智能側(cè)開關(guān)產(chǎn)品通過AEC-Q100車規(guī)認證

    兩款產(chǎn)品——智能側(cè)開關(guān)RM77100DD與MOS預驅(qū)RM7515KSF,成功通過AEC-Q100車規(guī)認證。截至目前,
    的頭像 發(fā)表于 07-04 16:58 ?1365次閱讀
    <b class='flag-5'>亞</b>成<b class='flag-5'>微</b>兩款<b class='flag-5'>智能</b>高<b class='flag-5'>側(cè)</b>開關(guān)產(chǎn)品通過AEC-Q100車規(guī)認證

    華邦電子創(chuàng)新存儲賦能側(cè)智能側(cè)

    華邦電子于 4 月 15 日、4 月 25 日受邀參加新唐科技 2025 新品發(fā)布會,期間進行了題為“創(chuàng)新存儲賦能側(cè)智能”的主旨演講,展示了華邦電子在
    的頭像 發(fā)表于 05-14 09:59 ?1706次閱讀
    華邦電子創(chuàng)新存儲賦能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>智能</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>

    蘋芯科技 N300 存算一體 NPU,開啟側(cè) AI 新征程

    隨著側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地算力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約
    的頭像 發(fā)表于 05-06 17:01 ?1243次閱讀
    蘋芯科技 N300 存算一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b> AI 新征程

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓側(cè)AI模型接入得心應手

    AI巨頭強強聯(lián)手,勢必為智能體化AI體驗時代按下超級加速鍵。 AI終端的下一步是“普適智能”,而不是“極限性能”。聯(lián)發(fā)憑借天璣9400+強悍的側(cè)
    發(fā)表于 04-13 19:52

    硅基覺醒已至前夜,聯(lián)發(fā)攜手生態(tài)加速智能體化用戶體驗時代到來

    ,芯片能力的躍遷都是一切的起點。從率先落地側(cè)AI大模型,到打造天璣AI智能體化引擎,聯(lián)發(fā)一直跑在行業(yè)最前沿。去年發(fā)布的天璣9400不僅
    發(fā)表于 04-13 19:51