91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

進迭時空同構融合技術加速大模型AI應用創(chuàng)新

進迭時空 ? 2025-06-06 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

同構融合技術


為了加速AI計算,芯片企業(yè)設計了多種專用處理器架構,如GPGPU、NPU、TPU等。這些專用處理器架構在執(zhí)行調(diào)度代碼及應用層代碼時,需要主控CPU的配合,如下圖所示。因此,通常需要構建復雜的異構調(diào)度系統(tǒng)來協(xié)調(diào)CPU和XPU的額外數(shù)據(jù)交互和同步。


進迭時空踐行的同構融合技術,創(chuàng)新性地在CPU內(nèi)集成TensorCore,以RISC-V指令集為統(tǒng)一的軟硬件接口,驅動Scalar標量算力、Vector向量算力和 Matrix AI算力,支持軟件和AI模型同時在RISC-V AI核上運行,并通過程序正常跳轉實現(xiàn)軟件和AI模型之間的事件和數(shù)據(jù)交互,進而完成整個AI應用執(zhí)行。我們將這種使用同構融合技術,得到具有AI算力的CPU稱為AI CPU。


f223d4dc-42b3-11f0-986f-92fbcf53809c.png



同構融合技術以更輕的軟件基礎設施構建接近Nvidia的軟件層級


雖然市面上已有多種不同架構且硬件做的非常出色的AI加速器,但是除了AIOT細分場景之外,Nvidia占據(jù)了AI計算絕大多數(shù)市場份額,成為AI計算主流架構,并深刻影響工業(yè)界學術界AI計算的發(fā)展。Nvidia通過CUDA將異構開發(fā)的門檻降至最低,并基于多層級的軟件棧構建了護城河?;谶@些軟件棧,全球開發(fā)者都在壯大Nvidia生態(tài)。很多企業(yè)的GPGPU發(fā)展策略是硬件上學習Nvidia,軟件上兼容CUDA生態(tài)。由于很難跟上Nvidia的快速迭代,這條路徑并不容易實現(xiàn)。


同構融合有望成為新的發(fā)展路徑。相比于異構加速器和CPU的組合,同構融合技術在硬件層面上對AI算力和通用CPU進行了更高層次的封裝,用戶不需要關心主控CPU和異構加速器之間的數(shù)據(jù)同步,并且保留了通用CPU的調(diào)試和開發(fā)方式。廠商不需要開發(fā)復雜的異構調(diào)度系統(tǒng),也不需要開發(fā)額外的驅動管理就可以讓開發(fā)者便捷的使用AI算力。另外,同構融合技術中CPU的通用性和RISC-V架構良好的開源生態(tài)基礎,進一步降低了需要自建軟件棧的復雜度。


綜上,進迭時空基于開源軟件生態(tài),以更輕的基礎軟件設施,構建了接近Nvidia的軟件層級,如下圖所示。我們的目標是,基于這些軟件層級,達到接近Nvidia的AI通用性。


f235c71e-42b3-11f0-986f-92fbcf53809c.jpg


1

在模型加速層面,與Nvidia一樣,進迭時空的推理引擎可以非常便捷的接入各主流第三方框架

2

在Tensor及多維數(shù)據(jù)塊層面,SpineDNN、SpineTriton及SpineJit分別對標CUDNN、CUTLASS及CUTE

3

在Scalar及Vector層面,SpineDPC++可以對標CUDA

4

最底層的寄存器層面,標準的Intrinsic接口則對標Nvidia的PTX接口



進迭時空同構融合技術實踐


進迭時空基于同構融合技術完成兩代通用RISC-V AI核的研發(fā)。


第一代RISC-V AI核A60實現(xiàn)2Tops算力,支持INT8等數(shù)據(jù)格式。A60核已經(jīng)應用于RISC-V AI CPU芯片K1,實踐表明,同構融合AI算力可以無縫運行所有AI算法,更安全地加速從TEE到REE所有AI應用。RISC-V AI CPU芯片K1也是第一個完整提供Scalar、Vector和Matrix三個維度關鍵算力的RISC-V芯片。在運行常見的AI算法時,K1的實際性能是傳統(tǒng)芯片的3-5倍,某些AI應用幀率提升可達10倍以上。


尤其是在運行大模型算法時,Matrix算力可以從容應對prefill階段的算力需求,CPU出色的訪存系統(tǒng)可以解決decode階段的帶寬需求,無需構建復雜的異構計算調(diào)度系統(tǒng)。此外,由于CPU的通用性,可以支持幾乎所有低bit量化方式,將帶寬需求降至最低。


更重要的是,將整個AI應用涉及的計算步驟全部遷移至AI CPU上,還可以為客戶提供更加簡單高效的開發(fā)方式。不僅能夠避免在多個硬件設備上開發(fā)和調(diào)試,而且在一個編程模型覆蓋AI開發(fā)全過程,能夠讓部署和調(diào)試變得輕松,讓算法快速實現(xiàn)價值。例如,K1芯片在客戶場景下,可以把在傳統(tǒng)NPU上適配新算法所需的3-6個月時間壓縮到1周以內(nèi),K1芯片已支持多個客戶在語音和機器視覺領域快速開發(fā)了基于最新AI大模型的產(chǎn)品。


第二代RISC-V AI核A100已經(jīng)研發(fā)完畢,預期無論在大模型運行效率方面,還是運行傳統(tǒng)AI效率方面都能達到業(yè)界先進水平。


此外在算力堆疊方面,同構融合技術路線通過采用Core-to-Core coherence和Cluster-to-Cluster coherence,能以與GPU相同的技術實現(xiàn)多芯片級聯(lián)和算力堆疊。與總線的Die2Die一致性技術結合后,通往多芯片算力堆疊的規(guī)模有望接近現(xiàn)有最先進GPU集群。



同構融合技術適合運行MoE大模型


MOE模型(Mixture of Experts,混合專家模型)是一種基于分而治之策略的神經(jīng)網(wǎng)絡架構,它將復雜的問題分解為多個子問題,每個子問題由一個獨立的模型(稱為專家)進行處理。MOE模型在單請求推理場景,每個token只需要使用部分專家參與計算。這些專家共同組成了MOE模型的激活參數(shù)。以DeepSeek-R1模型為例,671B的模型,只有37B的激活參數(shù)。對于FP8的模型,相當于需要將近700GB的容量來存放模型所有的權重,但是在進行單請求推理時,每個token只需要使用將近40GB的權重。相比于Dense模型,MOE模型是一個大容量,弱帶寬的推理需求。相較于GDDR和HBM,內(nèi)存容量更容易擴展;再加上專家的選擇是動態(tài)的,其計算和訪存模式是CPU極其擅長的。


GPU與NPU適合密集的重復計算模式,而CPU適合復雜調(diào)度場景下的計算模式,AI CPU介于兩者之間。MoE的興起,代表了一個兼具大容量與復雜邏輯的大模型發(fā)展趨勢,而這正是AI CPU的發(fā)力場景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39707

    瀏覽量

    301314
  • 大模型
    +關注

    關注

    2

    文章

    3647

    瀏覽量

    5176
  • 進迭時空
    +關注

    關注

    0

    文章

    61

    瀏覽量

    515
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    時空發(fā)布新一代RISC-V AI CPU芯片,滿足端側大模型算力需求

    電子發(fā)燒友網(wǎng)報道 1月29日,時空線上發(fā)布新一代AI CPU芯片——K3。作為全球首顆符合RVA23規(guī)范的量產(chǎn)RISC-V芯片,K3實現(xiàn)多項技術
    的頭像 發(fā)表于 01-30 14:06 ?8338次閱讀

    時空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布

    時空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布
    的頭像 發(fā)表于 01-15 19:07 ?368次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>再獲數(shù)億元融資,下一代 RISC-V <b class='flag-5'>AI</b> 芯片  K3 即將發(fā)布

    時空2025年度十大開發(fā)者揭曉

    回顧2025,RISC-V與AI融合持續(xù)深化,推動智能計算進入更開放、更高效的新階段。在人工智能發(fā)展的浪潮中,廣大開發(fā)者始終與時空并肩
    的頭像 發(fā)表于 01-12 20:07 ?611次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>2025年度十大開發(fā)者揭曉

    聚勢前行,攜手共進|時空亮相 ICCAD-Expo 2025

    11月20日至21日,2025集成電路發(fā)展論壇(成渝)暨第三十一屆集成電路設計業(yè)展覽會(ICCAD-Expo2025)在成都西博城隆重舉行。時空作為RISC-V領域的重要創(chuàng)新力量受
    的頭像 發(fā)表于 11-22 09:04 ?1017次閱讀
    聚勢前行,攜手共進|<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>亮相 ICCAD-Expo 2025

    時空雙周報(20251022-1121)

    = \"okay\"; } 軟件與系統(tǒng) 【 問題 】請問一下時空的 K1 芯片,目前有支持 RTOS 嗎?我想在 K1 上跑 RTOS,但在網(wǎng)上沒找到相關的開發(fā)包。請問官方有提供
    發(fā)表于 11-21 17:34

    芯聚成都 | 時空邀您共赴 ICCAD-Expo 2025

    芯聚成都 | 時空邀您共赴 ICCAD-Expo 2025
    的頭像 發(fā)表于 11-14 18:02 ?3679次閱讀
    芯聚成都 | <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>邀您共赴 ICCAD-Expo 2025

    取之于開源,貢獻于開源:時空AI計算生態(tài)開源貢獻

    開放創(chuàng)新時空的企業(yè)價值觀之一,公司的軟硬件技術棧構建在開源之上,同時也積極在操作系統(tǒng)、編譯器、AI
    的頭像 發(fā)表于 10-21 09:03 ?5790次閱讀
    取之于開源,貢獻于開源:<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b><b class='flag-5'>AI</b>計算生態(tài)開源貢獻

    十萬元獎金池!首屆全國RISC-V高水平創(chuàng)新及應用大賽火熱進行中

    終端需融合多模態(tài)感知與決策能力,但面臨異構計算資源緊張、多模型協(xié)同效率低等挑戰(zhàn)。本賽題要求基于時空RISC-V
    發(fā)表于 09-25 13:56

    校園招聘 | 時空2026校園招募令

    校園招聘 | 時空2026校園招募令
    的頭像 發(fā)表于 09-11 09:05 ?831次閱讀
    校園招聘 | <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>2026校園招募令

    時空與青少年共赴RISC-V AI科技未來!

    8月15日至25日,首屆烏鎮(zhèn)青少年科技嘉年華圓滿落幕。時空受邀亮相世界互聯(lián)網(wǎng)科技館"烏鎮(zhèn)硅谷"體驗區(qū),展示了多款基于K1芯片的智能產(chǎn)品,為青少年帶來沉浸式的RISC-V與AI
    的頭像 發(fā)表于 08-28 17:53 ?1299次閱讀
    <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>與青少年共赴RISC-V <b class='flag-5'>AI</b>科技未來!

    芯活力,搏未來——2025時空應屆生入職培訓

    為助力應屆新員工快速融入公司文化、提升團隊協(xié)作能力,時空精心策劃了“芯活力,搏未來”2025應屆生入職培訓。本次培訓以“學習+體驗+成長”為核心,采用“室內(nèi)課程+戶外拓展”的形式,讓新芯們在互動
    的頭像 發(fā)表于 08-06 16:42 ?1973次閱讀
    芯活力,搏未來——2025<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>應屆生入職培訓

    迎接泛機器人時代:時空如何以RISC-V架構數(shù)智未來

    21世紀經(jīng)濟報道記者趙娜杭州報道“這是我們的時代?!苯衲?月的一天,21世紀經(jīng)濟報道記者來到時空杭州總部。
    的頭像 發(fā)表于 06-06 17:00 ?1116次閱讀
    迎接泛機器人時代:<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>如何以RISC-V架構數(shù)智未來

    高校賽事 | 時空攜手藍橋杯,誠邀全國高校學子共啟RISC-V人工智能應用創(chuàng)新賽道

    以下文章來源于RISC-V先鋒,作者時空2025年5月12日,第十六屆藍橋杯數(shù)字科技創(chuàng)新(RISC-V應用創(chuàng)新)命題賽正式啟動。本次大賽
    的頭像 發(fā)表于 06-06 16:55 ?1891次閱讀
    高校賽事 | <b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>攜手藍橋杯,誠邀全國高校學子共啟RISC-V人工智能應用<b class='flag-5'>創(chuàng)新</b>賽道

    大象機器人攜手時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    全球80多個國家和地區(qū)。 近日,大象機器人聯(lián)合時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機器人開源創(chuàng)新平臺。 “my
    發(fā)表于 04-25 17:59

    大象機器人×時空聯(lián)合發(fā)布全球首款RISC-V全棧開源小六軸機械臂

    ? ? 在全球AI與機器人技術高速發(fā)展的浪潮中,中國公司始終堅定走在自研創(chuàng)新的道路上。 ? ? 4月25日,大象機器人與 國內(nèi)RISC-V AI CPU芯片領軍企業(yè)【
    的頭像 發(fā)表于 04-25 14:19 ?1793次閱讀
    大象機器人×<b class='flag-5'>進</b><b class='flag-5'>迭</b><b class='flag-5'>時空</b>聯(lián)合發(fā)布全球首款RISC-V全棧開源小六軸機械臂