海光DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

近日，海光DCU正式完成對(duì)階躍星辰旗艦開(kāi)源基座模型Step 3.5 Flash的全流程適配與深度調(diào)優(yōu)。得益于新一代海光DCU原生支持FP8精度、超越主流旗艦產(chǎn)品的更大顯存等核心優(yōu)勢(shì)，高效完成Step 3.5 Flash FP8的推理適配，打造“適配更全面、性能更卓越”的國(guó)產(chǎn)算力解決方案。

作為階躍星辰推出的新一代基座模型，Step 3.5 Flash總參數(shù)達(dá)1960億，推理時(shí)僅激活約110億參數(shù)，單請(qǐng)求代碼任務(wù)下推理速度最高可達(dá)350TPS，專(zhuān)為智能體(Agent)場(chǎng)景設(shè)計(jì)，在復(fù)雜推理和長(zhǎng)鏈任務(wù)中表現(xiàn)出色，其推理深度可媲美部分頂級(jí)閉源模型，獲得全球開(kāi)發(fā)者廣泛認(rèn)可。

本次適配工作中，海光DCU團(tuán)隊(duì)充分依托以DTK(異構(gòu)計(jì)算平臺(tái))在內(nèi)的全棧AI軟件棧協(xié)同優(yōu)勢(shì)，針對(duì)Step 3.5 Flash的稀疏MoE架構(gòu)特性，重點(diǎn)開(kāi)展底層算子優(yōu)化、硬件調(diào)度加速與全流程推理性能打磨，優(yōu)化模型推理時(shí)延與吞吐效率，確保模型在海光DCU平臺(tái)上實(shí)現(xiàn)高可靠、低延遲的穩(wěn)定運(yùn)行。

相較于主流的FP16精度，新一代海光DCU原生支持的FP8在相同硬件平臺(tái)上可大幅增加理論峰值性能，同時(shí)降低內(nèi)存占用與通信開(kāi)銷(xiāo)，有效節(jié)約模型部署成本、提升Token Efficiency，為開(kāi)發(fā)者提供更具性?xún)r(jià)比的算力支撐。

現(xiàn)在，全球開(kāi)發(fā)者可在光合開(kāi)發(fā)者社區(qū)一鍵下載Step 3.5 Flash及Step 3.5 Flash FP8模型并落地部署，滿(mǎn)足多樣化推理需求。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3778

瀏覽量
52179
DCU

DCU

+關(guān)注

關(guān)注
0

文章
18

瀏覽量
3165
海光信息

海光信息

+關(guān)注

關(guān)注
0

文章
35

瀏覽量
2686

評(píng)論

CHANBAEK
專(zhuān)欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot Type-C接口的引腳定義 Type-C設(shè)備之間詳細(xì)的配置過(guò)程
Hot D觸發(fā)器的結(jié)構(gòu)特點(diǎn)、工作原理及主要應(yīng)用

New 美浦森推出新一代低損耗IGBT產(chǎn)品及配套的FRD
New 北方華創(chuàng)推出高深寬比TSV電鍍?cè)O(shè)備Ausip T830

精選推薦
更多

文章

資料

帖子

視美泰 AIBOX-3588M 性能測(cè)評(píng)：6T 算力 AI 主機(jī)盒應(yīng)用解析

jf_81913902
4小時(shí)前

329 閱讀

基于瑞薩R7FA2L1AB2DFL單片機(jī)的水位檢測(cè)器制作方案

瑞薩嵌入式小百科
3小時(shí)前

276 閱讀

24小時(shí)訂單破6萬(wàn)！26.98萬(wàn)起，華為王炸配置押注智慧SUV問(wèn)界M6

章鷹觀察
7小時(shí)前

2453 閱讀

基于SiC模塊的DAB變換器最小電流應(yīng)力跟蹤算法（MTCS）：原理、器件交互與系統(tǒng)實(shí)現(xiàn)

楊茜
7小時(shí)前

407 閱讀

雙向全橋DC-DC變換器在船舶應(yīng)急電源中的應(yīng)用

電源聯(lián)盟
1天前

1351 閱讀

DVDDV-703功放電路圖

王麗
182

10積分

387下載

制冷技術(shù)手冊(cè)

ejlwj
3540

10積分

158下載

自由軟件，自由社會(huì)教材（第三版）

ah此生不換
18.67 MB

免費(fèi)

0下載

基于Netty開(kāi)發(fā)的SMQTT

石飛鵬
1.52 MB

免費(fèi)

0下載

PAW3311DB光學(xué)鼠標(biāo)導(dǎo)航傳感器數(shù)據(jù)手冊(cè)

熊湘生
3.20 MB

2積分

0下載

【創(chuàng)芯工坊】PowerWriter 0048 如何在其他IDE中使用PowerWriter的Debugger（燒錄器常見(jiàn)使用問(wèn)題）

海闊天空010
18小時(shí)前

162 閱讀

ADS131A04讀取ID失敗，空閑時(shí)引腳電壓都正確，DRDY配置上拉但是空閑時(shí)一直測(cè)試1.98

jf_54964657
18小時(shí)前

80 閱讀

昉·星光開(kāi)發(fā)板使用基礎(chǔ)和GPIO點(diǎn)燈

fysydfdsfw
18小時(shí)前

43 閱讀

昉·星光開(kāi)發(fā)板溫濕度傳感器使用

tinlyxian
18小時(shí)前

43 閱讀

【RA-Eco-RA4M2開(kāi)發(fā)板評(píng)測(cè)】+ RTC電子時(shí)鐘

jennyzhaojie
18小時(shí)前

80 閱讀

推薦專(zhuān)欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

海光DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

評(píng)論