91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

海光DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

CHANBAEK ? 來(lái)源:海光信息 ? 2026-03-26 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,海光DCU正式完成對(duì)階躍星辰旗艦開(kāi)源基座模型Step 3.5 Flash的全流程適配與深度調(diào)優(yōu)。得益于新一代海光DCU原生支持FP8精度、超越主流旗艦產(chǎn)品的更大顯存等核心優(yōu)勢(shì),高效完成Step 3.5 Flash FP8的推理適配,打造“適配更全面、性能更卓越”的國(guó)產(chǎn)算力解決方案。

作為階躍星辰推出的新一代基座模型,Step 3.5 Flash總參數(shù)達(dá)1960億,推理時(shí)僅激活約110億參數(shù),單請(qǐng)求代碼任務(wù)下推理速度最高可達(dá)350TPS,專(zhuān)為智能體(Agent)場(chǎng)景設(shè)計(jì),在復(fù)雜推理和長(zhǎng)鏈任務(wù)中表現(xiàn)出色,其推理深度可媲美部分頂級(jí)閉源模型,獲得全球開(kāi)發(fā)者廣泛認(rèn)可。

本次適配工作中,海光DCU團(tuán)隊(duì)充分依托以DTK(異構(gòu)計(jì)算平臺(tái))在內(nèi)的全棧AI軟件棧協(xié)同優(yōu)勢(shì),針對(duì)Step 3.5 Flash的稀疏MoE架構(gòu)特性,重點(diǎn)開(kāi)展底層算子優(yōu)化、硬件調(diào)度加速與全流程推理性能打磨,優(yōu)化模型推理時(shí)延與吞吐效率,確保模型在海光DCU平臺(tái)上實(shí)現(xiàn)高可靠、低延遲的穩(wěn)定運(yùn)行。

相較于主流的FP16精度,新一代海光DCU原生支持的FP8在相同硬件平臺(tái)上可大幅增加理論峰值性能,同時(shí)降低內(nèi)存占用與通信開(kāi)銷(xiāo),有效節(jié)約模型部署成本、提升Token Efficiency,為開(kāi)發(fā)者提供更具性?xún)r(jià)比的算力支撐。

現(xiàn)在,全球開(kāi)發(fā)者可在光合開(kāi)發(fā)者社區(qū)一鍵下載Step 3.5 Flash及Step 3.5 Flash FP8模型并落地部署,滿(mǎn)足多樣化推理需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3778

    瀏覽量

    52179
  • DCU
    DCU
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    3165
  • 海光信息
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    2686
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DCU完成Qwen3.5多模態(tài)MoE模型全量適配

    近日,DCU完成Qwen3.5-397B MoE旗艦多模態(tài)模型、Qwen
    的頭像 發(fā)表于 03-26 09:35 ?310次閱讀

    天數(shù)智芯完成阿里云通義千問(wèn)Qwen3.5系列多模態(tài)模型全量適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義千問(wèn) Qwen3.5 系列多模態(tài)模型全量適配,實(shí)現(xiàn)模型精度精準(zhǔn)對(duì)齊與端到端無(wú)縫部署,再
    的頭像 發(fā)表于 03-26 09:25 ?432次閱讀

    沐曦股份曦云C系列GPU深度適配通義千問(wèn)Qwen3.5模型

    今天,通義千問(wèn)今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開(kāi)放權(quán)重版本。沐曦股份曦云C系列GPU
    的頭像 發(fā)表于 02-26 14:26 ?602次閱讀
    沐曦股份曦云C系列GPU深度<b class='flag-5'>適配</b>通義千問(wèn)Qwen<b class='flag-5'>3.5</b><b class='flag-5'>模型</b>

    摩爾線(xiàn)程快速完成對(duì)Qwen3.5模型全面適配

    2月17日,摩爾線(xiàn)程宣布已在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上完成對(duì)阿里最新大模型Qwen3.5的全方位適配。此次支持充分展示了摩爾線(xiàn)程MUSA生態(tài)的成熟度與完備性,
    發(fā)表于 02-18 08:32 ?1011次閱讀

    燧原科技訓(xùn)推一體芯片L600適配階躍星辰基座模型Step 3.5 Flash

    2026年2月2日,階躍星辰發(fā)布并開(kāi)源最新基座模型 Step 3.5
    的頭像 發(fā)表于 02-02 17:50 ?1359次閱讀
    燧原科技訓(xùn)推一體芯片L600<b class='flag-5'>適配</b><b class='flag-5'>階躍</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    壁仞科技壁礪166系列產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash

    NEWS 2月2日,階躍星辰發(fā)布并開(kāi)源最新旗艦基座模型Step 3.5
    的頭像 發(fā)表于 02-02 17:48 ?1284次閱讀
    壁仞科技壁礪166系列產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>階躍</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    階躍星辰開(kāi)源Step 3.5 Flash,多家國(guó)產(chǎn)芯片廠(chǎng)商完成適配

    2月2日,階躍星辰正式發(fā)布新一代開(kāi)源Agent基座模型——Step 3.5
    的頭像 發(fā)表于 02-02 15:36 ?1578次閱讀

    沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash

    今天,階躍星辰技術(shù)團(tuán)隊(duì)發(fā)布并開(kāi)源最新旗艦基座模型 Step 3.5
    的頭像 發(fā)表于 02-02 14:44 ?447次閱讀
    沐曦曦云C600 GPU產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>階躍</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    澎峰科技完成OpenAI最新開(kāi)源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開(kāi)源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶(hù)可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企
    的頭像 發(fā)表于 08-14 11:34 ?1450次閱讀

    華為CANN與智譜GLM端側(cè)模型完成適配

    已于7月28日正式開(kāi)源其新一代基座模型GLM-4.5,其GLM端側(cè)模型完成與CANN的適配。這標(biāo)志著國(guó)產(chǎn)大
    的頭像 發(fā)表于 08-11 11:00 ?2629次閱讀

    階躍星辰和燧原科技亮相WAIC 2025

    近日,2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2025)在上海開(kāi)幕。開(kāi)幕前夕,中國(guó)AI大模型頭部企業(yè)階躍星辰發(fā)布新一代基礎(chǔ)大模型
    的頭像 發(fā)表于 08-06 16:21 ?2028次閱讀

    寒武紀(jì)聯(lián)手階躍星辰成立模芯生態(tài)創(chuàng)新聯(lián)盟

    近日,階躍星辰發(fā)布了新一代基礎(chǔ)大模型Step 3。Step 3兼顧智能與效率,通過(guò)模型和系統(tǒng)聯(lián)合
    的頭像 發(fā)表于 07-31 11:26 ?1214次閱讀

    燧原科技加入階躍星辰模芯生態(tài)創(chuàng)新聯(lián)盟

    近日,階躍星辰在上海召開(kāi)「Step 3大模型發(fā)布會(huì)暨生態(tài)聯(lián)盟成立大會(huì)」,會(huì)上階躍發(fā)布了新一代基礎(chǔ)大模型
    的頭像 發(fā)表于 07-26 14:21 ?1136次閱讀

    DCU率先展開(kāi)文心系列模型的深度技術(shù)合作 FLOPs利用率(MFU)達(dá)47%

    DCU實(shí)現(xiàn)文心4.5模型高效適配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大
    的頭像 發(fā)表于 07-01 14:35 ?2404次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練
    的頭像 發(fā)表于 05-16 16:23 ?1067次閱讀