91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦助力上海創(chuàng)智學院siiRL 2.0全面升級

沐曦MetaX ? 來源:沐曦MetaX ? 2025-09-29 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能加速邁向大模型與智能體時代的今天,強化學習(Reinforcement Learning,RL)已經(jīng)成為推動智能系統(tǒng)演化的關鍵技術。隨著強化學習訓練規(guī)模不斷擴大,對底層算力提出了前所未有的挑戰(zhàn)。近日,上海創(chuàng)智學院 AI Infra 團隊發(fā)布的 siiRL 2.0,以其卓越特性為強化學習的發(fā)展帶來了新的突破,沐曦則憑借自身優(yōu)勢為 siiRL 2.0 的升級提供了堅實支撐,共同推動強化學習正式邁入 “千卡級”時代。

siiRL:全分布式架構的顛覆性突破

上海創(chuàng)智學院AI Infra團隊發(fā)布siiRL 2.0,聚焦性能、生態(tài)與前沿探索全面升級:

卓越性能與擴展性

基于全分布式架構,實現(xiàn)千卡級近線性擴展與業(yè)界領先吞吐,性能在7B~235B(Dense/MoE)等大規(guī)模模型上穩(wěn)定驗證。

自主可控,擁抱國產(chǎn)算力

全面適配多家主流國產(chǎn)芯片并完成千卡級擴展驗證,為AI基礎設施夯實自主可控的算力底座。

靈活易用與生態(tài)兼容

獨創(chuàng)DAG工作流支持無代碼算法實驗,兼容Megatron/FSDP等主流后端,極大提升研發(fā)效率。

面向前沿,支持多智能體研究

內建強大的多智能體協(xié)同訓練框架,為探索“智能涌現(xiàn)”等前沿課題提供關鍵基礎設施。

9b4e6c46-9829-11f0-8c8f-92fbcf53809c.png

圖 1:siiRL架構概覽

技術論文:https://arxiv.org/abs/2507.13833

開源代碼倉庫:https://github.com/sii-research/siiRL

在本次siiRL的升級適配工作中,沐曦做了一系列針對性優(yōu)化:

siiRL框架高效適配

基于沐曦自研的MXMACA軟件棧,已經(jīng)完整適配了siiRL需要的所有后端引擎(Vllm/Pytorch fsdp/Megatron-LM/Ray)以及深度優(yōu)化的mccl高性能通信庫,不需要其他額外的適配工作,實現(xiàn)了siiRL框架的高效適配。

超節(jié)點scale up

沐曦Dragonfly超節(jié)點,提供了64卡的光互連高速通信帶寬。在訓練過程中,通過設置fsdp_size=64,可以充分利用超節(jié)點內的帶寬,提升模型的訓練效率。

顯存優(yōu)化

通過設置模型參數(shù)offload選項,在共置集群上,有效降低了rollout和training階段的峰值顯存,可以采用更優(yōu)的切分方式,進一步提升計算效率。

分布式策略調整

結合實際負載與硬件拓撲,優(yōu)化了不同模型的分布式訓練參數(shù)切分方式,并調整了親和性配置,以提升通信效率。

通過上述優(yōu)化,siiRL框架在沐曦超節(jié)點集群上實現(xiàn)了從64卡到1024卡的穩(wěn)定擴展,系統(tǒng)保持了超過92%的高線性度拓展效率。在模型精度上,與國際主流生態(tài) GPU的訓練結果相比,沐曦超節(jié)點集群在驗證集上的平均絕對誤差控制在0.5%以內,滿足實際應用場景的精度要求。

9bc2af0c-9829-11f0-8c8f-92fbcf53809c.png

圖 2:siiRL在沐曦超節(jié)點集群上的擴展性評估,

展示了64卡到1024GPU規(guī)模下的高線性擴展能力

隨著 AI 技術逐漸成為國家科技競爭的核心,構建自主可控的算力基礎設施已經(jīng)成為產(chǎn)業(yè)發(fā)展的必然選擇。沐曦與上海創(chuàng)智學院 AI Infra 團隊的攜手合作,不僅驗證了國產(chǎn) GPU 在前沿 AI 應用上的可行性與先進性,更為中國科研機構、產(chǎn)業(yè)界提供了面向未來的堅實算力底座。沐曦將持續(xù)與產(chǎn)學研伙伴深度協(xié)作,推動大模型框架與國產(chǎn) GPU 的深度適配和生態(tài)完善,加速強化學習、大模型、智能體等關鍵領域的創(chuàng)新應用落地。

關于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135431
  • 沐曦
    +關注

    關注

    1

    文章

    80

    瀏覽量

    1811
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179

原文標題:強化學習進入“千卡級”時代,沐曦助力 siiRL 2.0 全面升級

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。技術團隊依托MXMACA軟件棧,在24小時內完成云C500/C550 對該模型的深度適配。
    的頭像 發(fā)表于 02-26 14:19 ?594次閱讀

    股份CXO預科班2026冬令營圓滿收官

    2月6日,由集成電路(上海)股份有限公司(股票代碼:688802,簡稱“股份”)主辦、之江實驗室大力支持、
    的頭像 發(fā)表于 02-25 16:29 ?1036次閱讀

    云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力Padd
    的頭像 發(fā)表于 01-30 10:19 ?738次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    股份與江南大學建立聯(lián)合研究中心

    近日,教育部哲學社會科學實驗室“食品安全與國家戰(zhàn)略治理實驗室”揭牌暨合作簽約儀式、學術委員會會議在無錫隆重舉行?;顒蝇F(xiàn)場,集成電路(上海)股份有限公司與江南大學簽署共建協(xié)議,并同步揭牌“江南大學
    的頭像 發(fā)表于 01-21 17:25 ?1362次閱讀

    與Arm、熠知一同到訪清華大學交流座談

    助力頂尖學府清華大學在“AI+教科研”領域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,集成電路(上海)股份有限公司(股票代碼:688802)、半導體頭部企業(yè)Arm控股有限
    的頭像 發(fā)表于 01-14 13:52 ?349次閱讀

    受邀出席第二屆開源產(chǎn)業(yè)生態(tài)大會

    以“開源筑基·數(shù)實維新”為主題的第二屆開源產(chǎn)業(yè)生態(tài)大會將于1月13日在上海舉行。受邀出席本次行業(yè)盛會,聯(lián)合創(chuàng)始人、CTO兼首席軟件架構師楊建將發(fā)表主題演講并參與圓桌論壇環(huán)節(jié),分享
    的頭像 發(fā)表于 01-14 13:51 ?294次閱讀

    股份在上海證券交易所科創(chuàng)板掛牌上市

    近日,股份正式在上海證券交易所科創(chuàng)板掛牌上市,股票代碼:688802.SH。作為國內高性
    的頭像 發(fā)表于 12-24 09:03 ?2571次閱讀

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,股份云C系列GPU完成Day 0適配。
    的頭像 發(fā)表于 12-17 14:28 ?618次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    DLInfer聯(lián)手股份實現(xiàn)數(shù)據(jù)生成場景的實際落地

    近期,上海 AI 實驗室 DeepLink 團隊推出的 DLInfer 通過支持 LMDeploy 主流模型推理,助力股份云 C500
    的頭像 發(fā)表于 12-09 14:55 ?708次閱讀
    DLInfer聯(lián)手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實現(xiàn)數(shù)據(jù)生成場景的實際落地

    股份與上海電信完成首期GPU生態(tài)專家認證培訓

    近期,集成電路(上海)股份有限公司(以下簡稱“股份”)攜手上海電信天翼云能力運營中心(以
    的頭像 發(fā)表于 10-31 10:33 ?491次閱讀

    首款全國產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    ,并支持MetaXLink超節(jié)點擴展技術,在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,股份與中國科學院合作的國產(chǎn)千卡集群,已完成多個大模型全參數(shù)訓練,證實國產(chǎn)算力已具備大模型預訓練能力。 公開資料
    的頭像 發(fā)表于 10-19 20:04 ?4.6w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技
    的頭像 發(fā)表于 10-17 15:06 ?1188次閱讀

    書生大模型實戰(zhàn)營魔樂專場MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實戰(zhàn)營魔樂專場 MeetUP 暨頒獎儀式」在上海
    的頭像 發(fā)表于 08-20 11:33 ?1108次閱讀

    硅基流動攜手首發(fā)基于云的Kimi K2推理服務

    今天,硅基流動聯(lián)合集成電路(上海)股份有限公司(簡稱“”),全球首發(fā)基于
    的頭像 發(fā)表于 07-23 17:33 ?1927次閱讀

    PaddleScience完成與AI芯片適配

    當前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計算、科學建模等多個方向。這一趨勢正加速形成面向"Al for Science"的國產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1638次閱讀