近日,備受矚目的“2024中國信息通信大會暨中國通信學(xué)會學(xué)術(shù)年會”在四川成都順利舉行。此屆大會以“科技領(lǐng)航創(chuàng)新,產(chǎn)業(yè)共筑未來”為主題,聚集了來自“政產(chǎn)學(xué)研用”各方代表,集中展示算力及網(wǎng)絡(luò)通信領(lǐng)域的最新研究成果。
在“算力網(wǎng)絡(luò)算網(wǎng)一體創(chuàng)新發(fā)展論壇”上,壁仞科技攜手中國移動、中興通訊等產(chǎn)業(yè)合作伙伴共同發(fā)布了通用異構(gòu)混合并行訓(xùn)練系統(tǒng)——“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0。該系統(tǒng)可解決大模型異構(gòu)算力孤島難題,實現(xiàn)同一訓(xùn)練任務(wù)在異構(gòu)算力集群的任務(wù)拆解和協(xié)同訓(xùn)練,對推動我國智算產(chǎn)業(yè)生態(tài)融通發(fā)展,構(gòu)建開放協(xié)同的新型智算基礎(chǔ)設(shè)施具有積極意義。
當(dāng)前,我國智算產(chǎn)業(yè)形成了軟硬件綁定的豎井式生態(tài),不同廠商、不同架構(gòu)的智能算力之間無法兼容互通,限制了異構(gòu)智能算力的有效整合和充分利用。大模型訓(xùn)練需要千卡集群甚至萬卡集群資源,目前國產(chǎn)芯片廠家百花齊放,移動新型智算中心已經(jīng)落地使用的算力資源類型多樣,形成了一些算力孤島。但由于目前Megatron等主流的分布式訓(xùn)練框架僅支持同構(gòu)算力集群,導(dǎo)致無論是不同廠商的智算芯片之間,亦或是同一廠商不同代際芯片之間都無法形成“合力”,極大地限制了智算中心對現(xiàn)有異構(gòu)算力資源使用的充分性和調(diào)度的靈活性,因此亟需面向異構(gòu)算力混合訓(xùn)練需求進行技術(shù)研究。
為屏蔽異構(gòu)硬件差異、融通智算豎井生態(tài),中國移動充分發(fā)揮移動信息現(xiàn)代產(chǎn)業(yè)鏈“鏈長”職責(zé),以異構(gòu)混訓(xùn)技術(shù)為攻關(guān)要點,率先提出通用異構(gòu)混合訓(xùn)練技術(shù),并開展“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0研發(fā),開辟以智算軟件帶動智算產(chǎn)業(yè)融通發(fā)展的全新路徑。
本次壁仞科技聯(lián)合中國移動發(fā)布的“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0依托基于 Inhomogeneous Task Distribution (ITD)算法的3D并行非均勻切分和基于GPUDirect RDMA(GDR)的異構(gòu)芯片高速通信兩大關(guān)鍵技術(shù)提供通用混合訓(xùn)練能力。其中,基于ITD算法的3D并行非均勻切分可通過通用混合訓(xùn)練框架實現(xiàn)異構(gòu)數(shù)據(jù)并行、異構(gòu)流水線并行,實現(xiàn)數(shù)據(jù)微批次大小、數(shù)量、流水線并行度等參數(shù)在異構(gòu)算力上的自適應(yīng)調(diào)整;基于GDR的異構(gòu)芯片高速通信可在不改變芯片原有通信接口基礎(chǔ)上,基于GDR芯片高速互聯(lián)技術(shù),通過定義數(shù)據(jù)傳輸架構(gòu)、流程及接口標(biāo)準約束,屏蔽底層硬件差異,實現(xiàn)頂層訓(xùn)練任務(wù)在異構(gòu)算力集群上分布式通信的無感拆解。當(dāng)前系統(tǒng)已實現(xiàn)百億參數(shù)大模型在壁仞科技、英偉達等多家智算芯片上的交叉混合訓(xùn)練,異構(gòu)混訓(xùn)效率達95%以上,未來將在提升智能算力資源利用率及促進國產(chǎn)算力發(fā)展等方面發(fā)揮重要作用。
此前壁仞科技的壁礪系列通用GPU算力產(chǎn)品已經(jīng)在中國移動智算中心(呼和浩特)成功上線運營,為該智算中心提供強大算力。該項目成功上線運營,標(biāo)志著雙方在智能計算領(lǐng)域的深度合作邁出了堅實的步伐。國產(chǎn)GPU加快落地的過程中正在在逐步擴大算力規(guī)模,為破解這一過程中的“大模型算力孤島”難題,壁仞科技一直在積極開展異構(gòu)GPU協(xié)同訓(xùn)練技術(shù)攻關(guān),已發(fā)布自主原創(chuàng)的異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT,業(yè)界首次支持3種及以上異構(gòu)GPU混合訓(xùn)練同一個大模型,用一套統(tǒng)一方案支持多種不同廠商、不同型號的GPU,而且一行代碼適配多種框架。此次壁仞科技攜手中國移動強強聯(lián)合,發(fā)揮雙方在底層通信庫和上層并行拆分策略的優(yōu)勢,聯(lián)合打造“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0,有利于幫助中國移動充分利用國產(chǎn)算力,加快國產(chǎn)GPU遷移落地,形成開放的國產(chǎn)智算生態(tài)。
大會同期舉辦了中國通信學(xué)會算力網(wǎng)絡(luò)委員會閉門會議及委員聘用儀式,壁仞科技AI軟件首席架構(gòu)師丁云帆被評選為中國通信學(xué)會第一屆算力網(wǎng)絡(luò)委員會委員,其將發(fā)揮在大規(guī)模智算集群、AI平臺、異構(gòu)訓(xùn)練系統(tǒng)、大模型分布式并行加速等方面的經(jīng)驗和能力,為中國算力網(wǎng)絡(luò)的發(fā)展貢獻力量。
未來,壁仞將繼續(xù)秉承開放與融合的理念,與中國移動等產(chǎn)業(yè)鏈的合作伙伴攜手并進,共同推進智算異構(gòu)混訓(xùn)系統(tǒng)的創(chuàng)新與建設(shè),支撐更多業(yè)務(wù)場景、支持更大參數(shù)規(guī)模模型、支持更大規(guī)模異構(gòu)集群、融通更多異構(gòu)芯片,真正打造以基礎(chǔ)軟件棧引領(lǐng)的全新智算生態(tài),為我國算力強國戰(zhàn)略落地提供堅實的支撐。
-
中國移動
+關(guān)注
關(guān)注
22文章
5713瀏覽量
78058 -
算力
+關(guān)注
關(guān)注
2文章
1527瀏覽量
16737 -
壁仞科技
+關(guān)注
關(guān)注
1文章
83瀏覽量
4004
原文標(biāo)題:破解“算力孤島”|壁仞科技聯(lián)合中國移動等生態(tài)伙伴共同發(fā)布“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
6G關(guān)鍵里程碑!來自中國移動
中國移動攜手華為等產(chǎn)業(yè)伙伴推出智簡天線能力演進白皮書
中星微技術(shù)與中國移動深化戰(zhàn)略合作
壁仞科技亮相2025中國移動全球合作伙伴大會
芯盛智能亮相2025中國移動全球合作伙伴大會
芯盛智能攜手中國移動發(fā)布全國產(chǎn)DDR4內(nèi)存產(chǎn)品
海格通信與中國移動合作打造空天地一體生態(tài)“中國芯”引擎
奇異摩爾攜手中國移動發(fā)布OISA 2.0協(xié)議
壁仞科技、中國移動等發(fā)布“芯合”異構(gòu)混合并行訓(xùn)練系統(tǒng)1.0
評論