當(dāng)前人工智能技術(shù)加速演進(jìn)并深入各行各業(yè),驅(qū)動(dòng)計(jì)算資源需求呈爆發(fā)式增長(zhǎng),在旺盛的應(yīng)用需求和多樣化場(chǎng)景的雙重推動(dòng)下,中國(guó)智能算力規(guī)模將持續(xù)攀升,預(yù)計(jì)2026年將達(dá)到1460 EFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù)),2027年進(jìn)一步增長(zhǎng)至超過(guò)2000 EFLOPS。然而,企業(yè)在實(shí)際使用算力過(guò)程中仍面臨"兩大瓶頸":一是本地算力擴(kuò)展難,配套機(jī)房用電、空間等改造成本巨大;二是安全管控難度大,訓(xùn)練與推理過(guò)程中所涉及的數(shù)據(jù)多為企業(yè)的核心資產(chǎn),數(shù)據(jù)安全性難以保障。
浙江電信與華為攜手攻堅(jiān)面向智算時(shí)代的AI WAN高算效無(wú)損網(wǎng)絡(luò)基礎(chǔ)設(shè)施,聚焦解決數(shù)據(jù)安全不出域、算力彈性擴(kuò)展等關(guān)鍵場(chǎng)景需求,充分發(fā)揮IPv6 Overlay特性,通過(guò)強(qiáng)化網(wǎng)絡(luò)能力,實(shí)施"以網(wǎng)強(qiáng)算"策略,對(duì)精準(zhǔn)響應(yīng)市場(chǎng)核心訴求、推動(dòng)產(chǎn)業(yè)智能化升級(jí)具有重要意義。
浙江電信搭建的AI WAN無(wú)損網(wǎng)絡(luò),融合IPv6+與廣域RDMA無(wú)損技術(shù),構(gòu)建具備"算網(wǎng)融合、彈性無(wú)損、安全可信、全域智控"特征的新一代運(yùn)力基礎(chǔ)設(shè)施。該網(wǎng)絡(luò)依托IPv6+實(shí)現(xiàn)業(yè)務(wù)靈活部署,通過(guò)租戶級(jí)擁塞控制與流級(jí)精細(xì)化調(diào)度保障廣域RDMA無(wú)丟包傳輸,并構(gòu)建智能運(yùn)維體系確保服務(wù)高可靠,最終形成一體化算網(wǎng)服務(wù)能力。
該方案具備如下3個(gè)技術(shù)突破點(diǎn):
廣域RDMA無(wú)損傳輸突破:在AI WAN高算效IP廣域網(wǎng)中基于IPv6+底座,部署新型租戶級(jí)流控機(jī)制,解決了傳統(tǒng)網(wǎng)絡(luò)因輕微丟包導(dǎo)致吞吐量驟降的問(wèn)題,并實(shí)現(xiàn)租戶級(jí)擁塞隔離,有效規(guī)避了傳統(tǒng)PFC(基于優(yōu)先級(jí)的流量控制)技術(shù)在廣域場(chǎng)景下易引發(fā)的頭部阻塞及擁塞擴(kuò)散等缺陷,為分布式訓(xùn)練與推理構(gòu)建可靠基礎(chǔ)。
流級(jí)動(dòng)態(tài)負(fù)載均衡技術(shù)突破:針對(duì)AI WAN高算效IP廣域網(wǎng)中大小流量混合的特點(diǎn),微秒級(jí)大象流識(shí)別技術(shù)創(chuàng)新,高準(zhǔn)確率捕捉全網(wǎng)大象流,克服了傳統(tǒng)ECMP算法因無(wú)法識(shí)別流速大小而導(dǎo)致的鏈路負(fù)載不均、吞吐低下等問(wèn)題。
算網(wǎng)融合服務(wù)創(chuàng)新:整合網(wǎng)絡(luò)傳輸、存儲(chǔ)與算力資源,提供"算力+網(wǎng)絡(luò)"一體化服務(wù)。企業(yè)可通過(guò)該模式實(shí)現(xiàn)訓(xùn)練與推理任務(wù)的端到端快速交付,算力獲取周期從月級(jí)縮短至天級(jí),極大加速企業(yè)AI業(yè)務(wù)部署進(jìn)程。在訓(xùn)練高峰期可臨時(shí)擴(kuò)容并按小時(shí)計(jì)費(fèi),顯著降低企業(yè)算力使用成本,推動(dòng)普惠算力落地。
在實(shí)際部署中,浙江電信AI WAN無(wú)損網(wǎng)絡(luò)接入嘉善和杭州的省級(jí)算力池,通過(guò)算網(wǎng)融合服務(wù)為全省政務(wù)、醫(yī)療、教育等多個(gè)行業(yè)提供普惠化的AI算力支持,助推行業(yè)智能化升級(jí)。
在超百公里存算分離的模型訓(xùn)練與微調(diào)場(chǎng)景中,浙江電信AI WAN無(wú)損網(wǎng)絡(luò)端到端的彈性無(wú)損傳輸,精準(zhǔn)適配數(shù)據(jù)預(yù)處理、模型訓(xùn)練及推理部署等關(guān)鍵場(chǎng)景的多樣化需求,有效克服RDMA在廣域網(wǎng)絡(luò)中因單流突發(fā)帶寬大、流數(shù)少而導(dǎo)致的擁塞、丟包和傳輸性能下降等問(wèn)題,微調(diào)訓(xùn)練和云邊協(xié)同分布式安全推理業(yè)務(wù)的計(jì)算效率高于95%,具備分布式推理、廣域高算效、高收斂比、數(shù)據(jù)高安全等核心優(yōu)勢(shì)。浙江電信以溫州為起點(diǎn),逐步構(gòu)建起"大集群+普惠化+智調(diào)度"新型算力體系和分布式訓(xùn)練與推理服務(wù),滿足政府、醫(yī)療、交通、企業(yè)的關(guān)鍵業(yè)務(wù)需求。
浙江電信AI WAN無(wú)損網(wǎng)絡(luò)打破了傳統(tǒng)的賣(mài)算力、賣(mài)存儲(chǔ)、賣(mài)專線單一服務(wù),創(chuàng)新性地為企業(yè)提供邊、網(wǎng)、云一體化的打包服務(wù),帶來(lái)數(shù)據(jù)安全0泄露、彈性算力小時(shí)級(jí)擴(kuò)容、邊云協(xié)同高效運(yùn)維三大核心能力,解決企業(yè)用算痛點(diǎn),積極踐行央企責(zé)任、創(chuàng)造社會(huì)效益,真正讓算力普惠浙江。
-
華為
+關(guān)注
關(guān)注
218文章
36013瀏覽量
262151 -
AI
+關(guān)注
關(guān)注
91文章
39820瀏覽量
301497 -
算力
+關(guān)注
關(guān)注
2文章
1533瀏覽量
16750
原文標(biāo)題:數(shù)通金拍檔 | 浙江電信聯(lián)手華為打造AI WAN IPv6 Overlay無(wú)損網(wǎng)絡(luò),助力企業(yè)用算彈性隨行
文章出處:【微信號(hào):Huawei_Fixed,微信公眾號(hào):華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Turkcell攜手華為推出面向AI WAN演進(jìn)的白皮書(shū)
Turkcell與華為在歐洲實(shí)現(xiàn)算力中心長(zhǎng)距無(wú)損互聯(lián)技術(shù)突破
GlobalData與華為探討AI對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的機(jī)遇與挑戰(zhàn)
華為AI WAN解決方案使能算網(wǎng)一體化新服務(wù)
天津移動(dòng)基于SPN數(shù)據(jù)基礎(chǔ)設(shè)施打造三新數(shù)聯(lián)服務(wù)產(chǎn)品
華為超節(jié)點(diǎn)互聯(lián)技術(shù)引領(lǐng)AI基礎(chǔ)設(shè)施新范式
科士達(dá)全棧解決方案亮相2025 ODCC,驅(qū)動(dòng)綠色AI智算基礎(chǔ)設(shè)施革新
浙江電信聯(lián)手華為打造AI WAN高算效無(wú)損網(wǎng)絡(luò)基礎(chǔ)設(shè)施
評(píng)論