91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列

浪潮存儲(chǔ) ? 來源:浪潮存儲(chǔ) ? 2024-05-08 09:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎DataTurbo,通過盤控協(xié)同、GPU直訪存儲(chǔ)、全局一致性緩存等技術(shù)為AI大模型數(shù)據(jù)歸集、訓(xùn)練、數(shù)據(jù)歸檔與管理等階段提供強(qiáng)大存儲(chǔ)支撐能力,助力用戶加速大模型系統(tǒng)的創(chuàng)新及應(yīng)用落地。

化解大模型時(shí)代的存儲(chǔ)挑戰(zhàn)

構(gòu)建堅(jiān)實(shí)的數(shù)據(jù)存儲(chǔ)底座

大模型已經(jīng)成為驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)深度創(chuàng)新、引領(lǐng)企業(yè)業(yè)務(wù)變革、加速形成新質(zhì)生產(chǎn)力的重要?jiǎng)幽?,隨著大模型參數(shù)量和數(shù)據(jù)量的極速膨脹,多源異構(gòu)數(shù)據(jù)的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一,用戶亟需構(gòu)建更加高效的存儲(chǔ)底座。在數(shù)據(jù)準(zhǔn)備階段,在規(guī)模大、來源廣泛、格式多樣的原始數(shù)據(jù)中,篩選和清洗出利用于訓(xùn)練的高質(zhì)量數(shù)據(jù)常會(huì)耗費(fèi)大量時(shí)間;在模型訓(xùn)練階段,海量小文件數(shù)據(jù)加載、Checkpoint數(shù)據(jù)調(diào)用對IO處理效率提出嚴(yán)苛要求;模型訓(xùn)練之后,多個(gè)數(shù)據(jù)資源池?zé)o法互通、海量冷數(shù)據(jù)歸檔帶來較高的數(shù)據(jù)管理復(fù)雜度。

作為率先在業(yè)界提出分布式融合存儲(chǔ)的廠商,浪潮信息聚焦行業(yè)客戶的大模型落地需求與核心痛點(diǎn),基于NVMe SSD研發(fā)出高效適配和優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盤位的全閃存儲(chǔ)機(jī)型,搭載英特爾至強(qiáng)第四、第五代可擴(kuò)展處理器,支持400 Gb 網(wǎng)卡,同時(shí)每盤位可配置15.36TB 大容量NVMe SSD。軟件方面,通過集群控制服務(wù)將N個(gè)節(jié)點(diǎn)聯(lián)成一套具有高擴(kuò)展性的文件系統(tǒng);通過分布式元數(shù)據(jù)服務(wù)提升海量小文件讀寫性能;通過數(shù)控分離架構(gòu),實(shí)現(xiàn)東西向網(wǎng)絡(luò)優(yōu)化,降低IO訪問時(shí)延,提升單節(jié)點(diǎn)帶寬。在軟硬件協(xié)同創(chuàng)新下,AS13000G7-N充分滿足大模型應(yīng)用在存儲(chǔ)性能和存儲(chǔ)容量方面的嚴(yán)苛需求。

1a34deda-0c6e-11ef-a297-92fbcf53809c.jpg

具體來說,在數(shù)據(jù)準(zhǔn)備階段,通過多協(xié)議融合互通技術(shù),面對多份、多種協(xié)議的數(shù)據(jù),存儲(chǔ)底層僅保留一份數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)共享免搬遷;在模型訓(xùn)練階段,通過大小IO智能識(shí)別和緩存預(yù)讀技術(shù)快速保存和恢復(fù)checkpoint(檢查點(diǎn))文件,實(shí)現(xiàn)TB級訓(xùn)練數(shù)據(jù)Checkpoint讀取耗時(shí)從10分鐘縮短至10秒內(nèi),大幅提升訓(xùn)練過程中數(shù)據(jù)加載速度;RDMA/RoCE網(wǎng)絡(luò)連接技術(shù)和數(shù)控分離架構(gòu)的設(shè)計(jì),實(shí)現(xiàn)東西向數(shù)據(jù)免轉(zhuǎn)發(fā),極限發(fā)揮大模型訓(xùn)練中硬件網(wǎng)絡(luò)帶寬性能;基于盤控協(xié)同架構(gòu),網(wǎng)絡(luò)數(shù)據(jù)直通NVMe SSD,進(jìn)一步提升單盤帶寬;在數(shù)據(jù)歸檔與管理階段,AS13000G7-N提供了多元異構(gòu)存儲(chǔ)的統(tǒng)一納管能力,保障數(shù)據(jù)資產(chǎn)高效存儲(chǔ)與管理,大幅提升存儲(chǔ)資源的利用率且最大化數(shù)據(jù)基礎(chǔ)設(shè)施投資回報(bào)比。

DataTurbo數(shù)據(jù)加速引擎

全力保障大模型高效訓(xùn)練

在大模型的數(shù)據(jù)應(yīng)用全流程中,要想使訓(xùn)練效率達(dá)到極致,減少不必要的資源浪費(fèi),訓(xùn)練階段的數(shù)據(jù)讀寫性能成為重中之重。而想要提升算力利用率、降低模型訓(xùn)練成本,必須要在數(shù)據(jù)存儲(chǔ)性能上進(jìn)行創(chuàng)新。

AS13000G7-N系列具備強(qiáng)大的端到端性能優(yōu)化能力,這也是模型訓(xùn)練階段最為核心的考量因素。浪潮信息基于計(jì)算和存儲(chǔ)協(xié)同的理念,依托自研分布式文件系統(tǒng)構(gòu)建了新一代數(shù)據(jù)加速引擎DataTurbo,在緩存優(yōu)化、空間均衡、縮短GPU與存儲(chǔ)讀取路徑等方面進(jìn)行了全面升級。”

■ 智能緩存優(yōu)化,保障大模型訓(xùn)練速度與質(zhì)量

AS13000G7-N能夠通過對大小IO的智能識(shí)別,進(jìn)行分類治理,小文件采取聚合的操作,大文件采取切片的操作,所有數(shù)據(jù)以大小均衡的模式保存到全局緩存中,實(shí)現(xiàn)小文件性能提升5倍,大文件性能提升10倍。在模型訓(xùn)練中斷后,從Checkpoint恢復(fù)數(shù)據(jù)過程中,AS13000G7-N通過緩存預(yù)讀技術(shù),提前識(shí)別數(shù)據(jù)的冷熱程度,加速了重復(fù)樣本數(shù)據(jù)的讀取,訓(xùn)練加載速度提升10倍。無論是讀操作還是寫操作,AS13000G7-N采取了字節(jié)級(Byte)分布式鎖機(jī)制,粒度是主流并行文件系統(tǒng)鎖機(jī)制粒度的幾十分之一,確保多個(gè)節(jié)點(diǎn)訪問共享資源時(shí)能夠安全、有序地進(jìn)行操作,從而保持訓(xùn)練數(shù)據(jù)的強(qiáng)一致性和訓(xùn)練質(zhì)量。

■ 智能空間均衡,高水位下性能無衰減

AS13000G7-N搭載了浪潮信息自主研發(fā)的分布式并行客戶端技術(shù),相比通用私有客戶端,卸載了獨(dú)立的元數(shù)據(jù),實(shí)現(xiàn)了元數(shù)據(jù)和數(shù)據(jù)節(jié)點(diǎn)的高效統(tǒng)一部署,有效提升存儲(chǔ)的并發(fā)能力,充分利用訓(xùn)練節(jié)點(diǎn)網(wǎng)卡的帶寬,讓GPU算力得到完全釋放。同時(shí)在存儲(chǔ)端,相較于業(yè)界主流的文件系統(tǒng)需要在磁盤之上構(gòu)筑一層文件協(xié)議,AS13000G7-N能夠直接對裸盤的空間進(jìn)行均衡排布,并在管理層面設(shè)計(jì)了智能空間預(yù)分技術(shù),能夠結(jié)合用戶前端算力節(jié)點(diǎn)數(shù)量、訓(xùn)練模型的數(shù)量,對存儲(chǔ)空間分配進(jìn)一步進(jìn)行智能策略預(yù)埋。這套組合拳能夠使AS13000G7-N在空間利用率達(dá)到95%高水位時(shí),依然可以平穩(wěn)輸出強(qiáng)大的性能。在模型訓(xùn)練的空間損耗上,AS13000G7-N相較傳統(tǒng)方案,將損耗率降低了85%左右,充分保護(hù)了客戶在大模型存儲(chǔ)上的投資。

■ GPU直通存儲(chǔ),服務(wù)萬億參數(shù)大模型

當(dāng)大模型參數(shù)在百億級別,GPU對存儲(chǔ)資源的調(diào)用效率往往差別不大。但隨著大模型從單模態(tài)走向多模態(tài),數(shù)據(jù)量指數(shù)型增長,訓(xùn)練效率隨之要求更高。從數(shù)據(jù)層面來看,AS13000G7-N具備和GPU直通的能力,數(shù)據(jù)流不經(jīng)過客戶端緩存,直接到達(dá)存儲(chǔ)底層文件系統(tǒng),縮短GPU與存儲(chǔ)的讀取路徑,這項(xiàng)技術(shù)能夠使存儲(chǔ)讀寫帶寬翻倍,大模型訓(xùn)練加載時(shí)間縮短50%。隨著萬卡萬億參數(shù)模型時(shí)代的到來,GPU直通存儲(chǔ)高效提升數(shù)據(jù)讀寫訪問的能力將是大模型訓(xùn)練的標(biāo)配。

通過上述技術(shù)創(chuàng)新,分布式全閃存儲(chǔ)AS13000G7-N憑借領(lǐng)先的性能和管理優(yōu)勢,能夠幫助用戶加速大模型的數(shù)據(jù)歸集、提升模型訓(xùn)練效率、簡化海量異構(gòu)數(shù)據(jù)的管理,從而推動(dòng)業(yè)務(wù)智能化變革。浪潮信息將借助AS13000G7-N等存儲(chǔ)產(chǎn)品,與合作伙伴加快在場景化方案定制、市場拓展等方面的創(chuàng)新,助力用戶構(gòu)筑人工智能時(shí)代最佳數(shù)據(jù)存儲(chǔ)底座。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20250

    瀏覽量

    252211
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135431
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3109

    瀏覽量

    122221
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179

原文標(biāo)題:為大模型專門優(yōu)化!浪潮信息發(fā)布分布式全閃存儲(chǔ)AS13000G7-N系列

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲(chǔ)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    分布式光伏“四可”裝置:可觀、可測、可控、可調(diào)的技術(shù)內(nèi)核解析

    分布式光伏“可觀、可測、可控、可調(diào)”四可裝置,精準(zhǔn)切中并網(wǎng)核心痛點(diǎn),通過維度功能構(gòu)建,成為推動(dòng)分布式光伏從“被動(dòng)并網(wǎng)”向“主動(dòng)協(xié)同”轉(zhuǎn)型的關(guān)鍵支撐。
    的頭像 發(fā)表于 11-24 11:20 ?509次閱讀
    <b class='flag-5'>分布式</b>光伏“四可”裝置:可觀、可測、可控、可調(diào)的技術(shù)內(nèi)核<b class='flag-5'>全</b>解析

    戴爾科技閃存存儲(chǔ)PowerStore有何獨(dú)特之處

    近日,在IDC最新發(fā)布的全球企業(yè)存儲(chǔ)系統(tǒng)季度跟蹤報(bào)告中,戴爾科技集團(tuán)再度蟬聯(lián)閃存存儲(chǔ)供應(yīng)商收入榜首!
    的頭像 發(fā)表于 10-15 14:19 ?1708次閱讀

    【節(jié)能學(xué)院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應(yīng)用

    分布式光伏本地和遠(yuǎn)程通信方案,并研究分布式光伏采集模型的構(gòu)建、多源數(shù)據(jù)融合估計(jì)、面向分布式光伏的有功、無功功率優(yōu)化控制等關(guān)鍵技術(shù),實(shí)現(xiàn)了對小
    的頭像 發(fā)表于 08-23 08:04 ?3490次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應(yīng)用

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計(jì)

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?675次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點(diǎn),面向萬億參數(shù)大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    一鍵部署無損網(wǎng)絡(luò):EasyRoCE助力分布式存儲(chǔ)效能革命

    分布式存儲(chǔ)的性能瓶頸往往在于網(wǎng)絡(luò)。如何構(gòu)建一個(gè)高帶寬、超低時(shí)延、零丟包的無損網(wǎng)絡(luò),是釋放分布式存儲(chǔ)全部潛力、賦能企業(yè)關(guān)鍵業(yè)務(wù)(如實(shí)時(shí)數(shù)據(jù)庫、AI訓(xùn)練、高性能計(jì)算)的關(guān)鍵挑戰(zhàn)。
    的頭像 發(fā)表于 08-04 11:34 ?1616次閱讀
    一鍵部署無損網(wǎng)絡(luò):EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存儲(chǔ)</b>效能革命

    Ceph分布式存儲(chǔ)系統(tǒng)解析

    在當(dāng)今數(shù)據(jù)爆炸的時(shí)代,企業(yè)對存儲(chǔ)系統(tǒng)的需求日益增長,傳統(tǒng)的集中式存儲(chǔ)已經(jīng)無法滿足大規(guī)模數(shù)據(jù)處理的要求。分布式存儲(chǔ)系統(tǒng)應(yīng)運(yùn)而生,而Ceph作為開源分布
    的頭像 發(fā)表于 07-14 11:15 ?995次閱讀

    飛利信與浪潮信息達(dá)成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術(shù)有限公司等22家戰(zhàn)略合作伙伴達(dá)成簽約,其中將面向北京人工智能應(yīng)用大市場,在產(chǎn)品技術(shù)共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1103次閱讀

    雙電機(jī)分布式驅(qū)動(dòng)汽車高速穩(wěn)定性機(jī)電耦合控制

    摘要:為了利用所設(shè)計(jì)的雙電機(jī)防滑差速驅(qū)動(dòng)系統(tǒng)來提高分布式驅(qū)動(dòng)汽車的動(dòng)力學(xué)性能,在前期同軸耦合驅(qū)動(dòng)控制理論研究的基礎(chǔ)上,開展該車的高速穩(wěn)定性機(jī)電耦合控制研究。建立并驗(yàn)證包含所設(shè)計(jì)驅(qū)動(dòng)系統(tǒng)在內(nèi)的分布式
    發(fā)表于 06-18 16:37

    潤和軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴(yán)峻挑戰(zhàn)。應(yīng)對行業(yè)痛點(diǎn),江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的StackRUNS異構(gòu)
    的頭像 發(fā)表于 06-13 09:10 ?1458次閱讀
    潤和軟件<b class='flag-5'>發(fā)布</b>StackRUNS異構(gòu)<b class='flag-5'>分布式</b>推理框架

    華為分布式存儲(chǔ)榮膺2025年Gartner“客戶之選”

    近日,全球權(quán)威咨詢與分析機(jī)構(gòu)Gartner發(fā)布《2025年Gartner Peer Insights文件與對象存儲(chǔ)平臺(tái)“客戶之聲”》報(bào)告,華為OceanStor分布式存儲(chǔ)再次登頂,連續(xù)
    的頭像 發(fā)表于 06-07 09:13 ?1368次閱讀

    曙光存儲(chǔ)領(lǐng)跑中國分布式存儲(chǔ)市場

    近日,賽迪顧問發(fā)布《中國分布式存儲(chǔ)市場研究報(bào)告(2025)》,指出2024 年中國分布式存儲(chǔ)市場首次超過集中式
    的頭像 發(fā)表于 05-19 16:50 ?1248次閱讀

    多通道電源管理芯片在分布式能源系統(tǒng)中的優(yōu)化策略

    摘要: 隨著分布式能源系統(tǒng)的廣泛應(yīng)用,對電源管理芯片的性能要求日益提升。本文深入探討了多通道電源管理芯片在分布式能源系統(tǒng)中的優(yōu)化策略,以國科安芯的ASP4644芯片例,從電氣特性、工
    的頭像 發(fā)表于 05-16 15:22 ?894次閱讀

    兆芯+圖云創(chuàng)智—可信分布式存儲(chǔ)系統(tǒng)解決方案

    圖云創(chuàng)智分布式存儲(chǔ)系統(tǒng)采用分布式設(shè)計(jì)與先進(jìn)的存儲(chǔ)虛擬化技術(shù)相結(jié)合,由多個(gè)獨(dú)立的兆芯 x86 服務(wù)器作為
    的頭像 發(fā)表于 04-23 10:29 ?938次閱讀
    兆芯+圖云創(chuàng)智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存儲(chǔ)</b>系統(tǒng)解決方案

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)—虛擬機(jī)上hbase和hive數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 16臺(tái)某品牌R730xd服務(wù)器節(jié)點(diǎn),每臺(tái)服務(wù)器節(jié)點(diǎn)上有數(shù)臺(tái)虛擬機(jī)。 虛擬機(jī)上部署Hbase和Hive數(shù)據(jù)庫。 分布式存儲(chǔ)故障: 數(shù)據(jù)庫底層文件被誤
    的頭像 發(fā)表于 04-17 11:05 ?714次閱讀

    天瞳威視與浪潮信息達(dá)成戰(zhàn)略合作,推進(jìn)高階智駕車載計(jì)算系統(tǒng)創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達(dá)成戰(zhàn)略合作協(xié)議。此次合作依托浪潮信息提供的車載算力平臺(tái)硬件系統(tǒng)、底層軟件環(huán)境
    的頭像 發(fā)表于 03-27 16:55 ?636次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達(dá)成戰(zhàn)略合作,推進(jìn)高階智駕車載計(jì)算系統(tǒng)創(chuàng)新