91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AIStaiton,有效提升大模型算力平臺效率

浪潮AIHPC ? 來源:浪潮AIHP ? 2023-06-30 15:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

日前,2023全球人工智能產(chǎn)品應(yīng)用博覽會在蘇州開幕。浪潮信息智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺AIStation憑借領(lǐng)先的資源調(diào)度與平臺管理能力,有效提升大模型算力平臺使用效率,榮獲智博會核心獎項“產(chǎn)品金獎”。此次獲獎,不僅體現(xiàn)了AIStation在大模型算力與業(yè)務(wù)支撐方面的領(lǐng)先性,也體現(xiàn)了產(chǎn)業(yè)對大模型算力平臺效率的高度關(guān)注。

當(dāng)前,以大模型為代表的生成式AI技術(shù)正在加速發(fā)展并革新各行業(yè)智能轉(zhuǎn)型路徑。生成式AI創(chuàng)新需要基于海量數(shù)據(jù)集,在擁有成百上千加速卡的AI服務(wù)器集群上對千億級參數(shù)的AI大模型進行分布式訓(xùn)練。如何發(fā)揮大模型算力平臺效能、抑制性能損耗,以高效完成AI大模型的訓(xùn)練部署,已成為AIGC時代的新挑戰(zhàn)。

作為專為人工智能開發(fā)和部署提供全流程支持的端到端平臺,AIStation能夠以強大的資源調(diào)度和管理能力助力客戶加速AI大模型開發(fā)與部署,通過對計算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源進行統(tǒng)一管理,有效提升大模型AI算力集群的使用效率。

一站式管理、毫秒級調(diào)度,集群利用率達(dá)70%

大模型訓(xùn)練需要構(gòu)建包含計算、網(wǎng)絡(luò)、存儲、框架等在內(nèi)的系統(tǒng)性分布式訓(xùn)練環(huán)境,傳統(tǒng)的分散化管理不僅門檻高、效率低,且缺少針對性優(yōu)化的整體調(diào)度系統(tǒng),導(dǎo)致大模型計算平臺的整體協(xié)同性較差,訓(xùn)練算力效率低。

針對分布式訓(xùn)練計算規(guī)模大、系統(tǒng)性強的特點,AIStation實現(xiàn)了異構(gòu)算力集群的統(tǒng)一池化管理,通過自研分布式任務(wù)自適應(yīng)系統(tǒng)將訓(xùn)練底層的計算、存儲、網(wǎng)絡(luò)環(huán)境自動化配置,并提供自定義修改基本超參數(shù)功能。通過多種資源高效管理和調(diào)度策略,AIStation能實現(xiàn)萬卡集群的毫秒級調(diào)度,提升整體資源利用率到70%以上。

同時,AIStation集成主流的大模型訓(xùn)練框架,依托容器化技術(shù),能夠?qū)⑦\行環(huán)境、框架適配過程標(biāo)準(zhǔn)化、模塊化,支持秒級構(gòu)建運行環(huán)境,保障AI開發(fā)和AI業(yè)務(wù)的高效運行。

瓶頸優(yōu)化、穩(wěn)健容錯,全流程加速大模型訓(xùn)練

針對大規(guī)模分布式訓(xùn)練過程中遇到的算力網(wǎng)絡(luò)搭建、數(shù)據(jù)加速、網(wǎng)絡(luò)通信優(yōu)化等瓶頸,AIStation通過鏡像分發(fā)加速、數(shù)據(jù)緩存加速、網(wǎng)絡(luò)拓?fù)湔{(diào)度、資源動態(tài)彈性伸縮等特性,在提高計算資源利用率的同時加速整個訓(xùn)練過程。其中,AIStation通過數(shù)據(jù)緩存機制可讓模型訓(xùn)練效率獲得200%-300%的提升,并能夠根據(jù)節(jié)點的數(shù)據(jù)緩存情況自動調(diào)度訓(xùn)練任務(wù),避免訓(xùn)練數(shù)據(jù)重復(fù)下載,節(jié)省數(shù)據(jù)加載時間,與自研調(diào)度系統(tǒng)配合后,分布式訓(xùn)練線性加速比能夠高達(dá)0.9,有效抑制多節(jié)點協(xié)同的性能損耗。

健壯性與穩(wěn)定性是目前高效完成大模型訓(xùn)練的強要求。對此,AIStation通過提供全生命周期管理、故障容錯、集群監(jiān)控運維等一體化能力,能夠?qū)崿F(xiàn)訓(xùn)練異常和故障的全面檢測和自動處理,有效縮短斷點續(xù)訓(xùn)時間,降低復(fù)雜度,以持續(xù)穩(wěn)定的訓(xùn)練降低大模型訓(xùn)練成本和周期。

高效調(diào)用,釋放大模型應(yīng)用價值

針對大模型訓(xùn)練完成后的應(yīng)用部署,AIStation實現(xiàn)訓(xùn)練和推理的全打通,加快模型應(yīng)用落地。針對大模型實際應(yīng)用中的調(diào)用突發(fā)性,AIStation可根據(jù)推理服務(wù)資源需求的變化及時調(diào)整資源配給,根據(jù)實時業(yè)務(wù)的請求量實現(xiàn)秒級服務(wù)擴縮容,可支持百萬級高并發(fā)的大模型AI推理服務(wù)場景,服務(wù)響應(yīng)平均延遲低于1ms,突發(fā)的訪問高峰的響應(yīng)效率提升50%。

目前,AIStation已經(jīng)在2457億參數(shù)的“源”大模型訓(xùn)練實踐中得到有效驗證,支撐 “源”大模型的訓(xùn)練算力效率達(dá)44.8%,高于GPT-3的21.3%。同時,某大型商業(yè)銀行基于AIStation打造的并行運算集群,憑借領(lǐng)先的大規(guī)模分布式訓(xùn)練支撐能力,榮獲2022IDC“未來數(shù)字基礎(chǔ)架構(gòu)領(lǐng)軍者”獎項。未來, AIStation平臺將持續(xù)為各行業(yè)的大模型開發(fā)與部署提供高效的算力平臺管理能力,加速AIGC技術(shù)迭代革新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265423
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1532

    瀏覽量

    16744
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5188

原文標(biāo)題:【開放試用】AIStaiton,有效提升大模型算力平臺效率

文章出處:【微信號:浪潮AIHPC,微信公眾號:浪潮AIHPC】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    “四合一”平臺,芯片國產(chǎn)化率超九成,兼容8種國產(chǎn)AI芯片

    調(diào)度平臺可支持每天上億次的調(diào)用,能調(diào)度全國1/6的規(guī)模,網(wǎng)一體化
    的頭像 發(fā)表于 04-13 00:03 ?4016次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    MWC Doha 2025|美格智能全新發(fā)布60 Tops AI、支持Linux系統(tǒng)的SNM982高AI模組

    QCS8550平臺提升25%以上,在模組性能與開放性方面同步提升,現(xiàn)已進入全面量產(chǎn)階段。全面提升:60Tops
    的頭像 發(fā)表于 11-25 16:34 ?1792次閱讀
    MWC Doha 2025|美格智能全新發(fā)布60 Tops AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系統(tǒng)的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b>AI模組

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“是AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預(yù)期——7nm工藝下直接拉到256 TFLOPS,比上一代
    發(fā)表于 10-27 13:12

    中國智能規(guī)模增長將超40%

    表示預(yù)計在2025年,中國智能規(guī)模增長將超過40%。 據(jù)中國信息通信研究院副院長 魏亮表示:目前,中國平臺實現(xiàn)了100多個
    的頭像 發(fā)表于 08-25 19:28 ?933次閱讀

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠(yuǎn)程平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU
    的頭像 發(fā)表于 07-30 21:44 ?913次閱讀

    揭秘瑞芯微協(xié)處理器,RK3576/RK3588強大搭檔

    瑞芯微協(xié)處理器-Gongga1(簡稱“貢嘎”),是瑞芯微針對旗艦芯片平臺RK3576/RK3588等SoC平臺配套的
    的頭像 發(fā)表于 07-17 10:00 ?1298次閱讀
    揭秘瑞芯微<b class='flag-5'>算</b><b class='flag-5'>力</b>協(xié)處理器,RK3576/RK3588強大<b class='flag-5'>算</b><b class='flag-5'>力</b>搭檔

    性能飛躍 慧視8核+32T平臺讓目標(biāo)檢測幀率提升20倍

    RK3588平臺6.0TOPS的在檢測識別領(lǐng)域已經(jīng)能滿足絕大多數(shù)場景的要求,但在少數(shù)應(yīng)用場景中,需要更高,以實現(xiàn)更快、更穩(wěn)定、更精準(zhǔn)
    的頭像 發(fā)表于 06-10 17:55 ?1445次閱讀
    性能飛躍 慧視8核+32T<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>平臺</b>讓目標(biāo)檢測幀率<b class='flag-5'>提升</b>20倍

    軟通智中標(biāo)韶關(guān)公共服務(wù)平臺項目

    日前,軟通動力旗下軟通智中標(biāo)《韶關(guān)公共服務(wù)平臺(一體化網(wǎng)
    的頭像 發(fā)表于 05-22 16:19 ?986次閱讀

    梯度科技助力客戶破解調(diào)度難題

    在數(shù)字經(jīng)濟與人工智能深度融合的新階段,已成為支撐人工智能發(fā)展的核心生產(chǎn)。梯度科技基于云原生技術(shù)架構(gòu)研發(fā)的調(diào)度
    的頭像 發(fā)表于 04-27 16:32 ?1320次閱讀

    智能服務(wù)器應(yīng)用領(lǐng)域

    加速金融模型訓(xùn)練與實時交易決策,頭部機構(gòu)云平臺規(guī)模超3.8萬臺服務(wù)器?。 二、?醫(yī)療健康? 藥物研發(fā)與基因測序?:AI
    的頭像 發(fā)表于 04-21 09:09 ?1576次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)器應(yīng)用領(lǐng)域

    智能最具潛力的行業(yè)領(lǐng)域

    ?; 數(shù)據(jù)治理與聯(lián)合創(chuàng)新?:民生銀行與華為、阿里云等共建AI實驗室,通過“數(shù)據(jù)湖+模型體系”提升服務(wù)精準(zhǔn)度?; 需求驅(qū)動?:金融大模型
    的頭像 發(fā)表于 04-11 08:20 ?1402次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    限制提升的瓶頸。800G光模塊通過更高的傳輸速率,能夠支持大規(guī)模GPU集群間的數(shù)據(jù)傳輸,保證各節(jié)點之間的快速互聯(lián)和低延遲通信,從而提升整個系統(tǒng)的計算
    發(fā)表于 03-25 12:00

    承載百芯,低功耗解鎖高性能——云端效率觸手可及

    云端效率未來發(fā)展趨勢預(yù)測 一、?AI與云計算深度融合驅(qū)動效率質(zhì)變? 1? 生成式AI重構(gòu)云端服務(wù)生態(tài) ? 生成式AI與大模型技術(shù)將深度融入云端平臺,推動云服務(wù)商向“智
    的頭像 發(fā)表于 03-24 08:35 ?644次閱讀

    阿里最新消息:國家超互聯(lián)網(wǎng)平臺、廣州中心、多所高校接入通義千問大模型

    ? 國家超互聯(lián)網(wǎng)平臺 接入阿里通義千問大模型 ? 3月10日,國家超互聯(lián)網(wǎng)平臺接入阿里巴巴通義千問大
    的頭像 發(fā)表于 03-14 11:54 ?1460次閱讀