91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力百度智能云落地新一代高性能AI計算集群

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-05-20 15:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

百度智能云是中國 AI 公有云服務市場的領先企業(yè)。近日,百度智能云落地新一代高性能AI計算集群,提供EFLOPS級算力支持,并發(fā)布了新一代GPU服務器實例GPU-H5-8NA100-IB01。該集群基于NVIDIA A100-80GB GPU和NVIDIA InfiniBand網(wǎng)絡構(gòu)建,成為領先的AI原生云算力底座。研究人員可基于全新發(fā)布的實例組建上千節(jié)點規(guī)模的超高性能計算集群,成倍縮短超大AI模型的訓練時間,激發(fā)AI業(yè)務創(chuàng)新想象力。

客戶挑戰(zhàn)

隨著 AI 的發(fā)展,創(chuàng)新業(yè)務層出不窮,業(yè)務復雜性不斷提升,大模型、超大模型成為必然趨勢,對于快速訓練與部署應用提出了前所未有的緊迫要求。百度智能云早在 2020 年就預見到這一發(fā)展態(tài)勢,啟動規(guī)劃與方案設計,并參考 NVIDIA 高性能分布式集群參考架構(gòu),設計落地新一代高性能 AI 集群,通過基礎架構(gòu)的升級,釋放技術使能想象力,幫助百度以及客戶的業(yè)務創(chuàng)新更上一層樓。

應用方案

NVIDIA 提出的高性能分布式集群參考架構(gòu)基于 NVIDIA A100 GPU 和 NVIDIA HDR 200Gb/s ConnectX-6 網(wǎng)卡組建,采用模塊化設計,能支持不同規(guī)模大小的設計,以 20 臺為一個可擴展單元(Scalable Unit), 可以任意擴展到 100 臺、 200 臺、400 臺或更大的規(guī)模,通過 InfiniBand 交換機采用胖樹結(jié)構(gòu)全互聯(lián)起來。此集群架構(gòu)旨在幫助 AI 研究人員快速搭建強大、靈活、高效的系統(tǒng),以滿足工業(yè)界日益復雜、多變的模型對計算資源不同程度的需求。尤其對于超大語言模型預訓練而言,此架構(gòu)尤為重要。

基于同樣的設計思路,百度智能云的新一代高性能 AI 集群采用百度自研的 X-MAN 架構(gòu)超級 AI 計算機為硬件平臺。

X-MAN 自 2016 年推出以來,已在鳳巢、自動駕駛、自然語言處理等百度內(nèi)部業(yè)務進行大規(guī)模應用多年,申請六項專利,包括 PCIe Fabric 架構(gòu)、液冷技術、最大支持 64 GPU 卡擴展等,是百度 AI 業(yè)務快速落地的重要基礎設施。

目前, X-MAN 已經(jīng)全面升級到第四代 X-MAN 4.0 ,為 AI 和 HPC 等計算場景進行了新的優(yōu)化設計。配置方面,每臺 X-MAN 4.0 包含8張搭載 NVLink 互聯(lián)技術的 NVIDIA A100-80GB GPU , 并可支持 8 張 200Gb/s 的 InfiniBand 網(wǎng)卡,實現(xiàn)了高速存儲、高速無阻網(wǎng)絡、高性能計算于一體的超級 AI 計算機。架構(gòu)方面, X-MAN 4.0 全新設計的架構(gòu)縮短了數(shù)據(jù)傳輸延遲,提高了數(shù)據(jù)傳輸帶寬,有效解決本地數(shù)據(jù)傳輸?shù)?a target="_blank">通信瓶頸,降低 AI 作業(yè)中 GPU 的閑置時間。在 MLCommons 1.1 榜單中, X-MAN 4.0 在同配置單機硬件性能名列 TOP2 。

為了實現(xiàn)更高的集群運行性能,百度智能云專門設計了適用于超大規(guī)模集群的 InfiniBand 網(wǎng)絡架構(gòu)。這個架構(gòu)優(yōu)化了網(wǎng)絡收斂比,提升了網(wǎng)絡吞吐能力。并結(jié)合容錯、交換機親和,拓撲映射等手段,得以將 EFLOPS 級算力的計算集群性能發(fā)揮到極致。

應用效果

經(jīng)過百度內(nèi)部 NLP 研究團隊的驗證,在這個網(wǎng)絡環(huán)境下的超大規(guī)模集群上提交千億模型訓練作業(yè)時,同等機器規(guī)模下整體訓練效率是普通 GPU 集群的 3.87 倍。

2022 年 3 月 1 日百度發(fā)布的 Q4 及 2021 全年財報顯示,百度智能云2021年實現(xiàn)全年總營收 151 億元,同比增長 64% 。高速增長的背后,是百度智能云在研發(fā)能力上的持續(xù)投入,以保持云智一體的技術引領,為客戶提供堅實的基礎架構(gòu)與服務平臺。

百度副總裁謝廣軍先生表示:“AI原生云是推動企業(yè)智能化升級的核心驅(qū)動力。作為中國AI公有云服務市場領跑企業(yè),百度智能云一直在優(yōu)化提升智能計算的核心能力。X-MAN 4.0助力百度內(nèi)部業(yè)務發(fā)展的同時,我們也愿意將這一領先的架構(gòu)開放給百度智能云的眾多客戶,幫助大家一起更高效地進行AI研發(fā)與探索,驅(qū)動業(yè)務創(chuàng)新,邁向AI原生?!?/p>

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5198

    瀏覽量

    135521
  • 計算機
    +關注

    關注

    19

    文章

    7809

    瀏覽量

    93234
  • AI
    AI
    +關注

    關注

    91

    文章

    39874

    瀏覽量

    301529
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文檔解析評測榜單 OmniDocBench V1.5 中取得
    的頭像 發(fā)表于 01-30 10:03 ?626次閱讀
    <b class='flag-5'>百度</b>正式發(fā)布并開源<b class='flag-5'>新一代</b>文檔解析模型PaddleOCR-VL-1.5

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI

    年,持續(xù)為行業(yè)搭建起交流前沿技術、碰撞創(chuàng)新思維、洞察未來趨勢的重要平臺。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗AI應用的價值涌現(xiàn),見證AI能力的創(chuàng)新爆發(fā)。 今年的百度世界2025以“效
    的頭像 發(fā)表于 11-13 15:47 ?1641次閱讀

    昆侖芯科技亮相2025百度智大會

    近日,2025百度智大會在北京國家會議中心二期隆重啟幕。本屆大會以“智能,生成無限可能”為主題,聚焦人工智能從技術到產(chǎn)業(yè)的全鏈條落地,深入
    的頭像 發(fā)表于 09-01 11:00 ?1304次閱讀

    百度智能全面升級舸5.0和千帆4.0

    大會上,百度智能全面升級AI計算平臺5.0、千帆企業(yè)級
    的頭像 發(fā)表于 08-30 09:18 ?1797次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    核心網(wǎng)絡支撐。未來,隨著1.6T光模塊的落地,睿海光電將進步推動數(shù)據(jù)中心向更高性能、更智能化演進,攜手全球伙伴開啟AI新時代。 睿海光電—
    發(fā)表于 08-13 19:01

    百度智能發(fā)布全球首批AI數(shù)字員工

    沒錯,在今天的百度AI Day開放日現(xiàn)場,這么溜的同事們正式上崗!
    的頭像 發(fā)表于 08-12 09:47 ?1727次閱讀

    百度智能亮相第二十二屆ChinaJoy

    百度智能亮相第二十二屆ChinaJoy 8月1日,第二十二屆中國國際數(shù)碼互動娛樂展覽會(ChinaJoy)在上海開幕。大會期間,百度全景展示了百度
    的頭像 發(fā)表于 08-05 09:47 ?815次閱讀

    高性能計算集群AI領域的應用前景

    隨著人工智能技術的飛速發(fā)展,高性能計算集群(HPC)在AI領域的應用前景日益受到關注。HPC提供的計算
    的頭像 發(fā)表于 06-23 13:07 ?1314次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b><b class='flag-5'>集群</b>在<b class='flag-5'>AI</b>領域的應用前景

    使用樹莓派構(gòu)建 Slurm 高性能計算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹莓派構(gòu)建Slurm高性能計算集群的經(jīng)歷。段時間前,我開始使用這個集群作為測試平臺,來創(chuàng)建
    的頭像 發(fā)表于 06-17 16:27 ?1755次閱讀
    使用樹莓派構(gòu)建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計算</b><b class='flag-5'>集群</b>:分步指南!

    65%央企大模型落地首選百度智能

    今天,很榮幸地分享個好消息,百度智能已牽手65%的央企,共同推進大模型產(chǎn)業(yè)落地。得益于全棧的AI
    的頭像 發(fā)表于 06-11 15:44 ?909次閱讀

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術全面開放,向開發(fā)者
    的頭像 發(fā)表于 05-26 11:26 ?1776次閱讀

    百度智能兩大基礎設施再升級

    近日,在Create2025百度AI開發(fā)者大會上,沈抖分享了百度智能智能基礎設施建設方面的最
    的頭像 發(fā)表于 04-30 10:20 ?1092次閱讀

    百度AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度AI領域的新進展。
    的頭像 發(fā)表于 04-30 10:14 ?1347次閱讀

    格靈深瞳與百度智能達成戰(zhàn)略合作,共筑AI算力新基建

    力底座,推動政務、金融、公共安全等領域的智能化升級。 百度智能泛科技業(yè)務部總經(jīng)理張瑋,格靈深瞳銷售副總裁蘆斌代表雙方簽約,百度集團執(zhí)行副總
    的頭像 發(fā)表于 04-27 10:20 ?1372次閱讀

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得銀兩項大獎。
    的頭像 發(fā)表于 04-08 15:43 ?990次閱讀