91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA AI平臺在MLPerf基準(zhǔn)測試實現(xiàn)飛躍

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-01 10:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA AI 仍是唯一能夠運行 MLPerf 行業(yè)基準(zhǔn)測試中所有測試的平臺, A100 GPU 自發(fā)布以來連續(xù)兩年一直保持著獲勝次數(shù)最多的紀(jì)錄。

根據(jù)今天發(fā)布的 MLPerf 基準(zhǔn)測試結(jié)果, NVIDIA 及其合作伙伴占了所有參賽生態(tài)伙伴的 90%,并且繼續(xù)提供了最佳的整體 AI 訓(xùn)練性能和提交了最多的測試項。

NVIDIA AI 平臺覆蓋了 MLPerf 訓(xùn)練 2.0 版本中的所有八項基準(zhǔn)測試,突顯了其領(lǐng)先的通用性。

除 NVIDIA 之外,無其它加速器運行過所有基準(zhǔn)測試,這些基準(zhǔn)測試代表了流行的 AI 用例,包括語音識別、自然語言處理、推薦系統(tǒng)、目標(biāo)檢測、圖像分類等,而 NVIDIA 自 2018 年 12 月向作為行業(yè)標(biāo)準(zhǔn) AI 基準(zhǔn)測試的 MLPerf 提交首輪測試結(jié)果以來就一直如此。

領(lǐng)先的基準(zhǔn)測試結(jié)果與可用性

在連續(xù)第四次 MLPerf 訓(xùn)練提交結(jié)果中,基于 NVIDIA Ampere 架構(gòu)的 NVIDIA A100 Tensor Core GPU 依然表現(xiàn)出色。

各個提交者平臺在每個網(wǎng)絡(luò)的“最快訓(xùn)練時間”

Selene 是 NVIDIA 內(nèi)部的一臺 AI 超級計算機,它基于模塊化的 NVIDIA DGX SuperPOD,并由 NVIDIA A100 GPU、軟件堆棧和 NVIDIA InfiniBand 網(wǎng)絡(luò)驅(qū)動,在八項大規(guī)模工作負(fù)載測試的四項中獲得 “最快訓(xùn)練時間” 。

為了計算單芯片性能,該圖表將每份提交結(jié)果歸一化到每個提交者最常見的尺度,檢測分?jǐn)?shù)歸一化到速度最快的競爭者,最快競爭者顯示為 1 倍。

NVIDIA A100 還保持了單芯片性能上的領(lǐng)導(dǎo)地位,在八項測試中的六項測試中呈現(xiàn)了最快的速度。

共有 16 家合作伙伴使用 NVIDIA AI 平臺提交了本輪結(jié)果,包括華碩、百度、中國科學(xué)院自動化研究所、戴爾科技、富士通、技嘉、新華三、慧與、浪潮、聯(lián)想、寧暢和超微。

NVIDIA 的大多數(shù) OEM 合作伙伴提交了使用 NVIDIA 認(rèn)證系統(tǒng)得到的結(jié)果,這些服務(wù)器經(jīng)過 NVIDIA 驗證,能夠為企業(yè)部署提供出色的性能、可管理性、安全性和可擴展性。

多種模型驅(qū)動實際 AI 應(yīng)用

AI 應(yīng)用可能需要理解用戶說出的要求,對圖像進行分類、提出建議并以語音信息的形式作出回應(yīng)。

即使是上圖簡單的用例也需要將近 10個模型,這突出了運行每個基準(zhǔn)的重要性

這些任務(wù)需要多種類型的 AI 模型按順序工作,用戶需要能夠快速且靈活地設(shè)計、訓(xùn)練、部署和優(yōu)化這些模型。

這也是為什么通用性(能夠在 MLPerf 及其他版本中運行每個模型)以及領(lǐng)先的性能都是將現(xiàn)實世界的 AI 引入入生產(chǎn)的關(guān)鍵。

通過 AI 實現(xiàn)投資回報

對于客戶而言,數(shù)據(jù)科學(xué)和工程團隊是最寶貴的資源,他們的生產(chǎn)力決定了 AI 基礎(chǔ)設(shè)施的投資回報??蛻舯仨毧紤]昂貴的數(shù)據(jù)科學(xué)團隊的成本,這通常在部署 AI 的總成本中占比很重,而部署 AI 基礎(chǔ)設(shè)施本身的成本相對較少。

AI 研究人員的生產(chǎn)力取決于能否快速測試新的想法,這需要通用性來訓(xùn)練任何模型,以及大規(guī)模訓(xùn)練模型所能提供的速度。這就是為什么企業(yè)關(guān)注單位成本的整體生產(chǎn)力,以確定最佳的 AI 平臺——更全面的視角,更準(zhǔn)確地代表了部署 AI 的真實成本。

此外, AI 基礎(chǔ)設(shè)施的利用率取決于可替換性,或在單一平臺上加速從數(shù)據(jù)準(zhǔn)備到訓(xùn)練再到推理的整個 AI 工作流程的能力。

憑借 NVIDIA AI,客戶可以在整個 AI 流程中使用相同的基礎(chǔ)設(shè)施,重新利用它來適配數(shù)據(jù)準(zhǔn)備、訓(xùn)練和推理之間的不同需求,這極大地提高了利用率,實現(xiàn)了非常高的投資回報率。

隨著研究人員發(fā)現(xiàn)新的 AI 突破口,支持最新模型創(chuàng)新是最大程度地延長 AI 基礎(chǔ)設(shè)施使用壽命的關(guān)鍵。

NVIDIA AI 兼容并適用于每個模型、可以擴展到任何規(guī)模,并加速從數(shù)據(jù)準(zhǔn)備到訓(xùn)練再到推理的端到端 AI 流程,能夠?qū)崿F(xiàn)最高的單位成本生產(chǎn)力。

今天的結(jié)果再次證明了 NVIDIA 在迄今為止所有 MLPerf 訓(xùn)練、推理和 HPC 評測中所展示的豐富而深厚的 AI 專業(yè)性。

3 年半內(nèi)將性能提高 23 倍

自首次基于 A100 提交 MLPerf 基準(zhǔn)測試以來的兩年時間里,在 NVIDIA 軟件堆棧持續(xù)優(yōu)化的推動下, NVIDIA 平臺的性能已提高了 6 倍。

自 MLPerf 問世以來,歸功于跨 GPU、軟件和大規(guī)模改進的全棧式創(chuàng)新, NVIDIA AI 平臺在 3 年半時間里,在基準(zhǔn)測試中實現(xiàn)了 23 倍的性能提升。正是這種對創(chuàng)新的持續(xù)追求,讓客戶確信他們現(xiàn)今投資的 AI 平臺將持續(xù)服務(wù) 3 至 5 年,并將繼續(xù)推進以適配最先進的技術(shù)。

此外, NVIDIA 于 3 月發(fā)布的 NVIDIA Hopper架構(gòu)有望在未來的 MLPerf 基準(zhǔn)測評中實現(xiàn)性能的另一巨大飛躍。

NVIDIA 如何做到這一點

軟件創(chuàng)新持續(xù)釋放 NVIDIA Ampere架構(gòu)的更多性能。

例如,在提交結(jié)果中大量使用的 CUDA Graphs,該軟件可以最大限度地減少跨多個加速器上運行作業(yè)的啟動開銷。NVIDIA 不同庫的內(nèi)核優(yōu)化,如 cuDNN 和預(yù)處理庫 DALI,解鎖了額外的加速。NVIDIA 還實現(xiàn)了跨硬件、軟件和網(wǎng)絡(luò)的全棧改進,如 NVIDIA Magnum IO 和 SHARP,將部分 AI 功能卸載到網(wǎng)絡(luò)中,以獲得更好的性能,特別是在大規(guī)模的情況中。

NVIDIA 所使用的所有軟件均可從 MLPerf 資源庫中獲取,所有人都可以獲得 NVIDIA 的世界級領(lǐng)先成果。NVIDIA 不斷地將這些優(yōu)化集成到 NVIDIA 的 GPU 應(yīng)用軟件中心—— NGC 上提供的容器中,并通過 NVIDIA AI Enterprise 提供完全由 NVIDIA 支持,并經(jīng)過優(yōu)化的軟件。

從 A100 GPU 兩年前首次提交以來, NVIDIA AI 平臺繼續(xù)在 MLPerf 2.0 中提供最高的性能,仍是唯一能夠提交所有基準(zhǔn)測試的平臺。NVIDIA 的下一代 Hopper 架構(gòu)有望在未來的 MLPerf 評測中實現(xiàn)另一巨大飛躍。

NVIDIA 平臺適用于任何規(guī)模的模型和框架,并具有可替代性以處理 AI 工作負(fù)載的每個部分。它可以在所有云端和主要的服務(wù)器制造商上使用。

原文標(biāo)題:NVIDIA 與合作伙伴在 MLPerf 中展示領(lǐng)先的 AI 性能和通用性

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109705
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135414
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301314
  • 基準(zhǔn)測試
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    7801
  • MLPerf
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    970

原文標(biāo)題:NVIDIA 與合作伙伴在 MLPerf 中展示領(lǐng)先的 AI 性能和通用性

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何評估憶聯(lián)Gen5 eSSD UH812aAI場景中的性能表現(xiàn)

    隨著AI大模型進入萬億參數(shù)時代,傳統(tǒng)存儲性能測試已難以真實反映存儲系統(tǒng)實際訓(xùn)練場景中對成本與效率的核心影響。為此,全球權(quán)威AI基準(zhǔn)測評組織
    的頭像 發(fā)表于 02-05 09:56 ?971次閱讀
    如何評估憶聯(lián)Gen5 eSSD UH812a<b class='flag-5'>在</b><b class='flag-5'>AI</b>場景中的性能表現(xiàn)

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進行重大擴展, 將通過一個開放式開發(fā)平臺支持實現(xiàn)實驗室閉環(huán)(lab-in-the-loop)工作流,以推動
    的頭像 發(fā)表于 01-14 11:40 ?461次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平臺</b>加速 <b class='flag-5'>AI</b> 驅(qū)動的藥物研發(fā)

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRIVE Alpamayo-R1。此外,一項新的
    的頭像 發(fā)表于 12-13 09:50 ?1329次閱讀

    NVIDIA擴大與微軟合作推動AI超級工廠建設(shè)

    Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括NVIDIA Blackwell 平臺驅(qū)動的全新 M
    的頭像 發(fā)表于 12-01 09:52 ?789次閱讀

    NVIDIAISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網(wǎng)絡(luò)和量子技術(shù)實現(xiàn)飛躍。 SC25 上展示
    的頭像 發(fā)表于 11-25 10:59 ?894次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>在</b>ISC 2025分享最新超級計算進展

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測試平臺引入 NVIDIA DGX S
    的頭像 發(fā)表于 11-03 15:14 ?904次閱讀

    LambdaTest推出全球首個AI智能體測試平臺

    領(lǐng)先的AI原生測試平臺LambdaTest已推出其智能體對智能體測試(Agent-to-Agent Testing)平臺的封閉
    的頭像 發(fā)表于 08-26 17:37 ?939次閱讀

    登頂!華為OceanStor A系列存儲再登MLPerf全球性能之巔

    2025年8月5日,全球權(quán)威AI性能評測組織公布最新MLPerf? Storage v2.0基準(zhǔn)測試結(jié)果,華為OceanStor A系列存儲聯(lián)合濟南超級計算技術(shù)研究院(簡稱“JNIST
    的頭像 發(fā)表于 08-07 14:02 ?822次閱讀

    西部數(shù)據(jù)通過 MLPerfa Storage V2 測試結(jié)果,驗證其真實場景下的AI存儲性能

    。西部數(shù)據(jù)(NASDAQ: WDC)近日公布其 MLPerf? Storage V2?測試結(jié)果,驗證了旗下 OpenFlex? Data24 4000?系列?NVMe-oF??存儲平臺
    發(fā)表于 08-05 18:15 ?916次閱讀

    自動化測試平臺ATECLOUD推出AI算法功能

    作為納米軟件自主研發(fā)的自動化測試平臺,ATECLOUD 始終致力于為用戶提供高效優(yōu)質(zhì)的測試解決方案。面對5G、AI等前沿技術(shù)的迭代發(fā)展,平臺
    的頭像 發(fā)表于 07-22 16:10 ?804次閱讀
    自動化<b class='flag-5'>測試</b><b class='flag-5'>平臺</b>ATECLOUD推出<b class='flag-5'>AI</b>算法功能

    NVIDIA計劃打造全球首個工業(yè)AI平臺

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個工業(yè) AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過 NVIDIA DGX B200 系統(tǒng) 和
    的頭像 發(fā)表于 06-16 14:17 ?1423次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1278次閱讀

    1.9倍性能提升!英特爾至強6MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測試結(jié)果,其中,英特爾??至強??6性能核處理器
    的頭像 發(fā)表于 04-07 10:58 ?668次閱讀

    英偉達(dá)GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrastructure (OCI) 與 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1424次閱讀
    英偉達(dá)GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b>推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實現(xiàn)
    發(fā)表于 03-19 15:24 ?575次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> 推理