91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell平臺(tái)帶來(lái)性能躍升

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-19 14:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Blackwell 完成的每一項(xiàng)測(cè)試,都為各項(xiàng) AI 應(yīng)用樹(shù)立了訓(xùn)練性能新標(biāo)桿。

對(duì)于使用文本、計(jì)算機(jī)代碼、蛋白質(zhì)鏈、摘要、視頻甚至 3D 圖形的生成式 AI 應(yīng)用,它們需要數(shù)據(jù)中心規(guī)模的加速計(jì)算來(lái)高效地訓(xùn)練其背后的大語(yǔ)言模型(LLM)。

在 MLPerf Training 4.1 行業(yè)基準(zhǔn)測(cè)試中,NVIDIA Blackwell 平臺(tái)在所有參與測(cè)試的工作負(fù)載上都取得了令人贊嘆的測(cè)試結(jié)果。在 LLM 基準(zhǔn)測(cè)試中,每塊 GPU 的性能提高了 2.2 倍,其中包括 Llama 2 70B 微調(diào)和 GPT-3 175B 預(yù)訓(xùn)練。

此外,NVIDIA 提交的 NVIDIA Hopper 平臺(tái)測(cè)試結(jié)果繼續(xù)在所有基準(zhǔn)測(cè)試上保持了規(guī)模級(jí)的記錄,包括使用 11,616 塊 Hopper GPU 進(jìn)行的 GPT-3 175B 基準(zhǔn)測(cè)試。

Blackwell 帶來(lái)性能躍升

這是 NVIDIA 首次向 MLCommons 聯(lián)盟提交 Blackwell 的訓(xùn)練測(cè)試結(jié)果,其結(jié)果突顯了該架構(gòu)是如何提高生成式 AI 訓(xùn)練性能的。MLCommons 聯(lián)盟為業(yè)內(nèi)公司創(chuàng)建了標(biāo)準(zhǔn)化、公正且經(jīng)過(guò)嚴(yán)格的同行評(píng)審的測(cè)試。

例如,Blackwell 架構(gòu)包括新的核函數(shù),它們可以更高效地使用 Tensor Core。這些核函數(shù)執(zhí)行優(yōu)化的專用數(shù)學(xué)運(yùn)算,例如矩陣乘,是許多深度學(xué)習(xí)算法的主要計(jì)算。

Blackwell 擁有更高的每塊 GPU 計(jì)算吞吐量以及更大、更快的高帶寬內(nèi)存,使其能夠在更少的 GPU 上運(yùn)行 GPT-3 175B 基準(zhǔn)測(cè)試,同時(shí)實(shí)現(xiàn)出色的每塊 GPU 性能。

通過(guò)利用容量更大、帶寬更高的 HBM3e 內(nèi)存,僅僅 64 塊 Blackwell GPU 就能夠運(yùn)行 GPT-3 LLM 基準(zhǔn)測(cè)試,并且不損失每塊 GPU 性能。使用 Hopper 進(jìn)行相同的基準(zhǔn)測(cè)試時(shí)則需要 256 塊 GPU。

在提交 Blackwell 的訓(xùn)練測(cè)試結(jié)果之前,NVIDIA 還提交了 MLPerf Inference 4.1 推理測(cè)試結(jié)果。在該測(cè)試中,Blackwell 的 LLM 推理性能比 Hopper 高出 4 倍。測(cè)試結(jié)果顯示,通過(guò)利用 Blackwell 架構(gòu)的 FP4 精度以及 NVIDIA QUASAR 量化系統(tǒng),Blackwell 在滿足基準(zhǔn)測(cè)試的精度要求的同時(shí)展現(xiàn)出了強(qiáng)大的性能。

持續(xù)優(yōu)化

經(jīng)過(guò)持續(xù)的軟件開(kāi)發(fā),NVIDIA 平臺(tái)在各種框架、模型和應(yīng)用的訓(xùn)練和推理方面獲得了性能提升和功能改進(jìn)。

在本輪提交的 MLPerf 訓(xùn)練測(cè)試結(jié)果中,當(dāng)使用 GPT-3 175B 進(jìn)行訓(xùn)練時(shí),Hopper 的每塊 GPU 訓(xùn)練性能比上次提交該基準(zhǔn)測(cè)試時(shí)提高了 1.3 倍。

NVIDIA 還提交了 GPT-3 175B 基準(zhǔn)測(cè)試的大規(guī)模測(cè)試結(jié)果,該測(cè)試使用了 11,616 塊 Hopper GPU,這些 GPU 通過(guò) NVIDIA NVLink 和 NVSwitch 高帶寬 GPU 間通信以及 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)連接在一起。

自去年以來(lái),NVIDIA Hopper GPU 在 GPT-3 175B 基準(zhǔn)測(cè)試中的規(guī)模和性能提升了三倍多。此外,在 Llama 2 70B LoRA 微調(diào)基準(zhǔn)測(cè)試中,NVIDIA 在使用相同數(shù)量的 Hopper GPU 的情況下將性能提高了 26%,這體現(xiàn)了軟件方面的持續(xù)優(yōu)化。

NVIDIA 持續(xù)優(yōu)化加速計(jì)算平臺(tái)的努力,使其 MLPerf 測(cè)試結(jié)果得以不斷提升——提高了容器化軟件的性能,為使用現(xiàn)有平臺(tái)的合作伙伴和客戶帶來(lái)更強(qiáng)大的算力,并讓他們從平臺(tái)投資中獲得更高的回報(bào)。

攜手合作

NVIDIA 的合作伙伴——包括華碩、Azure、思科、戴爾、富士通、Giga Computing、Lambda Labs、聯(lián)想、Oracle Cloud、云達(dá)科技和超微等系統(tǒng)制造商和云服務(wù)提供商——也在最新一輪 MLPerf 測(cè)試中提交了令人印象深刻的測(cè)試結(jié)果。

作為 MLCommons 的創(chuàng)始成員,NVIDIA 認(rèn)為,行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測(cè)試和基準(zhǔn)測(cè)試最佳實(shí)踐對(duì)于 AI 計(jì)算而言至關(guān)重要。通過(guò)獲取經(jīng)過(guò)同行評(píng)審、精簡(jiǎn)的 AI 和 HPC 各個(gè)平臺(tái)的對(duì)比信息,企業(yè)可以跟上最新的 AI 計(jì)算創(chuàng)新步伐,并獲得有助于指導(dǎo)其重大平臺(tái)投資決策的關(guān)鍵數(shù)據(jù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109707
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135418
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7806

    瀏覽量

    93181
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    346

    瀏覽量

    1328

原文標(biāo)題:巔峰的訓(xùn)練性能:Blackwell 在 MLPerf 測(cè)試中將訓(xùn)練性能帶到新高度

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA DGX SuperPOD為Rubin平臺(tái)橫向擴(kuò)展提供藍(lán)圖

    NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計(jì)算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA Blackwell
    的頭像 發(fā)表于 01-14 09:14 ?597次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 BlackwellNVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2214次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 <b class='flag-5'>Blackwell</b> GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試

    作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中單槽性能的巔峰之作,NVIDIA RTX PRO 4000 Blackwell 在各項(xiàng)核心指標(biāo)上均實(shí)現(xiàn)對(duì)前代 N
    的頭像 發(fā)表于 12-29 15:30 ?1324次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 <b class='flag-5'>Blackwell</b> GPU<b class='flag-5'>性能</b>測(cè)試

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構(gòu)的強(qiáng)大代理式與生成式 AI 能力帶到更多桌面和
    的頭像 發(fā)表于 12-24 10:32 ?822次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB <b class='flag-5'>Blackwell</b> GPU現(xiàn)已全面上市

    NVIDIA擴(kuò)大與微軟合作推動(dòng)AI超級(jí)工廠建設(shè)

    在 Microsoft Ignite 大會(huì)上,NVIDIA 擴(kuò)大與微軟的合作,包括在由 NVIDIA Blackwell 平臺(tái)驅(qū)動(dòng)的全新 Microsoft Fairwater AI
    的頭像 發(fā)表于 12-01 09:52 ?789次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來(lái)越多的應(yīng)用正在使用 AI 加速,而無(wú)論工作站的大小或形態(tài)如何,都有越來(lái)越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6261次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 <b class='flag-5'>Blackwell</b> GPU<b class='flag-5'>性能</b>測(cè)試

    通過(guò)NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺(tái)還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進(jìn)一步優(yōu)化推理性能。該
    的頭像 發(fā)表于 10-29 16:53 ?1420次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來(lái)全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,
    的頭像 發(fā)表于 08-28 11:02 ?3981次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 <b class='flag-5'>Blackwell</b> GPU測(cè)試分析

    基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時(shí)代的到來(lái)

    醫(yī)療、萬(wàn)集科技、優(yōu)必選、銀河通用、宇樹(shù)科技、眾擎機(jī)器人和智元機(jī)器人等公司已經(jīng)率先使用 Jetson Thor。 ·基于 NVIDIA Blackwell 的 Jetson Thor,較上一代產(chǎn)品
    發(fā)表于 08-26 09:28 ?1299次閱讀
    基于 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b> 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時(shí)代的到來(lái)

    OpenAI與NVIDIA共同開(kāi)發(fā)全新開(kāi)放模型

    NVIDIA 為 gpt-oss-120b 帶來(lái)業(yè)界領(lǐng)先性能,在單個(gè) NVIDIA Blackwell 系統(tǒng)上實(shí)現(xiàn)每秒 150 萬(wàn)個(gè) Tok
    的頭像 發(fā)表于 08-12 15:11 ?1553次閱讀

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3290次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b> GPU優(yōu)化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小延遲場(chǎng)景中的<b class='flag-5'>性能</b>紀(jì)錄

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA Blackwell加速計(jì)算機(jī)輔助工程軟件,實(shí)現(xiàn)實(shí)時(shí)數(shù)字孿生性能數(shù)量級(jí)提升

    、Altair、Cadence、Siemens 和 Synopsys 等在內(nèi)的領(lǐng)先計(jì)算機(jī)輔助工程(CAE)軟件供應(yīng)商正在使用 NVIDIA Blackwell 平臺(tái)加速其仿真工具,速度提升高達(dá) 50 倍
    的頭像 發(fā)表于 03-21 15:12 ?1486次閱讀

    NVIDIA Blackwell白皮書(shū):NVIDIA Blackwell Architecture Technical Brief

    NVIDIA Blackwell白皮書(shū):NVIDIA Blackwell Architecture Technical Brief
    的頭像 發(fā)表于 03-20 18:35 ?3032次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?2446次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?1545次閱讀