91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超級芯片GH200發(fā)布,AI算力是H100的兩倍

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-08-10 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達在計算機圖形學(xué)頂會 SIGGRAPH 2023 上發(fā)布了專為生成式 AI 打造的下一代 GH200 Grace Hopper 平臺,并推出了 OVX 服務(wù)器、AI Workbench 等一系列重磅更新。

五年前,也是在 SIGGRAPH 大會的演講中,英偉達宣布將 AI 和實時光線追蹤引入 GPU ,可以說,當(dāng)時的這個決定重塑了計算圖形學(xué)。

「我們意識到光柵化已經(jīng)達到了極限,」黃仁勛表示:「這要求我們重塑硬件、軟件和算法。在我們用 AI 重塑 CG 的同時,也在為 AI 重塑 GPU?!?/p>

預(yù)言應(yīng)驗了:幾年來,計算系統(tǒng)變得越來越強大,例如 NVIDIA HGX H100,它利用 8 個 GPU 和總共 1 萬億個晶體管,與基于 CPU 的系統(tǒng)相比,提供了顯著的加速。

「這就是世界數(shù)據(jù)中心迅速轉(zhuǎn)向加速計算的原因,」在今年的 SIGGRAPH 大會,黃仁勛重申:「The more you buy, the more you save.」

如今,訓(xùn)練越來越大的生成式 AI 模型所需的計算未必由具有一定 GPU 能力的傳統(tǒng)數(shù)據(jù)中心來完成,而是要依靠像 H100 這樣從一開始就為大規(guī)模運算而設(shè)計的系統(tǒng)??梢哉f,AI 的發(fā)展在某種程度上只受限于這些計算資源的可用性。

但黃仁勛斷言,這僅僅是個開始。新模型不僅需要訓(xùn)練時的計算能力,還需要實現(xiàn)由數(shù)百萬甚至數(shù)十億用戶實時運行的計算能力。

「未來,LLM 將出現(xiàn)在幾乎所有事物的前端:人類就是新的編程語言。從視覺效果到快速數(shù)字化的制造市場、工廠設(shè)計和重工業(yè),一切都將采用自然語言界面。」黃仁勛表示。

在這場一個多小時的演講中,黃仁勛帶來了一系列新發(fā)布,全部面向「生成式 AI」。

更強的 GH200 Grace Hopper 超級芯片平臺

英偉達的 Grace Hopper 超級芯片 NVIDIA GH200 結(jié)合了 72 核 Grace CPU 和 Hopper GPU,并已在 5 月全面投入生產(chǎn)。

現(xiàn)在,黃任勛又宣布 Grace Hopper 超級芯片將配備 HBM3e 高帶寬內(nèi)存(HBM3e 比當(dāng)前的 HBM3 快 50%),下一代 GH200 Grace Hopper 平臺將大幅提升生成式 AI 的計算速度。

全新的 GH200 內(nèi)存容量將增加至原有的 3.5 倍,帶寬增加至 3 倍,包含一臺具有 144 個 Arm Neoverse 核心、282GB HBM3e 內(nèi)存的服務(wù)器,提供 8 petaflops 的 AI 算力。

為了提升大模型的實際應(yīng)用效率,生成式 AI 模型的工作負(fù)載通常涵蓋大型語言模型、推薦系統(tǒng)和向量數(shù)據(jù)庫。GH200 平臺旨在全面處理這些工作負(fù)載,并提供多種配置。

英偉達表示,這款名為 GH200 的超級芯片將于 2024 年第二季度投產(chǎn)。

Nvidia AI Workbench,模型即服務(wù)

此外,為了加快全球企業(yè)定制化采用生成式 AI,老黃宣布英偉達即將推出 Nvidia AI Workbench。

盡管很多預(yù)訓(xùn)練模型都是開源的,但使其定制化服務(wù)自身業(yè)務(wù)仍然具有挑戰(zhàn)性。AI Workbench 減輕了企業(yè) AI 項目入門的復(fù)雜程度,將所有必要的企業(yè)級模型、框架、軟件開發(fā)套件和庫整合到統(tǒng)一的 workspace 之中。

只需要在本地系統(tǒng)上運行的簡化界面進行點擊,AI Workbench 就能讓開發(fā)者使用自定義數(shù)據(jù)微調(diào) Hugging Face、GitHub 和 NGC 等流行存儲庫中的模型,然后將其擴展到數(shù)據(jù)中心、公有云或 Nvidia DGX 云。

黃仁勛還宣布英偉達將與 Hugging Face 合作,開發(fā)人員將能夠訪問 Hugging Face 平臺中的 NVIDIA DGX Cloud AI 超級計算來訓(xùn)練和調(diào)整 AI 模型。這將使數(shù)百萬構(gòu)建大型語言模型和其他高級 AI 應(yīng)用程序的開發(fā)人員能夠輕松實現(xiàn)生成式 AI 超級計算。

「這將是一項全新的服務(wù),將世界上最大的人工智能社區(qū)與世界上最好的訓(xùn)練和基礎(chǔ)設(shè)施連接起來,」黃仁勛表示。

全新的 RTX 工作站和 Omniverse

老黃還宣布,英偉達與 BOXX、戴爾科技、惠普和聯(lián)想等工作站制造商合作,打造了一系列全新的高性能 RTX 工作站。

最新發(fā)布的 RTX 工作站提供多達四個英偉達 RTX 6000 Ada GPU,每個 GPU 配備 48GB 內(nèi)存。單個桌面工作站可提供高達 5828 TFLOPS 的性能和 192GB 的 GPU 內(nèi)存。

根據(jù)用戶需求,這些系統(tǒng)可配置 Nvidia AI Enterprise 或 Omniverse Enterprise 軟件,為各種要求苛刻的生成式 AI 和圖形密集型工作負(fù)載提供必要的動力。這些新發(fā)布預(yù)計將于秋季推出。

新發(fā)布的 Nvidia AI Enterprise 4.0 引入了 Nvidia NeMo,這是一個用于構(gòu)建和定制生成式 AI 基礎(chǔ)模型的端到端框架。它還包括用于數(shù)據(jù)科學(xué)的 Nvidia Rapids 庫,并為常見企業(yè) AI 用例(例如推薦器、虛擬助理和網(wǎng)絡(luò)安全解決方案)提供框架、預(yù)訓(xùn)練模型和工具。

工業(yè)數(shù)字化平臺 Omniverse Enterprise 是 Nvidia 生態(tài)系統(tǒng)的另一個組成部分,讓團隊能夠開發(fā)可互操作的 3D 工作流程和 OpenUSD 應(yīng)用程序。Omniverse 利用其 OpenUSD 原生平臺,使全球分布的團隊能夠協(xié)作處理來自數(shù)百個 3D 應(yīng)用程序的完整設(shè)計保真度數(shù)據(jù)集。

此次英偉達主要升級了 Omniverse Kit(用于開發(fā)原生 OpenUSD 應(yīng)用和擴展程序的引擎),以及 NVIDIA Omniverse Audio2Face 基礎(chǔ)應(yīng)用和空間計算功能。開發(fā)者可以輕松地利用英偉達提供的 600 多個核心 Omniverse 擴展程序來構(gòu)建自定義應(yīng)用。

作為發(fā)布的一部分,英偉達還推出了三款全新的桌面工作站 Ada Generation GPU:Nvidia RTX 5000、RTX 4500 和 RTX 4000。

全新 NVIDIA RTX 5000、RTX 4500 和 RTX 4000 桌面 GPU 采用最新的 NVIDIA Ada Lovelace 架構(gòu)技術(shù)。其中包括增強的 NVIDIA CUDA 核心(用于增強單精度浮點吞吐量)、第三代 RT 核心(用于改進光線追蹤功能)以及第四代 Tensor 核心(用于更快的 AI 訓(xùn)練性能)。

Nvidia RTX 5000 Ada 一代 GPU。

這幾款 GPU 還支持 DLSS 3,為實時圖形提供更高水平的真實感和交互性,以及更大的 GPU 內(nèi)存選項,用于大型 3D 模型、渲染圖像、模擬和 AI 數(shù)據(jù)集的無差錯計算。此外,它們還提供擴展現(xiàn)實功能,以滿足創(chuàng)建高性能 AR、VR 和混合現(xiàn)實內(nèi)容的需求。

因為配備了第三代 RT Core,這幾款 GPU 的吞吐量高達上一代的 2 倍,使用戶能夠?qū)崟r處理更大、保真度更高的圖像,將應(yīng)用于藝術(shù)創(chuàng)作和設(shè)計生產(chǎn)。

RTX 5000 GPU 已經(jīng)上市,并由 HP 和分銷合作伙伴發(fā)貨,而 RTX 4500 和 RTX 4000 GPU 將于秋季從 BOXX、Dell Technologies、HP、Lenovo 及其各自的分銷合作伙伴上市。

Nvidia OVX 服務(wù)器

英偉達還推出了配備 Nvidia L40S GPU 的 Nvidia OVX 服務(wù)器,用于生成式 AI 和數(shù)字化時代的開發(fā)和內(nèi)容創(chuàng)作。

每臺 Nvidia OVX 服務(wù)器將支持多達 8 個 Nvidia L40S GPU,每個 GPU 配備 48GB 內(nèi)存。L40S GPU 由 Nvidia Ada Lovelace GPU 架構(gòu)提供支持,擁有第四代張量核心和 FP8 Transformer 引擎,可實現(xiàn)超過 1.45 petaflops 的張量處理能力。

Nvidia L40S GPU。

在具有數(shù)十億參數(shù)和多種數(shù)據(jù)模式的生成式 AI 工作負(fù)載領(lǐng)域,與 Nvidia A100 Tensor Core GPU 相比,L40S GPU 的生成式 AI 推理性能提高了 1.2 倍,訓(xùn)練性能提高了 1.7 倍。這將更好地滿足 AI 訓(xùn)練和推理、3D 設(shè)計和可視化、視頻處理和工業(yè)數(shù)字化等計算密集型應(yīng)用的需求,加速多個行業(yè)的工作流程和服務(wù)。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    6569
  • 晶體管
    +關(guān)注

    關(guān)注

    78

    文章

    10395

    瀏覽量

    147730
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4086

    瀏覽量

    99173
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6516
  • NGC
    NGC
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    4067

原文標(biāo)題:超級芯片GH200發(fā)布,AI算力是H100兩倍

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    力爭百萬 Tokens 推理成本降低百:云天勵飛發(fā)布未來三年大芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構(gòu)創(chuàng)新,力爭實現(xiàn)百萬 Tokens 推理成本降低 100 以上的目標(biāo),推動 AI 從技術(shù)嘗鮮走向普惠生產(chǎn)。產(chǎn)業(yè)變局:推理競速,從
    的頭像 發(fā)表于 02-03 20:25 ?1944次閱讀
    力爭百萬 Tokens 推理成本降低百<b class='flag-5'>倍</b>:云天勵飛<b class='flag-5'>發(fā)布</b>未來三年大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>戰(zhàn)略,首曝 DeepVerse 路線圖

    中國芯片的拐點時刻

    作者|Taylor出品|芯片技術(shù)與工藝當(dāng)OpenAI的GPT-5在得克薩斯州的機房中晝夜轟鳴,當(dāng)Nvdia的H200芯片被炒至數(shù)十萬美元仍一卡難求,中國的
    的頭像 發(fā)表于 01-31 07:00 ?1666次閱讀
    中國<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>的拐點時刻

    即電力:當(dāng)單機柜功率突破100kW,誰在守護AI心臟的每一次跳動?

    的盡頭是能源,像英偉達GB200這樣超級芯片帶來超的同時產(chǎn)生巨大的能量消耗,迫使單機柜功率
    的頭像 發(fā)表于 12-24 17:18 ?743次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>即電力:當(dāng)單機柜功率突破<b class='flag-5'>100</b>kW,誰在守護<b class='flag-5'>AI</b>心臟的每一次跳動?

    邁向云端巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級。其INT8達256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶
    的頭像 發(fā)表于 12-14 11:17 ?1914次閱讀
    邁向云端<b class='flag-5'>算</b><b class='flag-5'>力</b>巔峰:昆侖芯K<b class='flag-5'>200</b> <b class='flag-5'>AI</b>加速卡全面解讀

    超級AI芯片時代,電子元器件的進化方向

    超級AI芯片時代,突飛猛進,行業(yè)日新月異,電子元器件的進化方向是哪里,我們要為此提前做好哪些準(zhǔn)備?
    的頭像 發(fā)表于 12-11 15:13 ?819次閱讀
    <b class='flag-5'>超級</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>時代,電子元器件的進化方向

    湘軍,讓變成生產(chǎn)

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預(yù)期——7nm工藝下
    發(fā)表于 10-27 13:12

    英偉達 H100 GPU 掉卡?做好這五點,讓穩(wěn)如泰山!

    H100服務(wù)器停工一天損失的成本可能比維修費還高。今天,我們給大家總結(jié)一套“防掉卡秘籍”,從日常管理到環(huán)境把控,手把手教你把掉卡風(fēng)險壓到最低。一、供電是“生命線”,這3點必須盯緊H100
    的頭像 發(fā)表于 09-05 11:03 ?1149次閱讀
    英偉達 <b class='flag-5'>H100</b> GPU 掉卡?做好這五點,讓<b class='flag-5'>算</b><b class='flag-5'>力</b>穩(wěn)如泰山!

    2025端側(cè)AI芯片爆發(fā):存一體、非Transformer架構(gòu)誰主浮沉?邊緣計算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)困局。各位大佬在實際項目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關(guān)注焦點。大家在討論AI的時候,經(jīng)常會提到AI集群。AI
    的頭像 發(fā)表于 07-23 12:18 ?1601次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    : NVlink1.0——初代的堆疊技術(shù) 英偉達2014發(fā)布了NVLink的首個版本——NVLink 1.0。在2016年發(fā)布的P100芯片上,首次搭載了NVLink 1.0技術(shù)。 N
    發(fā)表于 06-18 19:31

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐 一、硬件層:AI的物理載體 芯片技術(shù)升級? 國際前沿
    的頭像 發(fā)表于 05-29 07:44 ?940次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐

    GPU 維修干貨 | 英偉達 GPU H100 常見故障有哪些?

    上漲,英偉達H100GPU憑借其強大的,成為AI訓(xùn)練、高性能計算領(lǐng)域的核心硬件。然而,隨著使用場景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀
    的頭像 發(fā)表于 05-05 09:03 ?2989次閱讀
    GPU 維修干貨 | 英偉達 GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    搭建中心,從了解的GPU 特性開始

    ABSTRACT摘要本文介紹如何搭建,并介紹A100H100、H200和B200這些GPU
    的頭像 發(fā)表于 04-24 11:08 ?3363次閱讀
    搭建<b class='flag-5'>算</b><b class='flag-5'>力</b>中心,從了解的GPU 特性開始

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長,大芯片已成為科技競爭的核心領(lǐng)域之一。 ? 大芯片的核心應(yīng)用場景豐富多樣。
    的頭像 發(fā)表于 04-13 00:02 ?3242次閱讀