91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達發(fā)布最新AI芯片H200:性能提升2倍,成本下降50%

jf_WZTOguxH ? 來源:AI前線 ? 2023-11-22 17:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

周一,半導體行業(yè)巨頭英偉達發(fā)布了新一代人工智能芯片 H200,旨在為各種 AI 模型提供訓練和部署支持。

H200 芯片是目前用于訓練最先進的大型語言模型 H100 芯片的升級版,搭載了 141GB 的內存,專注于執(zhí)行“推理”任務。在進行推理或生成問題答案時,H200 的性能相比 H100 提升了 1.4 至 1.9 倍不等。

性能拉升無極限?

據(jù)英偉達官網(wǎng)消息,基于英偉達的“Hopper”架構,H200 是該公司首款采用 HBM3e 內存的芯片。這種內存速度更快、容量更大,使其更適用于大語言模型。相信過去一年來花大價錢購買過 Hopper H100 加速器的朋友都會為自己的沖動而后悔。為了防止囤積了大量 H100 的客戶們當場掀桿而起,英偉達似乎只有一種辦法:把配備 141 GB HBM3e 內存 Hopper 的價格,定為 80 GB 或 96 GB HBM3 內存版本的 1.5 到 2 倍。只有這樣,才能讓之前的“冤種”們稍微平衡一點。

fcab4cb4-82d4-11ee-939d-92fbcf53809c.png

下圖所示,為 H100 與 H200 在一系列 AI 推理工作負載上的相對性能比較:

fcb94800-82d4-11ee-939d-92fbcf53809c.png

可以看到,相較于 H100,H200 的性能提升最主要體現(xiàn)在大模型的推理性能表現(xiàn)上。在處理 Llama 2 等大語言模型時,H200 的推理速度比 H100 提高了接近 2 倍。 很明顯,如果能在相同的功率范圍之內實現(xiàn) 2 倍的性能提升,就意味著實際能耗和總體擁有成本降低了 50%。所以從理論上講,英偉達似乎可以讓 H200 GPU 的價格與 H100 持平。

fcc142da-82d4-11ee-939d-92fbcf53809c.png

得益于 Tansformer 引擎、浮點運算精度的下降以及更快的 HBM3 內存,今年起全面出貨的 H100 在 GPT-3 175B 模型的推理性能方面已經(jīng)較 A100 提升至 11 倍。而憑借更大、更快的 HBM3e 內存,無需任何硬件或代碼變更的 H200 則直接把性能拉升至 18 倍。 哪怕是與 H100 相比,H200 的性能也提高至 1.64 倍,而這一切都純粹源自內存容量和帶寬的增長。

fcd61bd8-82d4-11ee-939d-92fbcf53809c.png

想象一下,如果未來的設備擁有 512 GB HBM 內存和 10 TB/ 秒帶寬,性能又會來到怎樣的水平?大家愿意為這款能夠全力施為的 GPU 支付多高的價錢?最終產(chǎn)品很可能要賣到 6 萬甚至是 9 萬美元,畢竟很多朋友已經(jīng)愿意為目前未能充分發(fā)揮潛力的產(chǎn)品掏出 3 萬美元了。

英偉達需要順應 大內存的發(fā)展趨勢

出于種種技術和經(jīng)濟方面的權衡,幾十年來各種處理器在算力方面往往配置過剩,但相應的內存帶寬卻相對不足。實際內存容量,往往要視設備和工作負載需求而定。

Web 基礎設施類負載和那些相對簡單的分析 / 數(shù)據(jù)庫工作負載大多能在擁有十幾條 DDR 內存通道的現(xiàn)代 CPU 上運行良好,但到了 HPC 模擬 / 建模乃至 AI 訓練 / 推理這邊,即使是最先進 GPU 的內存帶寬和內存容量也相對不足,因此無法實質性提升芯片上既有向量與矩陣引擎的利用率。于是乎,這些 GPU 只能耗費大量時間等待數(shù)據(jù)交付,無法全力施展自身所長。

所以答案就很明確了:應該在這些芯片上放置更多內存!但遺憾的是,高級計算引擎上的 HBM 內存成本往往比芯片本身還要高,因此添加更多內存自然面臨很大的阻力。特別是如果添加內存就能讓性能翻倍,那同樣的 HPC 或 AI 應用性能將只需要一半的設備即可達成,這樣的主意顯然沒法在董事會那邊得到支持。這種主動壓縮利潤的思路,恐怕只能在市場供過于求,三、四家廠商爭奪客戶預算的時候才會發(fā)生。但很明顯,現(xiàn)狀并非如此。

好在最終理性還是占據(jù)了上風,所以英特爾才推出了“Sapphire Rapids”至強 SP 芯片變體,配備有 64 GB HBM2e 內存。雖然每核分配到的內存才剛剛超過 1 GB,但總和內存帶寬卻可達到每秒 1 TB 以上。對于各類對內存容量要求較低的工作負載,以及主要受帶寬限制、而非容量限制的工作負載(主要體現(xiàn)在 HPC 類應用當中),只需轉向 HBM2e 即可將性能提升 1.8 至 1.9 倍。于是乎,Sapphire Rapids 的 HBM 變體自然成為 1 月份產(chǎn)品發(fā)布中最受關注、也最具現(xiàn)實意義的內容之一。英特爾還很有可能在接下來推出的“Granite Rapids”芯片中發(fā)布 HBM 變體,雖然號稱是以多路復用器組合列(MCR)DDR5 內存為賣點,但這種內存擴容的整體思路必將成為 Granite Rapids 架構中的重要部分。

英偉達之前在丹佛舉行的 SC23 超級計算大會上宣布推出新的“Hopper”H200 GPU 加速器,AMD 則將于 12 月 6 日發(fā)布面向數(shù)據(jù)中心的“Antares”GPU 加速器系列——包括搭載 192 GB HBM3 內存的 Instinct MI300X,以及擁有 128 GB HBM3 內存的 CPU-GPU 混合 MI300A。很明顯,英偉達也必須順應這波趨勢,至少也要為 Hopper GPU 配備更大的內存。

fce14724-82d4-11ee-939d-92fbcf53809c.png

英偉達在一個月前的財務會議上放出技術路線圖時,我們都知道 GH200 GPU 和 H200 GPU 加速器將成為“Blackwell”GB100 GPU 及 B100 GPU 之前的過渡性產(chǎn)品,而后者計劃在 2024 年內發(fā)布。人們普遍認為 H200 套件將擁有更大的內存,但我們認為英偉達應該想辦法提升 GPU 引擎本身的性能。事實證明,通過擴大 HBM 內存并轉向速度更快的 HBM3e 內存,英偉達完全可以在現(xiàn)有 Hopper GPU 的設計之上帶來顯著的性能提升,無需添加更多 CUDA 核心或者對 GPU 超頻。 明年還有新的大冤種?

身處摩爾定律末期,在計算引擎中集成 HBM 內存所帶來的高昂成本已經(jīng)嚴重限制了性能擴展。英偉達和英特爾在 Sapphire Rapids 至強 Max CPU 上都公布了相應的統(tǒng)計數(shù)字。而無論英偉達接下來的 Blackwell B100 GPU 加速器具體表現(xiàn)如何,都基本可以斷定會帶來更強大的推理性能,而且這種性能提升很可能來自內存方面的突破、而非計算層面的升級。下面來看 B100 GPU 在 GPT-3 175B 參數(shù)模型上的推理能力提升:

fced9696-82d4-11ee-939d-92fbcf53809c.png

因此,從現(xiàn)在到明年夏季之間砸錢購買英偉達 Hopper G200 的朋友,肯定又要被再割一波“韭菜”(當然,這也是數(shù)據(jù)中心持續(xù)發(fā)展下的常態(tài))。

最后:H200 GPU 加速器和 Grace-Hopper 超級芯片將采用更新的 Hopper GPU,配備更大、更快的內存,且計劃于明年年中正式上市。也正因為如此,我們才認定 Blackwell B100 加速器雖然會在明年 3 月的 GTC 2024 大會上首次亮相,但實際出貨恐怕要等到 2024 年底。當然,無論大家決定為自己的系統(tǒng)選擇哪款產(chǎn)品,最好現(xiàn)在就提交訂單,否則到時候肯定會一無所獲。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50099

    瀏覽量

    265440
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99199
  • AI芯片
    +關注

    關注

    17

    文章

    2128

    瀏覽量

    36786

原文標題:囤H100的都成了大冤種!英偉達發(fā)布最新AI芯片H200:性能提升2倍,成本下降50%

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    H200之后,美國AI芯片管制再出“幺蛾子”,英偉和AMD慌嗎?

    。這意味著英偉、AMD 等美國芯片廠商向全球任何目的地出口 AI 加速器,均需事先獲得美國政府許可。 ? 美國政府正在考慮的這項新規(guī),將從根本上改變其在
    的頭像 發(fā)表于 03-07 06:08 ?3238次閱讀

    H200 解禁!預交付8萬顆,傳阿里砸數(shù)億抄底對手

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日,有多方消息傳出,英偉計劃在2026年2月中旬在中國交付H200芯片,這意味著此前特朗普發(fā)文表示允許
    的頭像 發(fā)表于 12-25 09:33 ?7284次閱讀

    堪稱史上最強推理芯片英偉發(fā)布 Rubin CPX,實現(xiàn)50ROI

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日,英偉AI infra峰會上發(fā)布了專為大規(guī)模上下文推理設計的全新GPU系列Rubin CPX,性能堪稱
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強推理<b class='flag-5'>芯片</b>!<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>發(fā)布</b> Rubin CPX,實現(xiàn)<b class='flag-5'>50</b><b class='flag-5'>倍</b>ROI

    H200解禁了個寂寞?2個月0銷售,審查層層加碼!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)“解禁”2個月,0銷量?近日美國商務部出口執(zhí)法助理部長David Peters透露,目前英偉H200芯片獲批
    的頭像 發(fā)表于 02-26 09:24 ?2364次閱讀

    美國政府正式批準英偉H200芯片對華出口

    1月13日,美國正式放行英偉面向中國的第二強人工智能芯片H200出口,在華盛頓對華強硬派的強烈憂慮聲中,為這款芯片對華出貨打開通道。
    的頭像 發(fā)表于 01-16 16:11 ?676次閱讀

    再加25%關稅!鎖定對華AI芯片,點名英偉、AMD

    電子發(fā)燒友網(wǎng)綜合報道,1月14日,美國總統(tǒng)特朗普簽署行政令,宣布對部分先進人工智能(AI芯片及衍生產(chǎn)品加征25%的從價關稅。以“國家安全”為名,加速重構其芯片產(chǎn)業(yè)政策。在公告中明確提到A英偉
    的頭像 發(fā)表于 01-16 09:20 ?1525次閱讀
    再加25%關稅!鎖定對華<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,點名<b class='flag-5'>英偉</b><b class='flag-5'>達</b>、AMD

    美國將允許英偉H200對華出口,但要抽成25%

    。 ? 據(jù)《紐約時報》信息,H200芯片目前為英偉性能第二強”的芯片,特朗普方面表示,美國商
    的頭像 發(fā)表于 12-10 11:07 ?1132次閱讀

    突發(fā)!特朗普批準英偉H200芯片對華出口,抽成25%

    一種“妥協(xié)”。此前,英偉一直希望向中國銷售其更先進的Blackwell系列芯片,但美政府目前仍明確表示不贊成。H200芯片
    的頭像 發(fā)表于 12-09 17:58 ?1601次閱讀

    今日看點:特朗普允許英偉對華出口H200芯片,但要抽成25%;眾擎完成 A1+ 輪與 A2 輪融資

    特朗普允許英偉對華出口H200芯片,但要抽成25% 12月8日,美國總統(tǒng)特朗普宣布,將允許英偉
    發(fā)表于 12-09 11:00 ?1082次閱讀

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4

    Trainium 4的開發(fā)計劃。亞馬遜表示,這款芯片能夠比英偉市場領先的圖形處理單元(GPU)更便宜、更高效地驅動AI模型背后的密集計算。 ? ? 作為亞馬遜首款3納米工藝
    的頭像 發(fā)表于 12-09 08:37 ?8566次閱讀
    亞馬遜<b class='flag-5'>發(fā)布</b>新一代<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    今日看點:馬斯克:特斯拉已部署超百萬顆 AI 芯片;長鑫存儲發(fā)布全新 DDR5 內存新品

    美國考慮允許英偉對華出售H200芯片 ? 據(jù)外媒報道,特朗普政府正考慮批準向中國出口美國芯片制造商英偉
    發(fā)表于 11-24 11:10 ?916次閱讀

    英偉 Q3 狂攬 308 億

    廠商季度合計 500 億美元資本支出中,約 30% 流向了英偉。 新一代 Blackwell 芯片已全面投產(chǎn),Q3 交付 1.3 萬個 GPU 樣品,H200 GPU 理論
    的頭像 發(fā)表于 11-20 18:11 ?1256次閱讀

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片
    的頭像 發(fā)表于 04-16 16:59 ?2089次閱讀

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    解決方案在英偉 GPU和英偉 CUDA-X庫上所實現(xiàn)的加速 基于英偉 GB
    發(fā)表于 03-19 17:59 ?498次閱讀