91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布超強(qiáng)AI加速卡,性能大幅提升,可支持1.8萬億參數(shù)模的訓(xùn)練

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-03-19 12:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3月19日消息,NVIDIA宣布成功研發(fā)AI加速卡——Blackwell GB200,預(yù)計年內(nèi)開始交付。這是NVIDIA在GTC開發(fā)者大會上所公布的最新成果。

GB200創(chuàng)新性的運(yùn)用了NVIDIA獨(dú)創(chuàng)的新一代AI圖形處理器架構(gòu)Blackwell。NVIDIA CEO黃仁勛明確指出:“盡管Hopper已然優(yōu)秀,但我們需要更強(qiáng)的GPU推動發(fā)展?!?/p>

得益于NVIDIA每兩年進(jìn)行一次GPU架構(gòu)升級以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更為強(qiáng)大,尤其適用于AI相關(guān)任務(wù)。

Blackwell GPU卓越表現(xiàn)使得AI性能達(dá)到驚人的20PetaFLOPS。相比之下,基于Hoper架構(gòu)的H100僅為4PetaFLOPS。NVIDIA強(qiáng)調(diào),這種額外的處理能力將極大地便利人工智能廠商順利培訓(xùn)復(fù)雜且大規(guī)模的模型。

Blackwell GPU大大刷新了人們的認(rèn)知,其龐大身形由臺積電4納米(4NP)工藝制成,包含兩個獨(dú)立制造的裸晶(Die),共有2080億個晶體管。為了方便捆綁芯片,它采用NVLink 5.0技術(shù)。兩枚Blackwell芯片在同一封裝中,相較以往的GPU而言,整體性能顯著提升達(dá)2.5倍,若處理FP4八精度浮點(diǎn)運(yùn)算,則性能甚至可飆升至5倍之多。校園秘

關(guān)于GB200,NVIDIA宣稱,其合成物包括兩個B200 Blackwell GPU以及一個基于Arm的Grace CPU。很多人驚訝地發(fā)現(xiàn) NvTech的首批量產(chǎn)計算機(jī)將其性能獲得了提升超過30倍,同時降低成本和能耗。根據(jù)NVIDIA的數(shù)據(jù)分析,他們現(xiàn)有的硬件只用2000個Blackwell GPU就夠再去完成諸如1.8萬億個參數(shù)模型這樣的運(yùn)算任務(wù),且只消耗4兆瓦的電力。在參數(shù)為1,750億的GPT-3 LLM基準(zhǔn)測試中,Nvidia的GB200的性能甚至超越了H100 7倍。規(guī)律紀(jì)律意識

對于致力于擁有龐大需求企業(yè)的成品服務(wù),NVIDA推出了包含36個CPU及72個Blackwell GPU的NVL72服務(wù)器,并附贈一體式水冷散熱解決方案,產(chǎn)能可實現(xiàn)高達(dá)720 PetaFLOPS的AI訓(xùn)練性能,或者達(dá)到驚人的1,440 PetaFlops。另外,還有144個壁搏立帆、576個GPU以及240TB的內(nèi)存。單據(jù)一份官方報道顯示,早先以至于要運(yùn)行一帶有1.8萬億個參數(shù)模型的堆棧,原先需要8000個 Hopper GPU,外加15兆瓦的電力。

英偉達(dá)透露,同類機(jī)型已被亞馬遜、谷歌、微軟和甲骨文計劃納入他們的云服務(wù)產(chǎn)品之中,由于對具體采購量的保密,外界暫無確切消息。但據(jù)Nvidia表示,已經(jīng)接到了Amazon AWS對于采用2萬片 Blackwell芯片建成的服務(wù)器集群的購買計劃。通過Node-to-Node NVLink 5.0,每個機(jī)架將被18塊GB200芯片和9塊交換機(jī)裝滿。而不同于此,英偉達(dá)的 Skeeter InfiniBand可連接多達(dá)144個節(jié)點(diǎn),Quantum-X800 InfiniBand則最高可支持64個節(jié)點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109721
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135432
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39757

    瀏覽量

    301366
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)5萬億市值背后,是一場賭上未來的燒錢競賽

    需求下,各大云計算廠商不斷加大對AI算力基建的投資,大量購買算力。在10月29日的GTC大會上,英偉達(dá)CEO黃仁勛表示,公司新一代AI芯片
    的頭像 發(fā)表于 11-02 11:18 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>5<b class='flag-5'>萬億</b>市值背后,是一場賭上未來的燒錢競賽

    Hailo-8算力 + RK3588實測!26TOPS加持,助力AI視覺升級!

    推理、低功耗運(yùn)行”的硬核實力,為邊緣AI視覺部署提供了可靠高效的算力支持。 我們收到Hailo-8 AI算力加速卡實物后,第一時間基于RK3588評估板完成適配測試,解鎖算力新可能!
    的頭像 發(fā)表于 03-02 16:46 ?52次閱讀
    Hailo-8算力<b class='flag-5'>卡</b> + RK3588實測!26TOPS加持,助力<b class='flag-5'>AI</b>視覺升級!

    FPGA硬件加速卡設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號計算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?386次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計算場景的高性能AI加速卡套件,由LLM-8850CardAI加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1024次閱讀
    新品 | LLM-8850 Kit,高<b class='flag-5'>性能</b><b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻解碼能力,支持
    的頭像 發(fā)表于 12-14 13:12 ?1590次閱讀
    昆侖芯R200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>技術(shù)規(guī)格解析

    邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級。其INT8算力達(dá)256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶寬,專為千億參數(shù)大模型
    的頭像 發(fā)表于 12-14 11:17 ?1914次閱讀
    邁向云端算力巔峰:昆侖芯K200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>全面解讀

    算力密度翻倍!江原D20加速卡發(fā)布,一雙芯重構(gòu)AI推理標(biāo)桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國產(chǎn)化產(chǎn)業(yè)鏈實現(xiàn)首次突破后,11月11日,江原科技
    的頭像 發(fā)表于 11-14 08:21 ?1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>發(fā)布</b>,一<b class='flag-5'>卡</b>雙芯重構(gòu)<b class='flag-5'>AI</b>推理標(biāo)桿

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI
    的頭像 發(fā)表于 06-05 13:39 ?1644次閱讀
    智算<b class='flag-5'>加速卡</b>是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉GPU和TPU!

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?746次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>

    邊緣AI運(yùn)算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測解決方案

    DeepX 推出了一款革命性的產(chǎn)品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具備高達(dá) 25 TOPS 的卓越運(yùn)算性能,以及高準(zhǔn)確度、低功耗、低溫
    的頭像 發(fā)表于 05-06 14:15 ?1249次閱讀
    邊緣<b class='flag-5'>AI</b>運(yùn)算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>結(jié)合Rockchip RK3588多路物體檢測解決方案

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

    MLU370-X8智能加速卡是全面升級的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe
    的頭像 發(fā)表于 04-24 17:57 ?5365次閱讀
    寒武紀(jì)基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>產(chǎn)品手冊詳解

    RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    推理任務(wù),需額外部署GPU加速卡,導(dǎo)致成本與功耗飆升。 擴(kuò)展性受限:老舊接口(如USB 2.0、百兆網(wǎng)口)無法支持5G模組、高速存儲等現(xiàn)代外設(shè),升級困難。 開發(fā)周期長:BSP適配不完善,跨平臺AI
    發(fā)表于 04-15 10:48

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時,用戶體驗更貼心。 聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣AI人聲萃
    發(fā)表于 04-13 19:52

    新思科技攜手英偉達(dá)加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    宣布在英偉達(dá) Grace Blackwell 平臺上實現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主
    發(fā)表于 03-19 17:59 ?492次閱讀

    邊緣AI新突破:MemryX AI加速卡與RK3588打造高效多路物體檢測方案

    本方案特別結(jié)合了 Orange Pi 5 Plus (Rockchip RK3588) 與 MemryX AI 加速卡,構(gòu)建出一套高性價比的智能解決方案。憑借 MemryX 提供的豐富軟件資源
    的頭像 發(fā)表于 03-06 10:45 ?951次閱讀
    邊緣<b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>與RK3588打造高效多路物體檢測方案