91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾面向中國市場發(fā)布Gaudi2處理器,加速大模型訓(xùn)練和推理

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-17 00:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)日前,英特爾AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會在京舉行。會上,英特爾正式于中國市場推出第二代Gaudi深度學(xué)習(xí)加速器——HabanaGaudi2。英特爾在中國市場推出的Gaudi2AI加速器,將通過其合作伙伴浪潮提供給中國客戶。

Gaudi2在訓(xùn)練和推理上的出色表現(xiàn)

英特爾此次推出的Gaudi2深度學(xué)習(xí)加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),以多方位性能與能效比提升,加速高性能大語言模型運行。該加速器具備:

24個可編程Tensor處理器核心(TPCs)

21個100Gbps(RoCEv2)以太網(wǎng)接口

96GBHBM2E內(nèi)存容量

2.4TB/秒的總內(nèi)存帶寬

48MB片上SRAM

集成多媒體處理引擎。

相比于國際版本,面向中國市場的Gaudi2每張芯片集成的專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2RDMA)以太網(wǎng)接口,從24個減至21個。

英特爾HabanaLabs首席運營官EltanMedina對媒體表示,根據(jù)模型的不同,特供版Gaudi2性能會有輕微的影響,但在很多數(shù)據(jù)訓(xùn)練擴展中,并不是用這三個端口,整體性能差別不大。

根據(jù)英特爾的展示,相比于上一代產(chǎn)品,在ResNet-50模型測試中,Gaudi2訓(xùn)練吞吐量提高了3倍,BERT模型的訓(xùn)練吞吐量提高了4.7倍。目前,單個Gaudi2在ResNet-50模型可達到非常穩(wěn)定的5800個圖像/每秒的吞吐量。

英偉達相比,Gaudi2運行ResNet-50的每瓦性能約是英偉達A100的2倍,性價比相較于AWS云中基于英偉達的解決方案高出40%。英特爾表示,接下來到9月,采用FP8軟件的Gaudi2預(yù)計能夠提供比H100更高的性價比。

根據(jù)此前的報道,在測試GPT-3方面,Gaudi2也表現(xiàn)出了強勁性能,384個加速器上的訓(xùn)練時間為311分鐘,從256個加速器到384個加速器實現(xiàn)近線性95%的擴展效果。

Gaudi2在大規(guī)模的多模態(tài)和語言模型的推理方面也表現(xiàn)出色。HuggingFace評估中,Gaudi2在運行StableDiffusion、70億以及1760億參數(shù)BLOOMz模型時,在行業(yè)內(nèi)都保持領(lǐng)先水平。

英特爾在AI領(lǐng)域的布局

AI計算包括訓(xùn)練和推理,目前而言,在訓(xùn)練方面,英偉達的GPU長期占據(jù)主導(dǎo)地位。近段時間,大模型的熱潮四起,英偉達的GPU明顯供不應(yīng)求。這讓AMD、英特爾以及一些AI芯片初創(chuàng)企業(yè)看到了新的機會。

事實上英特爾在AI領(lǐng)域早有布局。2019年12月,英特爾斥資約20億美元重金收購了成立于2016年的以色列人工智能(AI)芯片初創(chuàng)企業(yè)HabanaLabs。在此之前,英特爾還收購了FPGA廠商Altera、AI芯片公司Nervana。

在收購HabanaLabs后的幾年中,英特爾加緊使Habana團隊與英特爾內(nèi)部業(yè)務(wù)整合。在2022年IntelVision活動上,英特爾推出第二代深度學(xué)習(xí)芯片HabanaGaudi2和HabanaGreco,分別用于AI訓(xùn)練和AI推理。也就是說,英特爾此次面向中國市場推出的新Gaudi2,也是在此前收購了HabanaLabs的基礎(chǔ)上完成的。

面向AI領(lǐng)域的應(yīng)用,英特爾有全面的芯片組合,包括CPU、GPU、FPGA、AI專用芯片等。英特爾公司執(zhí)行副總裁數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理SandraRivera表示,Gaudi2作為用于AI加速的專用處理器,是英特爾產(chǎn)品組合適用于大模型負載中,性能最優(yōu)的產(chǎn)品。

除了硬件方面,英特爾也非常注重在軟件方面的優(yōu)化,SandraRivera表示,英特爾致力于通過客戶提供廣泛的硬件選擇,并支持開放的軟件環(huán)境,加速人工智能技術(shù)的發(fā)展。

據(jù)英特爾介紹,為支持客戶輕松構(gòu)建模型,或?qū)?dāng)前基于GPU的模型業(yè)務(wù)和系統(tǒng)遷移到基于全新Gaudi2服務(wù)器,并幫助保護軟件開發(fā)投入,SynapseAI軟件套件針對Gaudi平臺深度學(xué)習(xí)業(yè)務(wù)進行了優(yōu)化,旨在與廣泛的軟件生態(tài)系統(tǒng)一起,幫助簡化模型的開發(fā)和遷移。

SynapseAI集成了對TensorFlow和PyTorch框架的支持,并提供眾多流行的計算機視覺和自然語言參考模型,能夠滿足深度學(xué)習(xí)開發(fā)者的多樣化需求。

對于英特爾來說,中國是一個很重要的市場,根據(jù)2022年數(shù)據(jù),英特爾在中國的營收占到總營收的27%。如今中國的大模型發(fā)展如火如荼,而英偉達的A100/H100在中國禁售,特供版的A800/H800也需要獲得許可才能出售。這對于英特爾來說,是一個很好的機會。

據(jù)悉,目前英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器NF5698G7,該服務(wù)器集成8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強可擴展處理器。此外,新華三、超聚變等公司,預(yù)計也將推出搭載Gaudi2的服務(wù)器。

小結(jié)

算力是AI大模型發(fā)展的重要基礎(chǔ),而AI芯片又是提供算力的重要組成部分。無論是訓(xùn)練還是推理,未來隨著大模型的不斷推進及應(yīng)用落地,AI芯片的市場需求都將會持續(xù)上升。在英偉達一家獨大的情況下,英特爾等廠商競爭力的不斷提升,對整個產(chǎn)業(yè)的發(fā)展也更為有利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252242
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10301

    瀏覽量

    180437
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2127

    瀏覽量

    36773
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    281
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英特爾炮轟,AMD回擊!掌機市場芯片之爭

    英特爾推出的才是專為掌機設(shè)計的最新處理器,信心源于新一代旗艦產(chǎn)品Panther Lake處理器。該處理器是首款基于英特爾18A工藝節(jié)點制造的
    的頭像 發(fā)表于 01-12 09:09 ?1794次閱讀

    英特爾與憶聯(lián)重磅推出企業(yè)級網(wǎng)絡(luò)存儲解決方案

    白皮書,旨在充分發(fā)揮至強6處理器與憶聯(lián)UH812a企業(yè)級SSD的性能潛力,全面滿足AI訓(xùn)練推理場景下的高吞吐、高帶寬及極致低延遲需求。
    的頭像 發(fā)表于 02-02 09:14 ?969次閱讀
    <b class='flag-5'>英特爾</b>與憶聯(lián)重磅推出企業(yè)級網(wǎng)絡(luò)存儲解決方案

    18A工藝首發(fā)!英特爾推出下一代PC處理器,77%游戲性能暴漲+180TOPS算力

    1月6日,在CES 2026上,英特爾發(fā)布了代號為Panther Lake 的全新 Core Ultra 3 系列處理器上市產(chǎn)品陣容。該系列處理器基于18A 制程節(jié)點打造的AI PC計
    的頭像 發(fā)表于 01-07 07:56 ?1.3w次閱讀
    18A工藝首發(fā)!<b class='flag-5'>英特爾</b>推出下一代PC<b class='flag-5'>處理器</b>,77%游戲性能暴漲+180TOPS算力

    發(fā)力圖形工作站和AI推理市場英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布面向專業(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢?在支持AI推理工作站和大模型
    的頭像 發(fā)表于 10-22 13:40 ?1.1w次閱讀
    發(fā)力圖形工作站和AI<b class='flag-5'>推理</b><b class='flag-5'>市場</b>,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾
    的頭像 發(fā)表于 08-26 19:18 ?3024次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E AI<b class='flag-5'>加速器</b>為DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺上完成針對該模型
    的頭像 發(fā)表于 08-07 14:42 ?1365次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核
    的頭像 發(fā)表于 06-27 11:44 ?879次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7467次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系
    的頭像 發(fā)表于 05-20 12:27 ?5443次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3
    發(fā)表于 05-20 11:03 ?1844次閱讀

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    關(guān)鍵項目中,性能表現(xiàn)卓越。測試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實現(xiàn)了高達1.9倍的顯著提升,這也充分顯示了至強6處理器作為現(xiàn)代AI系統(tǒng)理想解決方案的強大實力。 英特爾公司副總裁兼數(shù)據(jù)中心和人工智能事業(yè)部臨時總經(jīng)理K
    的頭像 發(fā)表于 04-07 10:58 ?674次閱讀

    微星攜英特爾為玩家打造非凡游戲體驗,兩款泰坦家族新品均搭載全新英特爾酷睿Ultra HX處理器

    3月29日,在英特爾酷睿Ultra 200HX新品分享會上,搭載該處理器的高性能筆記本齊聚一堂,英特爾攜手生態(tài)合作伙伴致力于以創(chuàng)新技術(shù)滿足用戶的多樣需求,并加速AI技術(shù)與產(chǎn)業(yè)的深度融合
    的頭像 發(fā)表于 04-02 09:37 ?1315次閱讀

    英特爾至強6處理器助力數(shù)據(jù)中心整合升級

    繼去年9月重磅推出英特爾 至強 6900性能核處理器后,英特爾進一步擴充至強6產(chǎn)品家族,于近期發(fā)布了包括至強6700性能核處理器及至強650
    的頭像 發(fā)表于 03-13 17:36 ?1487次閱讀

    英特爾至強6再推新品!打造最強AI“機頭引擎”

    2月底,英特爾一口氣發(fā)布多款至強6處理器,其中包括備受矚目的6700/6500性能核處理器。在數(shù)據(jù)中心領(lǐng)域需求持續(xù)攀升的當(dāng)下,
    的頭像 發(fā)表于 03-13 14:57 ?741次閱讀

    英特爾展示基于至強6處理器的基礎(chǔ)網(wǎng)絡(luò)設(shè)施

    ? 集成AI功能的英特爾至強6系統(tǒng)級芯片,與前幾代產(chǎn)品相比,可帶來高達2.4倍的無線接入網(wǎng)(RAN)容量提升1,和70%的每瓦性能提升2; 集成的人工智能加速器將AI RAN性能提升了高達3.2倍3
    的頭像 發(fā)表于 03-08 09:24 ?1047次閱讀