91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾發(fā)布中國(guó)定制版大模型專用芯片Gaudi2,用性價(jià)比挑戰(zhàn)英偉達(dá)

甲子光年 ? 來源:甲子光年 ? 2023-07-12 14:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

訓(xùn)練大模型,英偉達(dá)GPU不再是唯一選項(xiàng)。

7月11日,英特爾在北京舉辦AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會(huì),正式于中國(guó)市場(chǎng)推出第二代深度學(xué)習(xí)加速器——Habana Gaudi2。

Habana是成立于2016年的AI芯片廠商,總部位于以色列,為數(shù)據(jù)中心提供可編程深度學(xué)習(xí)加速器。Habana在2019年推出了第一代Gaudi芯片,并在這一年12月被其早期投資人英特爾收購(gòu)。

其實(shí)在2022年5月,英特爾已經(jīng)發(fā)布過Gaudi2。而這一次在北京的產(chǎn)品發(fā)布,是面向中國(guó)市場(chǎng)的“定制版”,類似英偉達(dá)推出A100與H100的定制版A800與H800。

英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera強(qiáng)調(diào),Gaudi2是完全合法合規(guī)的。

在性能方面,這款中國(guó)定制版訓(xùn)練最主要的性能裁剪在于網(wǎng)絡(luò)端口。Gaudi2有21個(gè)百兆端口,而國(guó)際版有24個(gè)。不過,英特爾Habana Labs首席運(yùn)營(yíng)官Eitan Medina表示,“從客戶使用情況來看,預(yù)計(jì)影響會(huì)非常小”。

Gaudi2的推出,為訓(xùn)練大模型提供了英偉達(dá)之外的替代方案。在此之前,英偉達(dá)的GPU芯片——A100與H100,幾乎壟斷了訓(xùn)練大模型的市場(chǎng)。供需的極度不平衡也讓GPU一芯難求。

相比英偉達(dá)GPU,Gaudi2最顯著的優(yōu)勢(shì)在于“更高的性價(jià)比”。英特爾表示,將致力于為中國(guó)用戶提供更高的深度學(xué)習(xí)性能和效率,從而成為大規(guī)模部署AI的更優(yōu)解。

目前,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器。此外,新華三與超聚變也是英特爾的合作伙伴。

1.用性價(jià)比挑戰(zhàn)英偉達(dá)

目前,業(yè)內(nèi)普遍認(rèn)為生成式AI和大語(yǔ)言模型僅適宜在GPU上運(yùn)行。但英特爾Gaudi2正在向英偉達(dá)發(fā)起挑戰(zhàn)。

Gaudi2深度學(xué)習(xí)加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),采用了臺(tái)積電7nm工藝,專為訓(xùn)練大語(yǔ)言模型而構(gòu)建。該加速器具備:

24個(gè)可編程Tensor處理器核心(TPCs)

21個(gè)100 Gbps(RoCEv2)以太網(wǎng)接口

96GB HBM2E內(nèi)存容量

2.4TB/秒的總內(nèi)存帶寬

48MB片上SRAM

集成多媒體處理引擎

Gaudi2真實(shí)性能表現(xiàn)如何?在發(fā)布會(huì)現(xiàn)場(chǎng),英特爾多次與英偉達(dá)進(jìn)行參數(shù)對(duì)比。

在6月公布的MLCommons MLPerf基準(zhǔn)測(cè)試(被普遍認(rèn)為是最具信服力的AI性能測(cè)試基準(zhǔn))結(jié)果中,Gaudi2在GPT-3模型、計(jì)算機(jī)視覺模型ResNet-50(使用8個(gè)加速器)、Unet3D(使用8個(gè)加速器),以及自然語(yǔ)言處理模型BERT(使用8個(gè)和64個(gè)加速器)上均取得了比A100更優(yōu)異的結(jié)果,但還弱于H100。

不僅如此,Gaudi2在性價(jià)比上更具優(yōu)勢(shì)。

在MLCommons剛剛公布的MLPerf訓(xùn)練3.0結(jié)果中,Gaudi2在1750億參數(shù)的GPT-3模型上,從256個(gè)加速器到384個(gè)加速器可實(shí)現(xiàn)接近線性的95%擴(kuò)展效果。

英特爾表示,Gaudi2的每瓦性能大約是A100的兩倍。而隨著性能的進(jìn)一步優(yōu)化,英特爾預(yù)計(jì)在今年9月,Gaudi2的性價(jià)比將會(huì)超過H100。

值得一提的是,Gaudi2是僅有的兩個(gè)向GPT-3大模型訓(xùn)練基準(zhǔn)提交性能結(jié)果的解決方案之一。

英特爾Habana Labs首席運(yùn)營(yíng)官Eitan Medina強(qiáng)調(diào):“這說明了其他半導(dǎo)體廠商還無(wú)法構(gòu)建針對(duì)GPT-3的解決方案”。

除了模型的訓(xùn)練,還需要模型的推理。Gaudi2可為大規(guī)模的多模態(tài)和語(yǔ)言模型提供出色的推理性能。

在最近的Hugging Face評(píng)估中,Gaudi2在大規(guī)模推理方面的表現(xiàn),包括在運(yùn)行Stable Diffusion、70億以及1760億參數(shù)BLOOMz模型時(shí),都在行業(yè)內(nèi)保持領(lǐng)先。

其中,與英偉達(dá)A100相比,Stable Diffusion推理時(shí)延降低2.21倍。

值得一提的是,下一代Gaudi3預(yù)計(jì)在明年推出,采用臺(tái)積電5nm工藝。

2.英特爾的AI戰(zhàn)略

英特爾擁有龐大豐富的產(chǎn)品線,Gaudi2并非唯一的AI產(chǎn)品。

針對(duì)AI在不同場(chǎng)景、不同環(huán)節(jié)的異構(gòu)計(jì)算需求,英特爾將其產(chǎn)品線分為通用計(jì)算與加速計(jì)算。

其中,英特爾的CPU產(chǎn)品,第四代至強(qiáng)處理器解決通用計(jì)算,滿足客戶在大部分模型較小場(chǎng)景的AI推理需求;Gaudi2解決加速計(jì)算,解決大模型的訓(xùn)練及推理需求。

在通用計(jì)算層面,第四代英特爾至強(qiáng)可擴(kuò)展處理器(英特爾AMX)為廣泛的AI負(fù)載和用例提供10倍的推理和訓(xùn)練性能以及代際性能提升,同時(shí)每瓦性能比也比前代提高7.7倍。

在6月底公布的MLPerf訓(xùn)練3.0結(jié)果表明,第四代至強(qiáng)可擴(kuò)展處理器為企業(yè)提供了“開箱即用”的功能,可以在通用系統(tǒng)上部署AI,避免了引入專用AI系統(tǒng)的高昂成本和復(fù)雜性。

第四代至強(qiáng)可擴(kuò)展處理器也能夠支持Stable Diffusion。英偉達(dá)DGX H100系統(tǒng)也會(huì)選擇搭配英特爾CPU,從而為企業(yè)級(jí)AI提供高速、高能效并節(jié)省成本。

百度、美團(tuán)是英特爾AMX的客戶。英特爾AMX助力百度文心一言輕量版ERNIE-Tiny性能提升2.66倍,助力美團(tuán)加速視覺AI推理服務(wù),成本降低80%。

值得一提的是,在加速計(jì)算層面,英特爾除了推出人工智能專用芯片Gaudi2之外,也在2022年推出了面向數(shù)據(jù)中心的的GPU Max系列(代號(hào)為Ponte Vecchio)。兩款產(chǎn)品在AI計(jì)算層面存在一定的重合度。

對(duì)此,英特爾透露會(huì)在2025年把Gaudi產(chǎn)品線與GPU產(chǎn)品線整合為統(tǒng)一架構(gòu)的新產(chǎn)品,并帶來更好的軟件適配能力與AI處理能力。

此外,正如英偉達(dá)依靠CUDA構(gòu)建護(hù)城河,英特爾也在加強(qiáng)軟件開發(fā)生態(tài)的支持。

英特爾推出的軟件套件針對(duì)Gaudi平臺(tái)深度學(xué)習(xí)業(yè)務(wù)進(jìn)行了優(yōu)化,集成了對(duì)TensorFlow和PyTorch框架的支持,并面向400多個(gè)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)AI模型進(jìn)行驗(yàn)證,涵蓋每個(gè)業(yè)務(wù)領(lǐng)域使用的最常見AI用例。

總結(jié)來看,英特爾正在通過異構(gòu)產(chǎn)品組合、開放式的軟件棧以及用于大模型訓(xùn)練的Gaudi2集群,來降低人工智能的準(zhǔn)入門檻,來滿足龐大的市場(chǎng)需求。

芯片是大模型訓(xùn)練及推理的基礎(chǔ)設(shè)施,也是這場(chǎng)大模型淘金熱必不可少的“鏟子”。如今,隨著主流半導(dǎo)體巨頭紛紛布局,這場(chǎng)大模型的芯片戰(zhàn)已經(jīng)徹底打響了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54010

    瀏覽量

    466133
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10301

    瀏覽量

    180463
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99192
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5186
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    283

原文標(biāo)題:英特爾發(fā)布中國(guó)定制版大模型專用芯片Gaudi2,用性價(jià)比挑戰(zhàn)英偉達(dá)|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI峰會(huì)冰火兩重天:英特爾亮劍GPU挑戰(zhàn)英偉達(dá),黃仁勛怒懟AI代替軟件

    美東時(shí)間2月3日,在思科AI大會(huì)上,英偉達(dá)CEO黃仁勛和英特爾CEO陳立武接連放出了重磅消息。英特爾CEO陳立武宣布,已指派新任架構(gòu)師,準(zhǔn)備
    的頭像 發(fā)表于 02-05 10:05 ?1.2w次閱讀
    AI峰會(huì)冰火兩重天:<b class='flag-5'>英特爾</b>亮劍GPU<b class='flag-5'>挑戰(zhàn)</b><b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>,黃仁勛怒懟AI代替軟件

    英偉達(dá)斥資50億美元入股英特爾芯片巨頭攜手重塑行業(yè)格局

    一顆重磅炸彈,瞬間點(diǎn)燃了資本市場(chǎng)的熱情,英特爾股價(jià)在盤前交易中直線飆升,一度漲幅超過 30%,英偉達(dá)股價(jià)也隨之攀升,盤前漲幅逾 2%。 根據(jù)合作協(xié)議,在數(shù)據(jù)中心領(lǐng)域,
    的頭像 發(fā)表于 09-22 17:35 ?849次閱讀

    今日看點(diǎn)丨英偉達(dá)入股英特爾;寒武紀(jì):網(wǎng)傳訂單信息不實(shí)

    英偉達(dá)入股英特爾 NVIDIA和英特爾今日宣布達(dá)成合作,將共同開發(fā)多代定制化的數(shù)據(jù)中心和個(gè)人計(jì)算產(chǎn)品,以加速超大規(guī)模計(jì)算、企業(yè)級(jí)及消費(fèi)級(jí)市場(chǎng)
    發(fā)表于 09-19 10:21 ?1056次閱讀

    重磅!雙英強(qiáng)強(qiáng)合作,英偉達(dá)英特爾投資50億美元

    9月18日,英偉達(dá)CEO黃仁勛宣布,與英特爾達(dá)成投資50億美元的投資及技術(shù)合作,這是在雙方進(jìn)行一年多的討論后做出的決定。此舉標(biāo)志著兩大競(jìng)爭(zhēng)對(duì)手聯(lián)手,開創(chuàng)AI PC和數(shù)據(jù)中心合作新篇章。消息公布后,
    的頭像 發(fā)表于 09-19 09:36 ?1.1w次閱讀
    重磅!雙英強(qiáng)強(qiáng)合作,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>向<b class='flag-5'>英特爾</b>投資50億美元

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi
    的頭像 發(fā)表于 08-26 19:18 ?3028次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>Gaudi</b> <b class='flag-5'>2</b>E AI加速器為DeepSeek-V3.1提供加速支持

    美國(guó)商務(wù)部推進(jìn)收購(gòu)英特爾10%股份 估值約達(dá)105億美元

    據(jù)外媒報(bào)道;美國(guó)商務(wù)部正在積極推進(jìn)收購(gòu)英特爾10%股份。特朗普政府此前已經(jīng)明確表示政府考慮將英特爾獲批的聯(lián)邦補(bǔ)貼轉(zhuǎn)換為英特爾股權(quán);聯(lián)邦補(bǔ)貼就是此前的《芯片法案》撥款;估計(jì)為
    的頭像 發(fā)表于 08-20 12:25 ?747次閱讀

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語(yǔ)言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺(tái)上完成針對(duì)該模型
    的頭像 發(fā)表于 08-07 14:42 ?1368次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    2025年3月,英偉達(dá)發(fā)布了DGX B300 AI加速計(jì)算平臺(tái)。2025年5月,英特爾發(fā)布了三款全新英特
    的頭像 發(fā)表于 06-27 11:44 ?883次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    處理器的邊緣 AI 控制器 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機(jī) ,為工業(yè)AI的規(guī)?;涞刈⑷霃?qiáng)勁動(dòng)力。 英特爾與諾達(dá)佳聯(lián)合發(fā)布邊緣AI控制器和邊緣智算一體機(jī)
    發(fā)表于 06-24 17:50 ?1517次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    分析師:英特爾轉(zhuǎn)型之路,機(jī)遇與挑戰(zhàn)并存

    ,這正是英特爾當(dāng)前發(fā)展所需。上任后,他迅速推動(dòng)公司組織架構(gòu)重組,加大在制造與AI領(lǐng)域的投資,并將代工業(yè)務(wù)置于優(yōu)先位置。盡管面臨內(nèi)外多重挑戰(zhàn),英特爾股票在2025年上半年仍保持了穩(wěn)定走勢(shì)。 陳立武正在帶領(lǐng)
    的頭像 發(fā)表于 06-10 10:59 ?573次閱讀
    分析師:<b class='flag-5'>英特爾</b>轉(zhuǎn)型之路,機(jī)遇與<b class='flag-5'>挑戰(zhàn)</b>并存

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7478次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5452次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI加速器機(jī)架級(jí)和PCIe部署方案 ? 2
    發(fā)表于 05-20 11:03 ?1845次閱讀

    更高效更安全的商務(wù)會(huì)議:英特爾聯(lián)合海信推出會(huì)議領(lǐng)域新型垂域模型方案

    2025年4月16日,北京 ——在今日召開的專業(yè)視聽行業(yè)的年度盛會(huì)InfoComm China 2025上,英特爾攜手海信聯(lián)合發(fā)布海信自研端側(cè)會(huì)議領(lǐng)域垂域模型解決方案,助力商務(wù)會(huì)議更加安全、高效
    的頭像 發(fā)表于 04-21 09:50 ?837次閱讀
    更高效更安全的商務(wù)會(huì)議:<b class='flag-5'>英特爾</b>聯(lián)合海信推出會(huì)議領(lǐng)域新型垂域<b class='flag-5'>模型</b>方案

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    是“中國(guó)特供版”人工智能芯片;是英偉達(dá)公司為符合美國(guó)出口規(guī)定專門為中國(guó)市場(chǎng)開發(fā)的定制
    的頭像 發(fā)表于 04-16 16:59 ?2087次閱讀