91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)的破綻

佐思汽車研究 ? 來(lái)源:知乎 ? 2023-08-03 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

看到夏core寫(xiě)了篇夏晶晶:談一下英偉達(dá)帝國(guó)的破腚(來(lái)源:知乎),決定蹭個(gè)熱度,講點(diǎn)不一樣的看法。LLM的出現(xiàn)以及NVidia暴漲的股價(jià)和銷量確實(shí)讓很多人重新思考AI芯片的機(jī)會(huì)。夏core提到了很多個(gè)點(diǎn)都很有道理,比如關(guān)于GPU成本的分析,再比如最后戰(zhàn)略視角去看,產(chǎn)業(yè)利潤(rùn)分配的不均是最大的破綻。不過(guò)戰(zhàn)術(shù)層面的想法還是有些問(wèn)題的。

比如LPDDR和HBM卷成本,如果考慮的是$/GB,那LPDDR確實(shí)有優(yōu)勢(shì),但如果考慮的是$/GBps,HBM還是最具性價(jià)比的選擇。而LLM雖然對(duì)內(nèi)存容量有比較大的需求,但對(duì)于內(nèi)存帶寬同樣有巨大的需求。單純?nèi)萘康脑挘?a target="_blank">CPU內(nèi)存可以輕輕松松堆好幾TB,比GPU便宜多了。LLM的參數(shù)和kv緩存都是實(shí)打?qū)嵉膬?nèi)存容量占用大頭,而這些參數(shù)在每一輪forward的過(guò)程都全部要用一遍,這也就意味著你把內(nèi)存里的數(shù)據(jù)都讀出來(lái)一遍要多久(即內(nèi)存的容量和帶寬比)反而是最重要的。而擴(kuò)內(nèi)存帶寬一定需要增加DRAM bank數(shù)量從而等比擴(kuò)內(nèi)存容量,但擴(kuò)內(nèi)存容量可以把多個(gè)bank掛到一個(gè)通道上不增加內(nèi)存帶寬,所以算成本的時(shí)候關(guān)鍵要看$/GBps,這方面HBM是最具性價(jià)比的選擇。

至于夏core提到的擴(kuò)互聯(lián)帶寬,利用NVidia被美國(guó)出口管制卡帶寬的機(jī)會(huì),確實(shí)是一個(gè)好的路子,但我覺(jué)得更重要的點(diǎn)在于,在LLM的游戲規(guī)則下,內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬成了最核心的競(jìng)爭(zhēng)力,而算力的重要性下降了,這才是NVidia戰(zhàn)術(shù)層面最大的破綻。你看,AMD發(fā)布MI300X可是對(duì)算力指標(biāo)提都不提,只提內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬。放在之前的AI芯片發(fā)布會(huì)上是完全不可能的事情,去年的時(shí)候大家都還在拼命吹算力指標(biāo)。

76e7044e-31ab-11ee-9e74-dac502259ad0.jpg

Intel規(guī)劃的2025年的Falcon Shores GPU也規(guī)劃了288GB內(nèi)存容量和9.8TB/s帶寬,我們先不考慮Intel會(huì)不會(huì)繼續(xù)跳票的問(wèn)題,至少內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬成了最核心的競(jìng)爭(zhēng)力這一點(diǎn),幾家半導(dǎo)體頭部大廠都是達(dá)成共識(shí)的。

那這為什么又是NVidia的破綻呢?因?yàn)閮?nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬都是標(biāo)準(zhǔn)化的,而算力是非標(biāo)準(zhǔn)化的。算力的非標(biāo)準(zhǔn)化是NVidia在過(guò)去十年最大的護(hù)城河,因?yàn)門OPS和TFLOPS是不一樣的,SIMT算力和DSA算力也是不一樣的,甚至AMD算力和NVidia算力也是不一樣的。過(guò)去AI芯片的核心競(jìng)爭(zhēng)力在于算力,為了卷算力指標(biāo),有些廠商在TOPS和TFLOPS上玩花活,有些廠商在SIMT和DSA上玩花活,即使SIMT廠商,也需要在SIMT算力的具體實(shí)現(xiàn)上玩花活,不然難以對(duì)NVidia的算力指標(biāo)產(chǎn)生競(jìng)爭(zhēng)力。而這些花活的代價(jià)就是算力的非標(biāo)準(zhǔn)化,從而形成了CUDA深厚的護(hù)城河。

看過(guò)我之前文章的朋友都直到我在過(guò)去好多年都是在探討如何構(gòu)建一個(gè)有競(jìng)爭(zhēng)力的DSA算力范式,因?yàn)橐谒懔ι细?jìng)爭(zhēng)過(guò)NVidia,一方面要有對(duì)算力指標(biāo)的需求來(lái)覆蓋算力遷移成本,這個(gè)在過(guò)去是成立的。另一方面需要有一個(gè)和NVidia的CUDA算力相比有競(jìng)爭(zhēng)力的算力范式,而算力的顯性指標(biāo)是TFLOPS,隱性指標(biāo)是達(dá)到TFLOPS的開(kāi)發(fā)時(shí)間成本(也就是易用性),我過(guò)去很多關(guān)于SIMT算力和DSA算力在編譯器層面的探討都是圍繞解決最后一環(huán)展開(kāi)的,因?yàn)檫@是在過(guò)去的需求和市場(chǎng)條件下干老黃的唯一途徑。

但現(xiàn)在算力指標(biāo)的重要性下降,前面這種干老黃的路徑的基礎(chǔ)邏輯崩塌了,對(duì)算力指標(biāo)的需求下降了,覆蓋算力遷移成本的動(dòng)力是更不足的,但一個(gè)更有潛力的干老黃的路徑出現(xiàn)了。

算力指標(biāo)重要性的下降使得大家可以放棄在算力范式層面玩花活搞競(jìng)爭(zhēng)力,轉(zhuǎn)而去追求內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬的花活,這個(gè)層面玩花活的好處是他最后的指標(biāo)是標(biāo)準(zhǔn)化的,只要你的花活真的能把這些指標(biāo)懟上去,沒(méi)有太多隱性的護(hù)城河卡著你。而算力方面則可以盡量做到標(biāo)準(zhǔn)化,照著事實(shí)標(biāo)準(zhǔn)去做就行了,哪怕指標(biāo)差一點(diǎn),但堆到幾十TFLOPS的CUDA算力和幾百TFLOPS的矩陣算力其實(shí)都是可以做到的。

這時(shí)候通過(guò)市場(chǎng)對(duì)于大內(nèi)存帶寬、大互聯(lián)帶寬的需求來(lái)覆蓋算力遷移成本,同時(shí)又通過(guò)算力標(biāo)準(zhǔn)化來(lái)降低這個(gè)遷移成本。更進(jìn)一步,現(xiàn)在大模型訓(xùn)練、推理、部署的系統(tǒng)軟件也正處于蓬勃造輪子的時(shí)期,處于大量新增代碼的積累階段,一系列全新的生態(tài)位正處于形成過(guò)程中,一個(gè)超大容量和帶寬的準(zhǔn)標(biāo)準(zhǔn)化算力是有足夠卡這些全新生態(tài)位潛力的。

此外,夏core文章最后講的戰(zhàn)略層面的破綻產(chǎn)業(yè)利潤(rùn)分配的不均也是蘊(yùn)含在這背后的。

天下財(cái)共一石,老黃獨(dú)占八斗。
這是對(duì)全天下IT產(chǎn)業(yè)的傷害,包括TSMC,一個(gè)健康的產(chǎn)業(yè),其整個(gè)環(huán)節(jié)是需要一個(gè)合理的分配比例的,你要說(shuō)Logic制造的技術(shù)含量最高,但是分成的收益卻不到1%,這種分配關(guān)系不足以長(zhǎng)期維系,tsmc的工藝演進(jìn)是需要錢的(靠的就是大家共籌,利益均分),如果全世界IT就這么多錢,英偉達(dá)你是可以通過(guò)系統(tǒng)優(yōu)勢(shì)拿走更多,但產(chǎn)業(yè)鏈中tsmc及其他各個(gè)環(huán)節(jié)就會(huì)更加艱難。三星的HBM其實(shí)同理,操了白粉的心,賣個(gè)白菜的價(jià),不值得。

在LLM重新創(chuàng)建的邊界條件下,最大的需求HBM卻賣了個(gè)白菜價(jià),只因老黃提供了事實(shí)標(biāo)準(zhǔn)的算力把這些內(nèi)存帶寬連起來(lái)就吞了九成以上的利潤(rùn),這種不健康的產(chǎn)業(yè)利潤(rùn)分配其實(shí)給廣大造反者提供了巨大的機(jī)會(huì),畢竟一個(gè)準(zhǔn)標(biāo)準(zhǔn)化的算力誰(shuí)不會(huì)造(chao)呢?

當(dāng)然了,雞血打完也還是要潑點(diǎn)冷水。首先這些道理老黃肯定比我們都有更深刻的認(rèn)識(shí),處于守勢(shì)的老黃其實(shí)有很多見(jiàn)招拆招的手段。夏core提的通過(guò)美帝的出口管制反向卡老黃的互聯(lián)帶寬,其實(shí)AMD的形態(tài)就是老黃可以破解的方法。如果老黃能在一張卡里就把大模型全部塞進(jìn)去,大互聯(lián)帶寬最主要的需求就破解了,剩下的都可以靠其他并行模式以及廣大程序員優(yōu)化出來(lái),你互聯(lián)帶寬大任你大,我一堆“超大卡”之間卡著出口管制的帶寬也能把系統(tǒng)跑滿。

老黃最大的優(yōu)勢(shì)就在于只要老黃還能滿足大家的需求,甚至只要大家有預(yù)期老黃還能在短時(shí)間內(nèi)解決大家主要的需求,遷移算力的需求勢(shì)能就難以積累到足夠高度,比如AMD雖然現(xiàn)在拿出了一個(gè)核心指標(biāo)壓NVidia一倍的大殺器,但只要大家仍然預(yù)期老黃明年也能掏出這樣一個(gè)大家伙,等等不香嗎?畢竟一年時(shí)間算力遷移都不一定搞得完的,到時(shí)候NVidia來(lái)一個(gè)差不多指標(biāo)的,可不就是遷移了個(gè)寂寞。玩弄預(yù)期方面,老黃可是老手,前有算力增長(zhǎng)的黃氏定律取代摩爾定律,老黃明年必然也會(huì)給大家塑造帶寬增長(zhǎng)的新黃氏曲線,建立大家的預(yù)期??梢哉f(shuō),干老黃不光要干老黃當(dāng)代產(chǎn)品,更要去干老黃給市場(chǎng)塑造的預(yù)期曲線。

此外,堆帶寬沒(méi)有秘密,老黃在NVLink和HBM上的布局也仍然是行業(yè)領(lǐng)先水平。

不過(guò)干老黃雖然不容易,但至少標(biāo)準(zhǔn)化的核心指標(biāo)競(jìng)爭(zhēng)終歸是把老黃和各家拉到了一個(gè)層面進(jìn)行競(jìng)爭(zhēng),相比前幾年靠DSA在非標(biāo)算力層面進(jìn)行不對(duì)稱競(jìng)爭(zhēng)相比,難度還是降低了非常多的。最后引用夏core文章結(jié)尾來(lái)收尾,與各位同僚共勉。

AI這個(gè)行業(yè),也終將,昔日王榭堂前燕 飛入尋常百姓家。這是大勢(shì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99222
  • LPDDR
    +關(guān)注

    關(guān)注

    0

    文章

    46

    瀏覽量

    6853
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1533

    瀏覽量

    16749

原文標(biāo)題:英偉達(dá)的破綻

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)電話會(huì)看Agentic AI推理與FPGA價(jià)值

    2026年2月,英偉達(dá)發(fā)布2026財(cái)年Q4財(cái)報(bào):營(yíng)收681億美元,同比增長(zhǎng)73%,數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)75%——預(yù)期中的超預(yù)期。更值得關(guān)注的,是電話會(huì)中反復(fù)出現(xiàn)的幾個(gè)關(guān)鍵詞:Agentic AI、推理
    的頭像 發(fā)表于 03-04 17:07 ?1066次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>電話會(huì)看Agentic AI推理與FPGA價(jià)值

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作,為整車廠基于英偉達(dá)DRIVE Hyperion平臺(tái)的項(xiàng)目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?369次閱讀

    英偉達(dá)重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購(gòu)人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購(gòu)。但
    的頭像 發(fā)表于 12-26 08:44 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲(chǔ)全面覺(jué)醒

    黃仁勛:英偉達(dá)AI芯片訂單排到2026年 英偉達(dá)上季營(yíng)收加速增長(zhǎng)62%再超預(yù)期

    AI芯片總龍頭英偉達(dá)的財(cái)報(bào)終于帶來(lái)了驚喜;英偉達(dá)公司發(fā)布財(cái)報(bào)數(shù)據(jù)顯示,上季營(yíng)收加速增長(zhǎng)62%;再超華爾街預(yù)期。業(yè)界都比較振奮,英偉
    的頭像 發(fā)表于 11-20 11:36 ?1265次閱讀

    NVIDIA新聞:英偉達(dá)10億美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉達(dá)10億美元入股諾基亞 在當(dāng)?shù)貢r(shí)間10月28日,英偉達(dá)正式宣布將以10億美元入股諾基亞;據(jù)悉英偉
    的頭像 發(fā)表于 10-29 17:12 ?1716次閱讀

    英偉達(dá)推機(jī)器人“新大腦”,黃仁勛:人形機(jī)器人3年將普及

    英偉達(dá)行業(yè)資訊
    jf_15747056
    發(fā)布于 :2025年08月25日 18:01:33

    英偉達(dá)自研HBM基礎(chǔ)裸片

    電子發(fā)燒友網(wǎng)綜合報(bào)道,據(jù)臺(tái)媒消息,傳聞英偉達(dá)已開(kāi)始開(kāi)發(fā)自己的HBM基礎(chǔ)裸片,預(yù)計(jì)英偉達(dá)的自研HBM基礎(chǔ)裸片采用3nm工藝制造,計(jì)劃在2027年下半年進(jìn)行小批量試產(chǎn)。并且這一時(shí)間點(diǎn)大致對(duì)
    的頭像 發(fā)表于 08-21 08:16 ?2823次閱讀

    國(guó)家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問(wèn)題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉達(dá)算力芯片“追蹤定位”“遠(yuǎn)程關(guān)閉”技術(shù)已成熟。為維
    的頭像 發(fā)表于 07-31 13:56 ?2718次閱讀
    國(guó)家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    施耐德電氣與英偉達(dá)深化合作

    近日,施耐德電氣宣布與英偉達(dá)深化合作,旨在滿足市場(chǎng)對(duì)可持續(xù)、AI就緒基礎(chǔ)設(shè)施日益增長(zhǎng)的需求。
    的頭像 發(fā)表于 06-24 15:02 ?1239次閱讀

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近年來(lái),美國(guó)政府對(duì)華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。為保持在中國(guó)市場(chǎng)的競(jìng)爭(zhēng)力,英偉達(dá)推出了多款特供版GPU,以滿足政策限制下的市場(chǎng)需求
    發(fā)表于 05-27 00:03 ?4799次閱讀

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    據(jù)外媒報(bào)道,英偉達(dá)公司發(fā)布了一項(xiàng)通知稱,美國(guó)政府于9日告知英偉達(dá)公司;特供版的H20芯片出口到中國(guó)需要許可證,緊接著在14日又告知英偉
    的頭像 發(fā)表于 04-16 16:59 ?2097次閱讀

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開(kāi)展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺(tái)參考架構(gòu)(reference architecture)進(jìn)
    發(fā)表于 03-24 19:20 ?519次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    宣布在英偉達(dá) Grace Blackwell 平臺(tái)上實(shí)現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示了全棧EDA
    發(fā)表于 03-19 17:59 ?499次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會(huì)

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會(huì)上宣布,正在使用英偉達(dá) CUDA-X庫(kù)優(yōu)化其下一代半導(dǎo)體開(kāi)發(fā)解決方案。公司還在擴(kuò)大對(duì)英偉達(dá)Grace CPU架構(gòu)的支持,并將在2025
    的頭像 發(fā)表于 03-19 17:53 ?1313次閱讀