高通在2021年投資者大會(huì)上宣布下一代CPU將由收購(gòu)的Nuvia團(tuán)隊(duì)設(shè)計(jì),預(yù)計(jì)2023年有樣品可以交付大客戶,目標(biāo)市場(chǎng)針對(duì)Windows PC市場(chǎng),也就是筆記本電腦市場(chǎng),并且將擴(kuò)展到移動(dòng)、汽車和數(shù)據(jù)中心領(lǐng)域。
從高通第四代座艙芯片開(kāi)始,高通車載芯片也不再沿用手機(jī)芯片的設(shè)計(jì)。高通座艙芯片與高通筆記本電腦芯片的設(shè)計(jì)開(kāi)始非常近似,因?yàn)檐囕d芯片與筆記本電腦芯片的需求基本一致,即追求多核性能而非像手機(jī)那樣追求單核性能。早期手機(jī)也是看重多核性能,隨著短視頻和手機(jī)游戲的爆發(fā),大部分人都是抱著手機(jī)劃來(lái)劃去幾個(gè)小時(shí),這時(shí)候單核性能重要性便得以凸顯,手機(jī)從4大核加4小核改變?yōu)榻裉斓?個(gè)超大核加3個(gè)大核加4個(gè)小核,或者再加幾個(gè)中核。手機(jī)領(lǐng)域的設(shè)計(jì)在車載領(lǐng)域顯得有些不合時(shí)宜了,因此第四代的典型代表SA8295P與高通筆記本電腦領(lǐng)域的8cx Gen 3很接近,這樣做主要是車載領(lǐng)域出貨量相比筆記本電腦和手機(jī)都太低了,為車載領(lǐng)域做一款全新的芯片,會(huì)導(dǎo)致每顆芯片上分?jǐn)偟某杀咎?,采用高通芯片的筆記本電腦已經(jīng)不少,甚至包括了高通的對(duì)手華為,華為的海外版MateBook E Go就采用了8cx Gen3,微軟稱8cx Gen3為SQ3,即Surface Pro 9。

8cx?Gen3型號(hào)為SC8280XP,從中不難看出SC8280XP與SA8295P驅(qū)動(dòng)幾乎完全一致,應(yīng)該差別很小,二者的推出時(shí)間差不多也接近,都是2021年4季度。同時(shí)SA8295P還有可能取代第一代高通Ride中的SA8540P,SA8540P與SA8195P接近。8cx Gen3有兩個(gè)版本,一個(gè)帶5G Modem,一個(gè)不帶,華為的MateBook E Go就是不帶5G Modem的版本。GPU也有Adreno 695和Adreno 690兩個(gè)版本。
大膽推測(cè),8cx Gen4與高通第五代車載芯片重合度也會(huì)比較高,估計(jì)在量產(chǎn)車上使用要到2026或2027年以后了。為何會(huì)拋棄ARM,主要還是ARM擠牙膏擠得讓高通受不了了,ARM架構(gòu)與蘋果的差距讓高通的手機(jī)和筆記本電腦都無(wú)法超越蘋果。
ARM目前最頂級(jí)架構(gòu):Cortex-X3微結(jié)構(gòu)

圖片來(lái)源:ARM
蘋果自A14起大核心Firestorm架構(gòu)

圖片來(lái)源:Apple
蘋果微架構(gòu)的中后端

圖片來(lái)源:Apple
ARM目前最頂級(jí)架構(gòu)Cortex-X3與蘋果的A系列和M系列差距非常明顯。

圖片來(lái)源:Geekbench
單核跑分對(duì)比,蘋果的優(yōu)勢(shì)非常明顯。為何蘋果如此之強(qiáng)?關(guān)鍵在于其IPC(每周期執(zhí)行指令數(shù))也就是圖中的解碼器是8個(gè),即一個(gè)周期能執(zhí)行8條指令。而ARM的Cortex-X3是6個(gè)解碼器。另一個(gè)關(guān)鍵點(diǎn)是緩存大小。

圖片來(lái)源:各公司
從上表不難看出ARM擠牙膏的過(guò)程就是不斷增加解碼器寬度和L1/L2緩存容量。而蘋果自A14后一步到位,徹底碾壓ARM。并非ARM沒(méi)有能力一步到位,主要還是ARM要配合手機(jī)芯片廠家每年一升級(jí),每年一換機(jī),性能不能一步到位,否則吸引不了消費(fèi)者換機(jī)了。而蘋果的粉絲忠實(shí)度極高,即使蘋果沒(méi)有明顯提升性能,蘋果也能讓粉絲換機(jī)。

圖片來(lái)源:WikiChip
而對(duì)亂序執(zhí)行影響比較大的指令重新排序緩沖區(qū)(Re-Order Buffer, ROB),F(xiàn)irestorm有640條,X3只有320條,A78只有256條。蘋果的超強(qiáng)性能也有代價(jià),那就是對(duì)晶體管密度要求高,必須用最先進(jìn)的工藝,因此蘋果需要和臺(tái)積電合作,讓臺(tái)積電為其做出最先進(jìn)的工藝,達(dá)到最高的晶體管密度,臺(tái)積電開(kāi)價(jià)自然不低,這也是臺(tái)積電營(yíng)業(yè)利潤(rùn)率碾壓蘋果的原因。ARM對(duì)先進(jìn)工藝的迫切程度低于蘋果。
蘋果有沒(méi)有缺點(diǎn)?當(dāng)然有。

圖片來(lái)源:Anand Tech
上圖是蘋果M1的die shot,可以看出CPU占用面積很大,比一般ARM要大得多,沒(méi)辦法,蘋果的緩存太大,為性能不得不做大緩存,GPU面積也略大,GPU的效率肯定比不上高通的Adreno或AMD,這樣就使得NPU不可能做太高,而高通的DSP做AI算力驚人,8 Gen1就有29TOPS,而蘋果的M2才15.8TOPS。

圖片來(lái)源:ARM
ARM 2023與2024路線圖,估計(jì)2024年推出的CXC24(可能會(huì)叫Cortex-X5)會(huì)采用7位解碼器,且必須配合3納米制造工藝,即便是X5和蘋果的Firestorm也有差距,換句話說(shuō),ARM落后蘋果4-5年。因此高通等不及了,決定自研架構(gòu),這就是高通2021年1月收購(gòu)的Nuvia。
Nuvia由三位蘋果前高管創(chuàng)立,他們分別是威廉姆斯(Gerard Williams III)、古拉蒂(Manu Gulati)和布魯諾(John Bruno)。這三位創(chuàng)始人都曾在蘋果工作過(guò),且在iPhone芯片部門擔(dān)任過(guò)高管職務(wù),擁有超過(guò)20年的半導(dǎo)體工程經(jīng)驗(yàn),迄今已獲得100多項(xiàng)專利。其中:
威廉姆斯曾擔(dān)任蘋果CPU和A系列SoC首席設(shè)計(jì)師,九年期間幾乎負(fù)責(zé)了蘋果所有芯片的研發(fā),包括Cyclone、Typhoon、Twister、Hurricane、Monsoon和Vortex等架構(gòu)。他于2019年初離開(kāi)蘋果公司。除了蘋果經(jīng)歷,另外兩位創(chuàng)始人還在谷歌工作過(guò)。
古拉蒂曾在AMD和谷歌從事芯片研究,且在蘋果公司工作了八年,從事移動(dòng)端SoC的開(kāi)發(fā)。
布魯諾曾在谷歌從事芯片研究工作,2012年加入蘋果公司,并在芯片平臺(tái)架構(gòu)小組工作了五年多。
2019年2月,三人在美國(guó)加州圣克拉拉郡(Santa Clara)聯(lián)合創(chuàng)立Nuvia。
2019年11月15日,Nuvia宣布完成5300萬(wàn)美元的A輪融資,由著名的硅谷投資者Capricorn Investment Group和戴爾技術(shù)資本領(lǐng)投,Mayfield、WRVI Capital以及Nepenthe LLC參投。
加上2020年9月官宣完成的2.4億美元的B輪融資,Nuvia兩輪總募集資金達(dá)到2.93億美元。
2021年1月高通以14億美元收購(gòu)了Nuvia。
2022年ARM起訴高通,主要是針對(duì)Nuvia,不過(guò)近期似乎兩者已達(dá)成了和解,官司即使贏了,也打壓不了高通另起爐灶的心,反而堅(jiān)定了高通走獨(dú)立研發(fā)架構(gòu)的決心,輸了對(duì)ARM自然也是不利,對(duì)高通來(lái)說(shuō),贏了也和長(zhǎng)期合作伙伴ARM關(guān)系不再和睦,輸了意味著14億美元可能打水漂了。因此兩家可能秘密和解了。
我們大致知道8cx?Gen4的基本情況:
l8 performances cores - 3.4 GHz peak clock speed
l4 efficiency cores - 2.5 GHz peak clock speed(標(biāo)稱速率2.34GHz)
lAdreno 740 GPU(現(xiàn)在手機(jī)旗艦8Gen 2也用這個(gè)GPU,2.14TFLOPS)
lHexagon Tensor NPU (45 TOPS)
l36 MB L2 cache
l8 MB L3 cache
l12 MB system-level cache
l4 MB GPU cache
8個(gè)大核心每核心的L2緩存估計(jì)是4MB,4個(gè)小核心是1MB,性能比現(xiàn)在的SA8295P要強(qiáng)很多,SA8295P的大核心估計(jì)每核心的L2緩存也只有1MB。至于Nuvia Phoenix的架構(gòu),高通從未透露過(guò),只能推測(cè)大概像蘋果那樣,8個(gè)大核心類似Firestorm,小核心類似Icestorm,將采用4納米工藝制造,3納米還太貴,3納米用在出貨量上億的手機(jī)領(lǐng)域更合適。不過(guò)不管硬件如何演進(jìn),ARM的指令集誰(shuí)也無(wú)法繞開(kāi),ARM建立了強(qiáng)大的生態(tài)系統(tǒng),這個(gè)系統(tǒng)的核心就是ARM指令集,無(wú)論是蘋果、英偉達(dá)還是高通,都繞不開(kāi)。
高通即將在2023年推出的8Gen3旗艦手機(jī)芯片預(yù)計(jì)還是會(huì)采用ARM架構(gòu),臺(tái)積電4納米工藝N4P制造,超大核心是Cortex-X4,中核心是2個(gè)Cortex-A520,小核心是5個(gè)Cortex-A720。2024年推出的旗艦手機(jī)芯片8Gen 4也會(huì)采用Nuvia的架構(gòu),不過(guò)是2大核心(性能核)加6小核心(效率核),將采用臺(tái)積電的N3E即第二代3納米工藝制造。
8cx Gen4的AI算力很高,有45TOPS,幾乎是蘋果M2的3倍,對(duì)筆記本電腦來(lái)說(shuō),AI算力沒(méi)什么作用,蘋果一直都沒(méi)有增加AI算力的打算,從M1到M2再到M2 Pro,AI算力一直都是15.8TOPS,但車載就不一樣了,多多益善。高通第一代艙駕合一或者說(shuō)中央計(jì)算芯片SA8295P的AI算力是60TOPS,估計(jì)第二代能到100-120TOPS,第五代座艙至少也是45TOPS,是目前SA8295P的1.5倍。
對(duì)國(guó)內(nèi)芯片廠家來(lái)說(shuō),想徹底拋棄ARM恐怕還難以做到,如何面對(duì)高通的競(jìng)爭(zhēng),只能用ARM的服務(wù)器系列芯片與之對(duì)抗。
編輯:黃飛
?
電子發(fā)燒友App


















評(píng)論