91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

細品AMD的3D緩存技術(shù)

Linelayout ? 來源:電子工程專輯 ? 2023-01-30 16:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年P(guān)C行業(yè)的內(nèi)卷還在持續(xù),尤其AMDIntel的技術(shù)與產(chǎn)品競爭仍處于膠著狀態(tài)。AMD這邊的Zen 4架構(gòu)表現(xiàn)雖然未如預(yù)期,但這家公司的新年產(chǎn)品仍有不少亮點。

月初的CES上,AMD面向個人電腦發(fā)布的新款Ryzen 7000系列CPU中,繼續(xù)包含了采用3D V-Cache的型號,且相比去年多有強化。我們此前特別撰文談過3D V-Cache技術(shù)——簡而言之,這是一種增加處理器L3 cache的方案:將L3 cache單獨作為一片die(Extended L3 Die,以下簡稱L3D),以先進封裝的方式疊到原本的處理器die上方,大幅增加CPU的cache容量。

其實在去年的IEEE ISSCC上,AMD有進一步詳述3D V-Cache技術(shù)。這次我們也借著AMD的新品發(fā)布,來再度談?wù)勥@項給CPU堆cache的技術(shù)。

這次堆了更多的L3 cache

處理器采用更大的、在垂直方向疊起來的L3 cache,在PC市場上,是AMD于游戲用戶的殺手锏——隔壁Intel沒有用這項技術(shù)。所以3D V-Cache現(xiàn)階段還真是AMD在市場上差異化競爭的組成部分。不過我們此前也特別撰文提到過,面向個人電腦市場的CPU,堆L3 cache的價值并沒有那么大:主要價值都在游戲上,對其他PC應(yīng)用(比如生產(chǎn)力產(chǎn)經(jīng))甚至有負加成。

AMD本身也將這個系列的型號主要定位于游戲用戶,但這次發(fā)布的新品部分彌補了上代產(chǎn)品的不少短板。

7cc70126-9411-11ed-bfe3-dac502259ad0.png ?

CES上AMD發(fā)布了3款采用3D V-Cache的處理器:Ryzen 9 7950X3D、7900X3D和Ryzen 7 7800X3D。初代采用3D V-Cache的處理器就只有一款;這次AMD顯然是在初代試水之后,更看好這項技術(shù)了。

其中最高配的Ryzen 9 7950X3D為16核心。由于3D堆疊能讓L3 cache增多64MB,所以7950X3D的L3 cache總?cè)萘繛?28MB。值得一提的是,7950X3D核心睿頻達到了5.7GHz,與原本沒有堆3D V-Cache的7950X一樣;只不過基頻相比7950X降低了300MHz。

這一點之所以重要是因為,上代的5800X3D睿頻只有4.5GHz——這就讓5800X3D,在除游戲之外的其他絕大部分負載中,性能弱于原版5800X。堆疊cache,還是要讓核心部分付出代價的。這次睿頻沒降,也就不至于讓更依賴核心峰值性能的負載受到太多不良影響——雖然基頻還是略有下降的。

與此同時7950X3D標定的TDP為120W,PPT(Package Power Tracking)162W。這兩個標稱值還低于原版7950X的170W/230W,可能是因為基頻下降、全核睿頻相對不帶L3D的7950X更低、以及新增cache die容許略高的運行溫度。有一點格外值得一提,7950X3D這個處理器16個核心,按照Zen 4架構(gòu)是分成了兩個CCD(Core Complex Die)的——也就是兩片die,每片die有8個核心。

只有一片die是疊了L3D的:Lisa Su最早在發(fā)布會上展示的3D V-Cache處理器也是只在一片die上疊cache(上圖中左上的那片die),另一片仍然是普通的CCD die(右上那片die;下面較大的那片是I/O die)。沒有疊cache的CCD die上的核心才能用上最高頻率,而疊了3D V-Cache這邊的核心做不到全速運轉(zhuǎn)(或這片die的全核睿頻更受限制)。所以3D V-Cache依然對堆疊的那片L3D的處理器核心性能產(chǎn)生了少許影響。

基于這一點,AMD目前正在跟微軟合作進行Windows優(yōu)化,AMD芯片組驅(qū)動能夠識別不同的游戲,選擇更傾向于堆疊了L3D的CCD,還是更傾向于沒有疊cache的CCD。

另外兩個型號7900X3D和7800X3D,分別是12核心+128MB L3 cache,以及8核心+96MB L3 cache。在7800這個型號上,AMD今年只推了帶L3D的7800X3D,而沒有出不帶L3D的版本,所以沒法做規(guī)格上的直接比較了。

再有就是上代5800X3D是無法對核心做超頻的,這代的三顆處理器開始支持自動超頻PBO,以及使用Curve Optimizer;只不過仍然無法直接進行超頻操作。

7cfba872-9411-11ed-bfe3-dac502259ad0.png ? 7d253b60-9411-11ed-bfe3-dac502259ad0.png ?

AMD宣稱,Ryzen 9 7950X3D相比于Intel酷睿i9-13900K,在游戲中的表現(xiàn)領(lǐng)先13-24%;部分生產(chǎn)力應(yīng)用領(lǐng)先4-52%。不過從AMD此前給出第一方數(shù)據(jù)的可信度來說,這個數(shù)據(jù)還是僅供參考。而從此前5800X3D的游戲表現(xiàn)來看,這代處理器的1080p分辨率游戲表現(xiàn)應(yīng)該的確會相當不錯——非常值得期待。

3D V-Cache技術(shù)更大的服務(wù)場景應(yīng)該是面向服務(wù)器的Epyc處理器。去年AMD把3D V-Cache應(yīng)用到了挺多Epyc處理器上,從16-64核處理器都有。8個CCD的Epyc處理器,如果每個都疊上L3D,則處理器總共能堆出768MB的L3 cache——這個數(shù)字以前還真是不可想象。

3D緩存是早有“預(yù)謀”的

AMD暫時還沒有公布這幾顆芯片的售價。從去年的情況來看,3D V-Cache版本會比原版貴一些——最終售價對于用戶來說,基本就是在更多的核心數(shù)和更大的cache容量之間做抉擇,看你更愿意為SRAM買單,還是為邏輯電路買單了——這還真得看用戶購買CPU的真實用途在哪兒了,因為增大L3 cache容量呈現(xiàn)出了顯著的邊際遞減效應(yīng):增加cache命中率帶來的那點紅利,很多時候無法抵消延遲增加造成的不良影響。

從去年IEEE的技術(shù)匯報來看,半導(dǎo)體制造工藝雖然還在進步,但器件微縮主要體現(xiàn)在邏輯電路方向上,SRAM bitcell尺寸的縮減速度急劇放緩,尤其從臺積電N5到N3工藝,SRAM單元面積微縮幅度是5%。而且很快要大規(guī)模量產(chǎn)的N3E工藝,SRAM單元面積還要增大。這其實是技術(shù)發(fā)展過程中的桎梏。

3D V-Cache是符合這樣的時代發(fā)展主旋律的,也就是把SRAM往垂直方向去堆。而且這也增加了產(chǎn)品SKU的靈活性,畢竟很多應(yīng)用場景其實并不需要那么大的cache。AMD表示,在沒有增加橫向datapath距離的情況下就增加cache容量,保持動態(tài)低功耗和低延遲的同時,也縮減了封裝尺寸——節(jié)約的尺寸可以用來做其他事,比如說增加更多的核心。

7d45b976-9411-11ed-bfe3-dac502259ad0.jpg ?

3D V-Cache處理器總體包含三個組成部分,CCD(上圖最下層)、L3D(上層中間部分)和結(jié)構(gòu)支持die(兩側(cè)的die)。對AMD Zen架構(gòu)處理器有了解的同學應(yīng)該很清楚CCD是什么——現(xiàn)在的架構(gòu)中,大體上8個核心構(gòu)成一個CCD(如下圖),當然CCD內(nèi)部本身也是有L3 cache的。比如說原版Ryzen 9 7950X,兩片CCD總共配有64MB L3 cache。

7d67da1a-9411-11ed-bfe3-dac502259ad0.png ?

不過AMD在ISSCC上說,往CCD上面堆L3D并不是臨時起意。對于3D V-Cache的支持,無論是架構(gòu)上還是物理電路上,都是從此前Zen 3處理器設(shè)計之初就做好了準備的。也就是說從最初設(shè)計CCD、還沒有向市場推出3D V-Cache版本的處理器之時,CCD上面就預(yù)留了必要的邏輯電路以及TSV(硅通孔)信號pad。這就極大地節(jié)省了NRE成本、減少了掩膜組數(shù)量,簡化了整體的chiplet設(shè)計。

換句話說,Zen 3架構(gòu)的CCD原生就支持L3D擴展,包括TSV柱。AMD表示這種預(yù)留會對面積造成大約4%的影響——也就是需要額外4%的面積。

往上疊加的L3D這片die,制造工藝和CCD是一樣的。Wikichip在分析文章中提到,L3D內(nèi)部有13層銅層,和1層鋁層。L3D的確就是純粹的cache die。在Zen 3架構(gòu)那一代(即Ryzen 5000系列,臺積電N7工藝),L3D總共64MB SRAM,面積41mm2。

7d7d6fba-9411-11ed-bfe3-dac502259ad0.png

來源:Wikichip

L3D疊在上層,剛好覆蓋差不多一半的CCD;L3D僅位于CCD部分的L2/L3 cache區(qū)域上方——因為cache區(qū)域的功率密度相對更低,則 3D堆疊產(chǎn)生的散熱影響會相對更小一些。CCD上面的L3 cache設(shè)計為16-way set associative;總共8個切片,每片4MB。L3D也是這種設(shè)定。

所以L3D也是8個切片,每片包含8MB數(shù)據(jù),和816KB的tags/LRU。上一代的5800X3D因此就有了總共96MB L3 cache。AMD提供的數(shù)據(jù)是,新增堆疊的L3 cache,只會有增多4個周期的延遲。

除了CCD和疊在上面的L3D之外,還有做結(jié)構(gòu)支持的die——在L3D旁邊,也就是相對的位于下層CCD的處理器核心區(qū)域上方。這是一種物理結(jié)構(gòu)上的輔助設(shè)計,主要是在鍵合(bonding)過程中;與此同時也作為CPU die的散熱通道:結(jié)構(gòu)支持die需要在Z軸達成高度的匹配,畢竟最終封裝的散熱頂蓋也需要與die做到充分接觸。

還有機會再往上疊

AMD說L3D的設(shè)計是往高密度、低功耗的方向走的。實際在Zen 2走向Zen 3架構(gòu)的時候,AMD就為處理器選擇了高密度SRAM bitcell(而非高電流單元)。如此一來,每個核心分配到的L3 cache切片容量就更大,同時保持die面積可控。

L3D則用了高密度的8T SRAM bitcell,有功耗方面的紅利。其他縮減功耗的特性還包括用更高Vt的器件、floating bitline,以及一些電源門控技術(shù)。

Zen 2到Zen 3架構(gòu)變化過程中,每個CCX(core complex)的核心數(shù)翻番到8個,則核間通訊架構(gòu)就需要重做。Zen 2時代,CCX內(nèi)部的核心數(shù)還沒有這么多,所以采用crossbar型核間通訊。到了Zen 3,Wikichip在剖析文章里提到,由于核心數(shù)增多,所以核間通訊改用ring bus雙向環(huán)形總線。Zen 3每個CCD的L3 cache是32MB(不加L3D的情況下),分成8個切片(每核心4MB),也就是8 stops。

在新增L3D以后,每核心可分配到的L3 cache增大至12MB,仍然是雙向環(huán)形總線(64MB L3D,每個切片8MB——加上原本CCD上每個切片4MB,也就是每個stop 12MB)。

有關(guān)供電的詳情,由于篇幅原因不做贅述。有興趣的讀者可以去看一看Wikichip的分析。簡單來說,CCD有三種主要供電軌,RVdd——用于L3 cache logic;Vdd是為核心供電的;VddM針對L2和L3數(shù)據(jù)bitcell做門控供電。

7db34356-9411-11ed-bfe3-dac502259ad0.jpg ?

這里再談一下Hybrid Bonding混合鍵合。3D V-Cache的3D堆疊采用的是Hybrid Bonding方案,此前初代產(chǎn)品在做宣傳的時候,很多同學就應(yīng)該已經(jīng)知道了。這在高性能處理器上應(yīng)該是Hybrid Bonding的首個應(yīng)用。這種混合鍵合能夠把兩片wafer或者兩片die鍵合到一起,而且是直接的銅到銅——電介質(zhì)到電介質(zhì)的互聯(lián),而不用microbump。

7dd24e0e-9411-11ed-bfe3-dac502259ad0.jpg

來源:GlobalFoundries

具體到臺積電的技術(shù),用的SoIC工藝的F2B(face-to-back)鍵合。封裝時,CCD本身面朝下,以C4介面面向substrate;CCD的背面通過薄化(thinned down)露出TSV;然后L3D die同樣面朝下,混合鍵合到CCD上;最后把結(jié)構(gòu)支持die鍵合上去。就微觀層面來看,L3D的M13金屬層通過BPV(Bond Pad Via)連接到BPM(Bond Pad Metal)上。

AMD說,3D V-Cache應(yīng)用的SoIC封裝能夠做到最小9μm的TSV間距。這種較小的間距,本來也就是Hybrid Bonding的優(yōu)勢所在,此前電子工程專輯談先進封裝工藝的文章詳細闡述過。不過TechInsights的逆向工程顯示,Zen 3架構(gòu)的這代產(chǎn)品TSV間距是17μm。理論上最新發(fā)布且采用了新制造工藝的Ryzen 7000系列3D V-Cache新品應(yīng)該進一步讓這個間距下降了。

Hybrid Bonding本身包括低電阻之類的優(yōu)勢就不多談了,畢竟也還算知名;顯著更小的互聯(lián)間距才是其相比其他方案的真正優(yōu)勢。

最后值得一說的是,臺積電的F2B SoIC這套方案是完全可重復(fù)操作的。也就是說L3D本身的背面可以再做一次這樣的鍵合。那么理論上就能再往上堆L3D了。而且Wikichip認為,操作上所需的改動并不大——只不過需要供電方面的一些調(diào)整,供電到疊層上方,以及一些Die-to-Die信號的額外邏輯電路。

還是那句話,雖說就個人電腦來說,再增大L3 cache對于絕大部分非游戲類應(yīng)用而言并沒有太大價值,甚至產(chǎn)生副作用;但當應(yīng)用方向明確為存儲敏感型的,那么大cache就會非常有價值。

想必新發(fā)布的三款采用了3D V-Cache的處理器,能夠在新一年的游戲應(yīng)用上大殺四方了。等產(chǎn)品發(fā)布時,可以看看它們與酷睿i9-13900K的對比結(jié)果,畢竟這代酷睿處理器也大幅增加了cache容量,而且核心數(shù)和頻率都提高了。而且在游戲設(shè)定更高分辨率時,3D V-Cache的優(yōu)勢可能逐漸消失。當然對Epyc客戶而言,關(guān)注點可能又不同了。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252330
  • CCD
    CCD
    +關(guān)注

    關(guān)注

    32

    文章

    905

    瀏覽量

    149391
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5684

    瀏覽量

    139979
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11279

    瀏覽量

    225017
  • cache技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    1366

原文標題:當CPU三級緩存堆到768MB時:細品AMD的3D緩存

文章出處:【微信號:IC大家談,微信公眾號:IC大家談】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    常見3D打印材料介紹及應(yīng)用場景分析

    3D打印材料種類豐富,不同材料性能差異明顯。本文介紹PLA、ABS、PETG等常見3D打印材料的特點與應(yīng)用場景,幫助讀者了解3D打印用什么材料更合適,為選材提供基礎(chǔ)參考。
    的頭像 發(fā)表于 12-29 14:52 ?623次閱讀
    常見<b class='flag-5'>3D</b>打印材料介紹及應(yīng)用場景分析

    簡單認識3D SOI集成電路技術(shù)

    在半導(dǎo)體技術(shù)邁向“后摩爾時代”的進程中,3D集成電路(3D IC)憑借垂直堆疊架構(gòu)突破平面縮放限制,成為提升性能與功能密度的核心路徑。
    的頭像 發(fā)表于 12-26 15:22 ?592次閱讀
    簡單認識<b class='flag-5'>3D</b> SOI集成電路<b class='flag-5'>技術(shù)</b>

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅 在電子工程師的日常工作中,評估和開發(fā)磁傳感器是一項常見且重要的任務(wù)。英飛凌(Infineon
    的頭像 發(fā)表于 12-18 17:15 ?835次閱讀

    半導(dǎo)體“HBM和3D Stacked Memory”技術(shù)的詳解

    3D Stacked Memory是“技術(shù)方法”,而HBM是“用這種方法解決特定問題的產(chǎn)品”。
    的頭像 發(fā)表于 11-07 19:39 ?6136次閱讀
    半導(dǎo)體“HBM和<b class='flag-5'>3D</b> Stacked Memory”<b class='flag-5'>技術(shù)</b>的詳解

    京東11.11直播技術(shù)全面升級,立影3D技術(shù)、JoyAI大模型重構(gòu)沉浸式購物體驗

    隨著京東 11.11 大促的火熱進行,京東直播再度升級技術(shù)布局,以 “立影 3D 技術(shù)”“JoyAI大模型”等創(chuàng)新技術(shù),打破傳統(tǒng)直播邊界,為用戶帶來更具沉浸感、趣味性的購物體驗,引領(lǐng)直
    的頭像 發(fā)表于 10-27 14:58 ?626次閱讀

    微納尺度的神筆——雙光子聚合3D打印 #微納3D打印

    3D打印
    楊明遠
    發(fā)布于 :2025年10月25日 13:09:29

    技術(shù)資訊 I 圖文詳解 Allegro X PCB Designer 中的 3D 模型映射

    本文要點面對市面上的一切要將PCB板放進一個盒子里的產(chǎn)品的設(shè)計都離不開3D模型映射這個功能,3D協(xié)同設(shè)計保證了產(chǎn)品的超薄化、高集成度的生命線;3D模型映射將PCB設(shè)計從傳統(tǒng)的二維平面拉入了三維立體
    的頭像 發(fā)表于 10-17 16:16 ?1670次閱讀
    <b class='flag-5'>技術(shù)</b>資訊 I 圖文詳解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> 模型映射

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學習如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 在日常的 PCB 設(shè)計中,我們大部分
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    視覺傳感器對于機器信息獲取至關(guān)重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺能力,從而推動創(chuàng)新應(yīng)用。3D 視覺解決方案大致分為立體視覺、結(jié)構(gòu)光和飛行時間 (TOF)
    發(fā)表于 09-05 07:24

    索尼與VAST達成3D業(yè)務(wù)合作

    近日,索尼空間現(xiàn)實顯示屏與VAST旗下的3D大模型Tripo AI正式宣布達成業(yè)務(wù)合作:雙方將圍繞裸眼3D顯示技術(shù)、AI驅(qū)動的3D內(nèi)容生成與交互創(chuàng)新展開深度協(xié)同,致力于通過索尼空間現(xiàn)實
    的頭像 發(fā)表于 08-28 17:32 ?1432次閱讀

    AD 3D封裝庫資料

    ?AD ?PCB 3D封裝
    發(fā)表于 08-27 16:24 ?7次下載

    3D打印能用哪些材質(zhì)?

    3D打印的材質(zhì)有哪些?不同材料決定了打印效果、強度、用途乃至安全性,本文將介紹目前主流的3D打印材質(zhì),幫助你找到最適合自己需求的材料。
    的頭像 發(fā)表于 07-28 10:58 ?3803次閱讀
    <b class='flag-5'>3D</b>打印能用哪些材質(zhì)?

    多芯粒2.5D/3D集成技術(shù)研究現(xiàn)狀

    面向高性能計算機、人工智能、無人系統(tǒng)對電子芯片高性能、高集成度的需求,以 2.5D3D 集成技術(shù)為代表的先進封裝集成技術(shù),不僅打破了當前集成芯片良率降低、成本驟升的困境,也是實現(xiàn)多種
    的頭像 發(fā)表于 06-16 15:58 ?1828次閱讀
    多芯粒2.5<b class='flag-5'>D</b>/<b class='flag-5'>3D</b>集成<b class='flag-5'>技術(shù)</b>研究現(xiàn)狀

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢,本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?2448次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)