91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么歷代AMD顯卡在ROP單元數(shù)量上都非常保守?

lhl545545 ? 來源:快科技 ? 作者:流云 ? 2020-11-19 10:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)NVIDIA基于新一代Ampere安培架構(gòu)的GeForce RTX 30系列顯卡發(fā)布之時(shí),幾乎在所有玩家的內(nèi)心都默默的宣判了AMD的死刑。

因?yàn)榇饲霸诹?a target="_blank">處理器數(shù)量相同的情況下,同時(shí)代的NVIDIA顯卡性能是遠(yuǎn)強(qiáng)于AMD顯卡,就算是RDNA構(gòu)架也不能難幸免。RX 5700 XT無法戰(zhàn)勝擁有相同2560個(gè)流處理器數(shù)量的RTX 2070 Super,前者是7nm,后者是12nm。

新一代RTX 3090一上來就宣告擁有10496個(gè)流處理器,帶來的震撼可想而知!至于傳說中的RDNA2,很早之前大家就知道了,它最多擁有5120個(gè)流處理器。恐怕那時(shí)沒人會覺得RNDA2會威脅到RTX 3090,甚至RTX 3080都可以高枕無憂。

不過如同Zen3處理器帶給大家的震撼一樣,10月29日發(fā)布的RDNA2 GPU的實(shí)際性能表現(xiàn)幾乎超出了所有人的預(yù)料!

RDNA 2雖然是RDNA架構(gòu)的更新版本,并不是完全重新設(shè)計(jì)。但在RDNA原有的基礎(chǔ)上,RDNA2性能提升1倍,能效提升至少50%,ROP單元翻倍,完整支持DX12 Ultimate等技術(shù)特性,支持硬件光線追蹤。

可以發(fā)現(xiàn)整體布局沒有太大變化,當(dāng)然各個(gè)功能模塊都是調(diào)整優(yōu)化過的,而最突出的,一是增加了獨(dú)立的Infinity Cache高速緩存,二是在每個(gè)計(jì)算單元內(nèi)加入了專用的光追加速器Ray Accelerator。

至于RDNA 2架構(gòu)的底層細(xì)節(jié),比如說計(jì)算單元的變化,AMD這次沒有給出更多資料,只是簡單提到了幾點(diǎn),包括精簡TLB以降低延遲、重新設(shè)計(jì)32位像素流水線并支持HDR格式、優(yōu)化幾何分派與曲面細(xì)分、全方位精細(xì)時(shí)鐘門控、頻率樹分離與門控、最小化數(shù)據(jù)轉(zhuǎn)移、重新平衡流水線、高性能庫等等,但沒有任何圖示。

以下是RDNA2構(gòu)架新技術(shù)解析:

1、Smart Access Memory (SAM)顯存智取技術(shù)

在游戲運(yùn)行的時(shí)候,CPU是不能一次性訪問全部顯存的,比如RTX 3090有24GB顯存,而CPU只能訪問其中的256MB。于是有大量數(shù)據(jù)會回到內(nèi)存后給CPU處理器完成后再轉(zhuǎn)移到顯存,此時(shí)不僅浪費(fèi)了帶寬也造成了無謂的資源浪費(fèi)。

Smart Access Memory (SAM)可以讓搭載AMD 500系列芯片組在搭載Zen3 CPU和RDNA2 GPU的時(shí)候,讓Zen3 CPU可以完整訪問全部顯存,而且?guī)掃€是PCIe 4.0的速度,理論上最多可以讓游戲性能提升13%。

2、Ray Accelerator單元

在RDNA2構(gòu)架中,加入了硬件光追單元Ray Accelerator!與NVIDIA的完全專用RT Core相比,RDNA2的Ray Accelerator緊密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的現(xiàn)有HW。

這是AMD放出的RNA 2光追渲染效果圖,可以看到RDNA2實(shí)時(shí)光線追蹤效果與傳統(tǒng)光柵化渲染的差別。

AMD聲稱,相比于軟件方案,RDNA 2架構(gòu)的硬件加速光追性能,可以提升10倍之多,同時(shí)給出了部分游戲的實(shí)際性能,2K分辨率下《使命召喚:現(xiàn)代戰(zhàn)爭》可以跑出95FPS,《孤島危機(jī)重制版》可達(dá)90FPS,《戰(zhàn)地5》能有70FPS。

3、全局Infinity Cache

在大容量三級緩存的加持下,Zen3的IPC性能獲得了巨大的性能提升。如今AMD將這個(gè)理念帶入了GPU領(lǐng)域。

傳統(tǒng)的GPU構(gòu)架中,一般只有1.5~4MB的緩存,RDNA2除了4MB的L2緩存之外,還加入了128MB的全局Infinity Cache緩存,所有的CU單元均可以訪問。

AMD Infinity Cache 作為一個(gè)巨大的帶寬放大器,其有效帶寬可以達(dá)到256 位 16 Gbps GDDR6 顯存的 4 倍。在Infinity Cache的帶動(dòng)下,512GB/s帶寬的RX 6900 XT的性能表現(xiàn)足以媲美936GB/s帶寬的RTX 3090。

4、Fidelity FX超分辨率抗鋸齒技術(shù)

針對NVIDIA DLSS深度學(xué)習(xí)超采樣抗鋸齒技術(shù),AMD也提出了超分辨率(FidelityFX Super Resolution),簡稱FSR。目前這個(gè)技術(shù)正在開發(fā)中,不久之后會在新驅(qū)動(dòng)中提供支持

歷代AMD顯卡在ROP單元數(shù)量上都非常保守,最頂級型號的GPU最多就只有64個(gè)ROP。這一次AMD非常的激進(jìn),RX 6800 XT直接就配備了128個(gè)ROP,也是GPU歷史上第一款擁有128個(gè)ROP的顯卡。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20250

    瀏覽量

    252213
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5682

    瀏覽量

    139941
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11277

    瀏覽量

    224954
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    GM9-2003/D3000主板圖形適配方案:Ventoy啟動(dòng)與顯卡兼容性優(yōu)化指南

    在GM9-2003/D3000飛騰商務(wù)主板使用Ventoy工具安裝服務(wù)器系統(tǒng)時(shí),若搭配AMD R5 230顯卡,可能出現(xiàn)啟動(dòng)階段花屏現(xiàn)象;而切換至MTT S30顯卡則顯示正常。此問題
    的頭像 發(fā)表于 01-04 14:36 ?976次閱讀
    GM9-2003/D3000主板圖形適配方案:Ventoy啟動(dòng)與<b class='flag-5'>顯卡</b>兼容性優(yōu)化指南

    智能卡在門禁中的應(yīng)用

    智能卡在門禁中的應(yīng)用智能卡在門禁管理中通過內(nèi)置芯片實(shí)現(xiàn)安全認(rèn)證與權(quán)限控制,覆蓋身份識別、實(shí)時(shí)監(jiān)控、多功能集成等場景,顯著提升管理效率與安全性。智能卡(含IC卡、RFID卡等)通過非接觸式或接觸式認(rèn)證
    的頭像 發(fā)表于 12-19 13:58 ?340次閱讀
    智能<b class='flag-5'>卡在</b>門禁中的應(yīng)用

    IC卡在人員管理中的應(yīng)用

    IC卡在人員管理中的應(yīng)用IC卡在人員管理中通過身份識別、權(quán)限控制和數(shù)據(jù)記錄實(shí)現(xiàn)全流程數(shù)字化,核心價(jià)值在于提升管理效率、保障安全性并降低人工成本。一、身份識別與權(quán)限管控多場景身份核驗(yàn):員工IC卡作為
    的頭像 發(fā)表于 12-15 16:13 ?298次閱讀
    IC<b class='flag-5'>卡在</b>人員管理中的應(yīng)用

    AMD Vitis AI 5.1測試版現(xiàn)已開放下載

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元( NPU )的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編譯工具和部署 API,可在嵌入式平臺上實(shí)現(xiàn)可
    的頭像 發(fā)表于 11-08 09:24 ?1306次閱讀

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編譯工具和部署 API,可在嵌入式平臺上實(shí)現(xiàn)可
    的頭像 發(fā)表于 10-31 12:46 ?790次閱讀

    AMD Versal自適應(yīng)SoC使用QEMU+協(xié)同仿真示例

    Cortex A72 (QEMU) 運(yùn)行的固件進(jìn)行仿真,該固件會訪問當(dāng)前 AMD Vivado Design Suite 仿真中正在進(jìn)行仿真的 PL 中的 IP。本文將使用 Versal VCK190 和 Vivado 2024.2 來生成仿真環(huán)境。
    的頭像 發(fā)表于 08-06 17:21 ?1991次閱讀
    在<b class='flag-5'>AMD</b> Versal自適應(yīng)SoC<b class='flag-5'>上</b>使用QEMU+協(xié)同仿真示例

    使用AMD Vitis Unified IDE創(chuàng)建HLS組件

    這篇文章在開發(fā)者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 傳統(tǒng) IDE) 的基礎(chǔ)撰寫,但使用的是 AMD Vitis Unifie
    的頭像 發(fā)表于 06-20 10:06 ?2328次閱讀
    使用<b class='flag-5'>AMD</b> Vitis Unified IDE創(chuàng)建HLS組件

    基于AMD Versal器件實(shí)現(xiàn)PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不僅擁有比16nm性能更強(qiáng)的邏輯性能,并且其PS系統(tǒng)中的CPM PCIe也較上一代MPSoC PS硬核PCIe單元強(qiáng)大得多。本節(jié)將基于AMD官方開發(fā)板展示如何快速部署PCIe5x8
    的頭像 發(fā)表于 06-19 09:44 ?1829次閱讀
    基于<b class='flag-5'>AMD</b> Versal器件實(shí)現(xiàn)PCIe5 DMA功能

    主板顯卡的特點(diǎn)是什么?能用來干什么?

    在計(jì)算機(jī)硬件系統(tǒng)中,顯卡是負(fù)責(zé)處理和輸出圖像的關(guān)鍵組件。安裝在主板顯卡主要分為集成顯卡和獨(dú)立顯卡,它們各自具備獨(dú)特的特點(diǎn),并在不同場景下
    的頭像 發(fā)表于 05-22 09:21 ?1081次閱讀

    如何在Ubuntu 22.04安裝NVIDIA顯卡驅(qū)動(dòng)

    Ubuntu 22.04 安裝 NVIDIA 顯卡驅(qū)動(dòng)完整步驟
    的頭像 發(fā)表于 05-20 11:00 ?5370次閱讀

    FCX3的視頻流亂碼怎么解決?

    數(shù)據(jù)包。 因此,我們修改了傳感器的定時(shí)參數(shù),并按照 KBA231382 的建議將水平消隱最大化。 我們還增加了 DMA 緩沖區(qū)的數(shù)量。 然而,即使采用非常保守的數(shù)值,問題仍然存在,因
    發(fā)表于 05-16 07:32

    Windows11未檢測到FX3設(shè)備是什么原因?qū)е碌模?/a>

    大家好, FX3 設(shè)備在 AMD win11 系統(tǒng)無法檢測到,在 intel win11 系統(tǒng)可以檢測到。 在 AMD 系統(tǒng)檢測不到的
    發(fā)表于 05-15 07:49

    如何在Ubuntu安裝NVIDIA顯卡驅(qū)動(dòng)?

    專有顯卡驅(qū)動(dòng)。本文將詳細(xì)介紹在Ubuntu系統(tǒng)安裝NVIDIA顯卡驅(qū)動(dòng)的多種方法,幫助用戶根據(jù)自身情況選擇最適合的安裝方式。 二,硬件參數(shù) 平臺:PX22_GPU CPU:I7-1165G7
    的頭像 發(fā)表于 05-07 16:05 ?2488次閱讀
    如何在Ubuntu<b class='flag-5'>上</b>安裝NVIDIA<b class='flag-5'>顯卡</b>驅(qū)動(dòng)?

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細(xì)分享了RDNA 4架構(gòu)的設(shè)計(jì)理念、FSR 4
    的頭像 發(fā)表于 03-06 11:19 ?881次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從RDNA 4到FSR 4,<b class='flag-5'>AMD</b> GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    專訪AMD GPU教父王啟尚:卓越的RDNA 4架構(gòu),造就新一代性價(jià)比王者顯卡

    在今年CES大會上首次公布定位4K游戲的RadeonRX9070系列顯卡之后,AMD于2月28日再次舉辦發(fā)布會并宣布了RadeonRX9070系列的技術(shù)細(xì)節(jié)與售價(jià),其中RadeonRX9070首發(fā)
    的頭像 發(fā)表于 03-06 10:21 ?1152次閱讀
    專訪<b class='flag-5'>AMD</b> GPU教父王啟尚:卓越的RDNA 4架構(gòu),造就新一代性價(jià)比王者<b class='flag-5'>顯卡</b>