RTX 30顯卡的在線發(fā)布會(huì)上有一個(gè)細(xì)節(jié)特別引人矚目,那就是公布了一個(gè)名為TFLOPS的數(shù)據(jù)時(shí),如果大家收看的視頻有彈幕,一定馬上就會(huì)彈幕爆炸了。這個(gè)參數(shù)到底是啥?為什么讓大家那么關(guān)注呢?咱們今天就來(lái)說(shuō)說(shuō)吧。
TFLOPS是Tera和Floating-point operations per second詞組的組合,后者的意思是每秒浮點(diǎn)運(yùn)算次數(shù),Tera則是萬(wàn)億的意思,合起來(lái)就是每秒浮點(diǎn)運(yùn)算多少萬(wàn)億次。因?yàn)楝F(xiàn)在的圖像是分成像素點(diǎn)來(lái)處理的,每個(gè)點(diǎn)的色彩都要進(jìn)行浮點(diǎn)運(yùn)算,然后組合成一幅圖片,所以這個(gè)參數(shù)就說(shuō)明了顯卡或者GPU每秒能處理多少個(gè)像素點(diǎn)。
它的基礎(chǔ)就來(lái)自現(xiàn)在的GPU設(shè)計(jì),目前的GPU都是由很多小處理核心或者叫流處理器組成,這個(gè)核心比處理器核心簡(jiǎn)單得多,每個(gè)時(shí)鐘周期只負(fù)責(zé)處理一個(gè)浮點(diǎn)數(shù)據(jù),所以總的浮點(diǎn)運(yùn)算次數(shù)就是核心數(shù)量×?xí)r鐘周期了。又因?yàn)楝F(xiàn)在的核心可以一次性處理一個(gè)雙精度浮點(diǎn)數(shù)據(jù),它相當(dāng)于兩個(gè)最基礎(chǔ)的單精度浮點(diǎn)數(shù)據(jù),所以再×2就得到了GPU的浮點(diǎn)運(yùn)算次數(shù)。
回過(guò)頭來(lái)看看這個(gè)參數(shù)對(duì)游戲有啥意義。在分辨率確定后,每一幅畫(huà)面的像素點(diǎn)數(shù)量也就確定了,那么每秒處理的像素點(diǎn)越多,實(shí)際上每秒能處理的畫(huà)面數(shù)量當(dāng)然就越多。這說(shuō)明了啥?當(dāng)然就是游戲的幀速(每秒畫(huà)面數(shù))越高啦。沒(méi)錯(cuò),對(duì)使用同一代特別是同一核心的顯卡,算出它的浮點(diǎn)運(yùn)算能力,基本就了解游戲速度了。

不過(guò)對(duì)于不同代甚至不同架構(gòu)的GPU,這種對(duì)比就不合適了,比如RTX 3080擁有兩倍于RTX 2080 Ti的浮點(diǎn)運(yùn)算次數(shù),幀速能達(dá)到RTX 2080 Ti的兩倍嗎?從之前的測(cè)試大家就知道,當(dāng)然不是這樣。

這就牽扯出了另一個(gè)問(wèn)題,也就是核心的效率,因?yàn)檎l(shuí)也不能保證所有的核心或者流處理器能一直滿載、有效運(yùn)行,它的實(shí)際發(fā)揮還要考慮到前端的分配、后端的合成、顯存數(shù)據(jù)等單元的配合,所以設(shè)計(jì)不同的架構(gòu)下,按照最理想情況算出的浮點(diǎn)運(yùn)算次數(shù)能發(fā)揮多少也是不同的。
RTX 30還有所不同,因?yàn)樗鼘?shí)際上是讓每個(gè)核心中的整數(shù)運(yùn)算單元也參加浮點(diǎn)運(yùn)算,造成了“理論”運(yùn)算能力翻倍、但因?yàn)楦傻氖欠菍I(yè)工作,整數(shù)單元的浮點(diǎn)運(yùn)算效率肯定趕不上專業(yè)的浮點(diǎn)運(yùn)算單元,再加上前端的數(shù)據(jù)分配能力、顯存帶寬啥的沒(méi)有跟著翻倍,所以效率大幅下降,最終我們可以看到,翻倍的浮點(diǎn)運(yùn)算能力帶來(lái)的只是不到40%的實(shí)際幀速提升。

既然同一個(gè)廠家在架構(gòu)上的改動(dòng)都會(huì)造成浮點(diǎn)運(yùn)算能力的實(shí)際發(fā)揮,AMD和NV這種相差更遠(yuǎn)的架構(gòu)就別提了,比如RX 6800系列用了比較特殊的架構(gòu)設(shè)計(jì),就以遠(yuǎn)低于RTX 3080/3070的浮點(diǎn)運(yùn)算能力,得到了能抗衡甚至壓制它們的性能。
編輯:hfy
-
amd
+關(guān)注
關(guān)注
25文章
5690瀏覽量
140038 -
gpu
+關(guān)注
關(guān)注
28文章
5200瀏覽量
135534 -
顯卡
+關(guān)注
關(guān)注
16文章
2521瀏覽量
71527
發(fā)布評(píng)論請(qǐng)先 登錄
微軟新主機(jī)GPU性能公布 略低于目前最強(qiáng)游戲顯卡GeForce RTX 2080 Ti
NVIDIA發(fā)布RTX 30系列顯卡,支持PCle 4.0功能
NVIDIA正式發(fā)布GeForce RTX 30系列顯卡!
英偉達(dá)RTX 30系列顯卡,售價(jià)不到RTX 2080 Ti的一半
RTX 30顯卡細(xì)節(jié)公布 TFLOPS是什么參數(shù)
評(píng)論