NVIDIA發(fā)明的具有主動電源管理系統(tǒng)的GPU,借助于人工智能技術(shù),在保證性能的前提下提供了更好的可靠性,并且可用于需要高度可靠性的計算場景中。
3D圖形顯卡在1999年NVIDIA公司推出GeForce 256時開始了其首次變革,這種硬件光影轉(zhuǎn)換技術(shù),極大的提高了計算機的圖像顯示性能,對游戲領(lǐng)域產(chǎn)生了重要的革命意義,同時也帶給了用戶極高的畫面真實感。
當前,圖形處理器已經(jīng)無處不在,GPU不再僅僅用于圖形應用,而是被廣泛用于密集計算操作的應用程序,包括人工智能、實時識別和自動駕駛等領(lǐng)域中。
就在2020年9月2日凌晨,NVIDIA發(fā)布了RTX30系列顯卡,分別為RTX3070、RTX3080和RTX3090,據(jù)悉,3070的性能比2080更強,價格確更加便宜,3080的性能是2080的兩倍,價格卻和2080一樣,而3090則支持8K 60幀光線追蹤。
而隨著人工智能芯片的興起,不僅僅是各種人工智能訓練需要借助于NVIDIA的圖形顯卡,NVIDIA也在嘗試將人工智能技術(shù)應用在GPU圖形處理單元中。在18年,NVIDIA發(fā)布了一款全新的AI芯片,它將價值10000美元的性能,塞進了一個售價僅為1299美元的小盒子,30W功耗就可以與1萬美元的工作站媲美。
無疑,這樣的技術(shù)對于AI芯片的功耗的要求非常高,因此需要電源控制器來最小化AI芯片的功率。為達此目的,NVIDIA在2020年2月13日發(fā)明了一項名為“指令和機器學習的能量特征有效地操作處理系統(tǒng)的技術(shù)”的發(fā)明專利(公開號:US 2020/0050920 A1),申請人為NVIDIA公司。
根據(jù)該專利目前公開的資料,讓我們一起來看看這項AI芯片的動態(tài)功率控制技術(shù)吧。
如上圖,為該專利中發(fā)明的AI芯片中主動電源管理控制系統(tǒng)的示意圖,系統(tǒng)100中包含有多個GPU(102),這些GPU通過數(shù)字通信總線與其他部件互相通信。在供電方面,這些GPU由配電網(wǎng)110供電,電源管理單元140監(jiān)視著配電網(wǎng)供給的電流,同時電源管理單元接受由并行處理器116發(fā)送的功率控制指令。
基于GPU當前的工作功率以及處理器所發(fā)送的信號,電源管理單元可以預測處理器在未來時段所需要的電量,并控制提供給GPU的電壓,以便于為GPU提供適當?shù)墓β?。這樣不僅可以保證GPU發(fā)揮穩(wěn)定的性能,同時也可以控制GPU的功耗,更重要的是,通過預先在需要高功率的時段來限制其功率,可以避免出現(xiàn)電流過載的情況,否則可能導致電路損壞或者電源過熱。
由此看來,電源管理模塊的預測工作是十分重要的,在NVIDIA的方案中,使用基于硬件的深度學習加速器對于深度神經(jīng)網(wǎng)絡進行加速,從而對處理器的功耗進行預測。

如上圖,為預測GPU功率的功率控制技術(shù)流程圖,首先,輸入功率監(jiān)視器采用ADC(數(shù)模轉(zhuǎn)換芯片)來對于提供給GPU的電源進行采樣,采樣包括輸入的電流以及電壓,并將采樣結(jié)果轉(zhuǎn)換為數(shù)字信號輸出。
其次,并行處理器接收預測功率信號的指令,這樣可以確定預測的GPU功率與當前功率之間的差值,在確定誤差之前,需要對預測功率進行縮放,以使其與當前功率處于正常的比例之中。
這種操作基于深度學習的方法,來更新自適應PID控制器,因為并行處理器的工作負載可以在短時間尺度上變化,因此,處理器可以主動控制輸入到GPU的電源,并根據(jù)并行處理器中的工作負載變化來優(yōu)化處理器的性能和功耗。

如上圖,為這種具有學習機制的實現(xiàn)主動電源管理技術(shù)的電路示意圖,其中電路400包括ADC(118)、濾波和縮放器電路420、狀態(tài)向量寄存器430、PID控制器440、電壓控制器450以及學習系統(tǒng)460。
該專利中特別提及,雖然處理器可以通過對于指令進行解析,來估計是否需要更高或者更小的功率,但是處理器可能并不知道通過執(zhí)行這種指定的指令具體需要消耗多少功率。
這就像一個長跑運動員,他可能大概知道在半程馬拉松比賽中可能會消耗多少卡路里的能量,但是通常無法預測小段路途中的具體卡路里能量消耗,因為具體的能量消耗與太多的因素關(guān)聯(lián),例如環(huán)境條件、溫度、實際速度以及自身體重等的變化。
所以,具體的電源使用情況還是取決于處理器的軟件指令的特定順序,盡管處理器可以預估消耗的功耗,并對GPU的功率進行大致的調(diào)整,但是由于制造工藝以及不同的計算任務,因此并不能精準的進行功耗控制。
以上就是NVIDIA發(fā)明的基于人工智能的芯片功耗控制系統(tǒng),這種具有主動電源管理系統(tǒng)的GPU智能芯片,在保證芯片性能的前提下具有更高的可靠性,因此可用于需要高度可靠性的計算環(huán)境,例如:數(shù)據(jù)種心、服務器環(huán)境等。此外,在目前較為火熱的智能駕駛領(lǐng)域中,這種方案不僅可以避免電流因為瞬間的下降而影響自動駕駛的通信信號,而且還可以通過實現(xiàn)更快的功率管理響應來改善車輛的功耗消耗。
關(guān)于嘉德
深圳市嘉德知識產(chǎn)權(quán)服務有限公司由曾在華為等世界500強企業(yè)工作多年的知識產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權(quán)法律理論和實務,在全球知識產(chǎn)權(quán)申請、布局、訴訟、許可談判、交易、運營、標準專利協(xié)同創(chuàng)造、專利池建設、展會知識產(chǎn)權(quán)、跨境電商知識產(chǎn)權(quán)、知識產(chǎn)權(quán)海關(guān)保護等方面擁有豐富的經(jīng)驗。
責任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
463文章
54054瀏覽量
466832 -
gpu
+關(guān)注
關(guān)注
28文章
5206瀏覽量
135595 -
AI
+關(guān)注
關(guān)注
91文章
40041瀏覽量
301699 -
人工智能
+關(guān)注
關(guān)注
1818文章
50134瀏覽量
265742
發(fā)布評論請先 登錄
面向xEV驅(qū)動+AI數(shù)據(jù)中心的功率封裝前瞻:芯片嵌入封裝與互聯(lián)技術(shù)的全景解析
面向AI/數(shù)據(jù)中心與EV驅(qū)動的芯片嵌入式面板級封裝技術(shù)路線的深度解析
電機驅(qū)動和控制技術(shù)解析
AI芯片冷卻技術(shù),正在成為關(guān)鍵
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導體芯片產(chǎn)業(yè)的前沿技術(shù)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽
AI 芯片浪潮下,職場晉升新契機?
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
ip6806芯片的詳細參數(shù)解析
AI芯片的動態(tài)功率控制技術(shù)解析
評論