人工智能(AI)近年來已廣泛應(yīng)用,并迅速成為一項具有變革性的技術(shù)。AI依托于機(jī)器學(xué)習(xí)(ML)算法,而這些算法需要強(qiáng)大的計算能力。傳統(tǒng)上,開發(fā)者們依賴圖形處理器(GPU)來運(yùn)行這些ML算法。GPU最初為圖形渲染而設(shè)計,但已證明在執(zhí)行人工智能所需的矩陣和向量運(yùn)算方面非常有效。然而,AI硬件領(lǐng)域的格局正在經(jīng)歷巨大變革。計算需求的日益復(fù)雜和對能效提升的需求促使一些專注于特定領(lǐng)域AI處理器的初創(chuàng)公司涌現(xiàn)。這些公司開發(fā)的AI處理器針對ML算法進(jìn)行了架構(gòu)優(yōu)化,與通用GPU相比,它們的性能功耗比顯著提高。
隨著AI技術(shù)的不斷發(fā)展,對更強(qiáng)計算能力和更高能效的需求將持續(xù)上升。根據(jù)Semianalysis的分析,預(yù)計到2028年,AI數(shù)據(jù)中心的電力需求將超過非AI數(shù)據(jù)中心,占全球數(shù)據(jù)中心總電力消耗的一半以上,而目前這一比例還不到20%。

▲圖1AI數(shù)據(jù)中心和非AI數(shù)據(jù)中心的電力需求
數(shù)據(jù)中心行業(yè)正在努力減輕電力負(fù)荷,逐步摒棄傳統(tǒng)的空氣冷卻方式,轉(zhuǎn)而采用成本較高但效果顯著的液冷技術(shù)。然而,單靠外部冷卻技術(shù)的進(jìn)步遠(yuǎn)遠(yuǎn)不夠。為了應(yīng)對不斷攀升的電力需求,人工智能硬件開發(fā)商還需在系統(tǒng)設(shè)計層面進(jìn)行創(chuàng)新,深入挖掘全面的電力優(yōu)化策略。
新思科技Foundation IP如何推動低功耗開發(fā)
在設(shè)計系統(tǒng)級芯片(SoC)時,開發(fā)者可以在設(shè)計的不同階段,包括架構(gòu)層次、實(shí)現(xiàn)層次以及底層技術(shù)層次,進(jìn)行功耗優(yōu)化。新思科技Foundation IP能夠助力開發(fā)者針對這些關(guān)鍵領(lǐng)域進(jìn)行優(yōu)化。SoC的功耗主要源于電路切換引起的動態(tài)功耗以及漏電(或稱靜態(tài))功耗。動態(tài)功耗在處理器執(zhí)行指令任務(wù)時產(chǎn)生,與CV2f成正比,這里的C代表開關(guān)電容,V為工作電壓,f是電路時鐘頻率。無論處理器處于空閑還是活躍狀態(tài),漏電功耗都會發(fā)生,并且隨閾值電壓、晶體管尺寸和溫度而變化。在架構(gòu)層面,通過采用電源門控、動態(tài)電壓頻率調(diào)整(DVFS)等電源管理技術(shù)來降低整體功耗。在實(shí)現(xiàn)和工藝技術(shù)層面,通過設(shè)計優(yōu)化以及對邏輯單元和嵌入式存儲器操作條件的精細(xì)管理,直接影響功耗。讓邏輯單元和存儲器在維持所需性能的前提下盡可能在更低電壓下工作,同時通過專門設(shè)計的單元減少活躍節(jié)點(diǎn)上的電容,這些都能顯著促進(jìn)功耗的降低。
新思科技憑借多代Foundation IP優(yōu)化積累的深厚經(jīng)驗(yàn)和強(qiáng)大能力,在AI SoC的功耗優(yōu)化中扮演著關(guān)鍵角色。新思科技Foundation IP提供的先進(jìn)解決方案包括經(jīng)過硅驗(yàn)證的高度優(yōu)化的邏輯庫、通用輸入輸出(GPIO)及嵌入式存儲器。新思科技的邏輯庫和IO與新思科技的電子設(shè)計自動化(EDA)工具協(xié)同優(yōu)化,充分利用工藝技術(shù)的優(yōu)勢,以實(shí)現(xiàn)功耗、性能和面積(PPA)的最佳平衡。新思科技的存儲器集成了針對機(jī)器學(xué)習(xí)算法的關(guān)鍵特性,為AI芯片帶來了顯著的面積及功耗節(jié)省。

▲圖2端到端的能效設(shè)計流程
讓我們深入探討新思科技Foundation IP如何幫助降低功耗,特別是針對AI處理器。
針對AI處理器的專用邏輯單元與新思科技存儲器的間距匹配
在AI處理器中,無論是訓(xùn)練還是推理任務(wù),大量的計算活動(70-90%或更多)都致力于乘累加(MAC)操作,這是矩陣乘法和卷積的基礎(chǔ)。新思科技提供的邏輯庫包含了專為AI處理器設(shè)計的復(fù)雜邏輯,支持MAC功能。這些單元具備如融合乘加能力等特性,有助于減少設(shè)計的凈長度和整體電容,從而顯著降低動態(tài)功耗。對于AI芯片而言,集成高效能存儲器同樣重要。在機(jī)器學(xué)習(xí)模型中,特別是在推理任務(wù)中,參數(shù)權(quán)重存儲在存儲器中,并頻繁被MAC單元訪問以進(jìn)行計算(見圖3)。新思科技提供了與MAC單元間距匹配的嵌入式存儲器。這意味著存儲器和邏輯單元的物理布局在尺寸和間距上進(jìn)行了協(xié)同優(yōu)化。這種集成設(shè)計策略帶來了更短的互連,某些應(yīng)用中已證明能減少33%的功耗。

▲圖3(a)MAC單元框圖(b)MAC單元的存儲器讀寫
可定制的超低電壓庫
在先進(jìn)技術(shù)中,設(shè)計在超低供電電壓下運(yùn)行的芯片,特別是在0.5V以下,極具挑戰(zhàn)性,需要非常細(xì)致的設(shè)計和驗(yàn)證。然而,使用低供電電壓的功耗效益可能是巨大的,因?yàn)榻档碗妷簳討B(tài)功耗產(chǎn)生二次方減少效應(yīng)。AI處理器通常依賴于巨大的并行性來提高性能,不需要在高頻下運(yùn)行。它們特別可以從使用超低電壓庫中受益。新思科技通過其可定制的超低電壓邏輯庫支持低功耗芯片設(shè)計。這些庫基于高質(zhì)量和詳盡的驗(yàn)證,采用先進(jìn)的表征技術(shù),在廣泛的工藝、電壓和溫度(PVT)條件下進(jìn)行測試。低電壓帶來的挑戰(zhàn)包括降低的噪聲裕度和對制造變異的敏感性增加。隨著供電電壓的降低,信號改變電路下一階段狀態(tài)的能力減弱。這可能導(dǎo)致信號更像脈沖,通過電路傳播的時間更長。這種延遲可能會影響電路的關(guān)鍵時序方面,包括建立時間和保持時間。為了解決這個問題,開發(fā)者應(yīng)考慮額外的因素,如軌到軌脈沖檢查、針對芯片內(nèi)變異(OCV)的額外時序裕度、保持時序的高西格瑪要求以及時鐘偏斜建議。新思科技Foundation IP的開發(fā)者在開發(fā)單元時會考慮到這些變異,單元會經(jīng)過高西格瑪蒙特卡羅模擬以進(jìn)行穩(wěn)健性驗(yàn)證,而謹(jǐn)慎使用基于矩的庫變異格式(LVF)允許對制造變異的概率特性進(jìn)行精確和詳細(xì)的建模

▲圖4低供電電壓導(dǎo)致的片上變異復(fù)雜性提升
具有分?jǐn)?shù)驅(qū)動強(qiáng)度的邏輯單元
具有更高驅(qū)動強(qiáng)度的邏輯單元消耗更多功耗,并且由于其更大的晶體管而傾向于有更高的漏電。對于非關(guān)鍵路徑,已經(jīng)通過使用高閾值電壓(VT)單元進(jìn)行了功耗優(yōu)化,可以通過使用具有分?jǐn)?shù)驅(qū)動強(qiáng)度的單元來進(jìn)一步降低功耗。新思科技邏輯庫組合包括一系列這樣的分?jǐn)?shù)驅(qū)動強(qiáng)度單元,包括驅(qū)動強(qiáng)度小于一的單元。
功耗優(yōu)化套件
為了增強(qiáng)功耗節(jié)省,新思科技在其標(biāo)準(zhǔn)單元平臺中提供了功率優(yōu)化套件(POK)。該套件包括各種專用邏輯單元,旨在實(shí)現(xiàn)先進(jìn)的電源管理技術(shù)。這包括幫助減少靜態(tài)功耗的電源開關(guān)和隔離單元,通過在不需要時啟用塊關(guān)閉。該套件還包括電平轉(zhuǎn)換器,通過允許不同塊根據(jù)其性能要求在不同的電壓下運(yùn)行,協(xié)助動態(tài)功耗降低。此外,POK還具有多比特版本的隔離單元、保持觸發(fā)器和電平轉(zhuǎn)換器,有助于減少凈長度和整體單元面積。
超低漏電IO
在具有AI芯片的SoC中,雖然片上組件在低電壓下運(yùn)行,但這些需要連接到在更高電壓下運(yùn)行的片外組件。設(shè)計支持如此電壓范圍的GPIO極具挑戰(zhàn)性,大多數(shù)公司轉(zhuǎn)而使用電平轉(zhuǎn)換器,給設(shè)計增加了不必要的面積和功耗。新思科技提供了一套全面的超低漏電IO,支持低至0.5V的電壓。這些相同的IO還支持1.8V IO供電,提高整體系統(tǒng)可靠性。具有AI芯片的SoC也更大,需要嚴(yán)格的靜電放電(ESD)保護(hù)標(biāo)準(zhǔn)。新思科技提供的IO解決方案包括強(qiáng)大的ESD保護(hù),能夠處理高達(dá)CDM 7A的電流。這轉(zhuǎn)化為更高效、可靠和具有成本效益的AI SoC設(shè)計。
非易失性存儲器和基于鎖存的存儲器
新思科技提供了一系列先進(jìn)的內(nèi)存解決方案,包括嵌入式磁阻隨機(jī)存取存儲器(MRAM)和電阻隨機(jī)存取存儲器(RRAM),它們提供的密度顯著高于傳統(tǒng)的SRAM。對于以讀取為主的應(yīng)用,例如存儲訓(xùn)練數(shù)據(jù),用MRAM或RRAM替換SRAM或片外DRAM可以顯著提高系統(tǒng)級PPA。這些非易失性存儲器(NVM)減少了硅面積和所需組件的數(shù)量。此外,由于它們不需要恒定功率來維持其數(shù)據(jù)狀態(tài)──與DRAM不同──它們消除了頻繁刷新周期的需要,從而降低了靜態(tài)功耗并減少了漏電流。新思科技還提供基于鎖存的存儲器,為較小的內(nèi)存實(shí)例節(jié)省了大量面積。這些對于特定的AI功能特別有用,如激活和池化,這些功能需要許多小的內(nèi)存實(shí)例。此外,新思科技提供了專門的多端口存儲器,能夠同時處理多個內(nèi)存訪問請求,有助于緩解內(nèi)存瓶頸并提高整體性能。
存儲器中的稀疏性和轉(zhuǎn)置支持
在許多機(jī)器學(xué)習(xí)模型中,要計算的數(shù)據(jù)中有相當(dāng)一部分是零值字,可以在讀/寫操作期間跳過以節(jié)省功率。為了利用這種數(shù)據(jù)稀疏性,新思科技在其存儲器中引入了一項名為WAZ(Word All Zero)的創(chuàng)新功能。該功能通過檢測并跳過零值,可以將功耗降低高達(dá)60%。此外,新思科技開發(fā)了一種在存儲器中以轉(zhuǎn)置格式存儲數(shù)據(jù)的方法。這意味著矩陣元素在存儲器中對齊,以匹配其在計算期間的訪問模式。結(jié)果,矩陣操作執(zhí)行更快,節(jié)省了能源,提高了整體效率。
總結(jié)
隨著應(yīng)用需求與AI技術(shù)的持續(xù)演進(jìn),開發(fā)具備強(qiáng)大計算能力且高效節(jié)能的AI處理器已成為普遍需求。傳統(tǒng)的基于GPU架構(gòu)以及新興的優(yōu)化AI架構(gòu)正將能效推向極致。傳統(tǒng)上為CPU及早期GPU優(yōu)化的庫和存儲器方案,已難以滿足當(dāng)下AI SoC設(shè)計嚴(yán)苛且特定的需求。作為基礎(chǔ)IP領(lǐng)域的佼佼者,新思科技憑借二十余年的創(chuàng)新歷程,始終致力于最優(yōu)PPA的研發(fā),持續(xù)推出專業(yè)解決方案,以滿足半導(dǎo)體行業(yè)不斷變化且極具挑戰(zhàn)的設(shè)計需求。在強(qiáng)大的研發(fā)團(tuán)隊與技藝精湛的應(yīng)用工程師共同支持下,新思科技發(fā)揮其在邏輯庫、IO及嵌入式存儲器領(lǐng)域的深厚專長,提供獨(dú)具特色的可調(diào)解決方案,全面提升AI芯片的性能范疇。
-
處理器
+關(guān)注
關(guān)注
68文章
20255瀏覽量
252405 -
存儲器
+關(guān)注
關(guān)注
39文章
7739瀏覽量
171696 -
AI
+關(guān)注
關(guān)注
91文章
39806瀏覽量
301479 -
人工智能
+關(guān)注
關(guān)注
1817文章
50100瀏覽量
265497
原文標(biāo)題:新思科技Foundation IP:AI芯片低功耗設(shè)計必選項
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
格羅方德收購新思科技處理器IP產(chǎn)品組合
什么是低功耗設(shè)計,如何評估低功耗MCU性能?
IP6831至為芯用于低功耗設(shè)備的2W無線充接收方案芯片
深度技術(shù)解析低功耗藍(lán)牙廠商nordic的nRF Connect SDK裸機(jī)選項方案
IP3111?超低功耗的單節(jié)鋰電池保護(hù)芯片
IP3102超低功耗 帶充放電控制功能的單節(jié)鋰電池保護(hù)芯片
AI 芯片浪潮下,職場晉升新契機(jī)?
Arm投資的超低功耗AI芯片公司Ambiq 上市
超低功耗語音芯片有哪些?
新思科技Foundation IP:AI芯片低功耗設(shè)計必選項
評論