91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大規(guī)模人工智能(AI)處理器的功耗分析方法

天數(shù)智芯 ? 來源:天數(shù)智芯 ? 作者:天數(shù)智芯 ? 2022-01-17 16:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,來自天數(shù)智芯公司Power團隊的三位工程師闕詩璇、孫凌、甘振華合作發(fā)表的技術(shù)論文《左移:大規(guī)模人工智能(AI)處理器的功耗分析方法》順利入選第58屆(國際設計自動化會議,Design Automation Conference),并做poster presentation。

文章主要內(nèi)容如下:

AI芯片最重要的設計指標之一就是單位功耗每瓦算力(TOPS/W),因此低功耗設計對于AI芯片的設計實現(xiàn),在市場中具備競爭力都十分重要。然而原有的功耗分析方法存在一定的不足,對新的需求也無法滿足:

1.原有方法只是對功能驗證的場景,而缺乏真實的應用場景,跟真實的軟件應用有一定的差距;

2.傳統(tǒng)的功耗分析需要綜合后的網(wǎng)表和門級的向量,這在項目早期很難獲取,太晚介入會讓功耗優(yōu)化受限;

3.對于仿真時間長的向量,尤其是要按時間分析功耗時,所需的運行時間和資源都是巨大的;

4.自適應電壓頻率縮放等需要有實時的功耗才能進行軟硬件控制,這是原有方法無法實現(xiàn)的;

5.為了搶占市場,需要更快的迭代設計,因此設計人員希望每周甚至每天都可以對低功耗功能進行驗證,原有方法很難趕上驗證迭代的速度;

為了解決這些挑戰(zhàn)跟需求,天數(shù)智芯提出了一種創(chuàng)新的功耗分析方案:利用一種功耗分析工具對所給的仿真向量進行高性能的按時間分析功耗的分布,從而得到平均功耗和峰值功耗等參數(shù)。這種方法在RTL階段就進行分析,有利于對AI處理器進行優(yōu)化功耗的迭代,最終實現(xiàn)項目功耗目標。與之前的方法相比較,它在某些實驗中,可以達到100甚至1000倍的加速。

接下來將展開描述該方案在實際工作中的一個應用:通過機器學習的訓練得到實時功耗預測模型。

現(xiàn)在所用的新的功耗分析方法和原有的按時間分析網(wǎng)表的功耗分析方法,具有很好的相關(guān)一致性。所以利用它超高倍加速的分析能力,可以用于各種應用場景激勵產(chǎn)生訓練模型所需要的充足的數(shù)據(jù)集。當訓練數(shù)據(jù)集達到百萬甚至是上億級別,通過機器學習算法得到的模型就比較準確。這是依賴新的分析方法才能得到的,傳統(tǒng)的分析方法無法產(chǎn)生這么大的數(shù)據(jù)量。

我們用機器學習的算法對各個模塊進行參數(shù)訓練,從而得到最佳的預測模型,這樣就可以用于預測實時功耗,從而實現(xiàn)軟硬件的控制。

經(jīng)過幾天的訓練,我們最終得到的預測模型與真實的功耗之間的誤差只有不到5%。

總的來看,創(chuàng)新的功耗分析方法與傳統(tǒng)流程相比,能在項目早期介入,所需要的運行時間跟內(nèi)存消耗大大減少,可以在設計階段進行快速的迭代。它不僅僅可以對原有的功能驗證激勵進行分析,對于原型驗證的真實的應用場景向量也可以進行分析,從而得到更真實的功耗相關(guān)指標,且與項目最終簽核時的數(shù)據(jù)具有一致性。利用它的快速和節(jié)省資源特性,能夠為實時功耗的預測模型提供大量充足的數(shù)據(jù)樣本,最終得到誤差5%以內(nèi)的預測模型。

關(guān)于DAC

DAC(國際設計自動化會議,Design Automation Conference)與ICCAD(國際計算機輔助設計會議,International Conference on Computer Aided Design)、DATE(歐洲設計自動化與測試學術(shù)會議,Design, Automation and Test in Europe)、ASP-DAC(亞太地區(qū)設計自動化會議,Asia and South Pacific Design Automation Conference)一起被公認為電子設計自動化領域水平最高的四大國際會議。

關(guān)于天數(shù)智芯

上海天數(shù)智芯半導體有限公司(簡稱“天數(shù)智芯”)于2018年正式啟動7納米通用并行(GPGPU)云端計算芯片設計,是中國第一家通用并行(GPGPU)云端計算芯片及高性能算力系統(tǒng)提供商。公司以“成為智能社會的賦能者”為使命,專注于云端服務器級的通用并行高性能云端計算芯片,瞄準以云計算、人工智能、數(shù)字化轉(zhuǎn)型為代表的數(shù)據(jù)驅(qū)動技術(shù)市場,解決核心算力瓶頸問題。重點打造自主可控、國際一流的通用、標準、高性能云端計算GPGPU芯片,從芯片端解決算力問題。

原文標題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信公眾號:天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 參數(shù)
    +關(guān)注

    關(guān)注

    11

    文章

    1869

    瀏覽量

    33945
  • 自動化
    +關(guān)注

    關(guān)注

    31

    文章

    5930

    瀏覽量

    90222
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265295

原文標題:天數(shù)智芯技術(shù)論文入選第58屆DAC

文章出處:【微信號:IluvatarCoreX,微信公眾號:天數(shù)智芯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Magna AI加入NVIDIA Inception計劃,推動生產(chǎn)級人工智能規(guī)模化發(fā)展

    智能交付的頂尖人工智能機構(gòu)行列。 Magna AI的加入,體現(xiàn)了其與NVIDIA人工智能平臺之間高度契合的技術(shù)協(xié)同關(guān)系。這一合作基于Magna A
    的頭像 發(fā)表于 01-12 15:46 ?167次閱讀

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI
    發(fā)表于 12-19 13:44

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)

    邊緣AI越來越多地應用于諸如工業(yè)攝像頭和公共設施攝像頭等嵌入式設備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速
    的頭像 發(fā)表于 09-23 10:31 ?885次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開發(fā)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    nRF52805),只占用幾千字節(jié)的非易失性存儲(NVM)。這使得以前被認為不可能的應用也能增加 ML 功能。例如,您現(xiàn)在可以在廣泛的傳感網(wǎng)絡的每個節(jié)點上進行人工智能處理,而在這
    發(fā)表于 08-31 20:54

    AI 芯片浪潮下,職場晉升新契機?

    方向,就明確涵蓋了人工智能芯片的研發(fā)、部署與優(yōu)化技術(shù)崗位 。如果你從事 GPU 相關(guān)研發(fā)工作,在申報職稱時,就需著重突出在圖形處理加速、大規(guī)模并行計算等方面的成果,因為 GPU 的高并行結(jié)構(gòu)及強大浮點
    發(fā)表于 08-19 08:58

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速處理器整合到各類應用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運作、能如
    的頭像 發(fā)表于 08-07 13:21 ?1067次閱讀
    關(guān)于<b class='flag-5'>人工智能</b><b class='flag-5'>處理器</b>的11個誤解

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務中的大規(guī)模并行計算需求。因此,專為
    的頭像 發(fā)表于 07-09 15:59 ?1555次閱讀

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經(jīng)網(wǎng)絡處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發(fā)表于 04-23 10:55

    光子 AI 處理器的核心原理及突破性進展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理人工智能AI)計算的新型硬件設備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?4160次閱讀

    支持實時物體識別的視覺人工智能處理器RZ/V2MA數(shù)據(jù)手冊

    DRP-AI 采用了一種由動態(tài)可重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速,該加速
    的頭像 發(fā)表于 03-18 18:12 ?916次閱讀
    支持實時物體識別的視覺<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2MA數(shù)據(jù)手冊

    用于實時人類和物體識別的視覺-AI ASSP人工智能處理器RZ/V2M數(shù)據(jù)手冊

    配置了DRP和AI-MAC的人工智能硬件IP DRP-AI將高速人工智能推理和低功耗結(jié)合起來,實現(xiàn)了1TOPS/W級別的功率性能。此外,圖像
    的頭像 發(fā)表于 03-14 17:41 ?935次閱讀
    用于實時人類和物體識別的視覺-<b class='flag-5'>AI</b> ASSP<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2M數(shù)據(jù)手冊

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊

    和特征提取,與ARM?Cortex?A9 CPU緊密結(jié)合,用于人工智能推理。 *附件:基于嵌入式人工智能的高速圖像處理的微處理器RZA2M數(shù)據(jù)手冊.pdf 特性 中央
    的頭像 發(fā)表于 03-11 15:54 ?1019次閱讀
    基于嵌入式<b class='flag-5'>人工智能</b>的高速圖像<b class='flag-5'>處理</b>的微<b class='flag-5'>處理器</b>RZ/A2M數(shù)據(jù)手冊