91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能資源利用率的問題如何解決?

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-10-26 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

華為發(fā)明的卷積運(yùn)算芯片,能夠在提高陣列資源利用率的同時(shí)降低RAM訪問次數(shù),進(jìn)而減小RAM的訪問壓力。

目前,深度神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成為人工智能領(lǐng)域的代表性算法,基于深度神經(jīng)網(wǎng)絡(luò)技術(shù)的字符識(shí)別、圖像分類或語音識(shí)別等關(guān)鍵技術(shù),已經(jīng)廣泛應(yīng)用于搜索引擎和智能手機(jī)等產(chǎn)品中。

其中,當(dāng)前最為有效且應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)算法是卷積神經(jīng)網(wǎng)絡(luò)算法,簡稱“卷積運(yùn)算”。在現(xiàn)有技術(shù)中,CNN算法的核心計(jì)算單元是乘加運(yùn)算,乘法累加器陣列常用于矩陣乘法運(yùn)算,而卷積運(yùn)算可以轉(zhuǎn)換為矩陣乘法運(yùn)算。因此業(yè)界廣泛采用MAC(乘累加器)陣列為計(jì)算核心的專用加速硬件,例如:現(xiàn)場可編程門陣列(FPGA)、專用集成電路ASIC)等,以加速卷積運(yùn)算的運(yùn)算速度。

但是目前卷積計(jì)算也存在著一些問題,一方面,當(dāng)MAC陣列中存在多個(gè)卷積窗口同時(shí)進(jìn)行卷積運(yùn)算時(shí),這些卷積窗口分布在MAC陣列中的不同位置,使得MAC陣列的利用率非常低。另一方面,存在大量重復(fù)數(shù)據(jù)被從RAM輸入到MAC陣列,這樣會(huì)增加RAM的訪問次數(shù)。

為了解決這樣的問題,華為發(fā)明了將CPU、RAM和卷積運(yùn)算芯片集成在同一數(shù)據(jù)總線上的AI芯片,2016年12月29日,華為發(fā)明了一項(xiàng)名為“卷積運(yùn)算芯片和通信設(shè)備”的發(fā)明專利(申請(qǐng)?zhí)枺?01611243272.X),申請(qǐng)人為華為機(jī)器有限公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看華為的這項(xiàng)新架構(gòu)AI芯片吧。


人工智能資源利用率的問題如何解決?

如上圖,為該專利中發(fā)明的硬件設(shè)備的示意性框架圖,硬件架構(gòu)中包括中央處理器100、雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器(DDR SDRAM)200以及卷積運(yùn)算芯片300。CPU用來控制卷積運(yùn)算芯片啟動(dòng)卷積運(yùn)算,DDR SDRAM用于向卷積運(yùn)算芯片的數(shù)據(jù)緩存模塊輸入多個(gè)卷積數(shù)據(jù)和多個(gè)卷積參數(shù),然后卷積運(yùn)算芯片根據(jù)這些數(shù)據(jù)來完成卷積運(yùn)算。

當(dāng)?shù)玫竭\(yùn)算結(jié)果后,就會(huì)將運(yùn)算結(jié)果寫回到DDR SDRAM事先設(shè)定好的內(nèi)存地址中,并同時(shí)通知CPU完成運(yùn)算,以從內(nèi)存地址中提取結(jié)果數(shù)據(jù)。

人工智能資源利用率的問題如何解決?

如上圖,為上面框架中的卷積運(yùn)算芯片的結(jié)構(gòu)示意圖,這種卷積運(yùn)算芯片包括數(shù)據(jù)緩存模塊310、M*N乘法累加器陣列320、輸出控制模塊330和陣列控制模塊340。

數(shù)據(jù)緩存模塊用于向乘法累加器中的第一乘法累加窗口傳輸用于卷積運(yùn)算的多個(gè)卷積數(shù)據(jù)和卷積參數(shù),卷積參數(shù)由數(shù)據(jù)緩存模塊根據(jù)第一卷積參數(shù)矩陣確定,而該控制器也是通過在運(yùn)算器內(nèi)集成這樣的數(shù)據(jù)緩存器,從而減少了RAM的訪問次數(shù),進(jìn)而減少了RAM的訪問壓力。

其中M*N乘法累加器是該運(yùn)算芯片的核心運(yùn)算部件,而這種M*N的結(jié)構(gòu)設(shè)計(jì)方式也是為了進(jìn)行卷積運(yùn)算而特意設(shè)計(jì)的,其具體結(jié)構(gòu)如下圖所示。


可以看到,這種乘法累加器包括M*N個(gè)處理單元,并且每兩行的處理單元之間還存在斜向的數(shù)據(jù)傳輸通道,這相比于傳統(tǒng)的矩陣式數(shù)據(jù)傳輸通道,具有更加靈活的數(shù)據(jù)傳輸方式,可以更好的適用于AI芯片進(jìn)行多種類型的運(yùn)算。

第一乘法累加窗口可以將數(shù)據(jù)進(jìn)行乘法運(yùn)算,并接著進(jìn)行加法運(yùn)算以獲得卷積結(jié)果,最后由輸出控制模塊輸出卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算結(jié)果,進(jìn)而完成AI芯片中的任務(wù)。

值得一提的是,在該專利中,為了盡可能地提高M(jìn)AC陣列的利用率以及卷積運(yùn)算效率,陣列控制模塊會(huì)根據(jù)第一卷積參數(shù)矩陣的行數(shù)和第一卷積數(shù)據(jù)陣列的行數(shù)來確定第一乘法累加窗口的列數(shù)。

以上就是華為發(fā)明的卷積運(yùn)算芯片,這種卷積運(yùn)算芯片能夠在提高陣列資源利用率的同時(shí)降低RAM訪問次數(shù),進(jìn)而減小RAM的訪問壓力。而例如華為發(fā)明的昇騰AI芯片也正是基于這樣的技術(shù)之上,才能實(shí)現(xiàn)極高的算力,不管多么復(fù)雜的模型都可以輕松訓(xùn)練,且實(shí)現(xiàn)極低的功耗。

關(guān)于嘉德


深圳市嘉德知識(shí)產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識(shí)產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識(shí)產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識(shí)產(chǎn)權(quán)申請(qǐng)、布局、訴訟、許可談判、交易、運(yùn)營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會(huì)知識(shí)產(chǎn)權(quán)、跨境電商知識(shí)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54051

    瀏覽量

    466692
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40001

    瀏覽量

    301635
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50129

    瀏覽量

    265675
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強(qiáng)人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?173次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    GPU 利用率<30%?這款開源智算云平臺(tái)讓算力不浪費(fèi) 1%

    作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購的 GPU 集群,利用率常年低于 30%,算力閑置如同燒錢;跨 CPU/GPU/NPU 異構(gòu)資源調(diào)度難如登天,模型訓(xùn)練卡在資源分配環(huán)節(jié);部署
    的頭像 發(fā)表于 01-26 14:20 ?202次閱讀

    華為發(fā)布AI容器技術(shù)Flex:ai,算力平均利用率提升30%

    決方案。 ? 當(dāng)前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時(shí)期,海量算力需求如潮水般涌來。然而,算力資源利用率偏低的問題卻成為了產(chǎn)業(yè)發(fā)展的關(guān)鍵桎梏。具體表現(xiàn)為,小模型任務(wù)常常獨(dú)占整卡,導(dǎo)致大量資源閑置;大模型任務(wù)又因單機(jī)算力不足而難以支撐
    的頭像 發(fā)表于 11-26 08:31 ?7633次閱讀

    【艾為視角】保證大方向正確!利用人工智能解決一線實(shí)際問題

    保證大方向正確,加快迭代,小步快跑。聚焦內(nèi)部效率提升,利用人工智能改變作業(yè)模式、簡化管理,結(jié)合業(yè)務(wù)場景解決一線實(shí)際問題?!慰傇贕TS人工智能實(shí)踐進(jìn)展匯報(bào)會(huì)上的講話1聚焦內(nèi)部效率提升,利用人工智能
    的頭像 發(fā)表于 09-26 19:03 ?709次閱讀
    【艾為視角】保證大方向正確!<b class='flag-5'>利用人工智能</b>解決一線實(shí)際問題

    從 “被動(dòng)維修” 到 “主動(dòng)管理”:這套系統(tǒng)讓設(shè)備利用率提升 30%

    從 “被動(dòng)維修” 到 “主動(dòng)管理”,是設(shè)備管理模式的轉(zhuǎn)變,更是數(shù)字化轉(zhuǎn)型的關(guān)鍵一步。在激烈的市場競爭中,能讓設(shè)備穩(wěn)定高效運(yùn)行的企業(yè),才能在效率與成本上占據(jù)優(yōu)勢(shì)。這套提升設(shè)備利用率 30% 的系統(tǒng),為企業(yè)高質(zhì)量發(fā)展提供了有效路徑。
    的頭像 發(fā)表于 09-04 10:04 ?876次閱讀
    從 “被動(dòng)維修” 到 “主動(dòng)管理”:這套系統(tǒng)讓設(shè)備<b class='flag-5'>利用率</b>提升 30%

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    海光DCU率先展開文心系列模型的深度技術(shù)合作 FLOPs利用率(MFU)達(dá)47%

    海光DCU實(shí)現(xiàn)文心4.5模型高效適配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大模型正式開源當(dāng)日,海光信息技術(shù)股份有限公司宣布其深度計(jì)算單元(DCU)率先完成對(duì)該系
    的頭像 發(fā)表于 07-01 14:35 ?2322次閱讀

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費(fèi)用?

    做板的時(shí)候,板廠經(jīng)常說我拼版利用率太低,要多收取費(fèi)用,哪位大神知道怎么算利用率
    發(fā)表于 05-14 13:42

    mes工廠管理系統(tǒng):如何讓設(shè)備利用率提升50%?

    在制造業(yè)競爭日益激烈的今天,設(shè)備利用率直接決定了企業(yè)的盈利能力。許多工廠管理者都在思考同一個(gè)問題:如何在不增加設(shè)備投資的情況下,讓現(xiàn)有產(chǎn)能發(fā)揮出最大價(jià)值?MES工廠管理系統(tǒng)正是解決這一難題的金鑰匙
    的頭像 發(fā)表于 05-09 15:55 ?829次閱讀
    mes工廠管理系統(tǒng):如何讓設(shè)備<b class='flag-5'>利用率</b>提升50%?

    提升AI訓(xùn)練性能:GPU資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    人工智能與機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展的背景下,GPU計(jì)算資源的高效利用已成為關(guān)鍵技術(shù)指標(biāo)。優(yōu)化的GPU資源分配不僅能顯著提升模型訓(xùn)練速度,還能實(shí)現(xiàn)計(jì)算成本的有效控制。根據(jù)AI基礎(chǔ)設(shè)施聯(lián)盟2
    的頭像 發(fā)表于 05-06 11:17 ?1568次閱讀
    提升AI訓(xùn)練性能:GPU<b class='flag-5'>資源</b>優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略

    、All-to-All等),網(wǎng)絡(luò)面臨高并發(fā)、低延遲、無損傳輸?shù)膰?yán)苛需求。然而,傳統(tǒng)以太網(wǎng)的網(wǎng)絡(luò)利用率長期徘徊在35%~40%,成為制約AI算力釋放的關(guān)鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?920次閱讀
    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)<b class='flag-5'>利用率</b>的關(guān)鍵策略

    梯度科技助力客戶破解算力調(diào)度難題

    在數(shù)字經(jīng)濟(jì)與人工智能深度融合的新階段,算力已成為支撐人工智能發(fā)展的核心生產(chǎn)力。梯度科技基于云原生技術(shù)架構(gòu)研發(fā)的算力調(diào)度平臺(tái),以“算力彈性調(diào)度、異構(gòu)資源兼容、業(yè)務(wù)智能運(yùn)維”為核心能力,為
    的頭像 發(fā)表于 04-27 16:32 ?1339次閱讀