91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm遲遲推出全新NPU系列的原因是什么

獨(dú)愛72H ? 來源:雷鋒網(wǎng) ? 作者:佚名 ? 2019-10-30 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:雷鋒網(wǎng))

Arm推出了一系列全新的IP,包括NPU、GPU以及DPU。NPU尤為值得關(guān)注,不僅因?yàn)镹PU系列同時(shí)發(fā)布了N57和N37兩款新品,還因?yàn)锳rm的ML處理器(Machine Learning Processor)系列名稱Ethos也正式公布。全新AI系列產(chǎn)品的亮相,意味著Arm的AI策略更加明晰。

實(shí)際上,Arm原計(jì)劃在2019年第一季度發(fā)布首款ML處理器。之所以選擇這個(gè)時(shí)間點(diǎn),Arm ML事業(yè)群商業(yè)與營(yíng)銷副總裁Dennis Laudick去年11月接受雷鋒網(wǎng)專訪時(shí)表示:“最近我們已經(jīng)看到機(jī)器學(xué)習(xí)技術(shù)正在穩(wěn)定和成熟,市場(chǎng)需求也正在不斷增加,我們認(rèn)為現(xiàn)在是進(jìn)入市場(chǎng)的最佳時(shí)機(jī)。”

不過,Arm首款ML處理器的發(fā)布時(shí)間是在今年5月,比計(jì)劃略晚一些。Dennis上周再次接受雷鋒網(wǎng)專訪時(shí)表示,發(fā)布推遲有很多原因,產(chǎn)品開發(fā)是主要的問題。ML處理器開發(fā)的過程中面臨很多挑戰(zhàn),其中一個(gè)很大的挑戰(zhàn)就是數(shù)據(jù)移動(dòng)處理不好就會(huì)消耗大量的電,另一個(gè)大的挑戰(zhàn)就是如何權(quán)衡效率和靈活性。

雖然產(chǎn)品的開發(fā)影響了首款ML處理器發(fā)布的時(shí)間,但Arm并沒有在首款ML產(chǎn)品發(fā)布時(shí)就公布其系列名稱和型號(hào)。而是直到面向主流市場(chǎng),提供性能、成本以及功耗均衡的N57和對(duì)成本極端敏感的N37發(fā)布,Arm才正式公布ML系列處理器的的名稱——Ethos(中文可翻譯為精神)。此時(shí),外界也才清楚5月發(fā)布的首款ML處理器型號(hào)為Ethos-N77,定位高端,面向高性能需求的市場(chǎng)。

這是為什么?Dennis解釋稱,其實(shí)有很多原因,Arm內(nèi)部也在重新思考命名系統(tǒng),如果推出第一款機(jī)器學(xué)習(xí)產(chǎn)品就立刻發(fā)布新的產(chǎn)品系列名稱,可能大家會(huì)把對(duì)這個(gè)系列品牌的印象和認(rèn)知捆綁在這一款產(chǎn)品身上,我們不希望造成這樣的效果。我們希望大家看到Ethos這個(gè)產(chǎn)品名下面的產(chǎn)品系列是廣泛而豐富的,這就是為什么要等到有針對(duì)三個(gè)不同市場(chǎng),三個(gè)不同檔次的產(chǎn)品都出來了,才正式的對(duì)外公布產(chǎn)品系列的名稱的主要原因。

但更為關(guān)鍵的是,市場(chǎng)上已經(jīng)有眾多競(jìng)爭(zhēng)者,此時(shí)推出Ethos還有競(jìng)爭(zhēng)力嗎?Dennis表示,Arm的成功一直以來都得益于生態(tài)系統(tǒng),對(duì)于NPU來說挑戰(zhàn)并不是能夠做出自己的NPU,而是NPU在市場(chǎng)上是不是真的好用。我們已經(jīng)聽到合作伙伴反饋說,希望在硬件上能夠標(biāo)準(zhǔn)化,他們不想支持15種不同的硬件,所以,他們期待有一個(gè)標(biāo)準(zhǔn)化的軟件平臺(tái)能夠支持。

以具體的產(chǎn)品看,Ethos-N57與Ethos-N37的設(shè)計(jì)理念包括一些基本原則,例如:針對(duì)Int8與Int16數(shù)據(jù)類型的支持性進(jìn)行優(yōu)化;先進(jìn)的數(shù)據(jù)管理技術(shù),以減少數(shù)據(jù)的移動(dòng)與相關(guān)的耗電;通過Winograd技術(shù)的落地,使性能比其他NPU提升超過200%。

AI處理器支持的數(shù)據(jù)類型非常關(guān)鍵,隨著算法和模型的逐步成熟,邊緣端的AI芯片很多都只支持Int8的數(shù)據(jù)類型,但Arm還選擇支持Int16。對(duì)此,Dennis表示,機(jī)器學(xué)習(xí)支持Int8數(shù)據(jù)類型基本就足夠了,我們之所以選擇也支持INT16是為了更好的應(yīng)對(duì)涉及到圖像處理的工作,因?yàn)橥ǔ碚f像素是10到12位,牽扯到顏色,支持INT16就省略了很多的數(shù)據(jù)轉(zhuǎn)換的工作,非常適合圖像處理。

但為何又沒有支持更高精度的FP16?“因?yàn)镕P16對(duì)帶寬的需求相當(dāng)高,這就意味著處理器的整個(gè)處理量和功耗就會(huì)提升。但消耗這么多的功耗和帶寬,準(zhǔn)確率與INT8比較卻沒有多少提升?!?Dennis如此解釋。

雖然機(jī)器學(xué)習(xí)讓處理器的設(shè)計(jì)面臨著新的挑戰(zhàn),不過Dennis認(rèn)為機(jī)器學(xué)習(xí)本身并沒有改變最為根本的處理器的設(shè)計(jì)原則,只不過針對(duì)機(jī)器學(xué)習(xí)的處理器設(shè)計(jì)的重點(diǎn)可能和通用處理器有所不同。Arm一直強(qiáng)調(diào)的數(shù)據(jù)管理是我們的重點(diǎn),還有并行計(jì)算、矩陣乘法都是我們關(guān)注的重點(diǎn)。

硬件的獨(dú)特性之外,軟件也同樣重要,特別是在AI時(shí)代,軟硬一體化的重要性更加突顯。要實(shí)現(xiàn)理想的軟硬結(jié)合,Dennis認(rèn)為有兩大挑戰(zhàn),一個(gè)還是權(quán)衡的問題,也就是多少工作讓硬件完成以及多少工作給軟件完成。另一個(gè)是ML框架的支持,因?yàn)檫@個(gè)領(lǐng)域還很新,還會(huì)出現(xiàn)不同的框架。

除了軟硬一體化提升AI性能,在先進(jìn)半導(dǎo)體制程越來越昂貴的背景下,通過異構(gòu)系統(tǒng)提升處理器性能也受到了很大的關(guān)注。但異構(gòu)的系統(tǒng)給軟件帶來的更大的挑戰(zhàn),此時(shí),到底是用統(tǒng)一的軟件API去分配硬件資源實(shí)現(xiàn)易用性,還是對(duì)每個(gè)硬件單獨(dú)編程讓系統(tǒng)更加高效?

Arm采用的在硬件之上有特別優(yōu)化的Compute Library,它會(huì)把底層的硬件和驅(qū)動(dòng)進(jìn)行充分優(yōu)化,根據(jù)算子的不同需求驅(qū)動(dòng)硬件,可以提升幾倍到十幾倍的效率。再上一層是Arm nn,可以將TensorFlow、Caffe等神經(jīng)網(wǎng)絡(luò)框架轉(zhuǎn)換成Compute Library可以執(zhí)行的任務(wù),讓開發(fā)者不用關(guān)心底層的硬件,只需要使用標(biāo)準(zhǔn)架構(gòu)進(jìn)行開發(fā)就可以。

因此,Dennis表示Arm采用的方式是更加底層的方式,軟件直接與CPU、GPU或NPU進(jìn)行溝通,做最佳匹配。這其中最大的挑戰(zhàn)還是平衡的問題,軟件的架構(gòu)要做到根據(jù)具體的應(yīng)用,分配專用和通用的處理器,這個(gè)百分比還可以不斷調(diào)整,這是最難做的。

在框架的支持上,Arm是希望其硬件可以讓開發(fā)者不需要去特別選擇需要用哪一個(gè)框架。NPU軟硬件的獨(dú)特性和優(yōu)勢(shì)只有獲得市場(chǎng)的認(rèn)可才能成功,那么首先得滿足不同場(chǎng)景的算力需求。Ethos系列現(xiàn)有的三款ML處理器性能從1-4 TOP/s不等,但是即便是在邊緣端,也會(huì)有更高的性能需求,更不用說高性能計(jì)算的場(chǎng)景。

但是,隨著系統(tǒng)的復(fù)雜性增加,計(jì)算單元的增加并不意味著一直能夠帶來線性的性能提升。Arm如何應(yīng)對(duì)?Dennis表示,這種組裝確實(shí)有其局限性,到達(dá)某個(gè)性能后可能性能的提升就消失了,但Arm在GPU和CPU多處理器架構(gòu)上有很好的架構(gòu)設(shè)計(jì),能夠盡量實(shí)現(xiàn)比較長(zhǎng)的線性性能提升。

為應(yīng)對(duì)AIoT時(shí)代更激烈的競(jìng)爭(zhēng),特別是RISC-V的競(jìng)爭(zhēng),我們也看到Arm在本月初宣布推出全新的功能 Arm Custom instructions,允許客戶在特定的 CPU 內(nèi)核中加入自定義指令功能,能夠加速特定的用例、嵌入式物聯(lián)網(wǎng)應(yīng)用程序。

Dennis表示,我們會(huì)認(rèn)真的看待RISC-V在市場(chǎng)上的進(jìn)展和動(dòng)作,就像我們認(rèn)真看待其他架構(gòu)一樣。Arm的優(yōu)勢(shì)在于我們能夠提供最全面的、擁有靈活性、普遍性的解決方案和產(chǎn)品,與此同時(shí),我們還擁有強(qiáng)大豐富的生態(tài),能夠更好的滿足市場(chǎng)的需求。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20256

    瀏覽量

    252451
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9554

    瀏覽量

    392065
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IMX95 - NPU 不工作的原因?怎么解決?

    作為標(biāo)題,我查了很多相關(guān)的帖子,似乎 IMX95 NPU 還存在不少問題。這是我迄今為止嘗試過的: 使用TFLite label_image演示程序: CPU A1 與內(nèi)核 6.6.3 SDK
    發(fā)表于 02-26 11:21

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世標(biāo)志著開放翻譯領(lǐng)域邁出了重要一步,它可幫助人
    的頭像 發(fā)表于 02-26 10:22 ?544次閱讀

    Glfipower杰夫微GLF推出全新推出基于AEC-Q100標(biāo)準(zhǔn)的車規(guī)級(jí)Load Switch IC系列

    Glfipower杰夫微GLF推出全新推出基于AEC-Q100標(biāo)準(zhǔn)的車規(guī)級(jí)Load Switch IC系列
    的頭像 發(fā)表于 01-16 17:43 ?1571次閱讀
    Glfipower杰夫微GLF<b class='flag-5'>推出</b><b class='flag-5'>全新</b><b class='flag-5'>推出</b>基于AEC-Q100標(biāo)準(zhǔn)的車規(guī)級(jí)Load Switch IC<b class='flag-5'>系列</b>

    Glfipower杰夫微GLF推出全新推出DC-DC系列產(chǎn)品GLF8114,以及方案應(yīng)用~

    Glfipower杰夫微GLF推出全新推出DC-DC系列產(chǎn)品GLF8114,以及方案應(yīng)用~
    的頭像 發(fā)表于 01-16 17:30 ?1011次閱讀
    Glfipower杰夫微GLF<b class='flag-5'>推出</b><b class='flag-5'>全新</b><b class='flag-5'>推出</b>DC-DC<b class='flag-5'>系列</b>產(chǎn)品GLF8114,以及方案應(yīng)用~

    【新品發(fā)布】艾為重磅發(fā)布端側(cè)AI高性能NPU語(yǔ)音芯片,打造智能語(yǔ)音體驗(yàn)新標(biāo)桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡(luò)智能語(yǔ)音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡(luò)處理器),通過聲音模型訓(xùn)練與NPU
    的頭像 發(fā)表于 01-07 18:33 ?384次閱讀
    【新品發(fā)布】艾為重磅發(fā)布端側(cè)AI高性能<b class='flag-5'>NPU</b>語(yǔ)音芯片,打造智能語(yǔ)音體驗(yàn)新標(biāo)桿

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布與谷歌聯(lián)合推出面向始終在線、超低能耗端側(cè)大語(yǔ)言模型應(yīng)用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?608次閱讀
    芯原與谷歌聯(lián)合<b class='flag-5'>推出</b>開源Coral <b class='flag-5'>NPU</b> IP

    Bourns推出全新Riedon PF2472系列功率電阻

    Bourns 推出全新 Riedon 系列功率電阻。此系列采用緊湊型 TO-247 封裝,具備堅(jiān)固耐用、高功率的厚膜電阻特性,能在搭配散熱器時(shí)提供高達(dá) 100 W 的輸出功率,并可承受
    的頭像 發(fā)表于 09-17 14:37 ?789次閱讀

    全新Arm Lumex CSS平臺(tái)實(shí)現(xiàn)兩位數(shù)性能提升

    Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡(jiǎn)稱 Arm)今日宣布推出全新 Arm Lu
    的頭像 發(fā)表于 09-10 16:14 ?941次閱讀
    <b class='flag-5'>全新</b><b class='flag-5'>Arm</b> Lumex CSS平臺(tái)實(shí)現(xiàn)兩位數(shù)性能提升

    TDK推出全新SmartMotion ICM-536xx系列高性能六軸IMU

    TDK株式會(huì)社(東京證券交易所代碼:6762)重磅推出全新的SmartMotion? ICM-536xx系列高性能六軸IMU,并向特定客戶開放供貨。
    的頭像 發(fā)表于 09-05 09:15 ?1204次閱讀

    搭載ARM,NPU,F(xiàn)PGA三種核心的開發(fā)板—米爾安路DR1M90飛龍派

    板上市,是A股首家專注于FPGA業(yè)務(wù)的上市公司。 YM90X開發(fā)板用的就是安路的SALDRAGON1(飛龍1,以下簡(jiǎn)稱 DR1)系列FPSoC。 FPSoC就是將ARM、NPU和JPU處理器
    發(fā)表于 06-13 17:02

    ARM,NPU,F(xiàn)PGA三種核心的開發(fā)板 — 米爾安路飛龍派開發(fā)板

    ,是A股首家專注于FPGA業(yè)務(wù)的上市公司。YM90X開發(fā)板用的就是安路的SALDRAGON1(飛龍1,以下簡(jiǎn)稱DR1)系列FPSoC。FPSoC就是將ARM、NPU
    的頭像 發(fā)表于 06-13 08:03 ?1726次閱讀
    有<b class='flag-5'>ARM</b>,<b class='flag-5'>NPU</b>,F(xiàn)PGA三種核心的開發(fā)板 — 米爾安路飛龍派開發(fā)板

    MDD辰達(dá)半導(dǎo)體推出全新SGT系列MOSFET

    在服務(wù)器電源、工業(yè)驅(qū)動(dòng)及新能源領(lǐng)域,MOSFET的性能直接決定系統(tǒng)的能效與可靠性。為滿足高密度、高效率需求,MDD辰達(dá)半導(dǎo)體推出全新SGT系列MOSFET,其中MDDG03R04Q(30V N溝道增強(qiáng)型MOS)憑借3.5mΩ低導(dǎo)
    的頭像 發(fā)表于 05-21 14:04 ?1307次閱讀
    MDD辰達(dá)半導(dǎo)體<b class='flag-5'>推出</b><b class='flag-5'>全新</b>SGT<b class='flag-5'>系列</b>MOSFET

    后摩智能NPU適配通義千問Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列模型(Qwen3 0.6B-14B)在端邊側(cè)的高效部署。這一成果充分彰顯了
    的頭像 發(fā)表于 05-07 16:46 ?1399次閱讀

    靈動(dòng)微電子推出全新超值型MM32F0050系列MCU

    靈動(dòng)微電子推出全新超值型MM32F0050系列MCU。2018年,靈動(dòng)首次上市了其主打性價(jià)比的超值型MM32F00系列,目前已陸續(xù)推出了F0
    的頭像 發(fā)表于 04-01 09:36 ?1776次閱讀
    靈動(dòng)微電子<b class='flag-5'>推出</b><b class='flag-5'>全新</b>超值型MM32F0050<b class='flag-5'>系列</b>MCU

    TDK推出全新FS160系列microPOL電源模塊

    TDK公司宣布推出全新FS160*系列microPOL(uPOL)電源模塊。FS160*系列uPOL直流-直流轉(zhuǎn)換器全部配備全遙測(cè)技術(shù),具有更高的性能、最小的尺寸以及不同于一般的功率密
    的頭像 發(fā)表于 03-12 16:12 ?1640次閱讀
    TDK<b class='flag-5'>推出</b><b class='flag-5'>全新</b>FS160<b class='flag-5'>系列</b>microPOL電源模塊