91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為啥軟件成了人工智能加速器致勝的法寶?

pmkA_arm_china ? 來源:YXQ ? 2019-03-27 08:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著Arm生態(tài)系統(tǒng)的發(fā)展壯大,各種各樣的應用場景層出不窮。為了更好地在特定場景下得到更好的性能,能耗比等指標,針對特定應用場景的加速器市場也在蓬勃發(fā)展,近年來火熱的人工智能加速器(Artificial Intelligence Accelerator)就是一個典型例子。

一個高效的加速器,需要精心設計的硬件以及與之搭配的軟件,兩者缺一不可,否則用戶體驗會大打折扣,這也是為什么我們常??吹侥承┲笜朔浅s@艷的加速器,在實際使用中體驗卻不盡如人意的原因。以人工智能加速器為例,其中基本的硬件加速單元就是乘加器的組合,但如何讓這些乘加器高效地進行并行計算,涉及到上層數(shù)據(jù)的打包、調(diào)度,需要大量的驅(qū)動軟件工作,而且大部分軟件開發(fā)者都是基于某種框架進行應用開發(fā),具體見圖 1,所以驅(qū)動到框架的適配也很重要,甚至有一些框架不能滿足應用的需求,需要專門開辟通道進行優(yōu)化。

圖1:ArmNPU軟硬件框架

開發(fā)一款高性能加速器,需要投入大量人力物力,如果不能大規(guī)模使用,那么投入回報比會大大降低,甚至虧本。如果加速器能和不同Arm系統(tǒng)輕松組合,拓展Arm系統(tǒng)的應用范圍,那么應用場景將會大大增加,生命周期也會延長。讓加速器適配不同的Arm系統(tǒng),這對軟硬件接口和驅(qū)動提出了非常大的挑戰(zhàn),因為今天的Arm產(chǎn)品非常豐富,從低功耗的微處理器,主流的移動平臺,到高端的服務器,高性能計算處理器都有相應產(chǎn)品。對于一個加速器團隊來說,針對盡可能多的Arm配置組合進行開發(fā)驗證成本將非常高昂,這里面不單單涉及IP/EDA的采購,還有系統(tǒng)的搭建維護,但如果沒有這些IP又無法將整個業(yè)務流程完整驗證,甚至影響軟硬件接口的設計優(yōu)化。

有沒有方法高效地解決加速器配套驅(qū)動,框架,應用軟件開發(fā)的問題呢?Fast Model!

圖2:使用DS-5調(diào)試運行在Fast Model中的系統(tǒng)軟件

在Fast Model的例子系統(tǒng)中,Arm給出了一系列Arm核,相關(guān)IP組合的子系統(tǒng)模型,以及相應OS,開發(fā)工具DS-5,方便客戶快速搭建軟件開發(fā)平臺,調(diào)整軟硬件接口,進行驅(qū)動以及上層軟件的開發(fā),具體參考圖3。

整個開發(fā)流程如下:

1.在Fast Model的例子系統(tǒng)中找到你需要的平臺,和對應的Bootloader, Firmware,OS軟件,并將他們順利運行

2. 將Fast Model的子系統(tǒng)導出生成SystemC的模型子系統(tǒng)模塊

3. 編寫加速器的功能模型,通過AMBA PV總線和Fast Model導出的子系統(tǒng)模塊進行連接

4. 編寫驅(qū)動在目標OS中操作加速器

5. 在模型平臺上進行軟件框架,應用匹配移植

Arm提供了絕大部分市面可見設計的類似子系統(tǒng),無論是基于Arm v7/v8單核,多核,多cluster系統(tǒng),還是包含最新架構(gòu)特性的CPU系統(tǒng),加速器開發(fā)團隊都可以在Fast Model的例子程序里面找對類似子系統(tǒng)范例進行適配,在設計之初就可以解決不同系統(tǒng)的適配性問題。Fast Model也提供工具讓開發(fā)者對例子系統(tǒng)進行修改,生成新的子系統(tǒng)以滿足需要。在加速器設計之初,軟件硬件人員就可以一起利用豐富多樣的例子系統(tǒng)進行架構(gòu)的探索,對穩(wěn)定軟硬件接口非常有幫助,而穩(wěn)定的接口定義對長期的產(chǎn)品演進至關(guān)重要。

圖3:基于Fast Model的加速器軟件開發(fā)

至此開發(fā)者已經(jīng)完成了大部軟硬件接口,驅(qū)動以及框架軟件開發(fā)工作,但驅(qū)動中的時序問題還沒有完全解決,因為Fast Model是一款功能型模型,它為了提高運行速度(50-200MHz),犧牲了時序信息。對于時序信息,開發(fā)者可以最后去仿真平臺甚至最終芯片上去調(diào)節(jié),而此時軟件測試用例和框架都已經(jīng)完成,這將大大節(jié)省占用仿真平臺(MHz)進行調(diào)試排錯的時間,從而降低成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5332

    瀏覽量

    91603
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50102

    瀏覽量

    265520

原文標題:為何軟件是人工智能加速器致勝的秘密?

文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?139次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    奇異摩爾參編人工智能加速器互聯(lián)芯粒技術(shù)要求團體標準發(fā)布

    近日,中國電子工業(yè)標準化技術(shù)協(xié)會批準并發(fā)布了《人工智能超節(jié)點服務技術(shù)要求》等28項團體標準。其中由中國移動研究院牽頭、奇異摩爾產(chǎn)品市場&研發(fā)部門主要參編的《人工智能加速器互聯(lián)芯粒技術(shù)
    的頭像 發(fā)表于 01-09 11:20 ?592次閱讀
    奇異摩爾參編<b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>互聯(lián)芯粒技術(shù)要求團體標準發(fā)布

    工業(yè)級-專業(yè)液晶圖形顯示加速器RA8889ML3N簡介+顯示方案選型參考表

    本帖最后由 MTCN2013 于 2025-11-17 15:23 編輯 專業(yè)液晶圖形顯示加速器能夠有效減少對MCU運算資源的占用,對于只需普通單片機運算資源的儀器儀表來說,專業(yè)圖形顯示加速器
    發(fā)表于 11-14 16:03

    邊緣計算中的AI加速器類型與應用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設備上
    的頭像 發(fā)表于 11-06 13:42 ?819次閱讀
    邊緣計算中的AI<b class='flag-5'>加速器</b>類型與應用

    創(chuàng)客總部加入MathWorks加速器計劃

    全球領(lǐng)先的數(shù)學計算軟件開發(fā)商 MathWorks 日前宣布,創(chuàng)客總部已加入 MathWorks 加速器計劃。作為中關(guān)村科創(chuàng)孵化,創(chuàng)客總部致力于為人工智能創(chuàng)業(yè)企業(yè)、高校院所技術(shù)精英搭建
    的頭像 發(fā)表于 08-22 10:00 ?1152次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理的11個誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速器和處理整合到各類應用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運作、能如
    的頭像 發(fā)表于 08-07 13:21 ?1079次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>處理<b class='flag-5'>器</b>的11個誤解

    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案

    ,專為NVMe部署而設計。該系列加速器尤其適用于現(xiàn)代人工智能數(shù)據(jù)中心環(huán)境。在此類環(huán)境中,加速訪問NVMe存儲對于支持高強度工作負載
    的頭像 發(fā)表于 08-06 16:31 ?1.9w次閱讀
    Microchip推出Adaptec? SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可擴展 NVMe? RAID 存儲解決方案

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質(zhì)子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?3626次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    愛立信攜手超微加速邊緣人工智能部署

    愛立信與超微 Supermicro近日宣布有意開展戰(zhàn)略合作,加速邊緣人工智能部署。
    的頭像 發(fā)表于 06-17 09:42 ?1.6w次閱讀

    MAX78002帶有低功耗卷積神經(jīng)網(wǎng)絡加速器人工智能微控制技術(shù)手冊

    人工智能(AI)需要超強的計算能力,而Maxim則大大降低了AI計算所需的功耗。MAX78002是一款新型的AI微控制,使神經(jīng)網(wǎng)絡能夠在互聯(lián)網(wǎng)邊緣端以超低功耗運行,將高能效的AI處理與經(jīng)過驗證
    的頭像 發(fā)表于 05-08 10:16 ?861次閱讀
    MAX78002帶有低功耗卷積神經(jīng)網(wǎng)絡<b class='flag-5'>加速器</b>的<b class='flag-5'>人工智能</b>微控制<b class='flag-5'>器</b>技術(shù)手冊

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應用 Cognizant將在關(guān)鍵增長領(lǐng)域提供解決方案,包括企業(yè)級AI智能體、定制化行業(yè)大型語言模型及搭載N
    的頭像 發(fā)表于 03-26 14:42 ?746次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺,<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>人工智能</b>應用

    支持實時物體識別的視覺人工智能微處理RZ/V2MA數(shù)據(jù)手冊

    DRP-AI 采用了一種由動態(tài)可重構(gòu)處理(DRP)和 AI-MAC組成的人工智能加速器,該加速器加速
    的頭像 發(fā)表于 03-18 18:12 ?925次閱讀
    支持實時物體識別的視覺<b class='flag-5'>人工智能</b>微處理<b class='flag-5'>器</b>RZ/V2MA數(shù)據(jù)手冊

    嵌入式AI加速器DRP-AI 詳細介紹

    的嵌入式設備。此外,人工智能正在不斷發(fā)展,新的算法不時被開發(fā)出來。 在人工智能快速發(fā)展的過程中,瑞薩開發(fā)了人工智能加速器(DRP-AI)和軟件
    的頭像 發(fā)表于 03-15 16:13 ?1814次閱讀
    嵌入式AI<b class='flag-5'>加速器</b>DRP-AI 詳細介紹