91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛芯片之爭(一):圖像識別是錦上添花而非不可或缺

佐思汽車研究 ? 來源:lq ? 2018-12-12 15:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、圖像識別是錦上添花而非不可或缺

自動駕駛領(lǐng)域首先要保證的是安全,其次才是智能。 在無人車環(huán)境感知問題中,必須要知道自動駕駛車輛與目標(biāo)間的距離、方位角,目標(biāo)移動的速度,目標(biāo)位置按時間序列的的預(yù)測(目標(biāo)追蹤),只有知道這些才能避免碰撞。傳統(tǒng)的做法是先獲得目標(biāo)的三維Bounding Box,再與毫米波雷達(dá)的數(shù)據(jù)融合,獲得目標(biāo)的速度和方位角,再通過激光雷達(dá)做目標(biāo)追蹤。我們并不需要對目標(biāo)進(jìn)行精確的語義分割,只需將目標(biāo)以一個三維的Bounding Box準(zhǔn)確框出即可(即Detection)。 最后才是識別目標(biāo),才是圖像識別。

通常有兩種做法獲得3D Bounding Box,第一種如上圖,采用激光雷達(dá)與攝像頭融合的方法,這是目前業(yè)內(nèi)的主流。這種密集PointFusion體系結(jié)構(gòu)有兩個特征提取器:一個處理原始點(diǎn)云數(shù)據(jù)的PointNet變體(A),以及一個從輸入圖像中提取視覺特征的CNN(B)。之后有兩種融合,一種是預(yù)測8個角中每個角相對于輸入點(diǎn)的空間偏移,如(C)所示:對于每個輸入點(diǎn),網(wǎng)絡(luò)預(yù)測從角落(紅點(diǎn))到輸入點(diǎn)(藍(lán)色)的空間偏移(白色箭頭),并選擇具有最高分?jǐn)?shù)的預(yù)測作為最終預(yù)測(E)。另外一種直接回歸盒角位置的香草全局結(jié)構(gòu)(D)。

另一種是只使用激光雷達(dá),以蘋果為代表,使用VoxelNet。VoxelNet是一個端到端的點(diǎn)云目標(biāo)檢測網(wǎng)絡(luò),VoxelNet的網(wǎng)絡(luò)結(jié)構(gòu)主要包含三個功能模塊:(1)特征學(xué)習(xí)層;(2)卷積中間層;(3) 區(qū)域提出網(wǎng)絡(luò)( Region Proposal Network,RPN)。

特征學(xué)習(xí)網(wǎng)絡(luò)的結(jié)構(gòu)如上圖所示,包括體素分塊(Voxel Partition),點(diǎn)云分組(Grouping),隨機(jī)采樣(Random Sampling),多層的體素特征編碼(Stacked Voxel Feature Encoding),稀疏張量表示(Sparse Tensor Representation)等步驟。卷積層相對簡單,每一個卷積中間層包含一個3維卷積,一個BN層(批標(biāo)準(zhǔn)化),一個非線性層(ReLU)。

RPN 是目標(biāo)檢測網(wǎng)絡(luò)中常用的一種網(wǎng)絡(luò),該網(wǎng)絡(luò)包含三個全卷積層塊(Block),每個塊的第一層通過步長為2的卷積將特征圖采樣為一半,之后是三個步長為1的卷積層,每個卷積層都包含BN層和ReLU操作。將每一個塊的輸出都上采樣到一個固定的尺寸并串聯(lián)構(gòu)造高分辨率的特征圖。

這種只使用激光雷達(dá)的方法效果要比傳感器融合效果更好,蘋果的論文里有對比,如上表。缺點(diǎn)是點(diǎn)云密度要求高,最好是128線,最低也要是64線。

無論哪一種方法,所需的運(yùn)算資源都遠(yuǎn)小于圖像識別類深度學(xué)習(xí)或語義分割類深度學(xué)習(xí)。按照ISO26262 功能安全的思路,安全關(guān)聯(lián)度高的領(lǐng)域要投入盡量多的資源,安全關(guān)聯(lián)度低的領(lǐng)域要盡量減少資源的浪費(fèi),這樣既保證安全,又降低成本。

雙目也可以獲得自動駕駛車輛與目標(biāo)間的距離、方位角,目標(biāo)移動的速度。目標(biāo)位置按時間序列的預(yù)測(用光流法的目標(biāo)追蹤),但是要獲得精確的3D Bounding Box,雙目是不大可能的,雙目的深度數(shù)據(jù)不夠精確。

雙目的好處是不使用復(fù)雜的傳感器融合,也不使用昂貴的激光雷達(dá),消耗運(yùn)算資源相對較低,整體成本是最低的,缺點(diǎn)是無法做到全天候。雙目對劇烈變化的光線無法適應(yīng),當(dāng)然單目也有同樣的問題。此外,雙目使用傳統(tǒng)的線性算法,可解釋性、確定性遠(yuǎn)高于深度學(xué)習(xí),更符合ISO26262對安全的要求。對于深度學(xué)習(xí)這種黑盒子,即便是最低的ISO26262 ASILA級都無法達(dá)到,因?yàn)镮SO26262最基本的要求就包括確定性和可解釋性。

反過來說,如果選擇雙目,那么所需要的運(yùn)算資源會大大減少。目前英偉達(dá)的Xavier、瑞薩的V3H、NXP的S32V3都有對雙目的硬核支持。通常都用硬核來完成雙目視差和光流的計算,因?yàn)殡p目的視差和光流是多任務(wù)的并行計算。

來源:博世

博世和大陸都堅持全面使用雙目,浮點(diǎn)運(yùn)算4TOPS即可。

長期以來有個誤解,那就是 GPU擅長并行計算,實(shí)際GPU擅長的是單一任務(wù)的并行計算,而非多任務(wù)的并行計算,多任務(wù)的并行計算還是要靠CPU,不過CPU確實(shí)不擅長并行計算。所以通常都用硬核來完成雙目視差和光流的計算,硬核的缺點(diǎn)是毫無靈活性可言,并且成本偏高。

所以自動駕駛的主芯片,要比拼不是單一任務(wù)的浮點(diǎn)運(yùn)算的算力,只有圖像識別,語義分割才是真正消耗單一任務(wù)的浮點(diǎn)運(yùn)算的地方,而這些不是必須的,只是錦上添花。自動駕駛主芯片要比拼的還是多任務(wù)的處理能力。

二、卷積與MAC,DSP最適合做深度學(xué)習(xí)的推理

圖像識別是自動駕駛芯片計算力消耗最大的部分,通常核心的算法都是基于CNN的,也就是基于卷積的。卷積是什么?如果純粹從算法的角度,卷積就是乘積累加算法,即MAC(Multiply Accumulate)。

第二個等號右邊每個括號里的系數(shù)構(gòu)成的序列 (14,34,14,4),實(shí)際上就是序列 (2,4) 和 (7,3,1) 的卷積。這就是個典型的MAC,通常MAC是DSP的核心運(yùn)算方式,衡量DSP性能最常用的數(shù)據(jù)就是GMAC/s,即每秒十億次乘積累加。

DSP主要的工作也是做MAC的,理論上講DSP是最適合做卷積運(yùn)算的,是卷積運(yùn)算效率最高的硬件,但是我們看到DSP在卷積領(lǐng)域幾乎無人提及,即便德州儀器也很少發(fā)聲。原因在于DSP不是并行處理的架構(gòu),也就是說,DSP一般是單核的,而GPU是多核的,單核的DSP遠(yuǎn)不是GPU的對手。不過DSP的好兄弟FPGA上場了,F(xiàn)PGA天生的并行處理架構(gòu),自2010年后,F(xiàn)PGA將多核DSP引入系統(tǒng),今天幾乎所有的中高端FPGA都或多或少擁有數(shù)十乃至數(shù)百個DSP核,通常這種FPGA可以在 4 瓦的功率電力預(yù)算下實(shí)現(xiàn) 200 G-ops/s 的速度,也即 50 G-ops/s/W,這個結(jié)果幾乎是 GPU 效能的 10 倍。

不僅天生更適合做卷積運(yùn)算,DSP和FPGA在架構(gòu)上也具備壓倒性優(yōu)勢。GPU同CPU一樣,都是馮諾伊曼架構(gòu),也就是指令執(zhí)行過程:取指令->指令譯碼->指令執(zhí)行,只有在指令執(zhí)行的時候,計算單元才發(fā)揮作用,大部分時候,計算單元是空閑無事可做的。馮諾伊曼架構(gòu)數(shù)據(jù)和程序放在同一個地方,不用花銷太多的資源就能取到數(shù)據(jù)和程序。這也算是馮氏結(jié)構(gòu)的優(yōu)點(diǎn)??墒怯捎诔绦蚝蛿?shù)據(jù)存放在同一存儲區(qū),存取程序和數(shù)據(jù)間時共享同一總線,導(dǎo)致了馮諾依曼瓶頸。

與馮氏結(jié)構(gòu)相對的是哈佛結(jié)構(gòu),即將程序和數(shù)據(jù)分開存儲的結(jié)構(gòu)。其過程CPU首先到程序指令儲存器中讀取程序指令內(nèi)容,解碼后得到數(shù)據(jù)地址,再到相應(yīng)的數(shù)據(jù)儲存器中讀取數(shù)據(jù),并進(jìn)行下一步的操作(通常是執(zhí)行)。程序指令儲存和數(shù)據(jù)儲存分開,數(shù)據(jù)和指令的儲存可以同時進(jìn)行,可以使指令和數(shù)據(jù)有不同的數(shù)據(jù)寬度。哈佛結(jié)構(gòu)能夠完成指令和數(shù)據(jù)的并發(fā)操作,DSP處理器的指令集通常都允許程序員在一個指令內(nèi)說明若干個并行的操作,減輕了程序運(yùn)行時的訪存瓶頸,也就是提高了吞吐量,是一種并行結(jié)構(gòu)。而馮氏結(jié)構(gòu)只能是順序操作,是一種串行的處理方式。原始的馮·諾依曼體系結(jié)構(gòu),如GPU就通過引入管線技術(shù)(Pipeline)提高吞吐量。與哈佛架構(gòu)比,做并行計算是要吃虧的。但哈佛架構(gòu)也有缺點(diǎn),那就是指令既不直觀,也不容易使用,通用型的編譯器很難做。

對馮諾伊曼架構(gòu)來說,芯片本身運(yùn)算速度不是瓶頸,瓶頸在于內(nèi)存的帶寬,換句話說,你看到的計算性能參數(shù)都要被內(nèi)存打折扣,大部分時候運(yùn)算部分都在等待內(nèi)存響應(yīng)。現(xiàn)在一顆手機(jī)中處理器的性能已經(jīng)比20年前超級計算機(jī)中的處理器還要強(qiáng)。另一方面,計算機(jī)的主要內(nèi)存使用的是DRAM方案,DRAM是基于電容充放電實(shí)現(xiàn)的高密度存儲方案,其性能(速度)取決于兩方面,即內(nèi)存中電容充放電的讀取/寫入速度以及DRAM與處理器之間的接口帶寬。DRAM電容充放電的讀?。瘜懭胨俣入S著摩爾定律有一定提升,但是速度并不如處理器這么快。另一方面DRAM與處理器之間的接口屬于混合信號電路,其帶寬提升速度主要是受到PCB板上走線的信號完整性所限制,因此從摩爾定律晶體管尺寸縮小所獲得的益處并不大。這也造成了DRAM的性能提升速度遠(yuǎn)遠(yuǎn)慢于處理器速度,目前DRAM的性能已經(jīng)成為了整體計算機(jī)性能的一個重要瓶頸,即所謂阻礙性能提升的“內(nèi)存墻”。

除了性能之外,內(nèi)存對于能效比的限制也成了傳統(tǒng)馮諾伊曼體系計算機(jī)的一個瓶頸。這個瓶頸在人工智能應(yīng)用快速普及的今天尤其顯著。這一代人工智能基于的是神經(jīng)網(wǎng)絡(luò)模型,而神經(jīng)網(wǎng)絡(luò)模型的一個重要特點(diǎn)就是計算量大,而且計算過程中涉及到的數(shù)據(jù)量也很大,使用傳統(tǒng)馮諾伊曼架構(gòu)會需要頻繁讀寫內(nèi)存。目前的DRAM一次讀寫32bit數(shù)據(jù)消耗的能量比起32bit數(shù)據(jù)計算消耗的能量要大兩到三個數(shù)量級,因此成為了總體計算設(shè)備中的能效比瓶頸。如果想讓人工智能應(yīng)用也走入對于能效比有嚴(yán)格要求的移動端和嵌入式設(shè)備以實(shí)現(xiàn)“人工智能無處不在”,那么內(nèi)存訪問瓶頸就是一個不得不解決的問題。

為了解決“內(nèi)存墻”問題,一個最近得到越來越多關(guān)注的思路就是做內(nèi)存內(nèi)計算。2018年的國際固態(tài)半導(dǎo)體會議(ISSCC,全球最頂尖的芯片設(shè)計會議,發(fā)表最領(lǐng)先的芯片設(shè)計成果,稱為“芯片界的奧林匹克”)有專門一個議程,其中的論文全部討論內(nèi)存內(nèi)計算;今年早些時候,IBM發(fā)布了基于相變內(nèi)存(PCM)的內(nèi)存內(nèi)計算,在此之后基于Flash內(nèi)存內(nèi)計算的初創(chuàng)公司Mythic獲得了來自軟銀領(lǐng)投的高達(dá)4000萬美元的B輪融資,而在中國,初創(chuàng)公司知存科技也在做內(nèi)存內(nèi)計算的嘗試。

另外一種解決思路基于目前的技術(shù),就是3D PoP內(nèi)存,在處理器內(nèi)部用TSV技術(shù)堆疊內(nèi)存,與傳統(tǒng)的芯片外置內(nèi)存相比,這種方式可以提高10倍的存取效率,但這需要與內(nèi)存廠家通力合作,三星在這方面具備天然優(yōu)勢,所以三星也在開發(fā)人工智能芯片,將來會是英特爾和英偉達(dá)的強(qiáng)勁對手。

對哈佛架構(gòu)的FPGA來說,內(nèi)存瓶頸的問題要小得多,幾乎可以忽略,F(xiàn)PGA可以做片內(nèi)SRAM,本質(zhì)上FPGA就是一片SRAM。

FPGA雖然優(yōu)勢極為明顯,然而卻有致命缺點(diǎn)。那就是與GPU相比,F(xiàn)PGA都是硬線設(shè)計,die面積大,成本高,加上應(yīng)用面窄,出貨量低進(jìn)而導(dǎo)致性價比太低。GPU的通用性很強(qiáng),產(chǎn)品IP可以復(fù)用,等于出貨量很高,所以性價比很高。

三、AUTOSAR

在自動駕駛時代,軟件的工作量是驚人的,因此AUTOSAR成為不可或缺的支持,AUTOSAR的好處一言以蔽之就是軟件和硬件分離,提高軟件的復(fù)用性,降低軟件開發(fā)成本。同時AUTOSAR也是ISO26262 ASIL的關(guān)鍵元素。

只有使用AUTOSAR,才有可能進(jìn)入主流車廠的供應(yīng)鏈,才可能通過ISO 26262的嚴(yán)苛安全標(biāo)準(zhǔn)。因此全球主要芯片廠家如英特爾、英偉達(dá)、NXP、瑞薩和意法半導(dǎo)體,中國的華為也于近期加入AUTOSAR聯(lián)盟。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54024

    瀏覽量

    466373
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    534

    瀏覽量

    40071
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14890

    瀏覽量

    180027

原文標(biāo)題:自動駕駛芯片之爭(一)

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動駕駛領(lǐng)域的主要應(yīng)用: 、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及到大量的
    發(fā)表于 07-29 17:09

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺部分。以下是FP
    發(fā)表于 07-29 17:11

    谷歌的自動駕駛汽車是醬紫實(shí)現(xiàn)的嗎?

    看到新聞報道說谷歌自動駕駛汽車已經(jīng)行駛近30萬公里了,非常的強(qiáng)大~~上次參加了重慶新能源汽車峰會,對會上富士通半導(dǎo)體宣講的款全景視頻汽車實(shí)時監(jiān)控技術(shù)平臺似乎看到了自動駕駛的影子(利用MB86R11
    發(fā)表于 06-14 16:15

    自動駕駛真的會來嗎?

    高速路段,其無法自動識別停車等路標(biāo)。所以只有當(dāng)圖像識別、判斷,信息的分析、學(xué)習(xí),得到深入發(fā)展,才可能真正解決自動駕駛面臨的難題?! ×硗庠谟布用?,圖像采集也是難關(guān)。無論是各類攝像頭還
    發(fā)表于 07-21 09:00

    細(xì)說關(guān)于自動駕駛那些事兒

    展示在市區(qū)的自動駕駛情境。這臺由光達(dá)、定位系統(tǒng)和攝影機(jī)組成的自動駕駛車,在車輛偏離車道時可自動導(dǎo)回車道。三種系統(tǒng)的作用優(yōu)先級,第是光達(dá),不僅可以偵測障礙物,還可以“
    發(fā)表于 05-15 17:49

    自動駕駛的到來

    自動駕駛需要海量的數(shù)據(jù)積累,前期完整的測試是實(shí)現(xiàn)自動駕駛的必不可少的步驟?! ∑浯沃袊菣C(jī)動車及行人的行為規(guī)律存在差異,自動駕駛外部傳感器必須對非機(jī)動車及行人做出及時準(zhǔn)確的判斷從而有
    發(fā)表于 06-08 15:25

    淺析自動駕駛發(fā)展趨勢,激光雷達(dá)是未來?

    初創(chuàng)公司進(jìn)入自動駕駛市場的個門檻較低的入口。攝像頭:車載攝像頭是最基本常見的傳感器,價格低廉且應(yīng)用廣泛同時具備雷達(dá)無法完成的圖像識別功能,不僅可以識別路牌,在
    發(fā)表于 09-06 11:36

    激光雷達(dá)是自動駕駛不可或缺的傳感器

    `激光雷達(dá)是自動駕駛不可或缺的傳感器2015 年,當(dāng)時業(yè)界還在爭論:無人駕駛是該用激光雷達(dá)還是用攝像頭。到 2016 年,事情發(fā)生很大的轉(zhuǎn)變,尤其某汽車公司 Autopilot 致死事故之后,業(yè)內(nèi)
    發(fā)表于 09-08 17:24

    淺析自動駕駛不可或缺的幾項技術(shù)

    不久前,全球管理咨詢公司麥肯錫發(fā)布了份研究報告,估算自動駕駛技術(shù)如能實(shí)現(xiàn),將提升個人安全系數(shù),可減少90%以上的事故。
    的頭像 發(fā)表于 07-25 17:45 ?3418次閱讀

    如何使用Python進(jìn)行圖像識別自動學(xué)習(xí)自動訓(xùn)練?

    圖像識別自動學(xué)習(xí)和自動訓(xùn)練。 首先,讓我們了解一下圖像識別的基本概念。圖像識別是指通過計算機(jī)程序識別
    的頭像 發(fā)表于 01-12 16:06 ?1507次閱讀

    神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強(qiáng)大的特征提取和分類能力,為圖像識別帶來了革命性的進(jìn)步。本文將詳細(xì)介紹神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用案例,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)在面部
    的頭像 發(fā)表于 07-01 14:19 ?1802次閱讀

    圖像檢測和圖像識別的區(qū)別是什么

    圖像檢測和圖像識別是計算機(jī)視覺領(lǐng)域的兩個重要研究方向,它們在許多應(yīng)用場景中都有著廣泛的應(yīng)用。盡管它們在某些方面有相似之處,但它們之間還是存在些明顯的區(qū)別。本文將從多個角度對圖像檢測和
    的頭像 發(fā)表于 07-03 14:41 ?2843次閱讀

    圖像識別屬于人工智能嗎

    的過程。它涉及到圖像的獲取、預(yù)處理、特征提取、分類和識別等多個環(huán)節(jié)。 1.2 重要性 圖像識別技術(shù)在人工智能領(lǐng)域具有重要的地位,它使計算機(jī)能夠“看”和“理解”圖像,為機(jī)器視覺、
    的頭像 發(fā)表于 07-16 10:44 ?3210次閱讀

    圖像識別算法的優(yōu)缺點(diǎn)有哪些

    圖像識別算法是種利用計算機(jī)視覺技術(shù)對圖像進(jìn)行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別
    的頭像 發(fā)表于 07-16 11:09 ?4247次閱讀

    目標(biāo)檢測與圖像識別的區(qū)別在哪

    目標(biāo)檢測與圖像識別是計算機(jī)視覺領(lǐng)域中的兩個重要研究方向,它們在實(shí)際應(yīng)用中有著廣泛的應(yīng)用,如自動駕駛、智能監(jiān)控、醫(yī)療診斷等。盡管它們在某些方面有相似之處,但它們之間存在些關(guān)鍵的區(qū)別。 基本概念 目標(biāo)
    的頭像 發(fā)表于 07-17 09:51 ?2536次閱讀