91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

遇到無法識別(分類)的物體怎么辦?

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:佐思汽車研究 ? 2022-11-10 10:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

單目或三目構(gòu)成的視覺系統(tǒng)是目前智能駕駛的主流,其致命缺陷就是識別與檢測是一體的,也就是說要檢測目標必須先識別目標,無法識別就等于看不到,車輛不會有任何減速而直接撞上去,此類事故,特斯拉、小鵬和蔚來都發(fā)生過。普通人說識別,在計算機視覺里實際是分類,為了對應(yīng)傳統(tǒng)習(xí)慣,本文依然把分類叫識別。

1ec7a6b8-609d-11ed-8abf-dac502259ad0.png

圖片來源:Andrew Ng公開課

要解決這個問題最好的辦法是立體雙目,其次是沒有分類任務(wù)的激光雷達,典型代表就是奧迪A8上那種四線激光雷達,目前多線的激光雷達通常都是用與單目攝像頭一樣的應(yīng)用算法,同樣會遇到識別與檢測一體的問題。這也正是特斯拉不用激光雷達的原因之一,單目攝像頭遇到的困難,多線激光雷達一樣會遇到,而奧迪A8上那種四線激光雷達只能檢測到前方有沒有物體,是什么物體就不知道,算是加強版的毫米波雷達。對于復(fù)雜駕駛環(huán)境如城區(qū)則不太適合,只能用于塞車時的自動跟車。最后是4D毫米波雷達,近似于4線激光雷達,缺點與4線激光雷達一樣。

立體雙目能完美解決問題,缺點是其標定太麻煩,傳感器的尺寸一致性要求很高。還有就是立體匹配算法難度不低,最好使用FPGA,AI加速器完全無用,GPU的話消耗算力太多。熟悉FPGA的廠家很少,需要摸索很長時間,因此立體雙目只有老牌的博世、斯巴魯、奔馳和豐田堅持使用。

大部分廠家沒有時間去摸索,看看Mobileye便知研發(fā)人員人工成本太高了,即便已經(jīng)占有超過75%的智能駕駛市場,利潤依然無法填平研發(fā)成本的坑。

為什么會出現(xiàn)無法識別的目標,這就是深度學(xué)習(xí)的天生缺陷,無法改變。學(xué)術(shù)的說法叫Outof Distribution(OOD),OOD detection 指的是模型能夠檢測出OOD樣本,而OOD樣本是相對于InDistribution(ID)樣本來說的。傳統(tǒng)的機器學(xué)習(xí)方法通常的假設(shè)是模型訓(xùn)練和測試的數(shù)據(jù)是獨立同分布的(IID,Independent Identical Distribution),這里訓(xùn)練和測試的數(shù)據(jù)都可以說是InDistribution(ID)。在實際應(yīng)用當中,模型部署上線后得到的數(shù)據(jù)往往不能被完全控制的,也就是說模型接收的數(shù)據(jù)有可能是OOD樣本,也可以叫異常樣本(outlier, abnormal)。

簡單地說,深度學(xué)習(xí)數(shù)據(jù)集就像窮舉法,但窮舉所有類型是不可能的,那樣數(shù)據(jù)集會異常龐大且成本高昂,并且現(xiàn)實世界每分每秒都在產(chǎn)生新的異常樣本,永遠都無法窮盡。對于牽涉到安全的應(yīng)用,如無人駕駛和醫(yī)學(xué)識別,OOD是噩夢般的存在。雖然說異常樣本出現(xiàn)的幾率很低,但一旦出現(xiàn)就可能損失一條生命。有人會說,人開車會出事故,因此不能苛求機器開車不出事故,這顯然是錯誤的,人是有糾錯機制的,而機器不會,它犯錯一次要一條人命,下次遇到異常樣本還是如此。

除了OOD外,還有一類物體是單目三目視覺系統(tǒng)永遠都無法識別的,那就是側(cè)翻車輛。

畫面中這輛側(cè)翻的集裝箱車對單目三目來說也是噩夢,是一大片紅色,無紋理特征的圖像,任何計算機視覺技術(shù)皆無能為力,當然,最困難的是白色,就等同于天空,特斯拉中國臺灣高速事故就是如此,無論何種單目計算機視覺都無從下手,立體雙目可以完美解決這個問題。

還有這種側(cè)翻,大面積反光,且有圖像顯示在車上,訓(xùn)練數(shù)據(jù)集都是基于正常車輛拍攝的圖像數(shù)據(jù),這種側(cè)翻的非常罕見,數(shù)據(jù)集里肯定沒有,再加上它還能反光,還能顯示其他圖像,單目計算機視覺完全無能為力。

想完美解決問題是不可能的,目前學(xué)術(shù)界在嘗試用差異性網(wǎng)絡(luò)來解決這個問題。眾所周知,深度神經(jīng)網(wǎng)絡(luò)不具備可解釋性,永遠存在概率,沒有確定性,而汽車領(lǐng)域一定要有確定性,但除了深度神經(jīng)網(wǎng)絡(luò),人類開發(fā)智能駕駛沒有其他低成本方式,只能用它。當然對于那種大面積空洞類似天空的目標,任何基于單目三目的計算機視覺技術(shù)都無能為力。

目前對于無法識別物體的檢測,學(xué)術(shù)界研究主要方向是差異性網(wǎng)絡(luò)DiscrepancyNetworks。本文主要基于四篇論文:

第一篇是瑞士洛桑聯(lián)邦理工學(xué)院EPFL的計算機視覺實驗室的《Detecting the Unexpected via Image Resynthesis》,

第二篇是豐田的《Road Obstacle Detection Method Based on an Autoencoder with SemanticSegmentation》,

還有一篇《Efficient Unknown Object Detectionwith Discrepancy Networks for Semantic Segmentation》。

最后一篇是微軟研究院和Wisconsin-Madison大學(xué)的《Unknown-Aware ObjectDetection Learning What You Don’t Know from Videos in the Wild》。

目前都局限于學(xué)術(shù)研究,離上車最快也要等10年。

思路都大同小異,即用GAN再合成圖像,制造差異性網(wǎng)絡(luò)。

EPFL的思路

1fc53530-609d-11ed-8abf-dac502259ad0.png

圖片來源:EPFL

EPFL的思路,圖a是路上的兩個異常樣本物體,深度學(xué)習(xí)完全無法識別,也就檢測不到;圖b是圖像語義分割,這兩個物體消失了,用GAN再合成圖像,這兩個物體還是消失不見,但最后加上差異性網(wǎng)絡(luò),這兩個物體找到了,就是圖d的高光顯示部分。

EPFL的做法

1ffb0e3a-609d-11ed-8abf-dac502259ad0.png

圖片來源:EPFL

EPFL的做法,用兩個VGG16網(wǎng)絡(luò)從原始圖像和再合成圖像中抽出特征并做金字塔矯正,特征和關(guān)聯(lián)送入一個跳過連接的解碼器,最終得到差異性圖像。

2017b684-609d-11ed-8abf-dac502259ad0.png

圖片來源:EPFL

基于CNN的圖像識別通常無法識別右邊這輛自行車,因為它靠在柱子上。

豐田的思路

2075dbc4-609d-11ed-8abf-dac502259ad0.png

圖片來源:豐田

微軟的思路

20945892-609d-11ed-8abf-dac502259ad0.png

圖片來源:微軟

微軟提出了一種新的未知感知目標檢測框架,該框架通過時空未知提?。⊿TUD)從野外視頻中提取未知對象,并有意義地正則化模型的決策邊界。視頻數(shù)據(jù)自然地捕獲了模型運行的開放世界環(huán)境,并封裝了已知和未知對象的混合物;見圖1(b)。例如,建筑物和樹木(OOD)可能會出現(xiàn)在駕駛視頻中,盡管它們沒有明確標注用于培訓(xùn)車輛和行人的物體檢測器(ID)。類似于化學(xué)中的蒸餾概念,即“從混合物中分離物質(zhì)的過程”。雖然經(jīng)典的目標檢測模型主要使用標記的已知對象進行訓(xùn)練,微軟試圖通過聯(lián)合優(yōu)化目標檢測和OOD檢測性能,利用未知對象進行模型正則化。

微軟的STUD框架

20db1f3e-609d-11ed-8abf-dac502259ad0.png

圖片來源:微軟

《Efficient Unknown Object Detectionwith Discrepancy Networks for Semantic Segmentation》這篇論文比較新,是2022年8月發(fā)表的,作者單位名氣不大,有日本SenseTime和德州奧斯汀大學(xué)。

21c053ec-609d-11ed-8abf-dac502259ad0.png

圖片來源:SenseTime

典型示例如上,圖中車輛車身上有大字,很容易被誤認為標志牌,或者無法識別。

21f470d2-609d-11ed-8abf-dac502259ad0.png

圖片來源:SenseTime

作者的思路主要是加入了所謂深監(jiān)督(Deep Supervision),就是在深度神經(jīng)網(wǎng)絡(luò)的某些中間隱藏層加了一個輔助的分類器作為一種網(wǎng)絡(luò)分支來對主干網(wǎng)絡(luò)進行監(jiān)督的技巧,用來解決深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練梯度消失和收斂速度過慢等問題。

雖然立體雙目可以完美解決所有難題,但立體雙目研發(fā)周期長,短期很難出成果,大部分企業(yè)都不會選擇立體雙目,深度學(xué)習(xí)太容易了,煉丹不需要知道因果關(guān)系,只需塞數(shù)據(jù)即可,立體雙目陣營目前也開始出現(xiàn)松動,豐田還專門出了個深度學(xué)習(xí)加單目推測立體視覺再獲得深度數(shù)據(jù)的數(shù)據(jù)集,寶馬也在2021年放棄了立體雙目。年輕人幾乎沒有從事立體雙目研究的。

Argo關(guān)閉,Aurora和圖森市值暴跌95%,Cruise和Waymo沉寂多日,過度依賴深度學(xué)習(xí)的無人駕駛該何去何從?

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 分類器
    +關(guān)注

    關(guān)注

    0

    文章

    153

    瀏覽量

    13789
  • 視覺系統(tǒng)
    +關(guān)注

    關(guān)注

    3

    文章

    378

    瀏覽量

    31832
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124406

原文標題:遇到無法識別(分類)的物體怎么辦?

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    在使用電磁屏蔽箱測試中遇到諧振怎么辦?

    在什么是電磁屏蔽箱諧振?這篇文章中我們講了電磁屏蔽箱諧振的產(chǎn)生的原因和原理,現(xiàn)在我們來講講在使用OI-ESA/OI-ESS/OI-ES系列電磁屏蔽箱測試中遇到諧振該怎么解決。處理諧振的思路不是“消除
    的頭像 發(fā)表于 02-27 17:22 ?707次閱讀
    在使用電磁屏蔽箱測試中<b class='flag-5'>遇到</b>諧振<b class='flag-5'>怎么辦</b>?

    三防漆不固化怎么辦?從材料到工藝的排查指南 |鉻銳特實業(yè)

    鉻銳特實業(yè)|東莞廠家|三防漆不固化怎么辦?從材料過期、固化條件錯配、涂層過厚、前處理不當?shù)江h(huán)境溫濕度,一文帶你系統(tǒng)排查三防漆固化不良問題,附行業(yè)數(shù)據(jù)及實用解決方法。
    的頭像 發(fā)表于 02-22 01:22 ?114次閱讀
    三防漆不固化<b class='flag-5'>怎么辦</b>?從材料到工藝的排查指南 |鉻銳特實業(yè)

    智能顯示模塊連接電腦后無法識別怎么辦?連接電腦后讀不到模塊U盤?

    智能顯示模塊連接電腦后無法識別怎么辦?連接電腦后讀不到模塊的U盤是什么原因?
    發(fā)表于 01-20 15:57

    智能顯示模塊上電后顯示“No Project”怎么辦?

    智能顯示模塊上電后顯示“No Project”怎么辦?
    發(fā)表于 01-20 15:20

    使用單片機系統(tǒng)時間不準怎么辦?

    使用單片機系統(tǒng)時間不準,怎么辦?具體的是與晶振有關(guān)系還是MCU內(nèi)部有關(guān)系,時間一長顯示的時間就慢了
    發(fā)表于 12-05 07:51

    請問單片機RAM空間不夠用了怎么辦

    單片機RAM空間不夠用了怎么辦?
    發(fā)表于 11-25 08:09

    人臉識別身份核驗終端卡頓死機怎么辦?看這篇就夠了

    不僅導(dǎo)致通行效率驟降,更可能引發(fā)用戶數(shù)據(jù)丟失、系統(tǒng)崩潰等次生風(fēng)險。那么,當遇到人臉識別身份核驗終端或人證對比一體機出現(xiàn)卡頓死機等情況,應(yīng)該怎么處理呢?一、人臉識別身份核驗終端運行應(yīng)用就卡頓故障現(xiàn)象:新增
    的頭像 發(fā)表于 11-10 10:25 ?641次閱讀
    人臉<b class='flag-5'>識別</b>身份核驗終端卡頓死機<b class='flag-5'>怎么辦</b>?看這篇就夠了

    USB 接口無法識別外接設(shè)備怎么辦??

    辦公插U盤傳文件、接移動硬盤存素材,或者連外接鍵盤辦公,難免會遇到USB接口無法識別設(shè)備的問題。很多人第一反應(yīng)以為“接口壞了”或“設(shè)備廢了”,其實80%的故障都是接口連接沒到位或者驅(qū)動出問題,也
    的頭像 發(fā)表于 09-17 16:28 ?5146次閱讀
    USB 接口<b class='flag-5'>無法</b><b class='flag-5'>識別</b>外接設(shè)備<b class='flag-5'>怎么辦</b>??

    自動駕駛汽車如何準確識別物體?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車想要在道路上安全行駛,需要識別的東西遠比我們所知道的諸如紅綠燈、行人、車輛等復(fù)雜得多。其中有一個是我們經(jīng)常會忽略,但同樣非常重要的障礙物,那就是小物體,像是
    的頭像 發(fā)表于 08-22 09:11 ?669次閱讀
    自動駕駛汽車如何準確<b class='flag-5'>識別</b>小<b class='flag-5'>物體</b>?

    電腦開機每次自動開啟很多軟件怎么辦?

    電腦開機每次自動開啟很多軟件怎么辦
    發(fā)表于 07-17 06:40

    路由器能連上但是沒有網(wǎng)絡(luò)怎么辦

    路由器能連上但是沒有網(wǎng)絡(luò)怎么辦
    發(fā)表于 07-10 06:15

    請問STM32U5不支持ST-LINK v2怎么辦?

    STM32U5不支持ST-LINK v2怎么辦
    發(fā)表于 06-09 07:59

    電腦連接到openmv,但不會自動彈出盤符,請問怎么辦?

    電腦連接到openmv,但不會自動彈出盤符,請問怎么辦?
    發(fā)表于 05-27 06:53

    請問訓(xùn)練平臺訓(xùn)練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?

    問題如題,訓(xùn)練平臺訓(xùn)練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?比較小白,可以解釋一下怎么做嗎?或者
    發(fā)表于 04-29 06:12

    FPGA的Jtag接口燒了,怎么辦?

    在展開今天的文章前,先來討論一個問題:FPGA的jtag接口燒了怎么辦?JTAG接口的輸入引腳通常設(shè)計為高阻抗,這使得它們對靜電電荷積累非常敏感,由于JTAG接口需要頻繁連接調(diào)試器、下載線纜等外
    的頭像 發(fā)表于 04-27 11:01 ?2631次閱讀
    FPGA的Jtag接口燒了,<b class='flag-5'>怎么辦</b>?