91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

目標(biāo)物體識別算法:物體識別算法的一般路徑

新機器視覺 ? 來源:創(chuàng)來科技 ? 作者:創(chuàng)來科技 ? 2021-04-18 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)語:智能駕駛的決策執(zhí)行依賴于對目標(biāo)物體識別的精準(zhǔn)判斷,因而目標(biāo)物體識別功能也是最早開始研發(fā)的部分。精度、響應(yīng)度提升是現(xiàn)階段技術(shù)關(guān)鍵。

物體識別分類對于速度和精度要求極高。一方面,物體的識別和分類是實時的,且結(jié)果的置信度要足夠高。由于無人駕駛需要實時做出駕駛決策,而物體識別僅僅是其中一環(huán),在做出判斷前,需要給算法處理、決策效應(yīng)到執(zhí)行器留有足夠時間,因此留給物體分類和識別器的時間很短,實時性要求非常高。

另一方面,汽車駕駛關(guān)系到乘客的生命安全,在此情況下,物體識別必須將誤報、錯判的概率和可能性降低到極低范圍。一旦發(fā)生誤判,系統(tǒng)執(zhí)行錯誤的指令,則結(jié)果將是致命的。

目標(biāo)物體識別難點

?目標(biāo)物體差異化。


無人駕駛需要依賴算法來識別道路上的各種差異化目標(biāo)。道路情況十分復(fù)雜,面對的物體多種多樣。即使同一類物體,也存在外形、尺寸差異。同時,路面上的物體也可能以組合形式出現(xiàn)。以行人為例,行人有不同的靜態(tài)和動態(tài)差異,靜態(tài)包括行人的外形、服裝、高矮胖瘦、體貌特征差異;動態(tài)差異指行人的運動狀態(tài),可能奔跑、行走或者靜止。這就要求識別算法擁有極高的辨識度,能夠區(qū)分路面上各個不同的物體,精準(zhǔn)判斷。

?環(huán)境和路況差異化。

實際道路行駛中,會碰到不同環(huán)境和路況,這就要求識別算法普適所有工況。例如:極端的天氣情況(大雨、大雪、閃電、霧霾等)、不同的光照、不同的路況。

?在動態(tài)場景中進行識別。

在實際道路行駛中周圍的場景都是運動的物體,從不同的視角看過去,不同的物體的坐標(biāo)變化模式、姿態(tài)變化模式都會不同,識別難度進一步增加。

物體識別算法的一般路徑

物體識別算法通常分為六個步驟:

前處理→前景分離→物體分類→結(jié)果改進→物體追蹤→應(yīng)用層面處理

前五個部分是算法的核心,第六部分則通常指后續(xù)的物體行為預(yù)測、路徑規(guī)劃、導(dǎo)航和防碰撞算法等。

c5340072-9fbb-11eb-8b86-12bb97331649.jpg

1

——前處理

此部分為最底層的機器視覺算法,通常包含攝像頭曝光、增益控制、攝像頭標(biāo)定校準(zhǔn)等步驟。由于路況復(fù)雜多變而實時性要求很高(例如當(dāng)車輛快速駛?cè)腭傠x隧道時,周圍的光照變化劇烈,需要迅速做出調(diào)整),無人駕駛中對前處理算法的要求極高。

前處理算法需要保證輸入到后續(xù)步驟的圖像質(zhì)量。圖像質(zhì)量會直接影響后續(xù)分類算法性能。盡管傳統(tǒng)的機器視覺增強算法能夠部分解決這一問題,但是使用高動態(tài)范圍(HDR)的視覺傳感器和配套算法將是未來的主要趨勢。高動態(tài)范圍傳感器可以通過多次曝光運算增強圖片對比度, “照亮” 場景。汽車上使用的 HDR 攝像頭通常還會將近紅外夜視波段也涵蓋進去,實現(xiàn)夜視功能。

傳感器自身的在線標(biāo)定也在這一部分完成。由于傳感器始終處于運動狀態(tài)中,因此實時確認傳感器自身的姿態(tài)尤為重要。單目攝像頭往往通過跟蹤不同圖像幀之間的差別來確認自身姿態(tài),而雙目攝像頭則使用額外的景深信息來實現(xiàn)這一功能。前者的可靠性較差,而后者則需要更多的計算資源。

2

——前景切分

前景切分的目的是盡可能過濾與待識別物體無關(guān)的背景信息(例如天空),并且將圖像切分為適宜大小。一個好的前景切分算法可能將原先的 200k- 1000k 個待識別區(qū)域縮小到 20k-40k,大大減輕后續(xù)處理負擔(dān)。主流算法有基于仿生原理的注意力算法等,但是這些算法往往需要依賴于預(yù)先收集的數(shù)據(jù),這些數(shù)據(jù)規(guī)定了不同場景下的可能的背景區(qū)間信息。另外,額外的傳感器輸入(包括定位系統(tǒng)、雙目攝像頭或雷達提供的景深信息等)可以進一步加快前景切分。

一旦有了這些額外的信息,前景切分算法對圖像區(qū)域是否處于前景(待識別)的判斷確信度會大幅提升,大量背景區(qū)間將會被去除,大幅減少輸入到物體識別器中的待識別區(qū)域,提高識別的速度和準(zhǔn)確性。

c55bc8c8-9fbb-11eb-8b86-12bb97331649.jpg

3

——物體識別

將上一步驟生成的大量待識別區(qū)間歸類為數(shù)百種已知的可能在道路上出現(xiàn)的物體,并且盡量減少誤判。基本上所有的物體識別算法都是以二維圖像作為輸入的。這種輸入分為兩種,一種是將待識別區(qū)域圖像中的邊緣提取出來,將邊緣信息輸入分類器(可以輔以激光雷達以獲得更高精度);另一種則是直接將圖像的外觀輸入到分類器(通過攝像頭實現(xiàn))。前者在性能上基本已經(jīng)到了極限,而后者則是目前研發(fā)的主要方向。

具體到算法,主流的特征提取方法包括梯度方向直方圖法(HOG)和形狀上下文描述符法(SCT),提取特征后進入分類程序。主流的 AI 分類學(xué)習(xí)算法包括支持向量機(SVM)、迭代分類算法(AdaBoost)和神經(jīng)網(wǎng)絡(luò)(NN)。

4

——驗證與結(jié)果改進

這一步驟使用與分類方法不同的判據(jù)來驗證分類的結(jié)果可靠性,并提取被歸類為特定物體的待識別區(qū)間中更加詳細的信息(例如交通標(biāo)志)。由于雷達、激光雷達等非視覺傳感器往往能夠滿足“冗余傳感信息來源”這一要求,因此在實際算法中,這一部分也將應(yīng)用大量的傳感器融合。

c57dbd3e-9fbb-11eb-8b86-12bb97331649.jpg

5

——物體跟蹤

這一步驟的目的有二。除了為應(yīng)用層提供物體軌跡外,還能為前景切分、物體分類提供輸入(告訴前景切分之前這個地方出現(xiàn)過什么)。目前最為常用的算法是卡爾曼濾波算法(用來跟蹤、預(yù)測物體軌跡,根據(jù)過去空間位置預(yù)測未來位置)。在物體跟蹤環(huán)節(jié)同樣涉及較多的傳感器融合算法,通過視覺數(shù)據(jù)預(yù)測軌跡,同時同雷達的物體跟蹤數(shù)據(jù)進行耦合

精度和響應(yīng)速度之間的最優(yōu)選擇

精度是視覺算法的核心,近年來視覺識別算法精度不斷提高。視覺識別算法的精度由誤檢率和漏檢率共同決定。物體識別本身的復(fù)雜性決定了這一功能必須以視覺為核心。

縱觀過去十多年,視覺物體識別的精度有了長足的發(fā)展。以美國加州理工學(xué)院進行的一項行人識別的算法調(diào)查為例,當(dāng)誤判率為每張圖 0.1 個行人時,純視覺算法的漏檢率已由 2004 年最早的 95%降低到了最近幾年的 50%附近。

因此我們有理由相信在無人駕駛真正商用時,即使是純視覺算法也能達到很高的物體識別精確度,而若加以傳感器融合(在相同誤判率下約能降低 10%的漏檢率)和強大的車聯(lián)網(wǎng)實時數(shù)據(jù),無人駕駛階段的精度要求將得以滿足。

c5b0fb40-9fbb-11eb-8b86-12bb97331649.jpg

視覺識別算法精度提升途徑

?視覺算法本身的優(yōu)化。在前處理和前景分離階段提取明確目標(biāo)值,分類和學(xué)習(xí)系統(tǒng)的算法不斷優(yōu)化。這需要技術(shù)研發(fā)的不斷投入,產(chǎn)生極高的進入壁壘,目前國內(nèi)從事視覺算法研究的公司只有少數(shù)幾家,因而也構(gòu)成了標(biāo)的稀缺性。

?通過傳感融合算法冗余信息判斷,提高精度。視覺識別以攝像頭數(shù)據(jù)為主,同時輔以雷達、激光雷達的邊界、距離信息。數(shù)據(jù)顯示,在相同誤判率下雷達的決策輔助能降低約 10%的漏檢率。

?利用車聯(lián)網(wǎng)、地圖數(shù)據(jù)的輔助決策。無人駕駛的商用與車聯(lián)網(wǎng)應(yīng)用密不可分,通過 V2X 實時數(shù)據(jù)傳輸,協(xié)助車輛判斷物體信息,同時通過 GPS 高精度定位和地圖數(shù)據(jù)相結(jié)合,輔助物體的分類識別。

另外一個值得關(guān)注的問題是各種算法的處理速度。為了保證在高速行駛狀態(tài)下的可靠性,物體識別的圖像輸入速率往往達到了 60~90fps (比一般攝像頭幀數(shù)高 3-4 倍)。即使前景分離步驟每張圖僅產(chǎn)生 20,000 個待識別區(qū)域,流入硬件的待識別區(qū)間也達到了每秒1200,000 個。目前算法在一臺普通計算機下運行速度如下圖所示。

c5cbdeec-9fbb-11eb-8b86-12bb97331649.jpg

面對如此大的計算量,通常情況會有如下幾種解決方法:

第一, 算法上做出妥協(xié)。不使用過于復(fù)雜的算法,這意味著精度上要做出妥協(xié)。

第二, 優(yōu)化算法架構(gòu),在算法上取得突破,分類器的性能往往是主流算法瓶頸,通過加強在前處理和前景分離過程中的數(shù)據(jù)篩選能力減少傳輸給分類環(huán)節(jié)的數(shù)據(jù)量。

第三, 更加強大的運算芯片。

第四, 定制專門的計算單元來處理物體識別計算,這需要較高的研發(fā)投入。CPU 用來處理日常的運算、排序、組合,GPU用來處理圖像、著色、點距等信息,DSP 應(yīng)用于處理時間序列信號。三者結(jié)合的定制芯片更為實用。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54010

    瀏覽量

    466146
  • 識別算法
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    10822
  • 無人駕駛
    +關(guān)注

    關(guān)注

    100

    文章

    4297

    瀏覽量

    126834

原文標(biāo)題:目標(biāo)物體識別算法:精度和響應(yīng)度關(guān)乎生命

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    目標(biāo)追蹤的簡易實現(xiàn):模板匹配

    、目標(biāo)追蹤和圖像識別 一般來說,提到機器視覺這個概念都會想到圖像識別,比如人臉識別、文本
    發(fā)表于 10-28 07:21

    自動駕駛汽車如何準(zhǔn)確識別物體?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車想要在道路上安全行駛,需要識別的東西遠比我們所知道的諸如紅綠燈、行人、車輛等復(fù)雜得多。其中有個是我們經(jīng)常會忽略,但同樣非常重要的障礙物,那就是小物體,像是
    的頭像 發(fā)表于 08-22 09:11 ?667次閱讀
    自動駕駛汽車如何準(zhǔn)確<b class='flag-5'>識別</b>小<b class='flag-5'>物體</b>?

    【上海晶珩睿莓1開發(fā)板試用體驗】物體識別的板端推理

    model/yolov5n.onnx desktop.jpg 加載模型和目標(biāo)圖片,處理后打印識別結(jié)果 下載保存路徑中輸出的識別結(jié)果圖片 更多場景 包括動物、路口、水果、運動、臥
    發(fā)表于 08-18 21:25

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecognition,ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二
    的頭像 發(fā)表于 08-15 15:13 ?2193次閱讀
    瑞芯微RK3576語音<b class='flag-5'>識別</b><b class='flag-5'>算法</b>

    人臉方向識別算法

    人臉識別
    深蕾半導(dǎo)體
    發(fā)布于 :2025年07月22日 09:58:29

    在樹莓派5上使用YOLO進行物體和動物識別-入門指南

    大家好,接下來會為大家開個樹莓派5和YOLO的專題。內(nèi)容包括四個部分:在樹莓派5上使用YOLO進行物體和動物識別-入門指南在樹莓派5上開啟YOLO人體姿態(tài)估計識別之旅YOLO
    的頭像 發(fā)表于 07-17 17:16 ?2058次閱讀
    在樹莓派5上使用YOLO進行<b class='flag-5'>物體</b>和動物<b class='flag-5'>識別</b>-入門指南

    基于FPGA的SSD目標(biāo)檢測算法設(shè)計

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識別作為人工智能的項重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識別精度越來越高
    的頭像 發(fā)表于 07-10 11:12 ?2563次閱讀
    基于FPGA的SSD<b class='flag-5'>目標(biāo)</b>檢測<b class='flag-5'>算法</b>設(shè)計

    【正點原子STM32MP257開發(fā)板試用】基于 YOLO 模型的物體識別

    介紹; 官方 Demo 測試; 動態(tài)識別:加載 USB 攝像頭實現(xiàn)動態(tài)畫面的物體識別,結(jié)果顯示在板載LCD屏; 靜態(tài)識別:通過加載本地圖片并執(zhí)行板端推理實現(xiàn)靜態(tài)圖片的
    發(fā)表于 06-21 16:32

    【正點原子STM32MP257開發(fā)板試用】基于 MobileNet 的物體識別

    【正點原子STM32MP257開發(fā)板試用】基于 MobileNet 的物體識別 本文介紹了正點原子 STM32MP257 開發(fā)板實現(xiàn)物體識別的項目設(shè)計。 項目介紹 準(zhǔn)備工作: Mobi
    發(fā)表于 06-20 20:43

    基于RK3576開發(fā)板的車輛檢測算法

    車輛檢測是種基于深度學(xué)習(xí)的對人進行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種算法
    的頭像 發(fā)表于 05-08 17:34 ?1481次閱讀
    基于RK3576開發(fā)板的車輛檢測<b class='flag-5'>算法</b>

    基于RK3576開發(fā)板的人臉識別算法

    RK3576開發(fā)板展示人臉識別算法例程和API說明
    的頭像 發(fā)表于 05-07 16:48 ?2740次閱讀
    基于RK3576開發(fā)板的人臉<b class='flag-5'>識別</b><b class='flag-5'>算法</b>

    請問訓(xùn)練平臺訓(xùn)練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?

    問題如題,訓(xùn)練平臺訓(xùn)練完的識別程序,可以實現(xiàn)在識別物體時屏幕再顯示出來,沒有識別物體時屏幕不顯示嗎?比較小白,可以解釋
    發(fā)表于 04-29 06:12

    人臉識別門禁終端的一般故障排查方法

    問題,有些可能是使用環(huán)境造成,有些可能是人為不小心損壞了。下面,天波小編就來簡單介紹人臉識別門禁終端的一般故障排查方法吧?!倦娫磫栴}】當(dāng)人臉識別
    的頭像 發(fā)表于 04-27 10:45 ?2324次閱讀
    人臉<b class='flag-5'>識別</b>門禁終端的<b class='flag-5'>一般</b>故障排查方法

    基于RV1126開發(fā)板的車輛檢測算法開發(fā)

    車輛檢測是種基于深度學(xué)習(xí)的對人進行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種算法
    的頭像 發(fā)表于 04-14 16:00 ?862次閱讀
    基于RV1126開發(fā)板的車輛檢測<b class='flag-5'>算法</b>開發(fā)

    研究基于多功能離子纖維傳感器系統(tǒng)的物體識別和抓取的人工觸覺感知

    人類觸覺感知是種復(fù)雜的感覺系統(tǒng),它依賴于皮膚中的感覺受體來接收外部刺激,轉(zhuǎn)換信號,隨后通過神經(jīng)系統(tǒng)分析和識別這些信號。傳遞到大腦皮層的觸覺信息在特定區(qū)域經(jīng)歷復(fù)雜的處理。例如,體感皮層感知身體
    的頭像 發(fā)表于 03-24 18:22 ?938次閱讀
    研究基于多功能離子纖維傳感器系統(tǒng)的<b class='flag-5'>物體</b><b class='flag-5'>識別</b>和抓取的人工觸覺感知