91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中常提的“深度估計”是個啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-02-16 13:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]當(dāng)我們看一張照片時,可以通過肉眼自然地判斷照片中的物體遠(yuǎn)近,這種對于空間和距離的感知,對于人類來說是本能,是從幼兒時期開始就形成的一種能力。

對于自動駕駛汽車來說,為了能更好地辨別路況,也需要類似的能力。

wKgZO2mRVxWATleBAAAQo00DEvw731.jpg

什么是深度估計?

自動駕駛汽車必須理解環(huán)境中物體距離它有多遠(yuǎn),需要能快速辨別前面是行人還是車?那個車到底是在十米開外還是一兩百米遠(yuǎn)?

深度估計就是讓機(jī)器從感知到的圖像或傳感器數(shù)據(jù)中估計出物體到自身的距離,給計算機(jī)一個可以理解的“空間感”。

這種能力在計算機(jī)視覺領(lǐng)域里被稱為深度估計(Depth Estimation),是自動駕駛感知系統(tǒng)的基礎(chǔ)一環(huán)。

深度估計的結(jié)果表現(xiàn)為“深度圖”,這張深度圖和普通照片不一樣,照片上的每個像素表示顏色,而深度圖上的每個像素代表的是這個像素點對應(yīng)的真實世界深度值,簡單理解就是圖片中的物體離我有多遠(yuǎn)。

有了深度圖,車載系統(tǒng)就能把二維畫面轉(zhuǎn)化為三維空間的感覺,這對路徑規(guī)劃、避障、速度控制等任務(wù)來說非常重要。

wKgZO2mRVxaALdkbAAAR42n7O-I013.jpg

為什么自動駕駛要進(jìn)行深度估計

如果只給自動駕駛系統(tǒng)提供一張照片,是無法讓它直接判斷距離的。這跟人類看照片的本能不同,機(jī)器只看到數(shù)字和像素點。

沒有深度信息的話,計算機(jī)只能判斷物體的大致形狀、顏色和類別,但不知道它在空間中的實際位置。

舉個例子,一輛車可能看起來很大很清晰,但它到底在十米還是一百米之外,是深度信息才能回答的問題。

傳統(tǒng)的深度感知方式是用激光雷達(dá)(LiDAR)這樣的感知硬件,利用激光直接測量距離,成像效果會非常好,也正因如此,現(xiàn)在很多自動駕駛系統(tǒng)都依托激光雷達(dá)來獲取深度信息。

但是激光雷達(dá)成本高、算力要求高,也有安裝和維護(hù)等各種后續(xù)問題。

深度估計作為計算機(jī)視覺的一種技術(shù),就是希望用廉價的攝像頭和算法來補(bǔ)充或者替代一些昂貴的傳感硬件。

也就是說,深度估計技術(shù)是讓自動駕駛車輛能從攝像頭拍攝的普通圖像中預(yù)測出每一處的距離。

比方說前方有個行人,機(jī)器不僅要知道這是個人,還要知道這個人距離車有多少米,這就是深度估計提供的數(shù)據(jù)。

沒有這樣的三維感知,即便能識別物體類別,也無法安全地制定行駛策略。

wKgZO2mRVxeALQ7GAAASG3BOmsQ165.jpg

如何實現(xiàn)深度估計?

深度估計本質(zhì)上是從圖像推斷空間距離的過程,由于單張圖像本身并不包含真實的深度信息,這一過程需要復(fù)雜的處理流程。

僅憑平面像素及色彩去推測三維空間中的距離,是一個典型的“欠定問題”,機(jī)器無法僅從一張圖片確定真實距離,而必須結(jié)合幾何原理、先驗知識以及大量數(shù)據(jù)來輔助推斷。

目前,主流的深度估計方法可分為兩類。

一種是多視圖方法,通過兩個或多個不同視角的攝像頭同時觀察同一個場景,然后用傳統(tǒng)的立體視覺算法去匹配、計算視差(就是確定同一個物體在不同視角中像素的偏移量),再根據(jù)視差轉(zhuǎn)換成深度信息。

這其實跟我們雙眼看到立體圖像類似,左右眼看到的是有輕微偏差的畫面,通過這種視差差異,我們的大腦能判斷深度。

類似的原理也可以在自動駕駛系統(tǒng)里用兩個攝像頭實現(xiàn)簡單的深度估計。

還有一種更常見的方法是單目深度估計,也就是只用一臺攝像頭實現(xiàn)深度估計。

由于單張圖像本身沒有視差信息,但是通過大量的數(shù)據(jù)和深度學(xué)習(xí)模型的訓(xùn)練,計算機(jī)還是可以學(xué)到一些圖像里固有的深度線索。

像是路面變得模糊、物體變小、遮擋關(guān)系等都是跟深度有關(guān)的視覺信號。

深度學(xué)習(xí)模型通過卷積神經(jīng)網(wǎng)絡(luò)、特征提取等手段,把這些線索編碼起來,然后預(yù)測每個像素的深度。

單目深度估計在技術(shù)層面有一些難點,真實世界物體的尺度有很大變化,而且同樣的像素在不同場景下可能對應(yīng)完全不同的距離,因此算法需要在大規(guī)模標(biāo)注數(shù)據(jù)上訓(xùn)練,讓模型學(xué)習(xí)到一般性的深度規(guī)律。

這個過程就像讓模型讀書一樣,通過成千上萬張有深度標(biāo)注的圖像讓它明白每種視覺特征對應(yīng)什么樣的深度分布。

訓(xùn)練出的模型在看到新圖像時,就能給出合理的深度預(yù)測。

wKgZO2mRVxiAZe2KAAASAJELks8975.jpg

深度估計在自動駕駛中的具體作用

對于自動駕駛汽車而言,深度估計不僅意味著通過圖像識別距離,更重要的是能以較低成本實現(xiàn)更高階的自動駕駛功能。

沒有深度信息,車輛雖能“看見”周圍環(huán)境,卻無法準(zhǔn)確判斷物體遠(yuǎn)近;而有了深度信息,自動駕駛系統(tǒng)的“思考”才能真正從二維提升到三維空間,深度估計的直接作用包括。

碰撞預(yù)警:知道前方物體到底有多遠(yuǎn),從而判斷是否需要剎車或避讓。

路徑規(guī)劃:基于三維空間關(guān)系計算最佳行駛路線,而不僅僅是圖像中的像素路徑。

跟車距離控制:估計前車距離,決定加速或減速。

動態(tài)障礙物預(yù)測:結(jié)合機(jī)器學(xué)習(xí)追蹤其他車輛、行人的運(yùn)動,并預(yù)測它們的未來位置。

所有這些功能都離不開準(zhǔn)確的深度預(yù)測。若缺少可靠的深度信息,后續(xù)的路徑規(guī)劃與控制決策便失去了空間依據(jù)。

在自動駕駛系統(tǒng)中,深度估計的結(jié)果并非依賴單一來源,而是與激光雷達(dá)、毫米波雷達(dá)等其他傳感器數(shù)據(jù)進(jìn)行融合(即“傳感器融合”)。

這種方式既能充分利用視覺數(shù)據(jù)所蘊(yùn)含的豐富信息,也能彌補(bǔ)單一傳感器的局限性。

wKgZO2mRVx6AWAK8AAARwcz1hbg554.jpg

最后的話

把深度估計看成自動駕駛系統(tǒng)中的一個模塊,其實有點低估它的價值。它不是簡單的圖像變換,而是把二維視覺轉(zhuǎn)化成三維空間認(rèn)知的橋梁。

它讓機(jī)器不僅看到世界,還能理解世界的結(jié)構(gòu)和遠(yuǎn)近關(guān)系。沒有準(zhǔn)確的深度估計,自動駕駛車輛就缺乏最基本的空間感覺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14879

    瀏覽量

    179782
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛中常的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動駕駛模型學(xué)習(xí)時,經(jīng)常會提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動駕駛中的模仿學(xué)習(xí),就是把人類司機(jī)在各種路況下的行為做成范例,記錄下看到了什么和做了什么等信息,然后將這些一一對應(yīng)起來當(dāng)作訓(xùn)練數(shù)據(jù),并訓(xùn)練出一
    的頭像 發(fā)表于 01-16 16:41 ?1991次閱讀

    自動駕駛中常的卷積神經(jīng)網(wǎng)絡(luò)是?

    自動駕駛領(lǐng)域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網(wǎng)格。
    的頭像 發(fā)表于 11-19 18:15 ?2072次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的卷積神經(jīng)網(wǎng)絡(luò)是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“強(qiáng)化學(xué)習(xí)”是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?662次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“強(qiáng)化學(xué)習(xí)”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的ToF是

    ToF。ToF輸出的是物理意義上的“距離”,不是通過圖像推理出來的估計值。這一點決定了它在很多應(yīng)用里會被當(dāng)作一很直接、可靠的深度來源。 ToF常被應(yīng)用到能輸出“深度圖”的相機(jī),或者做
    的頭像 發(fā)表于 10-10 09:58 ?982次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ToF是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“專家數(shù)據(jù)”是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,經(jīng)常會聽到一概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應(yīng)該這么做”的那類示范數(shù)據(jù)。它不是隨機(jī)抓來的日志,也不是隨便標(biāo)注的標(biāo)簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?600次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的ODD是

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運(yùn)行設(shè)計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?898次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的硬件在環(huán)是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術(shù)時,經(jīng)常會提及一技術(shù),那就是硬件在環(huán),所謂的硬件在環(huán)是?對于自動駕駛來說有
    的頭像 發(fā)表于 08-14 08:54 ?1242次閱讀

    自動駕駛中常的RTK是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛關(guān)鍵技術(shù)時,經(jīng)常會聽到一技術(shù),那就是RTK,很多人看到RTK后一定會想,這到底是技術(shù)?為啥這個技術(shù)很少在發(fā)布會上看到,但對于
    的頭像 發(fā)表于 08-10 10:35 ?1119次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的慣性導(dǎo)航系統(tǒng)是?可以不用嗎?

    每次提到自動駕駛硬件時,大家可能第一反應(yīng)想到的是激光雷達(dá)、車載攝像頭、毫米波雷達(dá)等,但想要讓自動駕駛車輛實際落地,有一硬件也非常重要,那就是慣性導(dǎo)航系統(tǒng)。在很多討論自動駕駛技術(shù)的內(nèi)容
    的頭像 發(fā)表于 07-24 18:12 ?1923次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的慣性導(dǎo)航系統(tǒng)是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?可以不用嗎?

    自動駕駛中常的高精度地圖是?有何審查要求?

    不僅在空間分辨率和數(shù)據(jù)豐富度上有質(zhì)的飛躍,還在數(shù)據(jù)處理與安全管理方面提出了更嚴(yán)格的規(guī)范。那高精度地圖到底是?是否有什么具體需求? 高精度地圖,顧名思義,是一種面向自動駕駛的高分辨率、結(jié)構(gòu)化道路環(huán)境數(shù)據(jù)集。它不僅包含道路的幾何
    的頭像 發(fā)表于 07-03 19:29 ?944次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的高精度地圖是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?有何審查要求?

    自動駕駛中常的世界模型是?

    對外部環(huán)境進(jìn)行抽象和建模的技術(shù),讓自動駕駛系統(tǒng)在一簡潔的內(nèi)部“縮影”里,對真實世界進(jìn)行描述與預(yù)測,從而為感知、決策和規(guī)劃等關(guān)鍵環(huán)節(jié)提供有力支持。 什么是世界模型? 我們不妨先把“世界模型”想象成一種“數(shù)字化的地
    的頭像 發(fā)表于 06-24 08:53 ?1124次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的HMI是?

    控”的過程中,人機(jī)交互界面擔(dān)負(fù)著承上啟下、溝通信息與建立信任的重任。此外,這一領(lǐng)域也是可以給駕駛員和乘客帶來最直觀感知的一項技術(shù),因此對于很多車企來說,這也是最值得深度研究的一部分。那HMI到底是
    的頭像 發(fā)表于 06-22 13:21 ?2340次閱讀

    自動駕駛中常的“點云”是?

    ?對自動駕駛有何影響? 點云是? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數(shù)據(jù)集合,每個點包含自身的笛卡爾坐標(biāo)(X、Y、Z),并可附帶顏色、強(qiáng)度、時間戳
    的頭像 發(fā)表于 05-21 09:04 ?1126次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“NOA”是?

    近年來,自動駕駛技術(shù)發(fā)展迅速,業(yè)界不斷探索如何在復(fù)雜交通場景中實現(xiàn)真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術(shù),正成為各大廠商相互爭奪的關(guān)鍵技術(shù)。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?3069次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛大模型中常的Token是?對自動駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強(qiáng)大的特征提取、信息融合和預(yù)測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或許會問: Token是
    的頭像 發(fā)表于 03-28 09:16 ?1336次閱讀