91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

BEVSegFormer創(chuàng)造了新的BEV分割SOTA

Nullmax紐勱 ? 來源:紐勱科技 ? 作者:紐勱科技 ? 2022-04-27 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)自動(dòng)駕駛而言,BEV(鳥瞰圖)下的語義分割是一項(xiàng)重要任務(wù)。盡管這項(xiàng)工作已經(jīng)吸引了大量的研究,但靈活處理自動(dòng)駕駛車輛上的任意相機(jī)配置(單個(gè)或多個(gè)攝像頭),仍然是一項(xiàng)挑戰(zhàn)。

為此,Nullmax的感知團(tuán)隊(duì)提出了BEVSegFormer,這一基于Transformer的BEV語義分割方法,可面向任意配置的相機(jī)進(jìn)行BEV語義分割。

這項(xiàng)研究的題目為《BEVSegFormer: Bird's Eye View Semantic Segmentation From Arbitrary Camera Rigs》,論文鏈接:https://arxiv.org/abs/2203.04050。

為了評(píng)估這一算法的效果,Nullmax在nuScenes公開數(shù)據(jù)集以及Nullmax的自采數(shù)據(jù)集上進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,BEVSegFormer對(duì)任意相機(jī)配置的BEV語義分割,具有出色的性能表現(xiàn)。并且在nuScenes驗(yàn)證集上,BEVSegFormer創(chuàng)造了新的BEV分割SOTA。

在接下來的工作中,我們還計(jì)劃針對(duì)自動(dòng)駕駛以及BEV語義分割的一些其他挑戰(zhàn),展開進(jìn)一步的研究。

歡迎對(duì)計(jì)算機(jī)視覺及自動(dòng)駕駛感知感興趣的小伙伴加入我們,一起探索!

01

關(guān)于BEVSegFormer

在自動(dòng)駕駛或者機(jī)器人導(dǎo)航系統(tǒng)中,以BEV形式對(duì)感知信息進(jìn)行表征,具有至關(guān)重要的作用,因?yàn)樗梢詾橐?guī)劃和控制提供諸多的便利。

比如,在無地圖導(dǎo)航方案中,構(gòu)建本地BEV地圖,不僅成為了高精地圖外的另一種選擇,并且對(duì)于包括智體行為預(yù)測(cè)以及運(yùn)動(dòng)規(guī)劃等感知系統(tǒng)下游任務(wù)而言,也非常重要。而利用相機(jī)的輸入進(jìn)行BEV語義分割,通常被視為構(gòu)建本地BEV地圖的第一步。

為此,傳統(tǒng)方法一般會(huì)先在圖像空間生成分割結(jié)果,然后通過逆透視變換(IPM)函數(shù)轉(zhuǎn)換到BEV空間。雖然這是一種連接圖像空間和BEV空間的簡(jiǎn)單直接的方法,但它需要準(zhǔn)確的相機(jī)內(nèi)外參,或者實(shí)時(shí)的相機(jī)位姿估計(jì)。所以,視圖變換的實(shí)際效果有可能比較差。

以車道線分割為例,在一些挑戰(zhàn)性場(chǎng)景中,比如遮擋或者遠(yuǎn)處區(qū)域,使用IPM的傳統(tǒng)方法提供的結(jié)果就不夠準(zhǔn)確,如圖所示。

d90fae6c-c5ca-11ec-bce3-dac502259ad0.png

近年來,深度學(xué)習(xí)方法已被研究用于BEV語義分割。Lift-Splat-Shoot通過逐像素深度估計(jì)結(jié)果完成了從圖像視圖到BEV的視圖變換。不過使用深度估計(jì),也增加了視圖變換過程的復(fù)雜度。此外,有一些方法應(yīng)用MLP或者FC算子來進(jìn)行視圖變換。這些固定的視圖變換方法,學(xué)習(xí)圖像空間和BEV空間之間的固定映射,因此不依賴于輸入的數(shù)據(jù)。

而基于Transformer的方法,是在BEV空間下進(jìn)行感知的另一個(gè)研究方向。在目標(biāo)檢測(cè)任務(wù)中,DETR3D引入了一種3D邊界框檢測(cè)方法,直接從多個(gè)相機(jī)圖像的2D特征生成3D空間中的預(yù)測(cè)。3D空間和2D圖像空間之間的視圖變換,通過交叉注意模塊的3D到2D查詢來實(shí)現(xiàn)。

受此啟發(fā),我們提出了BEVSegFormer,通過在Transformer中使用交叉注意機(jī)制進(jìn)行BEV到圖像的查詢,來計(jì)算視圖變換。

BEVSegFormer由3個(gè)主要的組件組成:

共享的主干網(wǎng)絡(luò),用于提取任意相機(jī)的特征圖;

Transformer編碼器,通過自注意模塊嵌入特征圖;

BEV Transformer解碼器,通過交叉注意機(jī)制處理BEV查詢,輸出最終的BEV語義分割結(jié)果。

d944de0c-c5ca-11ec-bce3-dac502259ad0.png

具體來說,BEVSegFormer首先是使用了共享的主干網(wǎng)絡(luò),對(duì)來自任意相機(jī)的圖像特征進(jìn)行編碼,然后通過基于可變形Transformer的編碼器對(duì)這些特征進(jìn)行增強(qiáng)。

除此之外,BEVSegFormer還引入了一個(gè)BEV Transformer解碼器模塊,對(duì)BEV語義分割的結(jié)果進(jìn)行解析,以及一種高效的多相機(jī)可變形注意單元,完成BEV到圖像的視圖變換。

最后,根據(jù)BEV中的網(wǎng)格布局對(duì)查詢進(jìn)行重塑,并進(jìn)行上采樣,以有監(jiān)督的方式生成語義分割結(jié)果。

我們分別在nuScenes公開數(shù)據(jù)集以及Nullmax的自采數(shù)據(jù)集上,檢驗(yàn)了BEVSegFormer的算法效果。實(shí)驗(yàn)結(jié)果表明,BEVSegFormer在nuScenes驗(yàn)證集上創(chuàng)造了新的BEV分割SOTA。通過消融實(shí)驗(yàn),當(dāng)中每個(gè)組件的效果也得到了驗(yàn)證。

d97c3780-c5ca-11ec-bce3-dac502259ad0.png

02

加入我們

在這項(xiàng)研究中,我們?yōu)榱藨?yīng)對(duì)自動(dòng)駕駛車輛上任意相機(jī)配置的BEV語義分割挑戰(zhàn),提出了BEVSegFormer。

接下來,我們還計(jì)劃在自動(dòng)駕駛當(dāng)中,基于Transformer探索內(nèi)存效率更高、解釋性更強(qiáng)的BEV語義分割方法。

歡迎對(duì)BEV、Transformer在自動(dòng)駕駛中的感知任務(wù)感興趣,以及希望從事于計(jì)算機(jī)視覺和自動(dòng)駕駛感知研發(fā)的同學(xué),加入Nullmax感知團(tuán)隊(duì)。

在這里,你可以直接參與到大量自動(dòng)駕駛量產(chǎn)項(xiàng)目的落地,以及最前沿技術(shù)的預(yù)研當(dāng)中,為你的idea和技術(shù)找到一個(gè)充分施展的舞臺(tái)!

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14883

    瀏覽量

    179905
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124400

原文標(biāo)題:當(dāng)BEV語義分割遇上了Transformer,故事的結(jié)局是新的SOTA

文章出處:【微信號(hào):Nullmax,微信公眾號(hào):Nullmax紐勱】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    SAM(通用圖像分割基礎(chǔ)模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一個(gè)分割一切的提示型模型,其在1100萬張圖像上訓(xùn)練了超過10億個(gè)掩碼,實(shí)現(xiàn)強(qiáng)大的零樣本泛化,突破了分割界限。本例程對(duì)SAM官方開源倉(cāng)庫的模型和算法進(jìn)行移植,使之能
    的頭像 發(fā)表于 01-12 16:17 ?307次閱讀
    SAM(通用圖像<b class='flag-5'>分割</b>基礎(chǔ)模型)丨基于BM1684X模型部署指南

    自動(dòng)駕駛BEV Camera數(shù)據(jù)采集系統(tǒng):高精度時(shí)間同步解決方案

    波動(dòng)。BEV(Bird's-Eye-View)感知技術(shù)以其尺度變化小、視角遮擋少的顯著優(yōu)勢(shì),正成為自動(dòng)駕駛領(lǐng)域的關(guān)鍵技術(shù),而高精度時(shí)間同步是確保BEV感知算法準(zhǔn)確性的基礎(chǔ)保障。 2 時(shí)間同步精度要求分析 2.1 不同應(yīng)用場(chǎng)景的精度需求 自動(dòng)駕駛數(shù)據(jù)采
    的頭像 發(fā)表于 12-11 17:11 ?1319次閱讀
    自動(dòng)駕駛<b class='flag-5'>BEV</b> Camera數(shù)據(jù)采集系統(tǒng):高精度時(shí)間同步解決方案

    自動(dòng)駕駛BEV Camera數(shù)據(jù)采集:時(shí)間同步技術(shù)解析與康謀解決方案

    整合多相機(jī)圖像等多源數(shù)據(jù),完成分類、檢測(cè)、分割、跟蹤等關(guān)鍵任務(wù),而傳感器融合的準(zhǔn)確性直接依賴于時(shí)間同步——若不同相機(jī)數(shù)據(jù)存在時(shí)間偏差,會(huì)導(dǎo)致多視角圖像信息錯(cuò)位,使BEV算法無法精準(zhǔn)構(gòu)建環(huán)境俯視圖,出現(xiàn)目標(biāo)定位錯(cuò)誤、軌跡跟蹤失效等問題,嚴(yán)重
    的頭像 發(fā)表于 12-11 16:36 ?1034次閱讀
    自動(dòng)駕駛<b class='flag-5'>BEV</b> Camera數(shù)據(jù)采集:時(shí)間同步技術(shù)解析與康謀解決方案

    賦能 BEV 感知課題!高校科研多傳感器時(shí)間同步方案

    在高校自動(dòng)駕駛實(shí)驗(yàn)室里,團(tuán)隊(duì)可能常以BEV(Bird’s-EyeView)感知架構(gòu)為研究主線。旨在通過相機(jī)陣列和激光雷達(dá)的數(shù)據(jù),在空間上重建統(tǒng)一的車周環(huán)境,為下游檢測(cè)、分割提供高精度“語義地圖”。然而,一旦相機(jī)間的時(shí)間同步存在幾十毫秒及以上的
    的頭像 發(fā)表于 11-14 17:32 ?2941次閱讀
    賦能 <b class='flag-5'>BEV</b> 感知課題!高??蒲卸鄠鞲衅鲿r(shí)間同步方案

    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    目標(biāo)分割兩個(gè)賽道中均榮獲全球第二名,擊敗眾多國(guó)內(nèi)外強(qiáng)隊(duì),充分展示團(tuán)隊(duì)在復(fù)雜視頻理解與多模態(tài)視頻目標(biāo)分割領(lǐng)域的深厚積累與世界級(jí)競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 10-31 09:42 ?558次閱讀
    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)<b class='flag-5'>分割</b>挑戰(zhàn)賽雙料亞軍

    手機(jī)板 layout 走線跨分割問題

    初學(xué)習(xí)layout時(shí),都在說信號(hào)線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對(duì)。 在后續(xù)工作中,跨分割的基礎(chǔ)都是相鄰層有一面完整的GND參考,跨分割發(fā)生在相鄰的另外一層。 但
    發(fā)表于 09-16 14:56

    AURIX tc367通過 MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過 SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過 MCU SOTA 更新邏輯 IC 閃存是否可行?
    發(fā)表于 08-11 06:36

    求助,關(guān)于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給一個(gè)demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    基于黃金分割搜索法的IPMSM最大轉(zhuǎn)矩電流比控制

    摘 要:在矢量控制理論的基礎(chǔ)上,研究內(nèi)嵌式永磁同步電機(jī)(IPMSM)基于黃金分割搜索法實(shí)現(xiàn)最大轉(zhuǎn)矩電流比控制(MTPA)的方法。該方法利用對(duì)理論最優(yōu)電流矢量角表達(dá)式進(jìn)行多項(xiàng)式擬合所得值作為搜索
    發(fā)表于 07-29 16:11

    禁用直接LPB訪問,如何與TC3x 上的 SWAPEN 協(xié)同工作?

    禁用直接 LPB 訪問 (xDDIS) 位可通過 TC37x 的 FLASHCON4 和 PROCONTP 進(jìn)行配置。在 SOTA 場(chǎng)景中,我們應(yīng)該如何配置上述兩個(gè)寄存器? 如果我啟用 SWAPEN,我是否應(yīng)該禁用 UCB_OTP PROCONTP 中的 DDIS?
    發(fā)表于 07-29 10:26

    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材分割機(jī)中?

    板材分割機(jī)是工業(yè)制造中常見的裝備。機(jī)器的內(nèi)部空間狹小,如何將多達(dá)32個(gè)步進(jìn)伺服驅(qū)動(dòng)器安裝在其中顯得非常困難。本文將通過基于EtherCAT總線的插板式步進(jìn)伺服驅(qū)動(dòng)器剖析其破解之法!傳統(tǒng)銑刀式板材分割
    的頭像 發(fā)表于 07-08 11:37 ?541次閱讀
    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材<b class='flag-5'>分割</b>機(jī)中?

    【正點(diǎn)原子STM32MP257開發(fā)板試用】基于 DeepLab 模型的圖像分割

    【正點(diǎn)原子STM32MP257開發(fā)板試用】圖像分割 本文介紹正點(diǎn)原子 STM32MP257 開發(fā)板基于 DeepLab 模型實(shí)現(xiàn)圖像分割的項(xiàng)目設(shè)計(jì)。 DeepLab 模型 DeepLab-v3
    發(fā)表于 06-21 21:11

    凡億Allegro Skill布線功能-檢查跨分割

    能會(huì)導(dǎo)致設(shè)計(jì)中的缺陷和問題。為了克服這一挑戰(zhàn),可以利用凡億skill中的“檢查跨分割”命令。這個(gè)工具能夠幫助設(shè)計(jì)者快速而準(zhǔn)確地識(shí)別出高速信號(hào)參考平面的跨分割問題,從而避免了人工檢查時(shí)可能出現(xiàn)的疏漏。通過使用這種自動(dòng)化
    的頭像 發(fā)表于 06-19 11:50 ?2264次閱讀
    凡億Allegro Skill布線功能-檢查跨<b class='flag-5'>分割</b>

    淺析4D-bev標(biāo)注技術(shù)在自動(dòng)駕駛領(lǐng)域的重要性

    感知領(lǐng)域的一項(xiàng)突破性創(chuàng)新,通過引入時(shí)間維度與全局視角,為自動(dòng)駕駛系統(tǒng)提供高精度、多模態(tài)的時(shí)空真值數(shù)據(jù),重塑自動(dòng)駕駛系統(tǒng)的開發(fā)范式。 4D-BEV標(biāo)注是什么? 4D-BEV 標(biāo)注技術(shù)
    的頭像 發(fā)表于 06-12 16:10 ?2363次閱讀

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類、obb

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類、obb、pose深度學(xué)習(xí),支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28