黄色三级一区二区三区,五月激情五月丁香

? 論文鏈接：

https://arxiv.org/abs/2503.05689

?項目鏈接：

https://github.com/YvanYin/GoalFlow

概述

自動駕駛軌跡規(guī)劃往往采用直接回歸軌跡的方法，這種方式雖在測試中能取得不錯的性能，可直接輸出當前場景下最有可能的軌跡或控制，但它難以對自動駕駛場景中常見的多模態(tài)動作分布進行有效建模。在實際駕駛場景里，往往不存在唯一的最優(yōu)決策，不同的路況、交通標志以及其他道路使用者的行為等，都可能導致車輛存在多種合理的行駛軌跡選擇，而回歸模型在處理這種多模態(tài)特性時顯得力不從心。為了解決這個問題，我們提出了一種基于goal point的生成式方法GoalFlow，通過使用goal point這種強引導信息來引導生成式模型生成安全、高質(zhì)量、多模態(tài)的規(guī)劃軌跡。我們的方法在公開數(shù)據(jù)集Navsim綜合分數(shù)大幅領先其他方法。同時，通過Flow Matching對軌跡分布進行建模僅用一步降噪即可實現(xiàn)優(yōu)秀的推理性能。

GoalFlow解決的問題

當前生成多模態(tài)候選軌跡的方法主要由兩種方式：一種是在回歸軌跡的基礎上添加不同的引導信息，例如左右轉(zhuǎn)等。另一種是通過擴散模型這種連續(xù)建模的方式通過不斷加噪和去噪來生成眾多的軌跡。這兩種方式都很難達到理想的效果。前者容易發(fā)生軌跡的坍縮，引導出的軌跡非常相似。后者容易生成高度發(fā)散的軌跡，這為挑選軌跡增加了難度。為此，GoalFlow主要思考如何探索其他可行道路來實現(xiàn)高質(zhì)量的候選軌跡生成。

如何應對生成式模型軌跡過于發(fā)散的情況

相比生成眾多發(fā)散的候選軌跡，從中挑選出來一條最優(yōu)的作為輸出是更加困難的事情。我們希望通過降低軌跡的發(fā)散程度來減輕軌跡打分器的壓力。而其中，使用什么樣的信息來對軌跡進行約束是最重要的。我們發(fā)現(xiàn)，相比于dense的圖像或者BEV特征，擴散模型更喜歡sparse的信息。于是，我們采用一段軌跡中最重要的點end point作為goal point來對軌跡進行約束，使得車輛能行駛到goal point。

如何構造goal point

goal point在自動駕駛中并不是個新事物，業(yè)務中往往可以使用車道信息來預測goal point或者使用直接將導航作為goal point。但是車道信息往往需要昂貴的高精地圖，而導航往往并不表示車輛在未來幾秒后的精確信息。其他學術上的方法也有map-free的用網(wǎng)格將空間劃分若干單元來進行預測，這種方式又沒有充分考慮到goal point自身的分布特性。在調(diào)研眾多方法后，我們根據(jù)VADv2的做法，首先將軌跡的末端點進行聚類得到goal point的分布特性后，再從不同角度對goal point進行評估。

如何平衡生成準確軌跡和多模態(tài)軌跡

輸入給生成模型的信息包括兩種，一種是goal point來對軌跡進行約束和引導，一種是場景信息的BEV特征。前者對軌跡的要求是生成指向goal point的軌跡，后者是生成當前情況下最有可能的軌跡。為了平衡這兩種需求，我們主要進行了訓練策略上的不同測試。具體來說，我們會對這兩種信息分別進行類型編碼，在訓練過程中采用Classifier-Free Guidance策略，隨機drop掉這兩種特征。訓練時condition輸入包括三類：無condition，場景信息作為condition以及場景信息和goal point作為condition。

GoalFlow框架

核心思路：引入goal point作為引導信息，通過建立dense的goal point詞匯表和新穎評分機制挑選最優(yōu)goal point，再由goal point和場景信息作為condition，交給Flow Matching生成軌跡。

具體流程：

感知方面上采用transfuser，融合圖像和LiDAR信息，得到BEV feature。

通過聚類數(shù)據(jù)集中的軌跡末端點得到dense的goal point詞表，作為goal point的候選集。

將goal point和真實end point的遠近程度以及goal point是否在車輛可行駛區(qū)域內(nèi)作為評價標準，從詞表中挑選出當前最優(yōu)的goal point。

引入flow matching對軌跡進行連續(xù)建模，將場景信息和goal point作為condition生成軌跡。

實驗結果

在Navsim數(shù)據(jù)集上，軌跡采用碰撞率，是否在可行駛區(qū)域內(nèi)，舒適度等綜合指標PDMS來評價。GoalFlow在PDMS上達到90.3分，遠超以regression為代表的Transfuser方法（84.0分）和naive的generative model（85.6分）。模擬真實場景用更精確goal point代替預測goal point時，PDMS達到92.1分，逼近人類駕駛的94.8分。此外，基于flow matching的方法對推理中denoising步數(shù)具有魯棒性，只需1步推理就能達到優(yōu)異性能，大大減輕自動駕駛硬件負擔。

展望與總結

GoalFlow通過聚類方法捕捉目標點 (goal point) 的分布特性，并設計了一套目標點評估機制，為目標點進行打分。基于這些目標點，GoalFlow引導生成式方法Flow Matching生成高質(zhì)量軌跡。實驗表明，GoalFlow能夠生成優(yōu)異的軌跡，并提供多樣化的高質(zhì)量軌跡候選，顯著提升了軌跡生成的性能。

未來，我們將進一步探索如何優(yōu)化引導信息的利用，尤其是設計更高效的網(wǎng)絡結構，以更好地平衡場景信息和目標點引導信息對模型的影響。此外，當前工作主要聚焦于坐標位置作為引導條件，之后可以進一步探索將人類語言指令作為條件輸入，結合GoalFlow實現(xiàn)更智能的指令跟隨能力，拓展其在人機交互和自動駕駛等領域的應用潛力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴