91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Transformer如何讓自動駕駛變得更聰明?

智駕最前沿 ? 來源:智駕最前沿 ? 2025-11-19 18:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]自動駕駛中常提的Transformer本質(zhì)上是一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最早在自然語言處理里火起來。與卷積神經(jīng)網(wǎng)絡(luò)(CNN)或循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)不同,Transformer能夠自動審視所有輸入信息,并動態(tài)判斷哪些部分更為關(guān)鍵,同時可以將這些重要信息有效地關(guān)聯(lián)起來。

這種能力對自動駕駛來說至關(guān)重要。由于駕駛場景復(fù)雜多變,自動駕駛系統(tǒng)需要同時處理來自攝像頭、毫米波雷達(dá)、激光雷達(dá)和高精地圖等多種來源的數(shù)據(jù),還要理解車輛、行人等參與者之間隨時間的動態(tài)交互。傳統(tǒng)方法在應(yīng)對這種多模態(tài)、長時序的信息關(guān)聯(lián)時會感覺力不從心,而Transformer的架構(gòu)特性剛好彌補(bǔ)了這些短板。

Transformer能將“前方100米處一個模糊的物體”、“旁邊車道一輛正在減速的汽車”以及“幾秒鐘前路口突然出現(xiàn)的行人”這些看似獨(dú)立的信息碎片,整合成一套統(tǒng)一的“輸入單元”。它會自動在這些單元之間建立有用的聯(lián)系,最終提煉出對當(dāng)前駕駛決策最有價值的核心信息。這種強(qiáng)大的全局關(guān)聯(lián)能力,讓感知、預(yù)測和規(guī)劃這些原本界限分明的模塊,可以用一種更集成、更智能的方式協(xié)同工作。

01Transformer的核心機(jī)制:自注意力和多頭注意力

Transformer之所以強(qiáng)大,其關(guān)鍵在于“自注意力”機(jī)制。自注意力機(jī)制會將輸入的每一個元素(比如圖像的一塊patch、激光雷達(dá)的一個點(diǎn))轉(zhuǎn)化為Query(查詢)、Key(鍵)、Value(值)這三種不同的向量:

查詢:可以理解為當(dāng)前元素提出的問題:“我應(yīng)該關(guān)注誰?”

鍵:是其他元素提供的標(biāo)識:“我是誰?”

值:是其他元素所包含的實(shí)際信息:“我有什么內(nèi)容。”

查詢會和所有鍵做相似度比較,得到權(quán)重,再把這些權(quán)重作用到所有值上,最終得到這個位置的新表示。這個過程就是讓模型自己決定“我應(yīng)該關(guān)注哪些其他位置的信息來更新當(dāng)前位置的理解”。為了穩(wěn)定訓(xùn)練過程,注意力計(jì)算會通過一個縮放因子進(jìn)行調(diào)整。

Transformer不會只做一次注意力計(jì)算,而是采用“多頭注意力”,即可以同時進(jìn)行多組獨(dú)立的注意力運(yùn)算。這好比讓多個專家從不同角度分析同一段信息,有的專家專注于局部細(xì)節(jié),有的專家則善于把握全局關(guān)系,他們最后會將見解綜合起來,形成更全面、更深刻的理解。

對于自動駕駛中常見的時間序列問題,Transformer可以輕松地將過去若干幀的數(shù)據(jù)作為輸入序列,通過注意力機(jī)制直接學(xué)習(xí)不同時刻之間的依賴關(guān)系。再輔以“位置編碼”來告知模型各個輸入單元的先后順序,從而有效地預(yù)測出車輛、行人未來的運(yùn)動軌跡。

02Transformer對感知的好處

之前,感知里最常見的做法是用卷積網(wǎng)絡(luò)做圖像特征提取,再用專門的檢測頭(如Faster R-CNN、YOLO)做目標(biāo)檢測。Transformer做的就是把檢測問題重新表述成了“一組查詢?nèi)テヅ鋱鼍袄锏奈矬w”,這類方法(比如DETR、以及后續(xù)變體)減少了很多手工設(shè)計(jì)的錨框、NMS(非極大值抑制)等步驟,思路上更直接,也更統(tǒng)一。

1)長距離與稀疏目標(biāo)的檢測更魯棒

得益于全局注意力,Transformer在分析一個遠(yuǎn)處的小目標(biāo)時,能夠同時參考近處的大物體和整體的場景上下文。這在目標(biāo)被部分遮擋或圖像分辨率有限的情況下尤其有用,模型可以依據(jù)其他相關(guān)線索推斷出“那可能是一個行人”或“遠(yuǎn)處有一輛??康能囕v”。

2)多模態(tài)融合更自然

自動駕駛車輛裝備了如攝像頭、毫米波雷達(dá)和激光雷達(dá)等傳感器,Transformer則提供了一個統(tǒng)一的框架,可以將這些不同來源的數(shù)據(jù)都表示為“輸入單元”,然后通過跨模態(tài)注意力機(jī)制讓它們自由地交流信息。舉個例子,激光雷達(dá)提供的精確三維點(diǎn)云信息可以與攝像頭豐富的紋理、顏色信息相互補(bǔ)充,模型能自動學(xué)習(xí)在何時、以何種方式信賴哪一種傳感器,實(shí)現(xiàn)真正意義上的早期融合。

3)端到端的檢測與跟蹤更容易結(jié)合

Transformer可以把檢測框、歷史軌跡、甚至ID信息都當(dāng)作token,讓模型同時做檢測和關(guān)聯(lián),能減少后處理步驟,降低誤關(guān)聯(lián)(ID-switch)的概率。Transformer在多目標(biāo)跟蹤(MOT)領(lǐng)域的進(jìn)展,可以有效解決自動駕駛里連續(xù)幀中物體身份保持的問題。

03Transformer如何讓決策更有洞察力

預(yù)測其他道路參與者的未來軌跡,并規(guī)劃出自車的安全路徑,是自動駕駛的核心任務(wù),為實(shí)現(xiàn)這一目標(biāo),需要模型具備強(qiáng)大的推理能力,能夠理解參與者之間復(fù)雜的時空交互。Transformer的自注意力機(jī)制在這里再次展現(xiàn)出巨大優(yōu)勢。

1)更好地建模交互行為

傳統(tǒng)方法在建模多智能體交互時會顯得比較僵硬。而Transformer的注意力機(jī)制天生就能計(jì)算任意兩個參與者之間的影響程度,并能動態(tài)地將注意力聚焦在“關(guān)鍵參與者”上。如在通過一個無信號燈的路口時,Transformer能同時考慮左側(cè)來車、右側(cè)準(zhǔn)備橫穿的行人以及前方車輛的意圖,從而生成多種合理的未來概率分布,以便自動駕駛汽車可以安全、高效地駕駛。

2)長時記憶更友好

某些駕駛行為的預(yù)測需要回顧較長的歷史信息。要預(yù)測一個行為,有時候需要回看很長時間的過去狀態(tài)(比如某輛車的轉(zhuǎn)向燈在幾秒前就亮了,但始終慢速行駛,現(xiàn)在終于開始并線)。Transformer對長序列的處理比傳統(tǒng)LSTM等要更為穩(wěn)健,而且可以并行計(jì)算,訓(xùn)練效率會更高。當(dāng)然,為了處理更長的歷史信息,需采用稀疏注意力、局部—全局混合機(jī)制或緩存機(jī)制來控制計(jì)算量。

3)規(guī)劃可以直接利用預(yù)測注意力

當(dāng)預(yù)測模塊和規(guī)劃模塊都基于Transformer構(gòu)建時,它們之間的信息流動會更加順暢。規(guī)劃模塊不僅能看到預(yù)測模塊輸出的軌跡,甚至能“看到”預(yù)測過程中的注意力分布,即其他交通參與者最關(guān)心誰。這為自車的決策提供了更深層次的上下文,如在通過一個擁擠路口時,自動駕駛汽車可以對那個注意力高度分散、行為不確定的車輛保持更大的安全距離。

04最后的話

Transformer為自動駕駛帶來了一種更強(qiáng)大、更靈活的“信息關(guān)聯(lián)與理解”的新范式。它讓機(jī)器能夠像人類一樣,更全面地審視復(fù)雜的駕駛環(huán)境,將不同來源、不同時間的信息融會貫通,從而做出更前瞻、更合理的決策。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14878

    瀏覽量

    179750
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    6936
  • 卷積神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    4

    文章

    372

    瀏覽量

    12873
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何構(gòu)建適合自動駕駛的世界模型?

    提出的。那世界模型是自動駕駛落地的正解嗎? 什么是世界模型? 世界模型對于自動駕駛汽車來說,更像是給汽車大腦里繪制一張地圖,可以將環(huán)境的現(xiàn)狀和未來可能的演變都表示出來,自動駕駛系統(tǒng)不
    的頭像 發(fā)表于 02-18 08:14 ?1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動駕駛</b>的世界模型?

    Transformer如何自動駕駛大模型獲得思考能力?

    在談及自動駕駛時,Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer自動駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4150次閱讀

    德州儀器這些技術(shù)推動自動駕駛邁向新高度

    2026 年 CES 展會上,自動駕駛成為熱議焦點(diǎn)!AI 融合 4D 成像雷達(dá)與高性能芯片,實(shí)現(xiàn)了更精準(zhǔn)的感知與實(shí)時決策。區(qū)域架構(gòu)和 48V 系統(tǒng)車輛聰明高效。這些技術(shù)已規(guī)?;涞?/div>
    的頭像 發(fā)表于 01-26 10:12 ?2338次閱讀

    如何設(shè)計(jì)好自動駕駛ODD?

    為確定自動駕駛的可使用范圍,會給自動駕駛設(shè)置一個運(yùn)行設(shè)計(jì)域(Operational Design Domain,ODD)。ODD的作用就是用來明確自動駕駛在什么情況下能工作,在什么情況下不能工作,給車設(shè)定“工作范圍”。
    的頭像 發(fā)表于 01-24 09:27 ?1497次閱讀

    算力越高,自動駕駛汽車就會越聰明?

    自動駕駛行業(yè),說起算力,很多人第一反應(yīng)是“更強(qiáng)就是更好”,更快的芯片、更大的算力池,感覺就可以汽車能看得清楚、做決定更快、安全。但事實(shí)并非如此。對于
    的頭像 發(fā)表于 12-28 14:23 ?1287次閱讀

    自動駕駛汽車如何檢測石頭這樣的小障礙物?

    [首發(fā)于智駕最前沿微信公眾號]最近有一位小伙伴留言,想我聊聊自動駕駛汽車對于石頭這樣的小障礙物,是使用什么視覺任務(wù)檢測的。在直接回答“如何檢測”之前,其實(shí)要思考一個根本的問題,對于一個像石頭這樣
    的頭像 發(fā)表于 12-24 16:53 ?1110次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何檢測石頭這樣的小障礙物?

    世界模型是自動駕駛汽車?yán)斫馐澜邕€是預(yù)測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型在自動駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是自動駕駛汽車得以理解世界,還是為其提供了預(yù)測未來的視角?
    的頭像 發(fā)表于 12-16 09:27 ?854次閱讀
    世界模型是<b class='flag-5'>讓</b><b class='flag-5'>自動駕駛</b>汽車?yán)斫馐澜邕€是預(yù)測未來?

    不同等級的自動駕駛技術(shù)要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學(xué)會(SAE)根據(jù)自動駕駛系統(tǒng)與人類駕駛員參與駕駛行為程度的不同,將
    的頭像 發(fā)表于 10-18 10:17 ?2703次閱讀

    自動駕駛Transformer大模型會取代深度學(xué)習(xí)嗎?

    持續(xù)討論。特別是在自動駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過時”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實(shí)際落地路徑等維度來看,Transformer與深度學(xué)習(xí)并非你死我活的替代
    的頭像 發(fā)表于 08-13 09:15 ?4172次閱讀
    <b class='flag-5'>自動駕駛</b>中<b class='flag-5'>Transformer</b>大模型會取代深度學(xué)習(xí)嗎?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對于自動駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對于卡車、礦車的
    的頭像 發(fā)表于 06-28 11:38 ?1355次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術(shù)要求上有何不同?

    自動駕駛安全基石:ODD

    電子發(fā)燒友網(wǎng)綜合報道 自動駕駛ODD(Operational Design Domain)即設(shè)計(jì)運(yùn)行域,是指自動駕駛系統(tǒng)被設(shè)計(jì)為安全、有效運(yùn)行的具體條件范圍。它定義了自動駕駛汽車在哪些環(huán)境、場景
    的頭像 發(fā)表于 05-19 03:52 ?6396次閱讀

    AI將如何改變自動駕駛?

    自動駕駛帶來哪些變化?其實(shí)AI可以改變自動駕駛技術(shù)的各個環(huán)節(jié),從感知能力的提升到?jīng)Q策框架的優(yōu)化,從安全性能的增強(qiáng)到測試驗(yàn)證的加速,AI可以自動駕駛從實(shí)驗(yàn)室走向大規(guī)模商業(yè)化。 對于感知
    的頭像 發(fā)表于 05-04 09:58 ?830次閱讀

    感知融合如何自動駕駛汽車“看”世界清晰?

    自動駕駛技術(shù)被認(rèn)為是未來交通領(lǐng)域的革命性變革,其目標(biāo)是通過技術(shù)手段實(shí)現(xiàn)安全、高效、便捷的出行體驗(yàn)。而在這一技術(shù)體系中,環(huán)境感知系統(tǒng)扮演著至關(guān)重要的角色,它不僅是自動駕駛車輛理解外部世界的“眼睛
    的頭像 發(fā)表于 04-27 16:24 ?867次閱讀
    感知融合如何<b class='flag-5'>讓</b><b class='flag-5'>自動駕駛</b>汽車“看”世界<b class='flag-5'>更</b>清晰?

    智慧光伏運(yùn)維管理系統(tǒng)電站聰明省心

    ?????? 智慧光伏運(yùn)維管理系統(tǒng)電站聰明省心 ?????? 光伏電站像一片巨大的太陽能農(nóng)田,每天默默吸收陽光發(fā)電。但要讓這片農(nóng)田高效運(yùn)轉(zhuǎn),過去需要大量人力巡查設(shè)備、處理故障,既
    的頭像 發(fā)表于 03-31 15:44 ?783次閱讀
    智慧光伏運(yùn)維管理系統(tǒng)<b class='flag-5'>讓</b>電站<b class='flag-5'>更</b><b class='flag-5'>聰明</b><b class='flag-5'>更</b>省心