91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型真的有助于自動駕駛落地嗎?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-08-16 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]隨著汽車智能化發(fā)展,越來越多新技術(shù)被應(yīng)用到汽車上,為了能夠讓汽車更加智能,大模型技術(shù)也開始被應(yīng)用到汽車上,尤其是隨著自動駕駛技術(shù)的逐漸落地,大模型的應(yīng)用也更加廣泛,那大模型真的有助于自動駕駛嗎?車企使用大模型,是跟風(fēng),還是真的有用?

wKgZPGif4jSASYNkAAAQo00DEvw334.jpg

大模在自動駕駛上的優(yōu)勢

在聊今天的話題前,要先聊聊什么是“大模型”。相較于我們熟知的在手機上使用的語言類大模型,自動駕駛使用的大模型僅限于聊天功能,而是指經(jīng)過海量數(shù)據(jù)預(yù)訓(xùn)練、擁有豐富表征能力和推理能力的深度模型。它們可以是純語言模型(LLM),也可以是視覺/視覺-語言的多模態(tài)模型,或者是將感知、地圖、軌跡等多模態(tài)數(shù)據(jù)聯(lián)合建模的巨型網(wǎng)絡(luò)。大模型的核心特點是強大的表征學(xué)習(xí)能力、遷移學(xué)習(xí)能力和在少量示例下進(jìn)行任務(wù)適配的能力。把這些能力放到自動駕駛場景,會帶來哪些直接好處?

第一個顯著優(yōu)勢是“語義化與通用表征”。傳統(tǒng)自動駕駛系統(tǒng)往往依賴大量手工設(shè)計的像是各類目標(biāo)框、車道線、交通標(biāo)志分類等中間表示和專門標(biāo)簽。大模型通過自監(jiān)督學(xué)習(xí)可以把圖像、雷達(dá)點云、軌跡序列、地圖要素等聯(lián)合編碼成高維語義向量,這種向量更能捕獲場景的高階關(guān)系,比如“這是一個繁忙交叉口、行人群集且有遮擋”的整體語義,而不是單個像素或點的局部判斷。這樣的表征對下游任務(wù)(場景理解、行為預(yù)測、決策輔助)有天然幫助,尤其在稀疏樣本或長尾場景上,表現(xiàn)出更好的遷移能力。

第二個好處是“少樣本學(xué)習(xí)與知識遷移”。大模型在海量多樣數(shù)據(jù)上預(yù)訓(xùn)練后,能把常識性知識和駕駛經(jīng)驗以分布式權(quán)重的形式存儲。當(dāng)遇到新城市、新氣候或未見過的路口設(shè)計時,通過少量標(biāo)注或在線微調(diào),模型往往能夠更快適應(yīng)。對于工程上要頻繁覆蓋新場景的車隊來說,這一點能顯著降低標(biāo)注成本和模型迭代周期。

第三個好處是“多模態(tài)推理與統(tǒng)一接口”。自動駕駛汽車對于交通環(huán)境的理解主要來自攝像頭、激光雷達(dá)、毫米波雷達(dá)、高清地圖、V2X等,大模型可以作為一個統(tǒng)一的推理層,把這些輸入融合在一起,輸出對場景的高層語義解釋或候選行為策略。相比傳統(tǒng)的硬編碼規(guī)則或松耦合模塊化方案,這種統(tǒng)一的推理有時能更好地處理信息不一致或局部傳感器失效的情況,提供更穩(wěn)健的備選解。

此外,大模型在工程流水線上的價值也很明顯,它可以自動化標(biāo)注、生成難例、合成訓(xùn)練場景、寫測試用例、做仿真場景擴展,甚至參與代碼生成與日志分析。把大量重復(fù)性、勞動力密集的工作交給大模型,能把工程師從低價值的任務(wù)中解放出來,集中做架構(gòu)設(shè)計和安全評估。

wKgZPGif4jWAQGwTAAAR42n7O-I161.jpg

大模型在自動駕駛上的風(fēng)險

理解了優(yōu)勢,再來聊聊不足。首先是“實時性與算力”的挑戰(zhàn)。大模型需要的參數(shù)量巨大,運行在車端直接做閉環(huán)控制在當(dāng)前算力與功耗預(yù)算下并不現(xiàn)實。即便采用剪枝、蒸餾或量化,依然需要小心平衡延遲和性能。自動駕駛對延遲、確定性和可預(yù)測性的要求極高,任何一次決策的延遲或抖動都可能變成安全隱患。

其次是“可驗證性與可解釋性”問題。想要確保自動駕駛汽車安全行駛,每一個動作都需要可證明的行為邊界和可審計的決策鏈路。大模型本質(zhì)上是統(tǒng)計學(xué)習(xí)器,其推理過程并不天然滿足形式化驗證要求。把一個黑箱模型放在決策閉環(huán)中,會讓安全審計、法規(guī)合規(guī)、事故歸因等工作變得復(fù)雜。為此要在使用大模型時加上可解釋的中間表示、約束層和冗余控制回退策略。

還有就是魯棒性與長尾場景處理能力。雖然大模型在遷移學(xué)習(xí)上表現(xiàn)優(yōu)異,但在極端場景、傳感器惡劣失真或?qū)剐暂斎胂氯钥赡苁?。自動駕駛的風(fēng)險集中在長尾事件上,而這些事件往往缺乏足夠數(shù)據(jù)供大模型預(yù)訓(xùn)練時學(xué)習(xí)到,因此不能把所有安全希望寄托在模型“學(xué)會”偶發(fā)事故上。

最后就是“分發(fā)式責(zé)任與法規(guī)風(fēng)險”。把決策權(quán)交給一個學(xué)得來的模型會引發(fā)責(zé)任界定問題。無論是車企、軟硬件供應(yīng)商還是服務(wù)運營方,誰為模型決策的失誤負(fù)責(zé),法律和保險生態(tài)尚在適配階段。在某些國家和地區(qū),監(jiān)管機構(gòu)對黑箱決策持謹(jǐn)慎態(tài)度,這會影響技術(shù)落地節(jié)奏。

wKgZPGif4jaAMIvOAAASG3BOmsQ125.jpg

大模型如何合理利用于自動駕駛?

那么在自動駕駛汽車上應(yīng)如何合理利用大模型?實踐中比較合理的路徑是“模塊化+大模型輔助”的混合架構(gòu)。把感知(像素到對象、幾何重建)、定位與映射、控制等關(guān)鍵實時環(huán)節(jié)仍然由高頻、經(jīng)過嚴(yán)格驗證的模塊承擔(dān);把大模型放在如場景解釋、長時程行為預(yù)測、復(fù)雜交互推理、異常檢測、策略建議和仿真場景生成等“中高層推理”或“離線路徑”上。這樣既能利用大模型的長處,又能保留低延遲和可驗證的控制路徑。

為了實現(xiàn)工業(yè)級落地,可采用蒸餾與層次化部署。先在云端用大模型完成復(fù)雜推理或策略搜索,生成穩(wěn)定的策略候選或結(jié)構(gòu)化指令,然后把這些知識蒸餾到輕量化、可實時運行的模型(或基于規(guī)則的控制器)中,并部署到車端。這樣既能把通用知識轉(zhuǎn)移到邊緣設(shè)備,又能保證每次決策的可控性與時效性。

在訓(xùn)練方法上,大模型的引入也改變了數(shù)據(jù)策略。自監(jiān)督學(xué)習(xí)(例如對比學(xué)習(xí)、掩碼建模)在多模態(tài)數(shù)據(jù)上能學(xué)習(xí)通用特征,減少對昂貴標(biāo)簽的依賴;仿真生成與合成數(shù)據(jù)在補齊長尾場景方面作用明顯,但需要做好域適配(sim2real)。行為級的訓(xùn)練則結(jié)合示范學(xué)習(xí)、離線強化學(xué)習(xí)和人類專家驗證,避免模型在現(xiàn)實世界里進(jìn)行危險的在線試錯。數(shù)據(jù)治理、標(biāo)注質(zhì)量控制和場景覆蓋評估,依然是能否把模型成功推向量產(chǎn)的關(guān)鍵。

在評估與驗證時,使用大模型并不意味著可以放松測試。相反,需要更嚴(yán)密的場景覆蓋度指標(biāo)、基于場景的安全指標(biāo)以及對模型不確定性的量化。對不確定性的估計(例如置信區(qū)間、貝葉斯近似或深度集成)在運行時能觸發(fā)切換策略或請求人工介入。覆蓋測試要包含傳感器失效、遮擋、惡劣天氣、稀有行為體等長尾場景,同時結(jié)合覆蓋引導(dǎo)的對抗測試來查找潛在失敗模式。

使用了大模型,并不意味著自動駕駛汽車可以完全智能,冗余和監(jiān)控依然不可或缺。即使大模型提供了高質(zhì)量的建議,系統(tǒng)也應(yīng)有兩個獨立鏈路來核驗輸出,并在不一致時執(zhí)行簡單、安全的停止或降級措施。運行時監(jiān)控要包括模型輸入管線的完整性檢查、輸出一致性檢查、以及隨時間漂移的性能回歸檢測。在線日志和回放機制同樣重要,事故發(fā)生后必須能回溯每一步?jīng)Q策和模型輸入以支持責(zé)任認(rèn)定與模型改進(jìn)。

對于研發(fā)團(tuán)隊而言,落地大模型的成本和工程量也不容忽視。模型訓(xùn)練需要大量算力和存儲,數(shù)據(jù)標(biāo)注與清洗仍是主要開銷之一??梢韵仍诜抡婧烷]環(huán)測試臺架上驗證大模型的推理能力,再在封閉場地、限定場景的道路測試中做安全下沉。

wKgZPGif4jeAU_YwAAASAJELks8723.jpg

最后的話

對于很多專門從事自動駕駛大模型的小伙伴以及一些剛進(jìn)入這一行的同學(xué),智駕最前沿想提一些建議。第一,掌握基礎(chǔ)的感知與幾何知識仍然是根基。無論未來模型怎樣發(fā)展,攝像頭、LiDAR、雷達(dá)的物理測量特性和幾何約束始終決定了可獲得信息的上限。第二,理解模型的不確定性很重要。會使用大模型和知道什么時候不用它,同樣是工程能力。第三,從小切口試水,先把大模型用在比如輔助標(biāo)注、生成訓(xùn)練場景、做日志分析或提供多模態(tài)檢索等非關(guān)鍵路徑上,以積累工程經(jīng)驗和安全方式論證。第四,重視數(shù)據(jù)治理和場景覆蓋,良好的數(shù)據(jù)策略比單純堆模型參數(shù)更能提升系統(tǒng)安全性。第五,若是在帶領(lǐng)團(tuán)隊,要建立跨學(xué)科的團(tuán)隊,把算法工程師、系統(tǒng)工程師、功能安全工程師和驗證工程師放在同一項目里,確保模型的研發(fā)和驗證能夠互相制衡。

其實大模型帶來的并不是單一的“萬能解”,而是一個能夠顯著提升認(rèn)知、生成和推理能力的新工具箱。它能加速數(shù)據(jù)閉環(huán)、提升對復(fù)雜場景的理解、改善人機交互、并在工程流程中提高效率。但它不是直接替代所有傳統(tǒng)模塊的捷徑;在安全關(guān)鍵的閉環(huán)控制上,黑箱式的大模型仍然難以滿足可驗證性與確定性的要求。合理的路徑是把大模型視為“認(rèn)知增強器”和“工程放大器”,在不降低系統(tǒng)可控性的前提下逐步滲透到感知、預(yù)測、規(guī)劃的上層、以及數(shù)據(jù)與仿真流水線里。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14878

    瀏覽量

    179764
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3647

    瀏覽量

    5176
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何構(gòu)建適合自動駕駛的世界模型?

    提出的。那世界模型自動駕駛落地的正解嗎? 什么是世界模型? 世界模型對于自動駕駛汽車來說,更像
    的頭像 發(fā)表于 02-18 08:14 ?1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動駕駛</b>的世界<b class='flag-5'>模型</b>?

    2026年,3DGS和世界模型,在自動駕駛仿真中的組合應(yīng)用

    寫在前面:作為自動駕駛仿真的核心支撐,3DGS與世界模型的技術(shù)落地一直備受關(guān)注。我們看到了車路漫漫的一篇文章,探討了3DGS與世界模型的路線
    的頭像 發(fā)表于 02-03 17:32 ?3171次閱讀
    2026年,3DGS和世界<b class='flag-5'>模型</b>,在<b class='flag-5'>自動駕駛</b>仿真中的組合應(yīng)用

    Transformer如何讓自動駕駛模型獲得思考能力?

    在談及自動駕駛時,Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer在自動駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4151次閱讀

    黃仁勛:未來十年很多汽車是自動駕駛 英偉達(dá)發(fā)布Alpamayo汽車大模型平臺

    最看好的AI落地場景就是自動駕駛。在演講中黃仁勛提到,未來十年,世界上很大一部分汽車將是自動駕駛或高度自動駕駛的。你期待嗎? 英偉達(dá)發(fā)布Alpamayo汽車大
    的頭像 發(fā)表于 01-06 11:45 ?1067次閱讀

    世界模型是讓自動駕駛汽車?yán)斫馐澜邕€是預(yù)測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型自動駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是讓自動駕駛汽車得以理解世界,還是為其提供了預(yù)測未來的視角?
    的頭像 發(fā)表于 12-16 09:27 ?858次閱讀
    世界<b class='flag-5'>模型</b>是讓<b class='flag-5'>自動駕駛</b>汽車?yán)斫馐澜邕€是預(yù)測未來?

    模型中常提的快慢思考會對自動駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能駕駛研發(fā)進(jìn)入了新階段。
    的頭像 發(fā)表于 11-22 10:59 ?2496次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會對<b class='flag-5'>自動駕駛</b>產(chǎn)生什么影響?

    VLA和世界模型,誰才是自動駕駛的最優(yōu)解?

    Model)路線,這兩種路徑都為自動駕駛快速落地提供了可能,那誰才是最優(yōu)解? 什么是VLA模型? VLA模型,即視覺—語言—行動模型,是將
    的頭像 發(fā)表于 11-05 08:55 ?774次閱讀
    VLA和世界<b class='flag-5'>模型</b>,誰才是<b class='flag-5'>自動駕駛</b>的最優(yōu)解?

    自動駕駛與具身智能技術(shù)上有什么共性及差異?

    ”以及“有何不同”,不僅有助于把準(zhǔn)技術(shù)脈搏,更能為跨領(lǐng)域的創(chuàng)新提供清晰的路線圖。 什么是“具身智能”與“自動駕駛”? “具身智能”指的是智能體不僅具備抽象思考能力,還擁有一個物理意義上的身體。這個身體帶來力學(xué)約束
    的頭像 發(fā)表于 10-25 16:10 ?1370次閱讀
    <b class='flag-5'>自動駕駛</b>與具身智能技術(shù)上有什么共性及差異?

    傳統(tǒng)車企和造車新勢力在自動駕駛技術(shù)上各有什么優(yōu)勢?

    [首發(fā)于智駕最前沿微信公眾號]在談今天這個話題之前先申明,之所以聊這個內(nèi)容并不是為了給誰貼標(biāo)簽,而是想把現(xiàn)實中影響自動駕駛研發(fā)與落地的關(guān)鍵能力說清楚。自動駕駛既涉及傳感器和感知算法,也涉及整車
    的頭像 發(fā)表于 10-14 15:10 ?548次閱讀
    傳統(tǒng)車企和造車新勢力在<b class='flag-5'>自動駕駛</b>技術(shù)上各有什么優(yōu)勢?

    為什么自動駕駛端到端大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,端到端(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端到端
    的頭像 發(fā)表于 07-04 16:50 ?878次閱讀
    為什么<b class='flag-5'>自動駕駛</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自動駕駛中常提的世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?1122次閱讀
    <b class='flag-5'>自動駕駛</b>中常提的世界<b class='flag-5'>模型</b>是個啥?

    自動駕駛技術(shù)落地前為什么要先測試?

    大量的傳感器、復(fù)雜的算法和強大的計算平臺來取代人類駕駛員的感知、判斷和操作。在技術(shù)落地之前,“測試”便成了自動駕駛從實驗室走向真實道路的“安全閥”和“試金石”。如果沒有充分的測試,無論技術(shù)多么先進(jìn),都可能在現(xiàn)實環(huán)境中
    的頭像 發(fā)表于 06-09 09:42 ?732次閱讀

    模型如何推動自動駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號]近年來,人工智能技術(shù)正以前所未有的速度在各個領(lǐng)域滲透與應(yīng)用,而大模型(大語言模型和多模態(tài)大模型)的迅猛發(fā)展為自動駕駛技術(shù)帶來了新的機遇。傳統(tǒng)的
    的頭像 發(fā)表于 04-20 13:16 ?1015次閱讀
    大<b class='flag-5'>模型</b>如何推動<b class='flag-5'>自動駕駛</b>技術(shù)革新?

    自動駕駛模型中常提的Token是個啥?對自動駕駛有何影響?

    近年來,人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語言處理、計算機視覺、語音識別以及自動駕駛等多個領(lǐng)域取得了突破性進(jìn)展。自動駕駛作為未來智能交通的重要方向,其核心技術(shù)之
    的頭像 發(fā)表于 03-28 09:16 ?1335次閱讀