91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

世界模型在自動(dòng)駕駛中部署時(shí)有何難點(diǎn)?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-04-10 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]世界模型應(yīng)該是這兩天自動(dòng)駕駛行業(yè)討論度非常高的一項(xiàng)技術(shù)。通俗來(lái)講,世界模型就像是給自動(dòng)駕駛車輛裝上了一個(gè)具備想象力的大腦。它不僅能看到眼前的紅綠燈和行人,還能根據(jù)當(dāng)前的狀況推演未來(lái)幾秒鐘內(nèi)交通環(huán)境可能發(fā)生的變化。這種預(yù)測(cè)未來(lái)的能力,是實(shí)現(xiàn)復(fù)雜場(chǎng)景自主決策的關(guān)鍵,但在實(shí)際部署時(shí),卻有非常多的問(wèn)題需要解決。

wKgZPGnYSyKAL5hHAAAQo00DEvw408.jpg

復(fù)雜的世界如何塞進(jìn)算法?

想要讓算法理解現(xiàn)實(shí)世界,首先要解決的是數(shù)據(jù)壓縮與特征提取的問(wèn)題。現(xiàn)實(shí)環(huán)境的信息量是爆炸式的,攝像頭、激光雷達(dá)和毫米波雷達(dá)每秒鐘產(chǎn)生的數(shù)據(jù)多達(dá)數(shù)個(gè)GB。如果直接讓模型去處理這些原始像素或點(diǎn)云,計(jì)算壓力會(huì)大到無(wú)法想象。因此,世界模型的第一步是建立一個(gè)潛空間,也就是將復(fù)雜的視覺信息壓縮成一組精煉的數(shù)學(xué)向量。

wKgZPGnYSyeAKe2FANjglQ9o894252.jpg

圖片源自:網(wǎng)絡(luò)

這種壓縮過(guò)程非常容易丟失關(guān)鍵細(xì)節(jié)。比如遠(yuǎn)處的紅綠燈顏色、地面的細(xì)微結(jié)冰痕跡或者行人的一個(gè)眼神動(dòng)作,在數(shù)據(jù)大幅度降維的過(guò)程中可能被當(dāng)作“噪聲”過(guò)濾掉。而在自動(dòng)駕駛中,這些細(xì)節(jié)往往決定了決策的成敗。如何在保持模型運(yùn)算效率的同時(shí),精準(zhǔn)地捕捉到那些能夠影響駕駛安全的微小特征,是目前技術(shù)實(shí)現(xiàn)的第一個(gè)難點(diǎn)。

此外,潛空間的狀態(tài)表示需要具備極強(qiáng)的泛化能力。如果模型只在晴天和寬敞的高速公路上訓(xùn)練,當(dāng)它面對(duì)暴雨、大雪或者擁堵的城中村路口時(shí),原有的壓縮邏輯就可能會(huì)失效。這種對(duì)未知環(huán)境的理解深度,直接決定了世界模型是否能像人類駕駛員那樣,在陌生路段也能迅速做出合理的判斷。

wKgZO2nYSyuAWrVmAAAR42n7O-I502.jpg

面對(duì)不確定性時(shí)該怎么辦?

世界模型的核心任務(wù)是預(yù)測(cè)未來(lái),但未來(lái)本身是具有多重可能性的,這在技術(shù)上被稱為多模態(tài)預(yù)測(cè)。當(dāng)車輛行駛到一個(gè)十字路口,左側(cè)的行人可能繼續(xù)直行,也可能突然停下。如果模型只能給出一個(gè)確定的預(yù)測(cè)結(jié)果,那么一旦現(xiàn)實(shí)情況偏離了預(yù)測(cè)軌道,系統(tǒng)就會(huì)陷入混亂。

wKgZPGnYSyuAChPPAADJzAGdTJY796.jpg

圖片源自:網(wǎng)絡(luò)

對(duì)于這個(gè)問(wèn)題,目前的難題在于,模型如何在概率分布中找到平衡。如果預(yù)測(cè)得過(guò)于發(fā)散,車輛會(huì)因?yàn)榭紤]到所有潛在的危險(xiǎn)而變得異常膽小,甚至在空曠的路口遲疑不決;如果預(yù)測(cè)得過(guò)于集中,又容易忽略掉低概率但高風(fēng)險(xiǎn)的極端情況。這種對(duì)未來(lái)可能性的建模,要求模型不僅要學(xué)習(xí)物體運(yùn)動(dòng)的物理規(guī)律,還要在某種程度上理解社會(huì)契約和交通心理,這顯然超出了單純圖像識(shí)別的范疇。

在長(zhǎng)序列預(yù)測(cè)中,不確定性帶來(lái)的問(wèn)題會(huì)呈幾何倍數(shù)增長(zhǎng)。隨著預(yù)測(cè)時(shí)間軸的拉長(zhǎng),微小的初始誤差會(huì)被不斷放大。模型預(yù)測(cè)出的未來(lái)圖像會(huì)從清晰變得模糊,甚至出現(xiàn)違反物理常識(shí)的幻覺,造成類似預(yù)測(cè)出的車輛憑空消失或建筑發(fā)生形變的情況。如何保證模型在預(yù)測(cè)未來(lái)數(shù)秒甚至更長(zhǎng)時(shí)間時(shí),依然能維持畫面的邏輯一致性和物理真實(shí)性,是開發(fā)者必須跨越的一道坎。

wKgZO2nYSyyASHLLAAASG3BOmsQ501.jpg

算力真的跟得上實(shí)時(shí)響應(yīng)嗎?

自動(dòng)駕駛對(duì)實(shí)時(shí)性的要求近乎苛刻,任何決策延遲都可能導(dǎo)致嚴(yán)重的后果。目前主流的世界模型,尤其是基于擴(kuò)散模型或自回歸架構(gòu)的模型,其實(shí)需要巨大的計(jì)算資源。這些模型在生成高質(zhì)量的未來(lái)場(chǎng)景預(yù)測(cè)時(shí),通常涉及大量的迭代計(jì)算,這在云端服務(wù)器上或許可行,但在車載計(jì)算平臺(tái)上卻面臨著嚴(yán)峻的功耗和散熱挑戰(zhàn)。

wKgZPGnYSy2AY1AWAAadZZ1MXyI388.jpg

圖片源自:網(wǎng)絡(luò)

高分辨率的視頻生成和多傳感器的融合處理,對(duì)顯存帶寬和處理器性能提出了極高要求。如果世界模型的推演速度跟不上車輛的實(shí)際行駛速度,那么它的預(yù)測(cè)價(jià)值就會(huì)歸零。

目前,行業(yè)內(nèi)正在嘗試各種剪枝、量化和模型蒸餾的方法,試圖在保證預(yù)測(cè)精度的前提下,壓減模型的參數(shù)規(guī)模。但這種優(yōu)化其實(shí)會(huì)面臨著既要又要的局面,減小模型會(huì)降低其對(duì)復(fù)雜環(huán)境的理解力,維持規(guī)模又難以達(dá)到毫秒級(jí)的響應(yīng)速度。

另外,訓(xùn)練這些模型本身也是一項(xiàng)耗資巨大的工程。世界模型需要海量的、帶有高質(zhì)量標(biāo)注的視頻數(shù)據(jù)進(jìn)行強(qiáng)化學(xué)習(xí),而這些數(shù)據(jù)的收集、清洗和訓(xùn)練過(guò)程消耗的電力和硬件資源,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō)都是沉重的負(fù)擔(dān)。如何通過(guò)更高效的算法架構(gòu)實(shí)現(xiàn)小樣本學(xué)習(xí)或者自監(jiān)督學(xué)習(xí),降低對(duì)頂級(jí)算力的依賴,是技術(shù)能否大規(guī)模普及的關(guān)鍵。

wKgZO2nYSy2AUwZHAAASAJELks8008.jpg

預(yù)測(cè)誤差是如何滾雪球的?

由于世界模型在預(yù)測(cè)時(shí)會(huì)采用自回歸的方式,即把前一刻預(yù)測(cè)出的結(jié)果作為下一刻預(yù)測(cè)的輸入,這不可避免地引入了誤差累積的問(wèn)題,這也被形象地稱為“曝光偏差”。在實(shí)際駕駛中,即使每一步的預(yù)測(cè)誤差只有1%,在經(jīng)過(guò)幾十次的連續(xù)反饋后,最終的判斷可能已經(jīng)南轅北轍,導(dǎo)致車輛做出完全錯(cuò)誤的避障動(dòng)作。

這種累積誤差在面對(duì)突發(fā)狀況時(shí)表現(xiàn)得尤為明顯。比如前方車輛突然急剎,模型如果沒(méi)能在第一幀準(zhǔn)確捕捉到剎車燈亮起的細(xì)微變化,后續(xù)的所有推演都會(huì)建立在“前車勻速行駛”的錯(cuò)誤假設(shè)之上。這種閉環(huán)系統(tǒng)中的不穩(wěn)定性,要求模型必須具備強(qiáng)大的實(shí)時(shí)糾錯(cuò)能力。

wKgZPGnYSy2Ab8k-AACY_18fvi0779.jpg

圖片源自:網(wǎng)絡(luò)

為了解決這個(gè)問(wèn)題,目前的策略是在預(yù)測(cè)過(guò)程中不斷引入真實(shí)的觀測(cè)數(shù)據(jù)進(jìn)行校準(zhǔn)。但這又帶來(lái)了新的矛盾,如果系統(tǒng)過(guò)于依賴實(shí)時(shí)觀測(cè),世界模型的預(yù)測(cè)意義就會(huì)被削弱,退化回傳統(tǒng)的感知系統(tǒng);如果過(guò)于依賴內(nèi)部推演,又容易脫離現(xiàn)實(shí)。尋找預(yù)測(cè)推演與實(shí)時(shí)感知的黃金平衡點(diǎn),并有效遏制誤差的雪球效應(yīng),依然是當(dāng)前自動(dòng)駕駛領(lǐng)域最前沿、也最棘手的課題之一。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14948

    瀏覽量

    181024
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    理想汽車發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

    下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過(guò)五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動(dòng)駕駛基礎(chǔ)模型,讓
    的頭像 發(fā)表于 03-18 11:51 ?1419次閱讀
    理想汽車發(fā)布下一代<b class='flag-5'>自動(dòng)駕駛</b>基礎(chǔ)<b class='flag-5'>模型</b>MindVLA-o1

    模型時(shí)代自動(dòng)駕駛標(biāo)注有什么特殊要求?

    自動(dòng)駕駛的發(fā)展歷程中,數(shù)據(jù)標(biāo)注一直被視為算法進(jìn)化的基石。然而,隨著大模型時(shí)代的到來(lái),這一領(lǐng)域正經(jīng)歷著重構(gòu)。 過(guò)去,標(biāo)注員的任務(wù)是簡(jiǎn)單地二維照片上畫框,標(biāo)記出車輛和行人的位置。但現(xiàn)在
    的頭像 發(fā)表于 03-01 09:09 ?2998次閱讀
    大<b class='flag-5'>模型</b>時(shí)代<b class='flag-5'>自動(dòng)駕駛</b>標(biāo)注有什么特殊要求?

    如何構(gòu)建適合自動(dòng)駕駛世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    2026年,3DGS和世界模型,自動(dòng)駕駛仿真中的組合應(yīng)用

    寫在前面:作為自動(dòng)駕駛仿真的核心支撐,3DGS與世界模型的技術(shù)落地一直備受關(guān)注。我們看到了車路漫漫的一篇文章,探討了3DGS與世界模型的路線
    的頭像 發(fā)表于 02-03 17:32 ?3448次閱讀
    2026年,3DGS和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,<b class='flag-5'>在</b><b class='flag-5'>自動(dòng)駕駛</b>仿真中的組合應(yīng)用

    Transformer如何讓自動(dòng)駕駛模型獲得思考能力?

    在談及自動(dòng)駕駛時(shí),Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer自動(dòng)駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4334次閱讀

    黃仁勛:未來(lái)十年很多汽車是自動(dòng)駕駛 英偉達(dá)發(fā)布Alpamayo汽車大模型平臺(tái)

    在當(dāng)?shù)貢r(shí)間1月5日黃仁勛CES 2026上發(fā)表主題演講,黃仁勛的新年首場(chǎng)演講中重點(diǎn)提及自動(dòng)駕駛、機(jī)器人等。 黃仁勛:未來(lái)十年很多汽車是自動(dòng)駕駛 黃仁勛認(rèn)為AI發(fā)展的下一站是進(jìn)入物理世界
    的頭像 發(fā)表于 01-06 11:45 ?1323次閱讀

    自動(dòng)駕駛中常提的世界模型是什么?

    很多廠家的技術(shù)方案中,會(huì)提到世界模型的介紹。世界模型,就是自動(dòng)駕駛系統(tǒng)內(nèi)部用來(lái)表示外部
    的頭像 發(fā)表于 01-05 16:23 ?1024次閱讀

    世界模型是讓自動(dòng)駕駛汽車?yán)斫?b class='flag-5'>世界還是預(yù)測(cè)未來(lái)?

    ? [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓
    的頭像 發(fā)表于 12-16 09:27 ?970次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓<b class='flag-5'>自動(dòng)駕駛</b>汽車?yán)斫?b class='flag-5'>世界</b>還是預(yù)測(cè)未來(lái)?

    模型中常提的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語(yǔ)言模型世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能
    的頭像 發(fā)表于 11-22 10:59 ?2603次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    山區(qū)實(shí)現(xiàn)自動(dòng)駕駛難點(diǎn)在哪里?

    城市道路實(shí)現(xiàn)自動(dòng)駕駛或許不難,但想把自動(dòng)駕駛車應(yīng)用到山區(qū)道路,其難度會(huì)比想象的大得多。城市里路標(biāo)、車道、紅綠燈比較多,車流也比較規(guī)則;而很多山路卻沒(méi)有清晰車道、路面起伏大、天氣變化快,還有隨時(shí)掉落
    的頭像 發(fā)表于 11-08 14:57 ?3047次閱讀

    VLA和世界模型,誰(shuí)才是自動(dòng)駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出兩種趨勢(shì),一邊是以理想、小鵬、小米為代表的VLA(視覺—語(yǔ)言—行動(dòng))模型路線;另一邊則是以華為、蔚來(lái)為主導(dǎo)的世界模型
    的頭像 發(fā)表于 11-05 08:55 ?900次閱讀
    VLA和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,誰(shuí)才是<b class='flag-5'>自動(dòng)駕駛</b>的最優(yōu)解?

    卡車、礦車的自動(dòng)駕駛和乘用車的自動(dòng)駕駛技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展,讓組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對(duì)于自動(dòng)駕駛技術(shù)的宣傳,普遍是乘用車領(lǐng)域,而對(duì)于卡車、礦車的
    的頭像 發(fā)表于 06-28 11:38 ?1651次閱讀
    卡車、礦車的<b class='flag-5'>自動(dòng)駕駛</b>和乘用車的<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>在</b>技術(shù)要求上有何不同?

    自動(dòng)駕駛中常提的世界模型是個(gè)啥?

    對(duì)外部環(huán)境進(jìn)行抽象和建模的技術(shù),讓自動(dòng)駕駛系統(tǒng)一個(gè)簡(jiǎn)潔的內(nèi)部“縮影”里,對(duì)真實(shí)世界進(jìn)行描述與預(yù)測(cè),從而為感知、決策和規(guī)劃等關(guān)鍵環(huán)節(jié)提供有力支持。 什么是世界
    的頭像 發(fā)表于 06-24 08:53 ?1323次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個(gè)啥?

    新能源車軟件單元測(cè)試深度解析:自動(dòng)駕駛系統(tǒng)視角

    焦點(diǎn)是否落在目標(biāo)物體上。某自動(dòng)駕駛公司借此發(fā)現(xiàn)模型夜間過(guò)度關(guān)注路燈而非行人。 ? 實(shí)時(shí)性保障: ?時(shí)間感知測(cè)試框架(TAF)注入時(shí)間戳探針,監(jiān)控函數(shù)執(zhí)行耗時(shí)。例如,某路徑規(guī)劃算法因內(nèi)存泄漏導(dǎo)致響應(yīng)
    發(fā)表于 05-12 15:59

    模型如何推動(dòng)自動(dòng)駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),人工智能技術(shù)正以前所未有的速度各個(gè)領(lǐng)域滲透與應(yīng)用,而大模型(大語(yǔ)言模型和多模態(tài)大模型)的迅猛發(fā)展為自動(dòng)駕駛
    的頭像 發(fā)表于 04-20 13:16 ?1128次閱讀
    大<b class='flag-5'>模型</b>如何推動(dòng)<b class='flag-5'>自動(dòng)駕駛</b>技術(shù)革新?