人人操92AV亚洲涩图二,人人狠狠在线视频

[首發(fā)于智駕最前沿微信公眾號]對于自動駕駛大模型的訓練，不知道是否有人感覺，訓練的數(shù)據(jù)越多，模型就會越聰明。這個說法只能說在一定程度上是對的，但如果把這個結論簡單理解為無限堆訓練數(shù)據(jù)就能讓模型越聰明，那只會偏離實際情況。

自動駕駛大模型的訓練數(shù)據(jù)，不能只單純看數(shù)量，而是要看數(shù)量、質量、結構等多個方面。

數(shù)據(jù)越多，模型真的就越強嗎？

在模型訓練的早期階段，增加數(shù)據(jù)量確實會明顯提升性能。模型性能一般會隨著數(shù)據(jù)規(guī)模增長而持續(xù)改善，甚至呈現(xiàn)出規(guī)模定律。

簡單說，就是投入越多、數(shù)據(jù)越大、參數(shù)越多，模型就越聰明。

圖片源自：網(wǎng)絡

之所以出現(xiàn)這個現(xiàn)象，是因為自動駕駛本質是在學習駕駛經(jīng)驗，數(shù)據(jù)越多，模型見過的道路情況就越豐富，對常見場景的理解也會更穩(wěn)定。像是常規(guī)的跟車、變道、紅綠燈識別等高頻場景只要數(shù)據(jù)量夠大，模型一般都能學得比較可靠。

但隨著訓練數(shù)據(jù)的增加，這種提升是逐漸變緩的。當數(shù)據(jù)規(guī)模達到一定程度之后，再增加同類型的數(shù)據(jù)，收益會明顯下降。換句話說，如果新增的數(shù)據(jù)只是重復已有場景，本質上是在讓自動駕駛大模型“刷題”，而不是學習新的能力。

為什么“多”不等于“有效”？

自動駕駛數(shù)據(jù)有一個很典型的特征，就是分布極不均衡。絕大多數(shù)數(shù)據(jù)來自日常的正常駕駛，很多內容都是與直行、跟車、停車相關，而真正決定安全性能的，恰恰是那些極少出現(xiàn)的特殊情況，也就是常說的長尾場景。

這些場景包括突發(fā)橫穿、異常行為車輛、復雜施工、極端天氣等，這類數(shù)據(jù)天然稀缺。即使采集了海量數(shù)據(jù)，絕大部分仍然是“普通樣本”，而關鍵的長尾樣本占比很低。

這就讓自動駕駛大模型訓練數(shù)據(jù)呈現(xiàn)出一個矛盾，那就是數(shù)據(jù)量在增加，但有效信息并沒有同步增加。

其實只要適當增加少量長尾數(shù)據(jù)，就可能對模型在對應邊緣場景下的表現(xiàn)帶來明顯提升，而盲目增加常規(guī)數(shù)據(jù)，大模型的能力提升其實很有限。

數(shù)據(jù)質量，比數(shù)量更關鍵

如果說數(shù)據(jù)量決定了大模型“上限”，那么數(shù)據(jù)質量決定的是其“底線”。

自動駕駛訓練數(shù)據(jù)對質量的要求非常高，不只是清晰與否的問題，而是包括標注準確性、時間同步、多傳感器對齊等一整套細節(jié)。如果這些環(huán)節(jié)出現(xiàn)問題，模型學到的就不是正確的駕駛邏輯，而是帶偏差的經(jīng)驗。

圖片源自：網(wǎng)絡

舉個簡單的例子，如果同一幀中，攝像頭和激光雷達的數(shù)據(jù)沒有對齊，那么模型看到的“位置關系”就是錯的。這種錯誤不會在訓練時暴露，但會在真實道路中放大。

再說說標注，如果目標類別、位置或運動狀態(tài)標錯，模型就會在這些邊界條件下產生系統(tǒng)性誤判。

所以在自動駕駛大模型訓練中會看到一個現(xiàn)象，那就是清洗一批“臟數(shù)據(jù)”，比新增同規(guī)模數(shù)據(jù)更有價值。

真正難的是“覆蓋”和“結構”

自動駕駛模型并不是在做簡單的識別，而是在學習一個動態(tài)系統(tǒng)，其中包括感知、預測和決策。因此，數(shù)據(jù)不僅要多，還要“覆蓋得對”。

有效的數(shù)據(jù)通常需要滿足多樣性、時序性、多態(tài)性等多個關鍵特征。

圖片源自：網(wǎng)絡

多樣性就是要覆蓋不同天氣、光照、道路類型和交通密度，否則模型只是在特定環(huán)境下有效。

時序性則強調的是大模型訓練數(shù)據(jù)同一場景下時刻的要求，單幀數(shù)據(jù)只能描述“此刻是什么”，但駕駛決策依賴的是“接下來會發(fā)生什么”，所以必須有連續(xù)幀來學習運動關系。

多模態(tài)則是指攝像頭、激光雷達、毫米波雷達等信息需要融合，否則感知能力會有明顯短板。

這些要求也體現(xiàn)出自動駕駛大模型訓練的一個要求，那就是數(shù)據(jù)不能只是簡單堆積，而是需要結構化設計。

數(shù)據(jù)閉環(huán)，比數(shù)據(jù)規(guī)模更重要

在實際量產的系統(tǒng)中，真正能拉開差距的，不是“誰的數(shù)據(jù)多”，而是“誰的數(shù)據(jù)用得更有效”。

圖片源自：網(wǎng)絡

數(shù)據(jù)閉環(huán)對于自動駕駛大模型來說非常重要，所謂數(shù)據(jù)閉環(huán)，就是指自動駕駛系統(tǒng)在道路行駛過程中運行的一整套邏輯，即車輛在道路上運行→發(fā)現(xiàn)問題→回傳數(shù)據(jù)→針對性訓練→再部署驗證。

數(shù)據(jù)閉環(huán)強調的不是數(shù)據(jù)規(guī)模，而是“針對性采集”。尤其是長尾問題，需要通過閉環(huán)機制不斷補齊，否則再多的歷史數(shù)據(jù)也覆蓋不到。

也正因為如此，一些技術方案并不會被動依賴自然采集，而是會通過影子模式、仿真生成等方式，主動挖掘或構造稀缺場景。

最后的話

回到最初的問題，自動駕駛模型訓練數(shù)據(jù)并不是越多越好，若單純增加數(shù)量，并不能持續(xù)提升能力。只有在數(shù)據(jù)質量和結構合理的前提下，規(guī)模越大才越有價值。

若想真正提升模型上限，其實需要關注幾個方面，即：

數(shù)據(jù)是否覆蓋關鍵場景，尤其是長尾；

數(shù)據(jù)是否干凈、標注準確、時序完整；

數(shù)據(jù)是否形成閉環(huán)，可不斷補齊缺失能力；

自動駕駛行業(yè)其實已經(jīng)從“拼數(shù)據(jù)量”逐漸轉向“拼數(shù)據(jù)效率”。誰能更快發(fā)現(xiàn)問題、采到關鍵數(shù)據(jù)、形成有效訓練，誰的系統(tǒng)就更接近真實可用。如果只靠堆數(shù)據(jù)，而忽略結構和質量，模型很容易在看似訓練充分的情況下，在關鍵時刻失效。這也是自動駕駛一直沒有完全落地的核心原因之一。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴