91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于大模型的仿真系統(tǒng)研究一——三維重建大模型

賽目科技 ? 來(lái)源: 賽目科技 ? 2024-07-30 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于大模型的仿真系統(tǒng)框架

傳統(tǒng)的仿真測(cè)試驗(yàn)證普遍基于場(chǎng)景,而場(chǎng)景的構(gòu)建主要由道路和場(chǎng)景編輯器來(lái)人工搭建靜態(tài)場(chǎng)景和動(dòng)態(tài)場(chǎng)景,這種方式費(fèi)時(shí)費(fèi)力,而且也大大限制了場(chǎng)景要素組合的豐富化。針對(duì)此痛點(diǎn)問(wèn)題,賽目推出了基于大模型的仿真系統(tǒng),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)人工智能技術(shù),不僅推出自動(dòng)標(biāo)注大模型、多模態(tài)檢測(cè)大模型和場(chǎng)景生成大模型等模塊,并且引入三維重建大模型加強(qiáng)渲染畫(huà)面真實(shí)性。

通過(guò)上述模塊,賽目的路采場(chǎng)景轉(zhuǎn)換系統(tǒng)實(shí)現(xiàn)了以傳感器原始數(shù)據(jù)或者目標(biāo)集數(shù)據(jù)為輸入,通過(guò)感知融合、場(chǎng)景提取和生成等功能,輸出仿真測(cè)試所需的靜態(tài)路網(wǎng)和動(dòng)態(tài)場(chǎng)景進(jìn)行仿真,大大提高了仿真測(cè)試的效率。

圖:基于大模型的仿真系統(tǒng)框架

三維重建大模型

本文首先介紹三維重建大模型。

三維重建是指根據(jù)單視圖或者多視圖重建三維信息、構(gòu)建三維模型的過(guò)程。傳統(tǒng)的計(jì)算機(jī)圖形學(xué)的核心通過(guò)復(fù)雜的物理模型求解渲染方程。需要的不僅僅是場(chǎng)景中物體的幾何和材質(zhì)信息、相機(jī)的內(nèi)外參信息,更需要復(fù)雜的光照模型來(lái)模擬自然光照的影響。

上述工作的重大突破來(lái)自Ben Mildenhall等人于2020發(fā)表的神經(jīng)輻射場(chǎng)(NeRF),根據(jù)對(duì)同一物體不同觀察視角的多張圖像,通過(guò)隱式的編碼表示場(chǎng)景實(shí)現(xiàn)三維重建的過(guò)程,利用體渲染生成新視角圖像。

NeRF訓(xùn)練渲染流程可以總結(jié)如下:

1. 對(duì)于給定的相機(jī)光線(xiàn),在光線(xiàn)上進(jìn)行采樣,對(duì)采樣點(diǎn)的空間坐標(biāo)及觀察方向進(jìn)行編碼,用深度復(fù)雜網(wǎng)絡(luò)存獲得輻射場(chǎng)信息;

2. 輻射場(chǎng)輸出空間點(diǎn)的顏色和密度;

3. 根據(jù)2的輸出用體素渲染方程獲得生成視角圖片;

4. 在訓(xùn)練階段與原視角圖片計(jì)算損失更新網(wǎng)絡(luò)。

圖:NeRF訓(xùn)練管線(xiàn)[1]

下圖表示了輻射場(chǎng)的網(wǎng)絡(luò)結(jié)構(gòu),其中PE表示位置編碼,x為三維坐標(biāo)點(diǎn),d為觀察方向,MLP為多層感知機(jī),ReLU和Sigmoid分別為不同激活函數(shù)。輻射場(chǎng)網(wǎng)絡(luò)的輸入是空間坐標(biāo)及方差方向,輸出為對(duì)應(yīng)的顏色和密度值傳遞至體渲染模塊。

圖:NeRF網(wǎng)絡(luò)結(jié)構(gòu)

體渲染主要為解決云、煙、果凍等非剛性物體進(jìn)行渲染建模,將其抽象成一團(tuán)粒子群,表現(xiàn)了光線(xiàn)穿過(guò)時(shí)光子和粒子交互的過(guò)程,產(chǎn)生的輻亮度的變化。其物理過(guò)程包括吸收、外散射、內(nèi)散射、放射。忽略背景光的影響,體渲染方程為:

上述方法主要針對(duì)室內(nèi)小型場(chǎng)景進(jìn)行三維重建,對(duì)于戶(hù)外場(chǎng)景、特別是自駕場(chǎng)景還有許多優(yōu)化的空間,相關(guān)內(nèi)容將在下節(jié)討論。

三維重建大模型-挑戰(zhàn)和對(duì)應(yīng)

對(duì)于自駕場(chǎng)景,上述Baseline方法面臨的挑戰(zhàn)包括:

1. 訓(xùn)練和渲染速度:Baseline方法需要花費(fèi)數(shù)小時(shí)、甚至數(shù)天進(jìn)行訓(xùn)練和生成,這對(duì)于仿真來(lái)說(shuō)是難以接受的,同樣不利于算法的迭代優(yōu)化;

2. 生成畫(huà)質(zhì)清晰度:自駕場(chǎng)景包括了靜態(tài)路網(wǎng)、動(dòng)態(tài)環(huán)境參與者、背景建筑物、天空等等,需要同時(shí)將遠(yuǎn)景與近景清晰地渲染生成是一個(gè)極大的挑戰(zhàn);

3. 算法訓(xùn)練的過(guò)擬合現(xiàn)象:與Baseline對(duì)同一物體360°環(huán)視圖像獲取不同,路采車(chē)輛一般沿著固定采集路線(xiàn)前進(jìn),對(duì)于同一物體的信息收集不夠充沛,影響最終的渲染質(zhì)量。

4. 動(dòng)態(tài)物體的添加和刪除:利用三維重建大模型能夠獲得不同主車(chē)視角的成像結(jié)果,但是對(duì)于測(cè)試場(chǎng)景生成需要靈活地控制環(huán)境參與者,因此需要模型能夠自由地對(duì)物體進(jìn)行添加和刪除。

基于上述問(wèn)題,我們提出了下述的研究路線(xiàn)。

圖:三維重建技術(shù)路線(xiàn)

對(duì)于無(wú)邊界場(chǎng)景,由于可視范圍變大的原因通過(guò)NDC坐標(biāo)變化后的采樣過(guò)程會(huì)將近景采樣稀疏化,影響最終成像質(zhì)量導(dǎo)致物體模糊,保持近距離坐標(biāo)不變,遠(yuǎn)距離坐標(biāo)作非線(xiàn)性轉(zhuǎn)換是一種解決思路。坐標(biāo)轉(zhuǎn)換形式包括了[2-3]:

1.半徑為r的球面內(nèi)保持坐標(biāo)不變,球面外坐標(biāo)以單位向量以及逆半徑重新定義,具體如下





然后利用線(xiàn)性插值法獲得相應(yīng)分辨率下的特征,輸入至多層感知機(jī)中進(jìn)行訓(xùn)練。特征柵格主要流程如下。

通過(guò)上述三維重建大模型方法,可以在自動(dòng)駕駛仿真領(lǐng)域提升模型的訓(xùn)練和渲染速度、重建畫(huà)質(zhì)的清晰度、輻射場(chǎng)中物體深度與表面的準(zhǔn)確度等等,同時(shí)能夠動(dòng)態(tài)添加環(huán)境車(chē)、行人等交通參與者進(jìn)行場(chǎng)景泛化,實(shí)現(xiàn)更靈活的場(chǎng)景生成需求。

參考文獻(xiàn)

[1]Mildenhall, Ben, et al. "Nerf: Representing scenes as neural radiance fields for view synthesis." Communications of the ACM 65.1 (2021): 99-106.

[2]Zhang, Kai, et al. "Nerf++: Analyzing and improving neural radiance fields." arXiv preprint arXiv:2010.07492 (2020).

[3]Barron, Jonathan T., et al. "Mip-nerf 360: Unbounded anti-aliased neural radiance fields." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.

[4]Müller, Thomas, et al. "Instant neural graphics primitives with a multiresolution hash encoding." ACM Transactions on Graphics (ToG) 41.4 (2022): 1-15.

賽目科技

專(zhuān)注智能網(wǎng)聯(lián)汽車(chē)測(cè)試

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 仿真系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    105

    瀏覽量

    21694
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5189

原文標(biāo)題:基于大模型的仿真系統(tǒng)研究一——三維重建大模型

文章出處:【微信號(hào):gh_c85a8e3c0f2a,微信公眾號(hào):賽目科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OFDR技術(shù)與三維重構(gòu)的協(xié)同價(jià)值

    模型上,讓結(jié)構(gòu)缺陷位置、應(yīng)變分布等信息目了然,為實(shí)時(shí)監(jiān)測(cè)和精準(zhǔn)決策提供了可視化支撐。三維重構(gòu)軟件核心功能解析數(shù)據(jù)交互與模型導(dǎo)入軟件支持兩種數(shù)據(jù)處理模式:通過(guò)
    的頭像 發(fā)表于 11-14 17:36 ?1326次閱讀
    OFDR技術(shù)與<b class='flag-5'>三維</b>重構(gòu)的協(xié)同價(jià)值

    從“重建”到“可用”:aiSim3DGS方案如何閉環(huán)自動(dòng)駕駛仿真場(chǎng)景?

    3DGaussianSplatting(3DGS)憑借高效渲染與逼真場(chǎng)景還原能力,逐漸成為三維重建仿真領(lǐng)域的焦點(diǎn)。然而,實(shí)際應(yīng)用中,如何將多源異構(gòu)數(shù)據(jù)高效轉(zhuǎn)化為可用的3DGS場(chǎng)景,如
    的頭像 發(fā)表于 10-24 17:33 ?28次閱讀
    從“<b class='flag-5'>重建</b>”到“可用”:aiSim3DGS方案如何閉環(huán)自動(dòng)駕駛<b class='flag-5'>仿真</b>場(chǎng)景?

    如何在vivadoHLS中使用.TLite模型

    MNIST數(shù)據(jù)集的輸入形狀(28,28,1),可以使用ap_uint<8>作為輸入數(shù)據(jù)類(lèi)型,使用三維數(shù)組作為輸入緩沖區(qū): void hls_function
    發(fā)表于 10-22 06:29

    拆解3D Gaussian Splatting:原理框架、實(shí)戰(zhàn) demo 與自駕仿真落地探索!

    ▍文章來(lái)源于康謀自動(dòng)駕駛01引言當(dāng)前,三維重建技術(shù)正處于從"實(shí)驗(yàn)室演示"邁向"工業(yè)級(jí)應(yīng)用"的關(guān)鍵時(shí)期。每次對(duì)場(chǎng)景細(xì)節(jié)的精準(zhǔn)還原,每幀實(shí)時(shí)流暢的渲染效果
    的頭像 發(fā)表于 10-17 17:33 ?3307次閱讀
    拆解3D Gaussian Splatting:原理框架、實(shí)戰(zhàn) demo 與自駕<b class='flag-5'>仿真</b>落地探索!

    種基于多次觀測(cè)融合的可交互三維高斯場(chǎng)景重建框架

    在計(jì)算機(jī)視覺(jué)和機(jī)器人領(lǐng)域,如何完整、真實(shí)地重建個(gè)可交互的三維場(chǎng)景,直是個(gè)難題。傳統(tǒng)方法往往依賴(lài)復(fù)雜的多階段流程,比如先做分割,再進(jìn)行背
    的頭像 發(fā)表于 09-29 11:12 ?664次閱讀
    <b class='flag-5'>一</b>種基于多次觀測(cè)融合的可交互<b class='flag-5'>三維</b>高斯場(chǎng)景<b class='flag-5'>重建</b>框架

    NVIDIA助力湯元科技突破智能駕駛數(shù)據(jù)獲取與生成瓶頸

    蘇州湯元科技有限公司(以下簡(jiǎn)稱(chēng)“湯元科技”)是家專(zhuān)注于三維重建與世界模型的科技公司,為自動(dòng)駕駛與具身智能提供高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。通過(guò)將自研的世界模型技術(shù)與 NVIDIA Cos
    的頭像 發(fā)表于 09-06 15:16 ?1486次閱讀

    構(gòu)建適用于三維集成系統(tǒng)的互連線(xiàn)長(zhǎng)分布模型

    三維集成電路設(shè)計(jì)中,TSV技術(shù)通過(guò)垂直互連顯著優(yōu)化了互連線(xiàn)長(zhǎng)分布特性。基于倫特定律的經(jīng)典分析框架,可構(gòu)建適用于三維集成系統(tǒng)的互連線(xiàn)長(zhǎng)分布模型
    的頭像 發(fā)表于 08-21 10:41 ?1142次閱讀
    構(gòu)建適用于<b class='flag-5'>三維</b>集成<b class='flag-5'>系統(tǒng)</b>的互連線(xiàn)長(zhǎng)分布<b class='flag-5'>模型</b>

    航天宏圖全棧式3DGS實(shí)景三維重建系統(tǒng)解決方案

    表達(dá)的核心技術(shù),通過(guò)相機(jī)、傳感器等設(shè)備獲取物理空間數(shù)據(jù),并結(jié)合計(jì)算機(jī)視覺(jué)與圖形學(xué)算法,將二圖像轉(zhuǎn)換為三維模型。目前,主流的三維重建方法包括傾斜攝影(多視角立體
    的頭像 發(fā)表于 06-27 09:28 ?1665次閱讀
    航天宏圖全棧式3DGS實(shí)景<b class='flag-5'>三維重建</b><b class='flag-5'>系統(tǒng)</b>解決方案

    無(wú)刷直流電機(jī)磁場(chǎng)定向控制系統(tǒng)研究

    了控制策略及實(shí)現(xiàn)方法,并建立系統(tǒng)仿真模型,仿真表明基于FOC的BLDCM控制系統(tǒng)性能良好,轉(zhuǎn)矩脈動(dòng)小。以STM32FI03B為核心設(shè)計(jì)了基于
    發(fā)表于 06-26 13:31

    無(wú)模型自適應(yīng)控制在永磁同步電機(jī)轉(zhuǎn)速中的仿真研究

    的可行性和有效性。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無(wú)模型自適應(yīng)控制在永磁同步電機(jī)轉(zhuǎn)速中的仿真研究.pdf 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)第
    發(fā)表于 06-25 13:01

    激光三維掃描技術(shù):無(wú)噴粉條件下高反光表面三維重建的光學(xué)原理與應(yīng)用

    高反光表面的三維重建是工業(yè)檢測(cè)、文化遺產(chǎn)保護(hù)等領(lǐng)域的關(guān)鍵技術(shù)瓶頸。傳統(tǒng)激光掃描依賴(lài)噴粉增強(qiáng)漫反射,但會(huì)對(duì)精密器件或文物造成不可逆損傷。本文通過(guò)融合結(jié)構(gòu)光調(diào)制、偏振分析及多視角協(xié)同技術(shù),構(gòu)建無(wú)噴粉測(cè)量
    的頭像 發(fā)表于 06-25 10:19 ?903次閱讀

    十二相同步發(fā)電機(jī)降階等效模型研究

    摘要:十二相同步發(fā)電機(jī)整流系統(tǒng)能夠提供高品質(zhì)直流電能,但是發(fā)電機(jī)模型復(fù)雜,解析分析困難。為此,推導(dǎo)了十二相整流發(fā)電機(jī)的等效相降階模型和狀態(tài)空間平均
    發(fā)表于 06-17 08:59

    VirtualLab:光學(xué)系統(tǒng)三維可視化

    摘要 為了對(duì)光學(xué)系統(tǒng)的性質(zhì)有個(gè)基本的了解,對(duì)其組件的可視化和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了個(gè)工具來(lái)顯示光學(xué)系統(tǒng)
    發(fā)表于 05-30 08:45

    數(shù)字孿生 × 爆炸動(dòng)畫(huà) × 三維拆解

    三維場(chǎng)景中實(shí)現(xiàn)模型零件爆炸效果是種常見(jiàn)且非常實(shí)用的視覺(jué)技術(shù),廣泛應(yīng)用于產(chǎn)品設(shè)計(jì)演示、機(jī)械運(yùn)動(dòng)模擬、建筑可視化等多個(gè)領(lǐng)域。
    的頭像 發(fā)表于 05-19 15:11 ?694次閱讀
    數(shù)字孿生 × 爆炸動(dòng)畫(huà) × <b class='flag-5'>三維</b>拆解

    種基于基礎(chǔ)模型對(duì)齊的自監(jiān)督三維空間理解方法

    三維空間理解是推動(dòng)自動(dòng)駕駛、具身智能等領(lǐng)域中智能系統(tǒng)實(shí)現(xiàn)環(huán)境感知、交互的核心任務(wù),其中3D語(yǔ)義占據(jù)預(yù)測(cè) (Semantic Occupancy Prediction) 對(duì)三維場(chǎng)景進(jìn)行精準(zhǔn)的體素級(jí)建模。然而,當(dāng)前主流方法嚴(yán)重依賴(lài)大
    的頭像 發(fā)表于 03-18 15:01 ?977次閱讀
    <b class='flag-5'>一</b>種基于基礎(chǔ)<b class='flag-5'>模型</b>對(duì)齊的自監(jiān)督<b class='flag-5'>三維</b>空間理解方法