91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NeRF的研究目的是合成同一場景不同視角下的圖像

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-01-29 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeRF,即Neural Radiance Fields(神經(jīng)輻射場)的縮寫。研究員來自UCB、Google和UCSD。

Title:NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Paper:https://arxiv.org/pdf/2003.08934.pdf

Code:https://github.com/bmild/nerf

寫這篇文章的動機是,一方面NeRF實在太重要了代表著計算機視覺、圖像學結(jié)合的未來重要方向;另一方面NeRF對于計算機視覺背景的同學有一定的理解門檻,這篇文章試圖以最小背景知識補充、最少理解成本為前提介紹NeRF。

整體介紹

NeRF的研究目的是合成同一場景不同視角下的圖像。方法很簡單,根據(jù)給定一個場景的若干張圖片,重構(gòu)出這個場景的3D表示,然后推理的時候輸入不同視角就可以合成(渲染)這個視角下的圖像了。

「3D表示」有很多種形式,NeRF使用的是輻射場,然后用「體渲染」(Volume Rendering)技術(shù),給定一個相機視角,把輻射場渲染成一張圖像。選用輻射場+體渲染的原因很簡單,全程可微分。這個過程很有意思,可以理解為把一個空間朝一個方向上拍扁,空間中的顏色加權(quán)求和得到平面上的顏色。

輻射場

7979651c-9f7f-11ed-bfe3-dac502259ad0.png

體渲染

所謂體渲染,直觀地說,我們知道相機的焦點,焦點和像素的連線可以連出來一條射線,我們可以對這條射線上所有的點的顏色做某種求和就可以得到這個像素的顏色值。

理論上,我們可以對這條射線經(jīng)過空間上的每個點的密度(只和空間坐標相關(guān))和顏色(同時依賴空間坐標和入射角)進行某種積分就可以得到每個像素的顏色。當每個像素的顏色都計算出來,那么這個視角下的圖像就被渲染出來了。如下圖所示:

7984c5e2-9f7f-11ed-bfe3-dac502259ad0.jpg

從相機焦點出發(fā),往一個像素連出一條射線,獲取射穿過空間中每個點的屬性,進行積分得到這個像素的顏色

為了順利完成上面過程,我們可能需要維護碩大無朋Tensor來表示輻射場,查表獲取RGB和密度。這里一個問題是空間有多大表就有多大,同時只能是離散表示的。NeRF要做的事情是用一個神經(jīng)網(wǎng)絡來建模輻射場,這樣無論空間有多大,不影響我們表示輻射場的所需要的存儲量,而且這個輻射場表示是連續(xù)的:?Θ:(?,?,?,?,?)→(?,?,?,?

799646fa-9f7f-11ed-bfe3-dac502259ad0.png

79a2b46c-9f7f-11ed-bfe3-dac502259ad0.jpg

用神經(jīng)網(wǎng)絡來代替查表的方式表示輻射場

整體過程

因為神經(jīng)網(wǎng)絡是可微分的,選取的體渲染方法是可微分;體渲染得到的圖片和原圖計算MSE Loss。整個過程可端到端地用梯度回傳來優(yōu)化非常漂亮。整個訓練Pipeline如下圖所示:

79b9f91a-9f7f-11ed-bfe3-dac502259ad0.jpg

看到這,讀者就已經(jīng)大致理解NeRF的原理了,后面章節(jié)是NeRF的具體細節(jié)。

用輻射場做體渲染

前面我們已經(jīng)大致理解體渲染的過程是怎么做了。可是怎么沿著射線對空間中的顏色進行積分呢?如果我們把射線看作是光線,可以直觀得到這個積分要滿足的兩個條件:

1、一個點的密度越高,射線通過它之后變得越弱,密度和透光度呈反比

2、一個點的密度越高,這點在這個射線下的顏色反應在像素上的權(quán)重越大

79c63be4-9f7f-11ed-bfe3-dac502259ad0.png

而實際渲染過程,我們只能把射線平均分成N個小區(qū)間,每個區(qū)間隨機采樣一個點,對采樣得到的點的顏色進行某種加權(quán)求和:

79d6a290-9f7f-11ed-bfe3-dac502259ad0.png

神經(jīng)輻射場的兩項優(yōu)化點

Positional encoding

類似Transformer的做法,把坐標和視角用更高維度的表示作為網(wǎng)絡輸入,來解決渲染圖像比較糊的問題:

79e7de2a-9f7f-11ed-bfe3-dac502259ad0.png

Hierachical volume sampling

79f73cf8-9f7f-11ed-bfe3-dac502259ad0.png

Architecture

7a0404f6-9f7f-11ed-bfe3-dac502259ad0.png

私貨

無論從方法的開創(chuàng)性,還是發(fā)表后兩年多的影響力來看。在筆者心目中,ECCV 2020的Best Paper沒給NeRF,不得不說是一個遺憾。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115062
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107792
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    831

    瀏覽量

    61946

原文標題:都2023年了,我不允許你還不懂NeRF

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    秀技術(shù)、亮場景、聚生態(tài)!唯創(chuàng)知音“寶創(chuàng)享”首秀,向“芯”而生!

    12月16日,福海街道這片匯聚866家國家級高新技術(shù)企業(yè)、841家規(guī)上工業(yè)企業(yè)、58家工信部"小巨人"的產(chǎn)業(yè)熱土上,一場關(guān)乎AI產(chǎn)業(yè)未來的場景對接盛會正式開啟。作為深耕AI語音
    的頭像 發(fā)表于 12-26 12:02 ?480次閱讀
    秀技術(shù)、亮<b class='flag-5'>場景</b>、聚生態(tài)!唯創(chuàng)知音“寶<b class='flag-5'>景</b>創(chuàng)享”首秀,向“芯”而生!

    中國車聯(lián)網(wǎng)行業(yè)加速滲透:一場“車聯(lián)萬物”的出行革命

    當汽車不再是孤立的機械載體,而是接入互聯(lián)網(wǎng)的智能終端,一場出行變革正悄然發(fā)生。近日,前瞻產(chǎn)業(yè)研究院發(fā)布《2018 - 2025年中國車聯(lián)網(wǎng)行業(yè)滲透率與用戶規(guī)模統(tǒng)計情況及預測》(稱“報告”),透過
    的頭像 發(fā)表于 12-04 11:22 ?565次閱讀

    無引導線的左轉(zhuǎn)場景,自動駕駛?cè)绾我?guī)劃軌跡?

    場景,想要很好地處理好無引導線左轉(zhuǎn)是個非常大的挑戰(zhàn)。但想要讓自動駕駛汽車滿足所有的出行需求,這一場景必須解決,那在無引導線的左轉(zhuǎn)場景
    的頭像 發(fā)表于 09-18 09:12 ?756次閱讀
    無引導線的左轉(zhuǎn)<b class='flag-5'>場景</b><b class='flag-5'>下</b>,自動駕駛?cè)绾我?guī)劃軌跡?

    衛(wèi)星圖像智能合成系統(tǒng)全面解析

    衛(wèi)星圖像智能合成系統(tǒng)全面解析
    的頭像 發(fā)表于 08-27 14:49 ?602次閱讀
    衛(wèi)星<b class='flag-5'>圖像</b>智能<b class='flag-5'>合成</b>系統(tǒng)全面解析

    TTS文字合成語音芯片的使用場景

    TTS文字合成語音播報芯片的使用場景非常廣泛,可以適用于各行各業(yè),主要應用于復雜的語音播報場景,下面小編帶大家起來了解一下。 傳統(tǒng)的語音播
    的頭像 發(fā)表于 08-22 17:11 ?1006次閱讀

    從開發(fā)工程師視角看TTS語音合成芯片

    功能機,有著諸多跨越性優(yōu)勢。 、TTS 語音合成芯片vs傳統(tǒng)播報芯片 ()內(nèi)容靈活性 傳統(tǒng)播報芯片如同老式唱片,內(nèi)容固化。在產(chǎn)品生產(chǎn)時就已將固定語音內(nèi)容燒錄進去,后續(xù)很難更改。若產(chǎn)品應用
    的頭像 發(fā)表于 08-13 14:52 ?834次閱讀

    電壓放大器驅(qū)動合成射流的渦結(jié)構(gòu)演化與摻混增強機制研究

    速度的作用向下游運動,相互融合形成射流。合成射流已被應用于眾多流動控制領(lǐng)域,包括摻混增強、傳熱增強、流動分離控制等。本實驗通過粒子圖像測速(PIV)技術(shù)從瞬時流動結(jié)構(gòu)演化的角度對合成
    的頭像 發(fā)表于 08-08 15:47 ?580次閱讀
    電壓放大器驅(qū)動<b class='flag-5'>合成</b>射流的渦結(jié)構(gòu)演化與摻混增強機制<b class='flag-5'>研究</b>

    2025零售快閃店場景,如何選擇更可靠的SDWAN服務商?

    ##零售快閃店場景,如何選擇更可靠的SDWAN服務商?在快節(jié)奏的零售戰(zhàn)場,快閃店如同一場精心策劃的閃電戰(zhàn)——品牌在黃金地段突然出現(xiàn),制造話題,引爆消費,又在熱潮未退時悄然離。然而,
    的頭像 發(fā)表于 08-04 17:32 ?2123次閱讀
    2025零售快閃店<b class='flag-5'>場景</b><b class='flag-5'>下</b>,如何選擇更可靠的SDWAN服務商?

    3Dfindit 提供的數(shù)字立方體模型為研究目的可視化提供了支持

    作為學習項目的部分,羅伊特林根教育大學的學生們在比辛根集中營紀念地的博物館中使用 3Dfindit 動畫立方體模型進行了學習。作為歷史教學研討會的部分,學生們研究了巴登-符騰堡州
    發(fā)表于 08-01 14:36

    火車車號圖像識別系統(tǒng)如何應對不同光照條件的識別問題?

    光譜成像技術(shù)的應用 先進的系統(tǒng)采用多光譜成像技術(shù),能夠在不同光照條件捕捉車號信息。高動態(tài)范圍(HDR)攝像頭的應用,可同時獲取同一場景的多種曝光圖像,確保在強光直射或夜間低照度環(huán)境
    的頭像 發(fā)表于 07-15 11:37 ?750次閱讀
    火車車號<b class='flag-5'>圖像</b>識別系統(tǒng)如何應對不同光照條件<b class='flag-5'>下</b>的識別問題?

    航天科普|一場救援中的通信革命-衛(wèi)星通信(下篇)

    當福來哥在云南雨崩的原始森林迷路,手機信號完全消失時,他背包里的衛(wèi)星手機成為救命稻草—條包含坐標的求救短信穿透密林樹冠,直達3.6萬公里高空的天通衛(wèi)星,小時后救援隊精準抵達。這一場景背后,是一場
    的頭像 發(fā)表于 07-01 17:03 ?1909次閱讀
    航天科普|<b class='flag-5'>一場</b>救援中的通信革命-衛(wèi)星通信(下篇)

    HarmonyOS NEXT意圖框架習慣推薦一場景說明

    、概述 意圖框架是HarmonyOS系統(tǒng)級的意圖標準體系。將應用和元服務的業(yè)務功能智慧分發(fā)給不同的系統(tǒng)入口,以“音樂播放”為例,HarmonyOS將業(yè)務分發(fā)給“小藝建議”,提供了桌面大流量曝光
    發(fā)表于 06-18 15:06

    LLSM流媒體傳輸模塊 高動態(tài)圖像帶寬穩(wěn)定技術(shù)突破

    高清實時視頻的能力。旦控制系統(tǒng)設定帶寬上限為500K,那么在多種場景,尤其是高動態(tài)圖像環(huán)境,帶寬的波動始終會控制在這個范圍內(nèi)。我們在
    的頭像 發(fā)表于 05-27 17:58 ?1152次閱讀
    LLSM流媒體傳輸模塊  高動態(tài)<b class='flag-5'>圖像</b>帶寬穩(wěn)定技術(shù)突破

    你以為的安全,真的安全嗎?——擬態(tài)安全,一場關(guān)于認知的博弈

    黑客的日常工作就像一場精心策劃的“入室盜竊”。首先“踩點”——掃描目標系統(tǒng)的端口、分析網(wǎng)絡流量、研究系統(tǒng)架構(gòu)找出漏洞,但如果黑客發(fā)現(xiàn)系統(tǒng)會“變臉”,今天Windows,明天變成Linux,剛研究
    的頭像 發(fā)表于 04-14 10:45 ?555次閱讀
    你以為的安全,真的安全嗎?——擬態(tài)安全,<b class='flag-5'>一場</b>關(guān)于認知的博弈

    普渡機器人核心技術(shù)全面升級

    隨著智能技術(shù)向更多元場景滲透,多類型機器人(如清潔、配送等)在同一場景的協(xié)同作業(yè)需求日益增長。然而,復雜環(huán)境中的地圖復用、電梯調(diào)度、路徑?jīng)_突及人機交互等問題,成為制約效率與用戶體驗的關(guān)鍵挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 16:17 ?994次閱讀