Single-View View Synthesis with Multiplane Images

最近在視圖合成方面的一系列工作使用深度學習來生成多平面圖像——一種以相機為中心的分層 3D 表示——給定兩個或多個已知視點的輸入圖像。我們將此表示應用于單視圖視圖合成,這是一個更具挑戰(zhàn)性但可能具有更廣泛應用的問題。我們的方法直接從單個圖像輸入中學習預測多平面圖像,并且我們引入了用于監(jiān)督的尺度不變視圖合成,使我們能夠在在線視頻上進行訓練。我們展示了這種方法適用于幾個不同的數(shù)據(jù)集,它還生成了合理的深度圖,并且它學會了在背景層中填充前景對象邊緣后面的內(nèi)容。
ASSET: Autoregressive Semantic Scene Editing with Transformers atHigh Resolutions

我們提出了資產(chǎn),一種神經(jīng)架構,用于根據(jù)用戶對其語義分割圖的編輯自動修改輸入的高分辨率圖像。我們的架構基于具有新穎注意力機制的轉(zhuǎn)換器。我們的關鍵思想是在高分辨率下稀疏變換器的注意力矩陣,由在較低圖像分辨率下提取的密集注意力引導。雖然以前的注意力機制在處理高分辨率圖像時計算成本太高,或者在阻礙遠程交互的特定圖像區(qū)域內(nèi)受到過度限制,但我們新的注意力機制在計算上既高效又有效。我們的稀疏注意力機制能夠捕捉遠程交互和上下文,從而合成場景中有趣的現(xiàn)象,例如景觀到水面上的反射或與景觀的其余部分一致的論壇,這些是以前的卷積網(wǎng)絡無法可靠生成的和變壓器方法。我們提供定性和定量結果,以及用戶研究,證明我們方法的有效性。
我們的代碼和數(shù)據(jù)集可在我們的項目頁面上找到:https://github.com/DifanLiu/ASSET
審核編輯 :李倩
-
圖像
+關注
關注
2文章
1096瀏覽量
42360 -
深度學習
+關注
關注
73文章
5600瀏覽量
124475
原文標題:2022 siggrqph:圖像和視頻生成(2)
文章出處:【微信號:計算機視覺芯片設計,微信公眾號:計算機視覺芯片設計】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
多通道兼容圖像采集卡:一機搞定多路圖像信號處理
MAX20361:小型單/多電池太陽能收集器的卓越之選
超景深顯微鏡在材料學中的應用
應用多光譜數(shù)字圖像區(qū)分苗期作物與雜草的研究進展
電線是多芯的好還是單芯的好
平面以太網(wǎng)配線架的優(yōu)點有哪些
電壓放大器驅(qū)動合成射流的渦結構演化與摻混增強機制研究
TechWiz LCD 3D應用:FFS仿真
VirtualLab Fusion:平面透鏡|從光滑表面到菲涅爾、衍射和超透鏡的演變
多層板設計經(jīng)驗談:地平面布局易錯點解析
瓶蓋檢測方案:從微米級測量到360° 無死角
集成電路版圖設計的基本概念和關鍵步驟
安森美Hyperlux ID系列深度傳感器技術介紹
多平面圖像的單視圖合成
評論