91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GANcraft可解決圖像到圖像轉(zhuǎn)換問題

星星科技指導員 ? 來源:NVIDIA ? 作者:Nathan Horrocks ? 2022-04-06 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 和康奈爾大學的科學家們引入了一種混合的無監(jiān)督神經(jīng)渲染管道,以有效地表示體素世界中的大型復雜場景。從本質(zhì)上講, 3D 藝術家只需要構建最小值,剩下的部分將由算法來構建照片級真實感世界。研究人員將這種混合神經(jīng)渲染管道應用于 Minecraft 區(qū)塊世界,以生成更逼真的 Minecraft 場景。

NVIDIA 和更廣泛的研究團體( pix2pix 、 pix2pixHD 、 MUNIT 、 SPADE )以前的工作已經(jīng)解決了圖像到圖像轉(zhuǎn)換( im2im )的問題——將圖像從一個域轉(zhuǎn)換到另一個域。乍一看,這些方法似乎為將一個世界轉(zhuǎn)換為另一個世界的任務提供了一個簡單的解決方案—一次翻譯一幅圖像。但是, im2im 方法不保持視點一致性,因為它們不了解 3D 幾何體,并且每個 2D 幀都是獨立生成的。從下面的圖像中可以看出,這些方法的結(jié)果會產(chǎn)生抖動和突然的顏色和紋理變化。

輸入 GANcraft ,這是一種直接在 3D 輸入世界上操作的新方法。

研究人員在 study 中解釋說:“由于用戶創(chuàng)建的塊世界根本不存在地面真實照片級真實感渲染,我們必須通過間接監(jiān)督來訓練模型。”。

該方法的工作原理是在輸入塊世界中隨機采樣攝影機視圖,然后想象該視圖的真實照片版本是什么樣子。這是在 SPADE 的幫助下完成的,這是 NVIDIA 先前在圖像到圖像轉(zhuǎn)換方面的工作,也是流行的 GauGAN 演示中的關鍵組件。 GANcraft 通過使用樣式調(diào)節(jié)網(wǎng)絡克服了這些生成的“偽真實”的視圖不一致性,該網(wǎng)絡可以消除世界結(jié)構與渲染樣式之間的歧義。這使 GANcraft 能夠生成與視圖一致的輸出視頻,并且具有不同的風格。

雖然研究結(jié)果在 Minecraft 中得到了驗證,但該方法適用于其他 3D 塊體世界,如體素??s短構建高清世界所需的時間和專業(yè)知識的潛力增加了這項研究的價值。它可以幫助游戲開發(fā)者、 CGI 藝術家和動畫產(chǎn)業(yè)縮短構建這些巨大而令人印象深刻的世界所需的時間。

GANcraft 是在 Imaginaire 庫中實現(xiàn)的。該庫針對生成模型和生成對抗網(wǎng)絡的訓練進行了優(yōu)化,支持多 GPU 、多節(jié)點和自動混合精度訓練。 NVIDIA 制作的 10 多種不同研究成果以及預訓練模型已經(jīng)發(fā)布。隨著時間的推移,此庫將繼續(xù)使用更新的作品進行更新。

關于作者

Nathan Horrocks 是 NVIDIA Research 的內(nèi)容營銷經(jīng)理。他重點強調(diào)了 NVIDIA 實驗室在世界各地進行的驚人研究。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5627

    瀏覽量

    109875
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5213

    瀏覽量

    135622
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用JPU對jpg圖像進行轉(zhuǎn)換,使用的工具為ffmpeg,轉(zhuǎn)換出來的圖像顏色失調(diào)嚴重,請問這是什么情況?

    我正在使用JPU對jpg圖像進行轉(zhuǎn)換,使用的工具為ffmpeg,轉(zhuǎn)換出來的圖像顏色失調(diào)嚴重,請問這是什么情況?
    發(fā)表于 02-05 07:19

    基于降壓轉(zhuǎn)換器的工業(yè)圖像傳感器供電方案教程

    電源、低壓差穩(wěn)壓器(LDO)、Hyperlux CMOS圖像傳感器等展開講解。作為系列教程的第一部分,本文將介紹穩(wěn)壓型降壓電源的關鍵組成部分、降壓轉(zhuǎn)換器的工作原理、連續(xù)導通與斷續(xù)導通等。
    的頭像 發(fā)表于 01-27 07:38 ?9373次閱讀
    基于降壓<b class='flag-5'>轉(zhuǎn)換</b>器的工業(yè)<b class='flag-5'>圖像</b>傳感器供電方案教程

    圖像采集卡:連接設備與數(shù)據(jù)的圖像樞紐

    在機器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機、內(nèi)窺鏡、攝像機等前端圖像設備的信號輸出,另一端對接后端數(shù)據(jù)處理、存儲、展示系統(tǒng),通過信號轉(zhuǎn)換、同步協(xié)調(diào)、高
    的頭像 發(fā)表于 01-22 13:51 ?265次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設備與數(shù)據(jù)的<b class='flag-5'>圖像</b>樞紐

    數(shù)字圖像采集的核心載體——圖像采集卡技術白皮書

    在工業(yè)自動化、醫(yī)療影像、廣電直播、科研成像等領域,圖像采集卡作為連接前端圖像設備與后端計算系統(tǒng)的核心硬件,是實現(xiàn)物理圖像向數(shù)字信號轉(zhuǎn)化并高效傳輸?shù)年P鍵樞紐。它解決了原始圖像信號與計算機
    的頭像 發(fā)表于 01-21 16:18 ?259次閱讀
    數(shù)字<b class='flag-5'>圖像</b>采集的核心載體——<b class='flag-5'>圖像</b>采集卡技術白皮書

    從信號數(shù)據(jù)的“魔法轉(zhuǎn)換”:圖像采集卡如何讓機器“看懂”世界?

    ?這背后,圖像采集卡正扮演著“信號翻譯官”與“數(shù)據(jù)搬運工”的雙重角色,用一系列精密的技術操作,完成從信號數(shù)據(jù)的“魔法轉(zhuǎn)換”,為機器搭建起“看懂”世界的核心橋梁。
    的頭像 發(fā)表于 12-17 14:58 ?401次閱讀
    從信號<b class='flag-5'>到</b>數(shù)據(jù)的“魔法<b class='flag-5'>轉(zhuǎn)換</b>”:<b class='flag-5'>圖像</b>采集卡如何讓機器“看懂”世界?

    從模擬AI集成:圖像采集卡的技術演進與未來三大趨勢

    作為機器視覺系統(tǒng)連接物理視界與數(shù)字大腦的核心樞紐,圖像采集卡始終以“信號翻譯官”的身份,推動著視覺信息處理技術的迭代升級。從早期簡單的模擬信號轉(zhuǎn)換,如今支持超高清采集與AI預處理的智能設備,其發(fā)展
    的頭像 發(fā)表于 12-15 16:30 ?1012次閱讀
    從模擬<b class='flag-5'>到</b>AI集成:<b class='flag-5'>圖像</b>采集卡的技術演進與未來三大趨勢

    圖像采集卡:機器視覺時代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術本質(zhì):從信號數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機器視覺系統(tǒng)的核心硬件組件,本質(zhì)是通過專用芯片(如FPGA、ASIC)實
    的頭像 發(fā)表于 11-12 15:15 ?672次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器視覺時代的<b class='flag-5'>圖像</b>數(shù)據(jù)核心樞紐

    如何將圖像文件轉(zhuǎn)換為二進制文件?

    如何將圖像文件轉(zhuǎn)換為二進制文件
    發(fā)表于 09-05 08:28

    無法使用OpenVINO?在 GPU 設備上運行穩(wěn)定擴散文本圖像的原因?

    在OpenVINO? GPU 設備上使用圖像大小 (1024X576) 運行穩(wěn)定擴散文本圖像,并收到錯誤消息: RuntimeError: Exception from
    發(fā)表于 06-25 06:36

    圖像采集卡:機器視覺與專業(yè)成像的關鍵橋梁

    在當今數(shù)字化時代,從工業(yè)自動化檢測到醫(yī)療影像診斷,從科學研究高清視頻制作,圖像信息的實時獲取和處理變得至關重要。而將現(xiàn)實世界的光信號(通過攝像頭或相機)高效、準確地轉(zhuǎn)換為計算機能夠處理的數(shù)字
    的頭像 發(fā)表于 06-19 12:25 ?1075次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器視覺與專業(yè)成像的關鍵橋梁

    HarmonyOS應用圖像stride處理方案

    圖像存儲在內(nèi)存中時,內(nèi)存緩沖區(qū)可能在每行像素之后包含額外的填充字節(jié)。填充字節(jié)會影響圖像在內(nèi)存中的存儲方式,但不會影響圖像的顯示方式。stride是內(nèi)存中一行像素內(nèi)存中下一行像素的字
    的頭像 發(fā)表于 06-10 14:17 ?1263次閱讀
    HarmonyOS應用<b class='flag-5'>圖像</b>stride處理方案

    工業(yè)相機圖像采集卡:機器視覺的核心樞紐

    工業(yè)相機圖像采集卡是用于連接工業(yè)相機與計算機的關鍵硬件設備,主要負責將相機輸出的圖像信號轉(zhuǎn)換為計算機可處理的數(shù)字信號,并實現(xiàn)高速、穩(wěn)定的數(shù)據(jù)傳輸。它在工業(yè)自動化、機器視覺、醫(yī)學影像、科學研究等領域
    的頭像 發(fā)表于 05-21 12:13 ?899次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:機器視覺的核心樞紐

    基于LockAI視覺識別模塊:C++使用圖像的統(tǒng)計信息

    圖像處理中,統(tǒng)計信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺識別模塊如何提取興趣區(qū)域(ROI)、轉(zhuǎn)換顏色通道、計算
    發(fā)表于 05-08 10:31

    基于LockAI視覺識別模塊:C++使用圖像的統(tǒng)計信息

    圖像處理中,統(tǒng)計信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺識別模塊如何提取興趣區(qū)域(ROI)、轉(zhuǎn)換顏色通道、計算
    的頭像 發(fā)表于 05-08 10:09 ?789次閱讀
    基于LockAI視覺識別模塊:C++使用<b class='flag-5'>圖像</b>的統(tǒng)計信息

    如何使用離線工具od SPSDK生成完整圖像?

    對我來說,完整圖像是指包含 keyblob、FCB 等的圖像。換句話說,圖像包含 0x30000000 0x30000FFF 之間的大約 4KB。 如果我理解正確,使用 SPT(以
    發(fā)表于 03-28 06:51