91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-12-24 12:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發(fā)明的由2D圖像生成3D圖像的技術(shù),利用3D估計神經(jīng)網(wǎng)絡(luò)圖像信息的補全以及預(yù)測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

谷歌研究人員制作的一個AI工具,可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter,使用機器學(xué)習(xí)來根據(jù)用戶的粗略草圖生成圖像。

Chimera Painter背后的團隊在一篇博客文章中解釋了他們的方法和動機,稱他們的想法是創(chuàng)造一種 “畫筆,它的行為不像工具,而更像助手”。Chimera Painter只是一個原型,但如果這樣的軟件變得普遍,它可以減少創(chuàng)造高質(zhì)量藝術(shù)所需的時間。

這種圖像生成技術(shù),其實在三維渲染方面有著非常廣泛的應(yīng)用,其中最具有代表性的工作之一,就是由2D圖像生成3D圖像。我們知道,3D圖像相比于2D圖像多了深度信息這一個維度,但也就是這一個差別,導(dǎo)致了3D圖像相比于2D圖像所多出的信息不是一星半點。因此,倘若想要從2D圖像生成3D圖像,其難度之大可想而知。

為此,谷歌在18年10月18日申請了一項名為“通過渲染許多3D視圖來學(xué)習(xí)重構(gòu)3D形狀”的發(fā)明專利(申請?zhí)枺?01880030823.5),申請人為谷歌有限責(zé)任公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項從2D圖像到3D圖像的生成方法吧。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

該技術(shù)中,主要使用了3D估計器神經(jīng)網(wǎng)絡(luò),如上圖,為使用3D估計器神經(jīng)網(wǎng)絡(luò)來估計圖像中描繪的面部的3D形狀和紋理,并基于估計的3D形狀和紋理生成替身的系統(tǒng)示意圖。用戶通過上傳面部圖像105,系統(tǒng)100可以對照片進行處理后生成替身115,這里所說的替身也就是用戶的3D畫像。

在具體的過程中,照片首先由面部識別引擎110進行處理,從而生成用戶的面部圖像特征112,該特征在3D估計神經(jīng)網(wǎng)絡(luò)中被處理,基于圖像特征估計照片中描繪的用戶面部的3D形狀和紋理,從而生成形狀紋理數(shù)據(jù)122。

最后,數(shù)據(jù)122被發(fā)送到3D渲染引擎130中,基于用戶獨特的面部形狀、紋理特征來生成用戶的3D畫像,并且為了做到更加真實,渲染引擎可以給出特定的視圖,視圖中融合了相機角度、光照以及視場的估計信息,可以讓生成的圖像質(zhì)量更加逼真。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

如上圖,為用于用戶3D渲染圖像生成的3D估計器神經(jīng)網(wǎng)絡(luò)220的系統(tǒng)框圖,整個系統(tǒng)的結(jié)構(gòu)還是相當(dāng)復(fù)雜的,從圖中我們可以看到這種神經(jīng)網(wǎng)絡(luò)是如何工作的。根據(jù)目前的技術(shù)來看,訓(xùn)練3D估計器神經(jīng)網(wǎng)絡(luò)通常有兩個困難:第一,由3D對象的圖像和那些3D對象的3D形狀和紋理組成的訓(xùn)練對通常是有限的并且難以獲得;第二,訓(xùn)練3D估計器神經(jīng)網(wǎng)絡(luò)可能經(jīng)常導(dǎo)致3D估計器神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)欺騙。

因此,該專利發(fā)明的整個網(wǎng)絡(luò)分為了監(jiān)督訓(xùn)練回路以及無監(jiān)督訓(xùn)練回路,通過二者相結(jié)合的方式,在完全訓(xùn)練階段期間,僅利用無監(jiān)督訓(xùn)練回路,從而允許估計神經(jīng)網(wǎng)絡(luò)輸出更快地收斂。

因為無監(jiān)督訓(xùn)練回路可以在預(yù)訓(xùn)練階段和完全訓(xùn)練階段兩者期間使用,所以從無監(jiān)督訓(xùn)練回路開始,在預(yù)訓(xùn)練之后,完全訓(xùn)練可以對大量迭代和大量樣本單獨利用無監(jiān)督訓(xùn)練回路,來改進3D估計神經(jīng)網(wǎng)絡(luò)估計圖像中的對象的3D形狀和紋理的能力。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

最后,是這種無監(jiān)督訓(xùn)練回路訓(xùn)練的流程圖,系統(tǒng)首先需要獲取對象圖像的第一圖像特征,該特征就是上述所說用戶面部信息的原始數(shù)據(jù),其次,將這種第一圖像特征提供給3D估計器神經(jīng)網(wǎng)絡(luò)并獲取3D形狀和紋理。

根據(jù)這些形狀和紋理進行3D渲染,并從多個3D視圖中導(dǎo)出第二圖像特征,基于圖像特征的損失函數(shù)計算損失,以知道神經(jīng)網(wǎng)絡(luò)進行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發(fā)明的利用2D圖像生成3D圖像的專利技術(shù),從2D到3D圖像的轉(zhuǎn)換過程中,由于2D圖像缺少了很多信息,因此該技術(shù)利用3D估計神經(jīng)網(wǎng)絡(luò)進行信息的補全以及預(yù)測,并融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術(shù)對于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

關(guān)于嘉德

深圳市嘉德知識產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強企業(yè)工作多年的知識產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權(quán)法律理論和實務(wù),在全球知識產(chǎn)權(quán)申請、布局、訴訟、許可談判、交易、運營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會知識產(chǎn)權(quán)、跨境電商知識產(chǎn)權(quán)、知識產(chǎn)權(quán)海關(guān)保護等方面擁有豐富的經(jīng)驗。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    114968
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111340
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107732
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    XS5018C:高性能2D/3D降噪ISP-TX 2K芯片電路圖資料

    HDcctv/CVBS, 支持多種制式 960H/720P/960P/1080P, ISP 最高支持 1080P@30FPS, 高性能 2D 降噪、 3D 降噪, 支持無極降幀。
    發(fā)表于 01-28 16:50 ?0次下載

    2D、2.5D3D封裝技術(shù)的區(qū)別與應(yīng)用解析

    半導(dǎo)體封裝技術(shù)的發(fā)展始終遵循著摩爾定律的延伸與超越。當(dāng)制程工藝逼近物理極限,先進封裝技術(shù)成為延續(xù)芯片性能提升的關(guān)鍵路徑。本文將從技術(shù)原理、典型結(jié)構(gòu)和應(yīng)用場景三個維度,系統(tǒng)剖析2D、2.
    的頭像 發(fā)表于 01-15 07:40 ?567次閱讀
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>與<b class='flag-5'>3D</b>封裝<b class='flag-5'>技術(shù)</b>的區(qū)別與應(yīng)用<b class='flag-5'>解析</b>

    2025 3D機器視覺的發(fā)展趨勢

    迭代與應(yīng)用拓展成為市場的主要推動力:·技術(shù)升級:視覺系統(tǒng)從單一任務(wù)的2D相機向多功能3D相機進化。過去用2D相機完成單一任務(wù),如今用戶更愿意為能自動化多流程的
    的頭像 發(fā)表于 12-10 17:25 ?1260次閱讀
    2025 <b class='flag-5'>3D</b>機器視覺的發(fā)展趨勢

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署在SMT生產(chǎn)線的 貼片機之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D2D復(fù)合檢測 :同時利用3D輪廓信息和2D彩色
    的頭像 發(fā)表于 12-04 09:27 ?642次閱讀

    淺談2D封裝,2.5D封裝,3D封裝各有什么區(qū)別?

    集成電路封裝技術(shù)2D3D的演進,是一場從平面鋪開到垂直堆疊、從延遲到高效、從低密度到超高集成的革命。以下是這三者的詳細分析:
    的頭像 發(fā)表于 12-03 09:13 ?813次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    時間都在與 2D 的焊盤、走線和絲印打交道。但一個完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達的。 幸運的是,KiCad 提供了強大的 3D 可視化功能。它不僅能讓你
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    TMAG5170D-Q1 3D線性霍爾效應(yīng)傳感器技術(shù)解析與應(yīng)用指南

    ,每個芯片均可獨立配置,包含帶溫漂補償?shù)臏囟葯z測功能。該器件支持多種測量類型,包括1D線性、2D角度、3D操縱桿和磁性閾值交叉應(yīng)用。
    的頭像 發(fā)表于 09-06 13:45 ?1269次閱讀
    TMAG5170<b class='flag-5'>D</b>-Q1 <b class='flag-5'>3D</b>線性霍爾效應(yīng)傳感器<b class='flag-5'>技術(shù)</b><b class='flag-5'>解析</b>與應(yīng)用指南

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    視覺傳感器對于機器信息獲取至關(guān)重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺能力,從而推動創(chuàng)新應(yīng)用。3D 視覺解決方案大致分為立體視覺、結(jié)構(gòu)光和飛行時間 (TOF)
    發(fā)表于 09-05 07:24

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進行各項參數(shù)計算 3
    的頭像 發(fā)表于 07-14 14:08 ?666次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    X-ray設(shè)備2D/3D檢測金屬材料及零部件裂紋異物的缺陷

    在高端制造領(lǐng)域,金屬材料及零部件的內(nèi)部質(zhì)量直接關(guān)系到產(chǎn)品性能與安全性。X-ray設(shè)備憑借其獨特的穿透成像能力,成為檢測裂紋、異物等缺陷的關(guān)鍵工具,而2D/3D檢測技術(shù)的結(jié)合,更將檢測精度與效率提升
    的頭像 發(fā)表于 06-27 17:23 ?1193次閱讀
    X-ray設(shè)備<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>檢測金屬材料及零部件裂紋異物的缺陷

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設(shè)置局部摩擦
    發(fā)表于 06-16 08:46

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個
    的頭像 發(fā)表于 06-05 09:24 ?888次閱讀

    HT 可視化監(jiān)控頁面的 2D3D 連線效果

    的連線效果是如何實現(xiàn)的。我們將從 基本概念、實現(xiàn)步驟、關(guān)鍵代碼 多個維度,逐步剖析這個效果的具體實現(xiàn)過程,為你提供全面的知識和實踐指導(dǎo)。 盡管 2D3D 連線效果看起來復(fù)雜,其本質(zhì)仍然是二維節(jié)點之間的連接。只需要通過一些巧妙的
    的頭像 發(fā)表于 04-09 11:28 ?1496次閱讀
    HT 可視化監(jiān)控頁面的 <b class='flag-5'>2D</b> 與 <b class='flag-5'>3D</b> 連線效果

    安森美這款iToF傳感器讓3D深度測量技術(shù)輕松落地

    現(xiàn)代工業(yè)自動化的成功離不開3D視覺技術(shù)的強大功能。傳統(tǒng)的2D傳感器只能提供平面圖像,這使其在設(shè)備檢測等應(yīng)用中的效能大打折扣。2D傳感器可以讀
    的頭像 發(fā)表于 03-28 14:31 ?1038次閱讀
    安森美這款iToF傳感器讓<b class='flag-5'>3D</b>深度測量<b class='flag-5'>技術(shù)</b>輕松落地

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價值?,F(xiàn)有主流算法主要依賴于點云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?1224次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>