91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌研究人員利用3D卷積網(wǎng)絡(luò)打造視頻生成新系統(tǒng)

DPVg_AI_era ? 來(lái)源:lq ? 2019-06-02 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌研究人員利用3D卷積網(wǎng)絡(luò)打造視頻生成新系統(tǒng),只需要視頻的第一幀和最后一幀,就能生成完整合理的整段視頻,是不是很神奇?

漫畫書(shū)秒變動(dòng)畫片了解一下?

想象一下,現(xiàn)在你的手中有一段視頻的第一幀和最后一幀圖像,讓你負(fù)責(zé)把中間的圖像填進(jìn)去,生成完整的視頻,從現(xiàn)有的有限信息中推斷出整個(gè)視頻。你能做到嗎?

這可能聽(tīng)起來(lái)像是一項(xiàng)不可能完成的任務(wù),但谷歌人工智能研究部門的研究人員已經(jīng)開(kāi)發(fā)出一種新系統(tǒng),可以由視頻第一幀和最后一幀生成“似是而非的”視頻序列,這個(gè)過(guò)程被稱為“inbetween”。

“想象一下,如果我們能夠教一個(gè)智能系統(tǒng)來(lái)將漫畫自動(dòng)變成動(dòng)畫,會(huì)是什么樣子?如果真實(shí)現(xiàn)了這一點(diǎn),無(wú)疑將徹底改變動(dòng)畫產(chǎn)業(yè)?!霸撜撐牡墓餐髡邔懙??!半m然這種極其節(jié)省勞動(dòng)力的能力仍然超出目前最先進(jìn)的水平,但計(jì)算機(jī)視覺(jué)機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步正在使這個(gè)目標(biāo)的實(shí)現(xiàn)越來(lái)越接近?!?/p>

原理與模型結(jié)構(gòu)

這套AI系統(tǒng)包括一個(gè)完全卷積模型,這是是受動(dòng)物視覺(jué)皮層啟發(fā)打造的深度神經(jīng)網(wǎng)絡(luò),最常用于分析視覺(jué)圖像。它由三個(gè)部分組成:2D卷積圖像解碼器,3D卷積潛在表示生成器,以及視頻生成器。

圖1:視頻生成模型示意圖

圖像解碼器將來(lái)自目標(biāo)視頻的幀映射到潛在空間,潛在表示生成器學(xué)習(xí)對(duì)包含在輸入幀中的信息進(jìn)行合并。最后,視頻生成器將潛在表示解碼為視頻中的幀。

研究人員表示,將潛在表示生成與視頻解碼分離對(duì)于成功實(shí)現(xiàn)中間視頻至關(guān)重要,直接用開(kāi)始幀和結(jié)束幀的編碼表示生成視頻的結(jié)果很差。為了解決這個(gè)問(wèn)題,研究人員設(shè)計(jì)了潛在表示生成器,對(duì)幀的表示進(jìn)行融合,并逐步增加生成視頻的分辨率。

圖2:模型生成的視頻幀序列圖,對(duì)于每個(gè)數(shù)據(jù)集上方的圖表示模型生成的序列,下方為原視頻,其中首幀和尾幀用于生成模型的采樣。

實(shí)驗(yàn)結(jié)果

為了驗(yàn)證該方法,研究人員從三個(gè)數(shù)據(jù)集中獲取視頻 - BAIR機(jī)器人推送,KTH動(dòng)作數(shù)據(jù)庫(kù)和UCF101動(dòng)作識(shí)別數(shù)據(jù)集 - 并將這些數(shù)據(jù)下采樣至64 x 64像素的分辨率。每個(gè)樣本總共包含16幀,其中的14幀由AI系統(tǒng)負(fù)責(zé)生成。

研究人員為每對(duì)視頻幀運(yùn)行100次模型,并對(duì)每個(gè)模型變量和數(shù)據(jù)集重復(fù)10次,在英偉達(dá)Tesla V100顯卡平臺(tái)上的訓(xùn)練時(shí)間約為5天。結(jié)果如下表所示:

表1:我們報(bào)告了完整模型和兩個(gè)基線的平均FVD,對(duì)每個(gè)模型和數(shù)據(jù)集重復(fù)10次,每次運(yùn)行100個(gè)epoch,表中FVD值越低,表示對(duì)應(yīng)生成視頻的質(zhì)量越高。

表2:使用直接3D卷積和基于的替代方法的模型的平均SSIM

RNN(SDVI)或光流(SepConv和SuperSloMo),數(shù)值越高越好。

研究人員表示,AI生成的視頻幀序列在風(fēng)格上與給定的起始幀和結(jié)束幀保持一致,而且看上去說(shuō)得通?!傲钊梭@喜的是,這種方法可以在如此長(zhǎng)的時(shí)間段內(nèi)實(shí)現(xiàn)視頻生成,”該團(tuán)隊(duì)表示,“這可能給未來(lái)的視頻生成技術(shù)研究提供了一個(gè)有用的替代視角?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1219

    瀏覽量

    43425
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111405
  • 智能系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    420

    瀏覽量

    74271

原文標(biāo)題:谷歌AI動(dòng)畫接龍:只用頭尾兩幀圖像,片刻生成完整視頻!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2D材料3D集成實(shí)現(xiàn)光電儲(chǔ)備池計(jì)算

    先進(jìn)材料與三維集成技術(shù)的結(jié)合為邊緣計(jì)算應(yīng)用帶來(lái)了新的可能性。本文探討研究人員如何通過(guò)單片3D集成方式將硒化銦光電探測(cè)器與二硫化鉬憶阻晶體管結(jié)合,實(shí)現(xiàn)傳感器與計(jì)算單元之間物理距離小于50納米的緊密集成[1]。
    的頭像 發(fā)表于 02-02 15:58 ?226次閱讀
    2<b class='flag-5'>D</b>材料<b class='flag-5'>3D</b>集成實(shí)現(xiàn)光電儲(chǔ)備池計(jì)算

    技術(shù)資訊 I 多板系統(tǒng) 3D 建模,提升設(shè)計(jì)精度和性能

    本文要點(diǎn)了解3D建模流程。洞悉多板系統(tǒng)3D建模如何提高設(shè)計(jì)精度、性能和成本效益。掌握3D建模在制造工藝中的優(yōu)勢(shì)。在PCBA領(lǐng)域,仿真與建模是實(shí)現(xiàn)精準(zhǔn)高效設(shè)計(jì)的基石。在量產(chǎn)前構(gòu)建并復(fù)用原
    的頭像 發(fā)表于 11-21 17:45 ?2518次閱讀
    技術(shù)資訊 I 多板<b class='flag-5'>系統(tǒng)</b> <b class='flag-5'>3D</b> 建模,提升設(shè)計(jì)精度和性能

    全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國(guó)內(nèi)版&quot;萌動(dòng)AI&quot;正式發(fā)布

    Animon國(guó)內(nèi)版——"萌動(dòng)AI"首秀:AI動(dòng)漫創(chuàng)作進(jìn)入全民時(shí)代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個(gè)專注于動(dòng)漫的AI視頻生成
    的頭像 發(fā)表于 09-25 12:33 ?961次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 在日常的 PCB 設(shè)計(jì)中,
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    索尼與VAST達(dá)成3D業(yè)務(wù)合作

    與Tripo AI的高精度3D生成能力,打造從內(nèi)容創(chuàng)作到沉浸式展示的全鏈路解決方案。此次合作將推動(dòng)3D技術(shù)在展覽、零售、教育等場(chǎng)景的普惠化應(yīng)用,同時(shí)也將為元宇宙、工業(yè)設(shè)計(jì)、數(shù)字孿生等領(lǐng)
    的頭像 發(fā)表于 08-28 17:32 ?1430次閱讀

    生成式 AI 重塑自動(dòng)駕駛仿真:4D 場(chǎng)景生成技術(shù)的突破與實(shí)踐

    生成式AI驅(qū)動(dòng)的4D場(chǎng)景技術(shù)正解決傳統(tǒng)方法效率低、覆蓋不足等痛點(diǎn),如何通過(guò)NeRF、3D高斯?jié)姙R等技術(shù)實(shí)現(xiàn)高保真動(dòng)態(tài)建模?高效生成極端天氣等長(zhǎng)尾場(chǎng)景?本文為您
    的頭像 發(fā)表于 08-06 11:20 ?5152次閱讀
    <b class='flag-5'>生成</b>式 AI 重塑自動(dòng)駕駛仿真:4<b class='flag-5'>D</b> 場(chǎng)景<b class='flag-5'>生成</b>技術(shù)的突破與實(shí)踐

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過(guò)程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?681次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    無(wú)刷直流電機(jī)雙閉環(huán)串級(jí)控制系統(tǒng)仿真研究

    以來(lái)伴隨著永磁材料技術(shù)、計(jì)算機(jī)及控制技術(shù)等支撐技術(shù)的快速發(fā)展及微電機(jī)制造工藝水平的不斷提高,永磁無(wú)刷直流電動(dòng)機(jī)在高性能中、小伺服驅(qū)動(dòng)領(lǐng)域獲得廣泛應(yīng)用并日趨占據(jù)主導(dǎo)地位嗎。一直以來(lái),研究人員都比較關(guān)注利用
    發(fā)表于 07-07 18:36

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,并增加Condition層 此層為局部摩擦的層,所以要注意區(qū)域的設(shè)置; 設(shè)置完成后要生成mesh文件 2.2在TechWiz LCD 3D軟件中將Local Mask的頂部以及底部配向角度添加進(jìn)來(lái) 3. 結(jié)果查看 3.1
    發(fā)表于 06-16 08:46

    4K、多模態(tài)、長(zhǎng)視頻:AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?7289次閱讀

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?6次下載

    VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化

    描述和F-Theta透鏡的應(yīng)用示例。 光學(xué)系統(tǒng)3D-可視化 VirtualLab Fusion提供的工具可以實(shí)現(xiàn)光學(xué)系統(tǒng)3D可視化,因此可以用于檢查元件的位置,以及快速了解
    發(fā)表于 04-30 08:47

    NVIDIA助力影眸科技3D生成工具Rodin升級(jí)

    在當(dāng)今數(shù)字化與 AI 飛速發(fā)展的時(shí)代,3D 生成技術(shù)正逐漸成為推動(dòng)各行業(yè)創(chuàng)新的關(guān)鍵力量。影眸科技(上海)有限公司專注于 3D 生成領(lǐng)域的探索,積極推動(dòng)領(lǐng)先實(shí)驗(yàn)室科研成果的民用化、商業(yè)化
    的頭像 發(fā)表于 04-27 15:09 ?1294次閱讀

    VirtualLab Fusion應(yīng)用:光學(xué)系統(tǒng)3D可視化

    Results Profile提供有關(guān)傳播光線的信 息,而后者只顯示組件和探測(cè)器。 在接下來(lái)的使用案例中,我們將重點(diǎn)介紹 System:3D視圖。 系統(tǒng):Ray Results Profile的3D視圖
    發(fā)表于 04-02 08:42

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的
    的頭像 發(fā)表于 03-17 13:44 ?1238次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>