技術(shù)和算法的開(kāi)發(fā)和精進(jìn)讓AI換臉、AI克隆都成了可實(shí)現(xiàn)的事情。近日,上??萍即髮W(xué)團(tuán)隊(duì)的一項(xiàng)新研究,再一擴(kuò)展了這一領(lǐng)域,其開(kāi)發(fā)建立了人體圖像合成——人體圖像合成的目的是制作可信和逼真的人類圖像,包括運(yùn)動(dòng)模擬、外觀傳遞和新視圖合成等。
這意味著,模型一旦經(jīng)過(guò)訓(xùn)練,就可以用來(lái)處理所有這些任務(wù)。只要一張照片、一段視頻,就能讓特朗普跟著明星偶像“唱、跳、Rap”。
研究團(tuán)隊(duì)先是采集了30個(gè)研究對(duì)象的數(shù)據(jù),他們的體型、身高各不相同。每個(gè)研究對(duì)象穿著不同的衣服,完成一套指定動(dòng)作和一套隨機(jī)動(dòng)作?;诖耍⒘艘粋€(gè)具有多種樣式、不同人物穿不同衣服的數(shù)據(jù)集,稱為Impersonator(iPER)數(shù)據(jù)集。
隨后,研究人員使用三維人體網(wǎng)格恢復(fù)模塊,以分離姿勢(shì)和形狀。值得一提的是,現(xiàn)有任務(wù)特定方法主要利用二維關(guān)鍵點(diǎn)、對(duì)人體結(jié)構(gòu)進(jìn)行估計(jì)。但是,它們只表示位置信息沒(méi)有能力描述人的個(gè)性化形狀和肢體旋轉(zhuǎn)模型。
而三維人體網(wǎng)格不僅可以對(duì)關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模,還可以對(duì)關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模描述個(gè)性化的體型。
為了保存源信息,如紋理、樣式、顏色和人臉標(biāo)識(shí),研究人員還提出了一種注意型液化GAN。比如,通過(guò)降噪卷積自動(dòng)編碼器提取特朗普的身體特征,然后經(jīng)過(guò)GAN不斷地訓(xùn)練學(xué)習(xí)、微調(diào)、監(jiān)督、轉(zhuǎn)化,將低分辨率的模型轉(zhuǎn)變成高分辨率的模型,使輸出來(lái)的視頻圖像清晰。
人體圖像合成一經(jīng)開(kāi)發(fā),將在角色動(dòng)畫、角色再現(xiàn)、虛擬服裝試穿、電影或游戲制作等方面展示其巨大的潛在應(yīng)用前景。當(dāng)然,技術(shù)的使用永遠(yuǎn)需要合理的規(guī)制,“以假亂真”一旦泛濫,將對(duì)市場(chǎng)造成難以恢復(fù)的危害。
責(zé)任編輯:PSY
-
人體
+關(guān)注
關(guān)注
0文章
11瀏覽量
11584 -
圖像
+關(guān)注
關(guān)注
2文章
1096瀏覽量
42328 -
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301400 -
合成
+關(guān)注
關(guān)注
0文章
16瀏覽量
13930
發(fā)布評(píng)論請(qǐng)先 登錄
圖像采集卡:連接設(shè)備與數(shù)據(jù)的圖像樞紐
數(shù)字圖像采集的核心載體——圖像采集卡技術(shù)白皮書
EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)
圖像采集卡:機(jī)器視覺(jué)時(shí)代的圖像數(shù)據(jù)核心樞紐
基于FPGA的CLAHE圖像增強(qiáng)算法設(shè)計(jì)
AI開(kāi)啟更逼真的游戲時(shí)代
圖像采集卡:機(jī)器視覺(jué)與專業(yè)成像的關(guān)鍵橋梁
HarmonyOS應(yīng)用圖像stride處理方案
利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成
基于LockAI視覺(jué)識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息
技術(shù)分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準(zhǔn)、學(xué)得更快”
基于RV1126開(kāi)發(fā)板實(shí)現(xiàn)自學(xué)習(xí)圖像分類方案
如何使用離線工具od SPSDK生成完整圖像?
特力康輸電線路圖像監(jiān)控裝置的主要功能
人體圖像合成制作可信和逼真的人類圖像
評(píng)論