91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人體圖像合成制作可信和逼真的人類圖像

工程師鄧生 ? 來(lái)源:搜狐網(wǎng) ? 作者:陳根 ? 2020-12-14 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

技術(shù)和算法的開(kāi)發(fā)和精進(jìn)讓AI換臉、AI克隆都成了可實(shí)現(xiàn)的事情。近日,上??萍即髮W(xué)團(tuán)隊(duì)的一項(xiàng)新研究,再一擴(kuò)展了這一領(lǐng)域,其開(kāi)發(fā)建立了人體圖像合成——人體圖像合成的目的是制作可信和逼真的人類圖像,包括運(yùn)動(dòng)模擬、外觀傳遞和新視圖合成等。

這意味著,模型一旦經(jīng)過(guò)訓(xùn)練,就可以用來(lái)處理所有這些任務(wù)。只要一張照片、一段視頻,就能讓特朗普跟著明星偶像“唱、跳、Rap”。

研究團(tuán)隊(duì)先是采集了30個(gè)研究對(duì)象的數(shù)據(jù),他們的體型、身高各不相同。每個(gè)研究對(duì)象穿著不同的衣服,完成一套指定動(dòng)作和一套隨機(jī)動(dòng)作?;诖耍⒘艘粋€(gè)具有多種樣式、不同人物穿不同衣服的數(shù)據(jù)集,稱為Impersonator(iPER)數(shù)據(jù)集。

隨后,研究人員使用三維人體網(wǎng)格恢復(fù)模塊,以分離姿勢(shì)和形狀。值得一提的是,現(xiàn)有任務(wù)特定方法主要利用二維關(guān)鍵點(diǎn)、對(duì)人體結(jié)構(gòu)進(jìn)行估計(jì)。但是,它們只表示位置信息沒(méi)有能力描述人的個(gè)性化形狀和肢體旋轉(zhuǎn)模型。

而三維人體網(wǎng)格不僅可以對(duì)關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模,還可以對(duì)關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模描述個(gè)性化的體型。

為了保存源信息,如紋理、樣式、顏色和人臉標(biāo)識(shí),研究人員還提出了一種注意型液化GAN。比如,通過(guò)降噪卷積自動(dòng)編碼器提取特朗普的身體特征,然后經(jīng)過(guò)GAN不斷地訓(xùn)練學(xué)習(xí)、微調(diào)、監(jiān)督、轉(zhuǎn)化,將低分辨率的模型轉(zhuǎn)變成高分辨率的模型,使輸出來(lái)的視頻圖像清晰。

人體圖像合成一經(jīng)開(kāi)發(fā),將在角色動(dòng)畫、角色再現(xiàn)、虛擬服裝試穿、電影或游戲制作等方面展示其巨大的潛在應(yīng)用前景。當(dāng)然,技術(shù)的使用永遠(yuǎn)需要合理的規(guī)制,“以假亂真”一旦泛濫,將對(duì)市場(chǎng)造成難以恢復(fù)的危害。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人體
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    11584
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42328
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301400
  • 合成
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    13930
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡:連接設(shè)備與數(shù)據(jù)的圖像樞紐

    在機(jī)器視覺(jué)與圖像傳輸體系中,圖像采集卡是無(wú)可替代的重要樞紐——它一端承接相機(jī)、內(nèi)窺鏡、攝像機(jī)等前端圖像設(shè)備的信號(hào)輸出,另一端對(duì)接后端數(shù)據(jù)處理、存儲(chǔ)、展示系統(tǒng),通過(guò)信號(hào)轉(zhuǎn)換、同步協(xié)調(diào)、高速傳輸三大能力
    的頭像 發(fā)表于 01-22 13:51 ?231次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設(shè)備與數(shù)據(jù)的<b class='flag-5'>圖像</b>樞紐

    數(shù)字圖像采集的核心載體——圖像采集卡技術(shù)白皮書

    在工業(yè)自動(dòng)化、醫(yī)療影像、廣電直播、科研成像等領(lǐng)域,圖像采集卡作為連接前端圖像設(shè)備與后端計(jì)算系統(tǒng)的核心硬件,是實(shí)現(xiàn)物理圖像向數(shù)字信號(hào)轉(zhuǎn)化并高效傳輸?shù)年P(guān)鍵樞紐。它解決了原始圖像信號(hào)與計(jì)算機(jī)
    的頭像 發(fā)表于 01-21 16:18 ?222次閱讀
    數(shù)字<b class='flag-5'>圖像</b>采集的核心載體——<b class='flag-5'>圖像</b>采集卡技術(shù)白皮書

    EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)

    /14/16; 黑白、彩色、Bayer;可見(jiàn)、紅外、紫外;線陣、面陣; 2 圖像存儲(chǔ)錄制 逐幀、跳幀、定時(shí)等多模式存儲(chǔ); BMP、JPEG、RAW、AVI等,視頻或者圖片皆可以。 3 特殊格式支持
    發(fā)表于 12-23 17:26

    圖像采集卡:機(jī)器視覺(jué)時(shí)代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號(hào)到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機(jī)器視覺(jué)系統(tǒng)的核心硬件組件,本質(zhì)是通過(guò)專用芯片(如FPGA、ASIC)實(shí)現(xiàn)圖像信號(hào)
    的頭像 發(fā)表于 11-12 15:15 ?624次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器視覺(jué)時(shí)代的<b class='flag-5'>圖像</b>數(shù)據(jù)核心樞紐

    基于FPGA的CLAHE圖像增強(qiáng)算法設(shè)計(jì)

    CLAHE圖像增強(qiáng)算法又稱為對(duì)比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過(guò)有限的調(diào)整圖像局部對(duì)比度來(lái)增強(qiáng)有效信號(hào)和抑制噪聲信號(hào)。
    的頭像 發(fā)表于 10-15 10:14 ?650次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強(qiáng)算法設(shè)計(jì)

    衛(wèi)星圖像智能合成系統(tǒng)全面解析

    衛(wèi)星圖像智能合成系統(tǒng)全面解析
    的頭像 發(fā)表于 08-27 14:49 ?602次閱讀
    衛(wèi)星<b class='flag-5'>圖像</b>智能<b class='flag-5'>合成</b>系統(tǒng)全面解析

    AI開(kāi)啟更逼真的游戲時(shí)代

    ,電子游戲正在借助人工智能創(chuàng)造出越來(lái)越逼真的場(chǎng)景和交互體驗(yàn)。GPU不再僅僅局限于圖形渲染,如今已廣泛應(yīng)用于多種AI任務(wù),包括生成更真實(shí)的非玩家角色(NPC)、動(dòng)態(tài)世界、個(gè)
    的頭像 發(fā)表于 08-20 11:22 ?1300次閱讀
    AI開(kāi)啟更<b class='flag-5'>逼真的</b>游戲時(shí)代

    圖像采集卡:機(jī)器視覺(jué)與專業(yè)成像的關(guān)鍵橋梁

    在當(dāng)今數(shù)字化時(shí)代,從工業(yè)自動(dòng)化檢測(cè)到醫(yī)療影像診斷,從科學(xué)研究到高清視頻制作,圖像信息的實(shí)時(shí)獲取和處理變得至關(guān)重要。而將現(xiàn)實(shí)世界的光信號(hào)(通過(guò)攝像頭或相機(jī))高效、準(zhǔn)確地轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)字
    的頭像 發(fā)表于 06-19 12:25 ?1006次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器視覺(jué)與專業(yè)成像的關(guān)鍵橋梁

    HarmonyOS應(yīng)用圖像stride處理方案

    當(dāng)圖像存儲(chǔ)在內(nèi)存中時(shí),內(nèi)存緩沖區(qū)可能在每行像素之后包含額外的填充字節(jié)。填充字節(jié)會(huì)影響圖像在內(nèi)存中的存儲(chǔ)方式,但不會(huì)影響圖像的顯示方式。stride是內(nèi)存中一行像素到內(nèi)存中下一行像素的字節(jié)數(shù);如果存在填充字節(jié),則步幅比
    的頭像 發(fā)表于 06-10 14:17 ?1230次閱讀
    HarmonyOS應(yīng)用<b class='flag-5'>圖像</b>stride處理方案

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過(guò)多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺(jué)效果。即使取得了如此飛躍,仍然存在一個(gè)挑戰(zhàn):實(shí)現(xiàn)創(chuàng)意掌控。
    的頭像 發(fā)表于 06-05 09:24 ?897次閱讀

    基于LockAI視覺(jué)識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息

    于邊緣檢測(cè)等任務(wù)。 HSV:用于顏色分割任務(wù),分離色調(diào)、飽和度和亮度。 LAB:更接近人類視覺(jué)感知,適合顏色校正。 1.3 圖像統(tǒng)計(jì)信息 均值和標(biāo)準(zhǔn)差:反映圖像整體亮度及亮度變化情況。 最小值
    發(fā)表于 05-08 10:31

    技術(shù)分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準(zhǔn)、學(xué)得更快”

    自動(dòng)駕駛研發(fā)如何高效獲取海量訓(xùn)練數(shù)據(jù)?高逼真合成數(shù)據(jù)技術(shù)正在提供新解法。通過(guò)仿真平臺(tái)可生成多場(chǎng)景、多傳感器的精準(zhǔn)標(biāo)注數(shù)據(jù)。文章詳解如何構(gòu)建符合nuScenes標(biāo)準(zhǔn)的數(shù)據(jù)集,覆蓋復(fù)雜交通場(chǎng)景,為感知模型訓(xùn)練提供高效、可控的數(shù)據(jù)支持。
    的頭像 發(fā)表于 04-29 10:47 ?3526次閱讀
    技術(shù)分享 | 高<b class='flag-5'>逼真</b><b class='flag-5'>合成</b>數(shù)據(jù)助力智駕“看得更準(zhǔn)、學(xué)得更快”

    基于RV1126開(kāi)發(fā)板實(shí)現(xiàn)自學(xué)習(xí)圖像分類方案

    在RV1126開(kāi)發(fā)板上實(shí)現(xiàn)自學(xué)習(xí):在識(shí)別前對(duì)物體圖片進(jìn)行模型學(xué)習(xí),訓(xùn)練完成后通過(guò)算法分類得出圖像的模型ID。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個(gè)業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,算法代碼負(fù)責(zé)訓(xùn)練和檢測(cè)功能。
    的頭像 發(fā)表于 04-21 13:37 ?11次閱讀
    基于RV1126開(kāi)發(fā)板實(shí)現(xiàn)自學(xué)習(xí)<b class='flag-5'>圖像</b>分類方案

    如何使用離線工具od SPSDK生成完整圖像?

    對(duì)我來(lái)說(shuō),完整圖像是指包含 keyblob、FCB 等的圖像。換句話說(shuō),圖像包含 0x30000000 到 0x30000FFF 之間的大約 4KB。 如果我理解正確,使用 SPT(以及底層
    發(fā)表于 03-28 06:51

    特力康輸電線路圖像監(jiān)控裝置的主要功能

    輸電線路五目圖像監(jiān)拍裝置TLKS-PMG-PV500 一、產(chǎn)品描述: 在電力系統(tǒng)中,輸電線路如同人體的血管,承載著電能傳輸?shù)闹厝巍H欢?,這些線路往往綿延數(shù)百公里,穿越復(fù)雜的地理環(huán)境,面臨著自然災(zāi)害
    的頭像 發(fā)表于 03-12 14:30 ?729次閱讀
    特力康輸電線路<b class='flag-5'>圖像</b>監(jiān)控裝置的主要功能