91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AIGC時(shí)代的ImageNet!百萬(wàn)生成圖片助力AI生成圖片檢測(cè)器研發(fā)

CVer ? 來(lái)源:CVer ? 2023-07-04 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 引言:

在這個(gè)AIGC爆發(fā)的時(shí)代,人人都可以利用AI算法生成高質(zhì)量的文本,圖像,音頻內(nèi)容。其中,由Midjourney, Stable Diffusion等圖像生成方法制作的圖像,其逼真程度讓人贊嘆。人眼已經(jīng)難以對(duì)其真假進(jìn)行區(qū)分了。這不禁喚起了人們的隱憂:大量虛假圖片將會(huì)在互聯(lián)網(wǎng)上廣泛傳播。虛假圖片的泛濫會(huì)引發(fā)多種社會(huì)安全問(wèn)題。例如,虛假新聞會(huì)擾亂社會(huì)秩序,混淆視聽(tīng)。惡意的人臉圖片造假則會(huì)引發(fā)金融欺詐,造成信任危機(jī)。例如,下圖為Midjourney生成的特朗普被捕圖片。這類圖片在社交媒體上廣泛傳播,對(duì)政治領(lǐng)域造成了不良影響。因此,對(duì)這些AI生成的圖像進(jìn)行有效監(jiān)管是非常有必要的。

cc0de970-1828-11ee-962d-dac502259ad0.jpg

圖2 AI生成的特朗普被捕圖片,來(lái)源于https://news.sina.com.cn/c/2023-04-15/doc-imyqmchz0199110.shtml

考慮到人眼已經(jīng)難以對(duì)真假圖片進(jìn)行區(qū)分,我們急需一種AI生成圖像檢測(cè)器以區(qū)分AI制作的圖像和真實(shí)的圖像。然而,現(xiàn)在大規(guī)模數(shù)據(jù)集的缺失妨礙了檢測(cè)器的開(kāi)發(fā)。因此,我們提出了百萬(wàn)量級(jí)的GenImage數(shù)據(jù)集,致力于構(gòu)建AIGC時(shí)代的ImageNet。

2 數(shù)據(jù)集介紹:

cc65a674-1828-11ee-962d-dac502259ad0.jpg

表1 虛假圖片檢測(cè)數(shù)據(jù)集概覽

過(guò)去業(yè)界也有推出一些數(shù)據(jù)集。他們主要有三個(gè)特點(diǎn)。第一個(gè)是數(shù)據(jù)規(guī)模小,第二個(gè)是都是基于GAN的,第三個(gè)是局限于人臉數(shù)據(jù)。隨著時(shí)間推移,數(shù)據(jù)規(guī)模慢慢地在增加,生成器也從GAN時(shí)代過(guò)渡到Diffusion時(shí)代,數(shù)據(jù)的范圍也在增加。但是一個(gè)大規(guī)模的,以Diffusion模型為主的,涵蓋各類通用圖像的數(shù)據(jù)集仍然是缺失的。

基于此,我們提出一個(gè)對(duì)標(biāo)imagenet的genimage數(shù)據(jù)集。真實(shí)的圖片采用了ImageNet。虛假的圖片采用ImageNet的標(biāo)簽進(jìn)行生成。我們利用了八個(gè)先進(jìn)的生成器來(lái)生成,分別是Midjourney, Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。這些生成器生成的圖片總數(shù)基本與真實(shí)圖片一致。每個(gè)生成器生成的圖片數(shù)量也基本一致。每一類生成的圖片數(shù)量基本一致。

這個(gè)數(shù)據(jù)集具有以下優(yōu)勢(shì):

1. 大量的數(shù)據(jù):超過(guò)百萬(wàn)對(duì)圖片對(duì)。

2. 豐富的圖片內(nèi)容:利用ImageNet進(jìn)行構(gòu)建,具有豐富的標(biāo)簽
3. 先進(jìn)的生成器:覆蓋Midjourney, Stable Diffusion等Diffusion生成器。

在真實(shí)世界中檢測(cè)器往往會(huì)遇到各種各樣的困難。我們經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),檢測(cè)器往往在兩種情況下性能下降嚴(yán)重。第一種是面對(duì)訓(xùn)練集中未出現(xiàn)的生成器生成的圖片時(shí)。第二種是面對(duì)退化的圖像。例如,CNNSpot在Stable Diffusion V1.4上訓(xùn)練后,在Midjourney上測(cè)試僅有52.8的準(zhǔn)確率。當(dāng)訓(xùn)練和測(cè)試生成器同為Stable Diffusion V1.4,在面對(duì)模糊的圖像時(shí),CNNSpot準(zhǔn)確率僅僅為77.9?;诖耍覀?cè)谶@個(gè)數(shù)據(jù)集基礎(chǔ)上對(duì)檢測(cè)器提出兩個(gè)挑戰(zhàn):

1. 交叉生成器:檢測(cè)器在一種生成器生成的數(shù)據(jù)上訓(xùn)練,在其他生成器生成的數(shù)據(jù)上驗(yàn)證。這個(gè)任務(wù)目的是考察檢測(cè)器在不同生成器上的泛化能力。

2. 退化圖像識(shí)別:檢測(cè)器需要對(duì)于低分辨率,模糊和壓縮圖像進(jìn)行識(shí)別。這個(gè)任務(wù)主要考察檢測(cè)器在真實(shí)條件(如互聯(lián)網(wǎng)上傳播)中面對(duì)低質(zhì)量圖像時(shí)的泛化問(wèn)題。

我們相信這個(gè)數(shù)據(jù)集的提出將大大有助于人們開(kāi)發(fā)AI生成圖片檢測(cè)器。

3 實(shí)驗(yàn):

我們做了一些實(shí)驗(yàn)來(lái)考察這個(gè)數(shù)據(jù)集,我們發(fā)現(xiàn)在某個(gè)生成器上訓(xùn)練的ResNet-50模型在其他的測(cè)試準(zhǔn)確率會(huì)明顯降低。然而在真實(shí)情況下我們難以得知遇到的圖像的生成器是什么。因此檢測(cè)器對(duì)于不同生成器生成圖片的泛化能力很重要。

cc9d592a-1828-11ee-962d-dac502259ad0.jpg

表2 使用ResNet 50在不同生成器上交叉驗(yàn)證

我們對(duì)比了現(xiàn)有方法在Stable Diffusion V1.4上訓(xùn)練,然后在各種生成器上測(cè)試的結(jié)果,見(jiàn)圖3。我們也評(píng)測(cè)了各種生成器上訓(xùn)練,然后在各種生成器上測(cè)試的結(jié)果。見(jiàn)圖4。圖4中,Testing Subset那一列中的每一個(gè)數(shù)據(jù)點(diǎn),都是在八個(gè)生成器上訓(xùn)練,然后在一個(gè)生成器上測(cè)試得到的平均結(jié)果。然后我們將這些測(cè)試集上的結(jié)果平均,得到最右側(cè)的平均結(jié)果。

cccf86d4-1828-11ee-962d-dac502259ad0.jpg

表3 在Stable Diffusion V1.4上訓(xùn)練,不同測(cè)試集上測(cè)試

cce87dce-1828-11ee-962d-dac502259ad0.jpg

表4 在不同生成器上訓(xùn)練,不同測(cè)試集上測(cè)試

我們對(duì)測(cè)試集進(jìn)行退化處理,采用不同參數(shù)下的低分辨率,JPEG壓縮和高斯模糊,評(píng)測(cè)結(jié)果如下

cd47e6b0-1828-11ee-962d-dac502259ad0.jpg

表5 在不同退化圖像上驗(yàn)證結(jié)果

那么采集這么多數(shù)據(jù)是不是有用呢?我們做了相關(guān)實(shí)驗(yàn),證明通過(guò)提升數(shù)據(jù)類比和每類的圖片數(shù)量,我們是可以提高性能的。

cd8a9c3a-1828-11ee-962d-dac502259ad0.jpg

表6 提升圖片數(shù)量的結(jié)果

針對(duì)GenImage數(shù)據(jù)集對(duì)于不同圖片的泛化能力,我們發(fā)現(xiàn)他對(duì)于人臉和藝術(shù)類圖片也能達(dá)到很好的效果。

cdb835f0-1828-11ee-962d-dac502259ad0.jpg

表7 泛化到藝術(shù)類和人臉類圖片的結(jié)果

cdf037de-1828-11ee-962d-dac502259ad0.jpg

圖3 測(cè)試所用的藝術(shù)類和人臉類圖片展示

4 展望

隨著AI生成圖片能力的不斷提升,對(duì)于AI生成的圖片實(shí)現(xiàn)有效檢測(cè)的需求將會(huì)越來(lái)越迫切。本數(shù)據(jù)集致力于為真實(shí)環(huán)境下的生成圖片檢測(cè)提供有效訓(xùn)練數(shù)據(jù)。我們使用ResNet-50在本數(shù)據(jù)集中訓(xùn)練,然后在真實(shí)推文中進(jìn)行檢測(cè)。如下圖4,ResNet-50能夠有效識(shí)別真圖和假圖。這個(gè)結(jié)果證明了GenIamge可以用于訓(xùn)練模型以判別真實(shí)世界的虛假信息。我們認(rèn)為,該領(lǐng)域未來(lái)值得努力的方向是不斷提升檢測(cè)器在GenImage數(shù)據(jù)集上的準(zhǔn)確率,并進(jìn)而提升其在真實(shí)世界面對(duì)虛假信息的能力。

ce1fd2a0-1828-11ee-962d-dac502259ad0.jpg

圖4.1 真實(shí)推文展示(真圖)

ce5e4cd8-1828-11ee-962d-dac502259ad0.jpg

圖4.2 真實(shí)推文展示(假圖)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    932

    瀏覽量

    49946
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26201
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    391

    瀏覽量

    3228

原文標(biāo)題:AIGC時(shí)代的ImageNet!百萬(wàn)生成圖片助力AI生成圖片檢測(cè)器研發(fā)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Copilot操作指南(一):使用圖片生成原理圖符號(hào)、PCB封裝

    的操作方法。? ” ? 圖片生成原理圖符號(hào)(Symbol) Copilot 支持圖片生成原理圖符號(hào)功能,支持原理圖編輯與符號(hào)編輯
    的頭像 發(fā)表于 07-15 11:14 ?4626次閱讀
    Copilot操作指南(一):使用<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>原理圖符號(hào)、PCB封裝

    LABVIEW怎么生成圖片,然后調(diào)用圖片

    ,然后把這個(gè)圖片保存起來(lái),以便別的地方調(diào)用。六個(gè)輸入項(xiàng)中,第一個(gè)是分類選擇,因?yàn)檫@種分子式結(jié)構(gòu)一共有6類。1.第一個(gè)的分類選擇,是為了選結(jié)構(gòu)形式,如下一共有六種:2.選擇完參數(shù)后 生成圖片如下:3.把
    發(fā)表于 12-08 11:21

    改進(jìn)的基于混沌理論的檢測(cè)器生成算法

    為提高抗體的生成速度,依據(jù)人工免疫系統(tǒng)的混沌特性,提出一種基于混沌方法的新的檢測(cè)器生成算法,利用混沌的遍歷性,并結(jié)合信息論中熵的概念來(lái)產(chǎn)生均勻的初始檢測(cè)器集合,利
    發(fā)表于 12-25 12:45 ?17次下載

    基于VC++的生成公章圖片的簡(jiǎn)易工具

    學(xué)習(xí)VC也沒(méi)多久,將我做的這個(gè)小工具和大家分享一下。其主要功能就是可以自定義生成公章圖形并保存為bmp圖片,希望對(duì)大家有點(diǎn)用。具體實(shí)現(xiàn)的方法如下: 步驟一:生成
    發(fā)表于 10-29 11:56 ?19次下載

    DTFM信號(hào)生成檢測(cè)?(2)

    本文介紹DTFM信號(hào)生成檢測(cè)之二,DTMF檢測(cè)器實(shí)現(xiàn)。
    發(fā)表于 03-11 13:15 ?1610次閱讀
    DTFM信號(hào)<b class='flag-5'>生成</b>與<b class='flag-5'>檢測(cè)</b>?(2)

    16、24、32全套字庫(kù)圖片生成應(yīng)用程序軟件免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是16、24、32全套字庫(kù)圖片生成應(yīng)用程序軟件免費(fèi)下載。
    發(fā)表于 09-19 16:04 ?19次下載
    16、24、32全套字庫(kù)<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>應(yīng)用程序軟件免費(fèi)下載

    電子印章圖片生成器的應(yīng)用程序免費(fèi)下載

    本文檔的主要內(nèi)容詳細(xì)介紹的是電子印章圖片生成器的應(yīng)用程序免費(fèi)下載。
    發(fā)表于 07-03 08:00 ?352次下載
    電子印章<b class='flag-5'>圖片</b><b class='flag-5'>生成</b>器的應(yīng)用程序免費(fèi)下載

    如何使用TensorFlow Hub的ESRGAN模型來(lái)在安卓app中生成超分圖片

    從一張低分辨率的圖片生成一張對(duì)應(yīng)的高分辨率圖片的任務(wù)通常被稱為單圖超分(Single Image Super Resolution - SISR)。盡管可以使用傳統(tǒng)的插值方法(如雙線性
    的頭像 發(fā)表于 11-26 09:40 ?4175次閱讀

    條件生成對(duì)抗模型生成數(shù)字圖片的教程

    這次我們?cè)谏洗蔚睦又性谔嵘幌拢@次我們選用條件生成對(duì)抗模型(Conditional Generative Adversarial Networks)來(lái)生成數(shù)字圖片
    的頭像 發(fā)表于 12-10 18:36 ?1356次閱讀

    GTC 2023主題直播:使用Picasso服務(wù)構(gòu)建圖片和視頻生成式模型

    我們很高興Getty Images將使用Picasso服務(wù)構(gòu)建Edify圖片和Edify視頻生成式模型。
    的頭像 發(fā)表于 03-22 11:31 ?1259次閱讀
    GTC 2023主題直播:使用Picasso服務(wù)構(gòu)建<b class='flag-5'>圖片</b>和視頻<b class='flag-5'>生成</b>式模型

    智慧有數(shù) 浪潮信息發(fā)布生成AI存儲(chǔ)解決方案

    與管理瓶頸,浪潮信息在"數(shù)智未來(lái)"AIGC數(shù)據(jù)應(yīng)用創(chuàng)新論壇上,正式發(fā)布面向生成AI的存儲(chǔ)解決方案,該方案以極致融合、極致性能、極致節(jié)能,和熱溫冷冰四級(jí)數(shù)據(jù)全生命周期管理,助力開(kāi)啟
    的頭像 發(fā)表于 07-11 09:46 ?907次閱讀

    IBM 謝東:IBM watsonx 助力生成AI 的企業(yè)應(yīng)用

    ,企業(yè)在探索利用生成AI 促進(jìn)自身業(yè)務(wù)發(fā)展時(shí)所面臨的挑戰(zhàn)以及應(yīng)對(duì)措施。 以下是他的發(fā)言摘要: IBM 全球副總裁、IBM 大中華區(qū)首席技術(shù)官 謝東 (圖片來(lái)源:2023 中國(guó) AIGC
    的頭像 發(fā)表于 09-06 18:20 ?1270次閱讀
    IBM 謝東:IBM watsonx <b class='flag-5'>助力</b><b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的企業(yè)應(yīng)用

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別

    AIGC(Artificial Intelligence Generated Content,人工智能生成內(nèi)容)與傳統(tǒng)內(nèi)容生成在多個(gè)方面存在顯著區(qū)別。以下是對(duì)這兩者的對(duì)比: 一、數(shù)據(jù)類型與處理
    的頭像 發(fā)表于 10-25 15:13 ?2777次閱讀

    AIGC生成內(nèi)容的優(yōu)勢(shì)與挑戰(zhàn)

    人工智能生成內(nèi)容(AIGC,Artificial Intelligence Generated Content)是指利用人工智能技術(shù)自動(dòng)生成文本、圖像、音頻和視頻等內(nèi)容的過(guò)程。隨著深度學(xué)習(xí)、自然語(yǔ)言
    的頭像 發(fā)表于 10-25 15:36 ?2929次閱讀

    AIGC與傳統(tǒng)內(nèi)容生成的區(qū)別 AIGC的優(yōu)勢(shì)和挑戰(zhàn)

    AIGC(Artificial Intelligence Generated Content,生成內(nèi)容)與傳統(tǒng)內(nèi)容生成在多個(gè)方面存在顯著區(qū)別,同時(shí)AIGC也展現(xiàn)出其獨(dú)特的優(yōu)勢(shì)和面臨的挑
    的頭像 發(fā)表于 11-22 16:04 ?3360次閱讀