91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI繪圖實(shí)踐-用人工智能生圖助力618大促

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-07-10 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)在各種AI大模型大行其道,前有GhatGPT顛覆了我們對(duì)對(duì)話型AI的原有印象,后有Sora文生視頻,讓我們看到了利用AI進(jìn)行創(chuàng)意創(chuàng)作的無限可能性。如今各大公司和團(tuán)隊(duì)都爭(zhēng)相提出自己的大模型,各種網(wǎng)頁(yè)端和軟件應(yīng)用也極大地降低了我們使用AI作為生產(chǎn)力的門檻。

我這次就為大家?guī)硎褂肁I進(jìn)行繪圖的入門實(shí)踐,為大促文章配圖,繪制大促?gòu)V告宣傳海報(bào),提升促銷圖的畫質(zhì)和精度,探索一下從這方面助力大促的新思路。

平臺(tái)

現(xiàn)在的AI繪圖主要用到的模型是SD(Stable Diffusion),它是一種穩(wěn)定擴(kuò)散模型,用于生成高質(zhì)量的圖像。這種模型是在傳統(tǒng)的擴(kuò)散模型DDPMs(Denoising Diffusion Probabilistic models)的基礎(chǔ)上發(fā)展出來的。

wKgZomaNMn2ADWP4AAc73r03Vng910.png

經(jīng)過多個(gè)版本的迭代和改進(jìn),這類模型已經(jīng)能很好的執(zhí)行“文生圖”、“圖生圖”、“后期處理”等AI功能,甚至可以在一定程度上代替PhotoShop等圖像處理軟件的工作。

現(xiàn)在許多開發(fā)者都發(fā)布了基于SD模型的改進(jìn)型模型,基本上所有的網(wǎng)頁(yè)端和軟件也都是基于此模型搭建的,要使用它進(jìn)行AI繪畫,主要有三種方法:

1.自己搭建基于SD的webui,在gitHub上有項(xiàng)目的源代碼: https://github.com/AUTOMATIC1111/stable-diffusion-webui 。這種方式的優(yōu)點(diǎn)是自由度高,可以根據(jù)自己的需求進(jìn)行客制化改造,更新也最及時(shí),但是要自己進(jìn)行環(huán)境搭建,對(duì)于一般用戶來說學(xué)習(xí)門檻較高,國(guó)內(nèi)使用的話需要魔法,同時(shí)經(jīng)過我的體驗(yàn)穩(wěn)定性不高,經(jīng)常會(huì)失敗。

2.使用網(wǎng)頁(yè)端應(yīng)用,這類網(wǎng)站是基于stable-diffusion-webui 搭建的第三方平臺(tái),由他們負(fù)責(zé)維護(hù)和更新,并提供穩(wěn)定的連接,用戶只需要選擇需要的模型和參數(shù),輸入提示詞,就可以在線生成圖片。

國(guó)內(nèi)有:

Liblib Ai: https://www.liblib.art/

MJ: https://mj.wxcbh.cn/home/?from=AI05&strategy=drawing5&bd_vid=17724435435623318479#/mj

都不需要魔法 。

國(guó)外的像:Playground AI: https://playground.com/ ,每天有免費(fèi)的體驗(yàn)次數(shù),速度和質(zhì)量也不錯(cuò)。

這類網(wǎng)站一般都有自己的模型市場(chǎng),以供創(chuàng)作者們上傳和下載自定義的模型,并且分享自己的繪圖作品以及相關(guān)生圖的參數(shù),非常方便。但是一般都會(huì)收費(fèi),都會(huì)收費(fèi),都會(huì)收費(fèi),重要的事情說三遍。

3.PC端軟件,這類軟件一般也是基于SD模型進(jìn)行封裝,可以下載模型,設(shè)置參數(shù)并在本地生成圖片,使用體驗(yàn)類似于PS等圖片處理軟件,但是由于整個(gè)生成過程在本地執(zhí)行,比較依賴于本機(jī)算力,電腦性能不好的話生成會(huì)很慢,但是好處就是自定義程度相對(duì)較高,而且一般免費(fèi)。

生圖軟件

我這次主要介紹軟件的途徑,使用的軟件就是這款Draw Things,Mac端App Store免費(fèi)下載,不需要魔法

他的界面是這樣的:

wKgZomaNMn-AbUf4AAdbu8WBjmU532.png

參數(shù)設(shè)置區(qū)用于選擇模型,采集器,步數(shù)和隨機(jī)種子等參數(shù),首次生成圖片首先選擇“文本到圖像”模式。在這里我大致介紹一下涉及到的名詞:

模型

模型是AI繪畫的基礎(chǔ),一般的模型都是基于SD改進(jìn)的,SD模型也有V1.0、V1.5、V2.0、V2.1等不同的迭代版本,不同的模型可以生成不同風(fēng)格的圖片,可以根據(jù)自己的需要進(jìn)行選擇,模型可以在DrawThings里進(jìn)行下載和選擇,當(dāng)然也可以在Liblib Ai等網(wǎng)站上下載然后導(dǎo)入。

wKgZomaNMoCAQynPAAG8l8RyF8k609.png

模型分為幾個(gè)主要的種類:

chekpoint(檢查點(diǎn))

它是完整模型的常見格式,模型體積較大,一般真人版的單個(gè)模型的大小在7GB左右,動(dòng)漫版的在2-5個(gè)G之間。決定了圖片的整體風(fēng)格。chekpoint的后綴名是safetensors

有寫實(shí),科幻,漫畫,廣告等等風(fēng)格

Lora

是一種體積較小的繪畫模型,是對(duì)大模型的微調(diào)。可以添加Lora為圖片創(chuàng)造更豐富的表現(xiàn)形式。與每次作畫只能選擇一個(gè)大模型不同,lora模型可以在已選擇大模型的基礎(chǔ)上添加一個(gè)甚至多個(gè)。一般體積在幾十到幾百兆左右。

Lora的后綴名也是safetensors,所以在安裝的時(shí)候要注意,Lora要在規(guī)定的地方導(dǎo)入:

wKgaomaNMoSAJzwNAAEjQzDLYck189.png

Hypernetwork(超網(wǎng)絡(luò))

類似 LoRA ,但模型效果不如 LoRA,不能單獨(dú)使用,需要搭配大模型使用

?

采樣器

采樣器也會(huì)在一定程度上影響圖畫風(fēng)格,不同于模型,它一般是基于算法。選擇對(duì)的采樣器對(duì)于生成圖片的質(zhì)量至關(guān)重要,下面介紹一些主流的采樣器類型:

DDIM和PLMS是早期SD專為擴(kuò)散模型而設(shè)計(jì)的采樣器。DPM和DPM++系列是專為擴(kuò)散模型而設(shè)計(jì)的新型采樣器。DPM++是DPM的改進(jìn)版。

Euler a 比較適用于圖標(biāo)設(shè)計(jì)、二次元圖像、小型場(chǎng)景等簡(jiǎn)單的圖像數(shù)據(jù)生成場(chǎng)景。

DPM和DPM++系列非常適用于三維景象和復(fù)雜場(chǎng)景的描繪,例如寫實(shí)人像。

Karras系列是專為擴(kuò)散模型而設(shè)計(jì)的改進(jìn)版采樣器,有效提升了圖片質(zhì)量。

Euler a,DPM2 a, DPM++2S a和DPM++2S a Karras適合給圖片增加創(chuàng)造性,隨著迭代步數(shù)的提升,圖片也會(huì)隨之變化。不同的采樣方法可能對(duì)不同的模型產(chǎn)生不同的影響,會(huì)影響生成圖片的藝術(shù)風(fēng)格,建議結(jié)合模型和迭代步數(shù)多做嘗試。

步數(shù)

生圖時(shí),去噪重復(fù)的步數(shù)被稱為采樣迭代步數(shù)。

測(cè)試新的模型或Prompts效果時(shí),迭代步數(shù)推薦使用10~15,可以快速獲得結(jié)果,方便進(jìn)行調(diào)整。當(dāng)?shù)綌?shù)太低時(shí),生成的圖像幾乎無法呈現(xiàn)內(nèi)容。20 ~ 30之間的迭代步數(shù)通常會(huì)有不錯(cuò)的效果。40步以上的迭代步數(shù)會(huì)需要更長(zhǎng)的生圖時(shí)間,但收益可能有限,除非在繪制動(dòng)物毛發(fā)或皮膚紋理等。

過低或過高的初始分辨率都可能會(huì)讓SD生圖時(shí)無法正常發(fā)揮,建議參考基礎(chǔ)模型的分辨率,配置合適的初始寬高

隨機(jī)種子

隨機(jī)種子會(huì)影響生圖時(shí)的初始噪聲圖像。

當(dāng)Seed=-1時(shí),表示每次出圖都會(huì)隨機(jī)一個(gè)種子,使得每次生成的圖都會(huì)不同。其他創(chuàng)作者上傳圖片的時(shí)候,一般會(huì)附帶此圖片對(duì)應(yīng)的隨機(jī)種子,可以參考它來生成類似的圖片。點(diǎn)擊可以生成一個(gè)隨機(jī)的種子,長(zhǎng)按則可以輸入特定的隨機(jī)種子。

提示詞

提示詞是生成圖片時(shí)關(guān)鍵中的關(guān)鍵,它直接決定了圖片內(nèi)容,畫面風(fēng)格,場(chǎng)景,表情動(dòng)作等一些列內(nèi)容,在生成圖片時(shí),選擇合適的提示詞至關(guān)重要。

wKgZomaNMoSATIFNAAHvdXyuBPk101.png

提示詞分為“正向提示詞”和“反向提示詞”,“正向提示詞”代表你想要在圖片中呈現(xiàn)的內(nèi)容,反之“反向提示詞”則是不想要在圖片里具備的要素。

比如,我想要畫一張“618西瓜大促”相關(guān)的宣傳圖,我就可以這樣描述:

“許多人在湖里流動(dòng)的水邊吃西瓜,高質(zhì)量的微型攝影”,翻譯成英文:“Many people eat watermelons by the flowing water in the lake, with high-quality miniature photography”

將這段文字輸入DrawThings的文本框,它會(huì)自動(dòng)把整句話拆分成一個(gè)個(gè)提示詞。

wKgaomaNMoWAKTf2AADXMVPkvIA764.png

當(dāng)然,我們也可以直接填入想要繪制的提示詞:

wKgZomaNMoaAerhTAAEYS8gmm-Y542.png

如上圖所示,如果我們想著重強(qiáng)調(diào)某一個(gè)提示詞,讓AI繪制的時(shí)候更偏重一這一特征,就可以用括號(hào)把它包起來,然后在后面注明權(quán)重,這里我就把西瓜(watermelon)加重到了1.5權(quán)重,以便更加突出這一點(diǎn)。

“反向提示詞”一般有:低質(zhì)量,不適合上班時(shí)間瀏覽(NSFW),描繪人物的時(shí)候,糟糕的眼睛,多余的手指,扭曲,變形等等

wKgaomaNMoeAeK9-AAF769G_4g8097.png

其他

還有一些其他的參數(shù),比如圖片分辨率和比例,文本指導(dǎo)強(qiáng)度(越高越忠實(shí)呈現(xiàn)文本內(nèi)容),以及一次生成的圖片數(shù)量等等

wKgZomaNMoiAIODUAADZMAaUcI4703.png

設(shè)置好一切,就可以開始生成圖片了,可以多嘗試幾張,從中挑選最合適的進(jìn)行二次處理。

wKgaomaNMouAC4IkAA3qGjmg_io804.png

?

二次處理

如果對(duì)生成的圖片有些細(xì)節(jié)不滿意,可以利用“圖像到圖像”模式,然后選擇強(qiáng)度。高分辨率修復(fù)的重繪強(qiáng)度為0時(shí)不會(huì)改變?cè)瓐D,30% 以下會(huì)基于原圖稍微修正,超過 70% 會(huì)對(duì)原圖做出較大改變,1 會(huì)得到一個(gè)完全不同的圖像。

二次處理主要包括以下幾個(gè)目的:

重繪圖像元素

如果對(duì)圖像中某部分的元素不滿意,可以用“橡皮擦”擦除該部分,然后重新生成,讓模型自動(dòng)將擦數(shù)的部分重繪,甚至可以消除某部分圖像元素,實(shí)測(cè)效果甚至好于PS。

擴(kuò)圖

對(duì)于一張圖片,如果想要擴(kuò)展邊界部分,讓模型繪制出額外的內(nèi)容,可以首先重新設(shè)置圖片的寬高。我這里原是圖片是1088*2048,想要擴(kuò)展左側(cè)湖里的景象,就可以先將圖片寬度增加到1536,然后移動(dòng)圖片到右側(cè)貼緊圖層邊緣。然后最關(guān)鍵的一步,用“橡皮擦”工具,沿著想要擴(kuò)展的那一邊,細(xì)細(xì)的擦一道,這么做的目的是告訴模型,從這一部分開始重繪,風(fēng)格要按照擦除的這部分來進(jìn)行,然后重新生成?

提升畫質(zhì)

最開始生成圖片時(shí),為了提高速度和效率,可以適當(dāng)降低分辨率,的到合適的圖片以后,可以重設(shè)分辨率和清晰度,重繪圖片,達(dá)到提升畫質(zhì)的目的。當(dāng)然,對(duì)于已經(jīng)已經(jīng)畫好的第三方圖片,也可以加載進(jìn)來進(jìn)行處理。

好了,本篇利用AI繪圖進(jìn)行實(shí)踐的文章就介紹到這里,希望能夠幫助到大家。在以后大促文章配圖,和大促海報(bào)繪制方面為大家提供便利,助力618大促再創(chuàng)新高!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40005

    瀏覽量

    301654
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50129

    瀏覽量

    265700
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?175次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    聲智科技助力第一屆產(chǎn)學(xué)結(jié)合高校通用人工智能大賽決賽圓滿落幕

    當(dāng)通用人工智能(AGI)浪潮席卷全球,如何縮短前沿算法與產(chǎn)業(yè)應(yīng)用之間的距離?本周一,第一屆產(chǎn)學(xué)結(jié)合高校通用人工智能大賽(AGIUC)決賽圓滿落幕。作為賽事官方支持單位,聲智科技深度參與賽題設(shè)計(jì)、算力
    的頭像 發(fā)表于 02-01 10:27 ?848次閱讀

    主線科技入選“人工智能+”創(chuàng)新應(yīng)用實(shí)踐案例

    日前,由新華網(wǎng)主辦的“人工智能+”創(chuàng)新應(yīng)用案例征集評(píng)選結(jié)果揭曉,主線科技“基于 AI 技術(shù)力的自動(dòng)駕駛卡車在智慧物流的創(chuàng)新應(yīng)用”案例憑借技術(shù)創(chuàng)新性與行業(yè)示范價(jià)值,成功入選創(chuàng)新應(yīng)用實(shí)踐案例并被
    的頭像 發(fā)表于 01-12 09:23 ?406次閱讀

    云知聲榮獲2025人工智能治理示范案例

    服務(wù)業(yè)協(xié)會(huì)聯(lián)合組織征集的《北京人工智能治理案例集》在會(huì)議期間正式發(fā)布。云知聲"基于醫(yī)療大模型和醫(yī)學(xué)知識(shí)圖譜技術(shù)打造可信可靠的醫(yī)學(xué)AI應(yīng)用"憑借其創(chuàng)新的技術(shù)架構(gòu)和卓越的治理實(shí)踐,榮獲"人工智能
    的頭像 發(fā)表于 11-10 17:28 ?996次閱讀

    四維新亮相2025國(guó)際前瞻人工智能安全與治理大會(huì)

    日前,2025國(guó)際前瞻人工智能安全與治理大會(huì)在北京舉行。作為數(shù)據(jù)治理領(lǐng)域的典型代表,四維新打造的“‘車云’數(shù)據(jù)協(xié)同治理,賦能車企高質(zhì)量發(fā)展”案例(以下簡(jiǎn)稱案例),入選《人工智能治理案例集》,并納入《北京市通
    的頭像 發(fā)表于 11-08 17:20 ?1449次閱讀

    【艾為視角】保證大方向正確!利用人工智能解決一線實(shí)際問題

    保證大方向正確,加快迭代,小步快跑。聚焦內(nèi)部效率提升,利用人工智能改變作業(yè)模式、簡(jiǎn)化管理,結(jié)合業(yè)務(wù)場(chǎng)景解決一線實(shí)際問題。——任總在GTS人工智能實(shí)踐進(jìn)展匯報(bào)會(huì)上的講話1聚焦內(nèi)部效率提升,利用人
    的頭像 發(fā)表于 09-26 19:03 ?709次閱讀
    【艾為視角】保證大方向正確!利<b class='flag-5'>用人工智能</b>解決一線實(shí)際問題

    【今晚7點(diǎn)半】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)!今晚正點(diǎn)原子B站直播間等你

    【聯(lián)合直播】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)! 一、直播介紹 隨著人工智能技術(shù)在邊緣計(jì)算領(lǐng)域的快速發(fā)展,STM32系列芯片憑借其卓越的性能與豐富的生態(tài),成為眾多智能
    發(fā)表于 09-25 14:14

    云天勵(lì)飛亮相2025深圳通用人工智能大會(huì)

    近日,以“模驅(qū)具身?智啟未來”為主題的2025 AGIC深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)(以下簡(jiǎn)稱大會(huì))在深圳國(guó)際會(huì)展中心(寶安)開幕。
    的頭像 發(fā)表于 09-01 14:09 ?955次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    中汽中心出席車用人工智能標(biāo)準(zhǔn)化促進(jìn)中心成立會(huì)議

    近日,我國(guó)汽車領(lǐng)域首個(gè)以車用人工智能標(biāo)準(zhǔn)化為研究目標(biāo)的技術(shù)組織——車用人工智能標(biāo)準(zhǔn)化促進(jìn)中心成立會(huì)議在天津召開,中汽中心副總經(jīng)理龔進(jìn)峰出席會(huì)議并致辭。來自整車企業(yè)、零部件企業(yè)、高校、科研機(jī)構(gòu)等70多家單位的180余位代表參會(huì)。
    的頭像 發(fā)表于 07-21 16:48 ?900次閱讀

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    亞馬遜一年助力兩百萬人提升人工智能技能的關(guān)鍵洞察

    諸多企業(yè)應(yīng)用人工智能技術(shù)的一大障礙。根據(jù)亞馬遜云科技與全球領(lǐng)先的科技咨詢公司Access Partnership的研究顯示,73%的雇主認(rèn)為擁有人工智能人才是當(dāng)務(wù)之急,而其中75%的雇主坦言難以找到合適人選。 ? 人工智能領(lǐng)域的
    發(fā)表于 04-21 15:17 ?808次閱讀
    亞馬遜一年<b class='flag-5'>助力</b>兩百萬人提升<b class='flag-5'>人工智能</b>技能的關(guān)鍵洞察