91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不知道菜譜怎么看,讓AI來幫你做示范吧

nlfO_thejiangme ? 來源:lq ? 2019-08-02 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

食物是我們每天必不可少的能量補給,也是很多吃貨小伙伴的快樂源泉。計算機視覺的發(fā)展,對于食物的分析和推薦為我們的餐桌提供了新的可能。拍一張照片就可以從這一餐的食物中分析出食材的營養(yǎng)成分和卡路里的多少,幫助我們監(jiān)控每日能量和營養(yǎng)的攝入,并對膳食進行管理。

除了分析和記錄,計算機輔助食物分析還能對食材的屬性進行分析并對烹飪后的食物色、香、味進行預(yù)測,不同烹飪方法下食材在最終菜品下呈現(xiàn)的樣式。但食物的烹調(diào)方式多種多樣、在不同菜品中呈現(xiàn)的樣子也各不相同,更別說各種無法直接看到的調(diào)味料了。如此復(fù)雜的視覺任務(wù)需要大量的數(shù)據(jù)來對算法進行訓(xùn)練,但數(shù)據(jù)的缺乏阻礙了這一領(lǐng)域的發(fā)展。

為了更好地推動這一領(lǐng)域的進步以解決計算機食物分析的挑戰(zhàn),來自羅格斯大學(xué)和三星AI中心的研究人員們提出了一種新的食物合成方法,從食材原料的名字直接合成菜品的圖像,為食物分析和預(yù)測提出了新的可能。對于食物圖像的生成,研究人員們進行了諸多有益的探索。雖然基于CycleGAN的方法實現(xiàn)了對食物的風(fēng)格遷移,但是目前還沒有能夠從不同的食材配料中直接生成食物圖像的方法。

食物圖像合成不僅引入了包括食材屬性、加工方法、烹調(diào)方式的復(fù)雜性,同時多樣性的菜品還極度依賴烹調(diào)的過程,生成模型必須能捕捉信息中隱含的關(guān)鍵點才能重建出有效的菜品。

在這篇文章中,研究人員結(jié)合基于注意力的菜譜相關(guān)模型和StackGAN來從食材中生成對應(yīng)的菜品圖像,隨后利用了循環(huán)連續(xù)約束來進一步提高了生成圖像的質(zhì)量、并有效改進了改變原料后生成的菜品效果。

尋找食材與食物圖像共同的隱空間

為了尋找到更為合適的編碼來表示食材與食物圖像間的關(guān)系,研究人員使用了基于注意力的聯(lián)合模型來訓(xùn)練得到隱空間的編碼方法。這一模型一共包含了三部分,分別是食材編碼器、聯(lián)合食物隱空間和美食圖像編碼器。

整個網(wǎng)絡(luò)的目的是將食材信息從文字中抽取出來并送入對應(yīng)的編碼隱空間中去,而對應(yīng)的食物圖像也進行編碼映射到隱空間中,并最大化食材信息編碼和對應(yīng)圖像編碼的余弦相似性。

基于注意力交叉聯(lián)合模型與隱空間,包含了從食材/圖像分別到FoodSpace聯(lián)合隱空間的編碼與映射。

食材原料編碼器的目的在于將菜譜中的食材轉(zhuǎn)化為共享隱含空間中的特征。這一部分的目標是尋找出食材間隱含的關(guān)系,甚至將佐料這樣不明顯的配料信息也挖掘出來。

研究人員通過獨特編碼的食材嵌入到低維向量空間中,并作為序列輸入到雙邊的LSTM中進行訓(xùn)練,每一層的隱空間輸出都作為對應(yīng)食材的特征,并在最后利用注意力機制將這些特征融合起來,基于加權(quán)方法融合所有的隱含狀態(tài),最終映射共享食物隱含空間中的高維食材特征p(1024維)。圖像編碼器的目的是將食物圖像轉(zhuǎn)換為食物空間中的特征,利用Resent50作為主干網(wǎng)絡(luò),并利用UPMC-Food-101對模型進行精調(diào)最后利用平均池化后的激活(2048維),映射到食物空間中去得到隱變量q(1024維)。

通過對兩種模態(tài)數(shù)據(jù)在共享隱空間中的訓(xùn)練后,得到了有效的食材特征表示p,我們就可以基于這一有效的特征利用GAN來合成逼真、有效穩(wěn)定的食物圖像了。

生成菜品

為了將輸入的食材單轉(zhuǎn)換為對應(yīng)菜品的圖像,研究人員基于StackGAN-v2來生成菜品圖像。這一模型包含了三個分支,每一分支都負責(zé)生成某種分辨率下的圖像,也對應(yīng)著自己獨立的判別器(對應(yīng)高、中、低分辨率的生成圖像)。

菜譜中的食材數(shù)據(jù)首先被編碼成共享隱空間中的向量p+,隨后利用條件增強網(wǎng)絡(luò)Fca來估計外觀因子相關(guān)的分布p(c|p+)。將c與噪聲z同時輸入到第一個分支中進行低分辨率圖像生成。通過F0生成隱含特征,并通過T0生成對應(yīng)的圖像。此時前一個分支的隱含特征將作為下一個分支的輸入來生成更高分辨率的圖像。

生成模型包含了三個生成器和判別器,用于生成高中低三種不同分辨率的圖像。

模型中的判別器需要同時完成三個功能,首先需要正確識別出對應(yīng)菜品真實圖像,同時也需要能夠區(qū)分出真實/錯誤對應(yīng)的菜品圖像,還需要識別出模型生成的偽造圖像。這樣就能訓(xùn)練網(wǎng)絡(luò)生成出與訓(xùn)練數(shù)據(jù)中食材對應(yīng)菜品圖像更為接近的結(jié)果。

驚艷的菜品生成結(jié)果

為了檢驗基于注意力的聯(lián)合模型對于特征的抽取能力,研究人員首先進行了基于菜譜食材的對應(yīng)圖像檢索實驗。在實驗中研究人員基于Recipe1M數(shù)據(jù)集進行訓(xùn)練,并抽取了其中1989種常見食材,并使用擁有多張菜品圖和多種食材的菜譜。

在實驗中主要利用了中位檢索排序(median retrieval rank, MedR, 越小越好)和top k召回率(recall at top K, R@K,召回越大越好)來對結(jié)果進行度量。從下表中可以看到研究人員提出的方法將MedR下降了很多,同時提升了R@K。

下圖展示了菜譜中的食材檢索出的top5對應(yīng)圖像。可以看到檢索出的圖像都屬于同一類,證明了模型對于原材料的理解和特征抽取具有泛化性。

隨后研究人員針對沙拉、餅干和松餅等三類西方常見的食物進行訓(xùn)練和合成,并利用感知分數(shù)和Frechet感知距離來作為評測指標。下圖可以看到本文提出的方法合成出的食物特別逼真,同時也真實反映了食材的構(gòu)成。

對于同樣的食材輸出,模型生成的菜品圖像表現(xiàn)也很穩(wěn)定:

與左上角的真實圖像相比,我們可以看到菜品的種類保持穩(wěn)定,同時圖像的質(zhì)量也十分優(yōu)秀。

最后研究人員還分析了隱含特征空間中的線性插值情況,在兩個不同的菜譜間進行差值可以看到一盤菜漸漸變成了另一盤了!

有了這樣的模型,下次買菜回來不知如何下手的時候,要不要先問問AI這些食材將會變成什么樣的美食呢?說不定它合成出的食物圖像將會啟發(fā)你在廚房的想象力呢!enjoy~~~

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42354
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40126

    瀏覽量

    301743
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47658

原文標題:從食材到菜品,AI幫你想象出豐盛晚餐該有的模樣

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    多機通訊的仿真過程中,我不知道仿真成功沒有

    多機通訊的仿真過程中,我不知道仿真成功沒有,諾諾的問一句我需要怎么看呢?
    發(fā)表于 05-10 14:38

    想學(xué)習(xí)ARM9,買塊開發(fā)板,但是不知道選擇哪家的開發(fā)板?

    想學(xué)習(xí)ARM9,買塊開發(fā)板,但是不知道選擇哪家的開發(fā)板,是飛凌的?天嵌的還是天祥的?據(jù)說天祥的資料很多各位大神怎么看
    發(fā)表于 02-22 09:30

    AI學(xué)習(xí)】AI概論:(Part-B)AI頭腦+機器人行為

    特征。? 在本任務(wù)(No.9)里,將向前邁進一大步:人們示范,傳授更多智慧,AI自己學(xué)習(xí)萃取特征、并且進行分類。這通稱為:
    發(fā)表于 10-30 14:17

    不知道電動車電池的型號怎么辦?

    不知道電動車電池的型號怎么辦?  近一年給很多人換過電動車電池了,我發(fā)現(xiàn)大多數(shù)人都不知道自己的電動車電池是什么型號的,
    發(fā)表于 11-11 08:56 ?3849次閱讀

    怎么看筆記本接口齊全

    怎么看筆記本接口齊全 最近看到索泰的筆記本,不知道好不好,請給點意見   索泰筆記本據(jù)說在日本本土是
    發(fā)表于 01-23 11:15 ?1882次閱讀

    Miniplayer小技巧 保證有你不知道

    Miniplayer小技巧 保證有你不知道的 1,用電源充電完成后先別拔充電器,先按住開關(guān)別放再拔開線就不用更新歌曲庫了。
    發(fā)表于 02-01 16:38 ?888次閱讀

    電機選幕布-告訴你不知道的產(chǎn)品細節(jié)

    電機選幕布-告訴你不知道的產(chǎn)品細節(jié) 家用投影幕布以固定畫框幕和電動式投影幕為主,其中電動幕由于安裝容易,對裝修影響較小
    發(fā)表于 02-10 10:28 ?7672次閱讀

    多數(shù)人眼中不知道的電子狗原理

    多數(shù)人眼中不知道的電子狗原理,感興趣的小伙伴們可以看看。
    發(fā)表于 07-28 09:32 ?41次下載

    低功耗藍牙不知道怎么選型?看這里!

    低功耗藍牙不知道怎么選型?看這里!
    發(fā)表于 07-27 16:46 ?12次下載

    你到底知不知道硬件設(shè)計是什么?

    想學(xué)習(xí)硬件電路方面的設(shè)計,但不知道怎么入手? 懵懵懂的進入硬件領(lǐng)域,對自己的發(fā)展和方向很迷茫? 做了一段時間硬件設(shè)計,事業(yè)發(fā)展和薪資遭遇瓶頸? 有時候必須承認,你還不夠優(yōu)秀!你甚至不知道硬件
    的頭像 發(fā)表于 05-18 11:27 ?1.1w次閱讀

    行業(yè)內(nèi)有95%的人還不知道的成單秘訣

    行業(yè)內(nèi)95%的人還不知道的成單秘訣
    的頭像 發(fā)表于 02-28 14:18 ?2692次閱讀
    行業(yè)內(nèi)有95%的人還<b class='flag-5'>不知道</b>的成單秘訣

    關(guān)于你可能不知道的printf

    你可能不知道的printf
    的頭像 發(fā)表于 02-05 12:28 ?3605次閱讀
    關(guān)于你可能<b class='flag-5'>不知道</b>的printf

    你愿意AI幫你理財投資嗎?

    理財投資這種事情,你愿意AI幫你嗎? 無論你是否愿意,銀行都可能在未來將一部分理財?shù)墓ぷ鹘唤oAI
    的頭像 發(fā)表于 11-27 15:08 ?2893次閱讀

    7種MOSFET柵極電路的常見作用,不看不知道!

    7種MOSFET柵極電路的常見作用,不看不知道!
    的頭像 發(fā)表于 12-15 09:46 ?3566次閱讀
    7種MOSFET柵極電路的常見作用,不看<b class='flag-5'>不知道</b>!

    揭秘pcb是什么物質(zhì):你不知道的“化學(xué)戰(zhàn)士”

    揭秘pcb是什么物質(zhì):你不知道的“化學(xué)戰(zhàn)士”
    的頭像 發(fā)表于 12-14 10:27 ?2532次閱讀