91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

精準(zhǔn)圖片搜索 OpenAI最新技術(shù) CLIP

工程師鄧生 ? 來源:凹非寺 ? 作者:金磊 ? 2021-02-11 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

別再怕圖片搜索結(jié)果牛頭不對馬嘴了,你可以試試這個(gè) 精準(zhǔn)圖片搜索,來自 OpenAI最新的技術(shù) CLIP。

只需一句 “大白話”描述,便能給出想要的圖片。

例如輸入:

The word love written on the wall

就會(huì)得到這樣的結(jié)果:

可以說是相當(dāng)?shù)?精準(zhǔn)了!這就是今天在Reddit上爆火的一個(gè)項(xiàng)目。

這個(gè)項(xiàng)目利用到的,便是 OpenAI前不久頻頻刷屏的DALL·E 中的核心模塊—— CLIP,一個(gè)負(fù)責(zé)重排序 (rerank)的模型。

這個(gè)項(xiàng)目使用谷歌Colab Notebook,而且在線、免費(fèi),包含200萬圖片數(shù)據(jù)集,最重要的是效果還非常的精準(zhǔn)。

不禁引得網(wǎng)友直呼“ Amazing”。

簡單幾步,“大白話”在線精準(zhǔn)搜圖

這個(gè)項(xiàng)目之所以如此火爆, 操作簡單是很重要的一個(gè)原因之一。

首先要做的,就是點(diǎn)開該項(xiàng)目在Colab Notebook中的地址 (見文末鏈接),登陸自己的賬號。

至于環(huán)境配置、包或庫的調(diào)用,這個(gè)項(xiàng)目非常貼心的已經(jīng)做好了,只需要依次點(diǎn)擊cell左側(cè)的小三角,等待運(yùn)行完成即可。

最后,來到包含如下代碼的cell:

search_query = “Two dogs playing inthe snow”

點(diǎn)擊運(yùn)行這個(gè)cell,便可得到搜索圖片的結(jié)果,例如:

當(dāng)然,這個(gè)程序似乎很懂人,若是輸入“當(dāng)你的代碼跑通時(shí)的情緒”:

The feeling when your program finallyworks

得到的結(jié)果,和正常人想象中的應(yīng)該是一致的:

為什么CLIP搜圖能如此精準(zhǔn)?

OpenAI前不久推出的DALL·E,主要能實(shí)現(xiàn)的功能就是 可以按照文字描述、生成對應(yīng)圖片。

而其呈現(xiàn)給我們的最終作品,其實(shí)是它生成大量圖片中的一部分。

在中間過程中,其實(shí)也有排名、打分的帥選過程。

這部分的任務(wù),便是由 CLIP來完成:

越是它看得懂、匹配度最高的作品,分?jǐn)?shù)就會(huì)越高,排名也會(huì)越靠前。

這種結(jié)構(gòu),有點(diǎn)像是利用生成對抗文本,以合成圖像的 GAN。

不過,相比于利用GAN擴(kuò)大圖像分辨率、匹配圖像-文本特征等方法,CLIP則選擇了直接對輸出進(jìn)行排名。

據(jù)研究人員表示,CLIP網(wǎng)絡(luò)的 最大意義在于,它緩解了深度學(xué)習(xí)在視覺任務(wù)中,最大的兩個(gè)問題。

首先,它 降低了深度學(xué)習(xí)需要的數(shù)據(jù)標(biāo)注量。

相比于手動(dòng)在ImageNet上,用文字描述1400萬張圖像,CLIP直接從網(wǎng)上已有的“文字描述圖像”數(shù)據(jù)中進(jìn)行學(xué)習(xí)。

此外,CLIP還能“身兼多職”,在各種數(shù)據(jù)集上的表現(xiàn)都很好 (包括沒見過的數(shù)據(jù)集)。

但此前的大部分視覺神經(jīng)網(wǎng)絡(luò),只能在訓(xùn)練的數(shù)據(jù)集上有不錯(cuò)的表現(xiàn)。

例如,CLIP與ResNet101相比,在各項(xiàng)數(shù)據(jù)集上都有不錯(cuò)的檢測精度,然而ResNet101在除了ImageNet以外的檢測精度上,表現(xiàn)都不太好。

具體來說,CLIP用到了零樣本學(xué)習(xí) (zero-shot learning)、自然語言理解和多模態(tài)學(xué)習(xí)等技術(shù),來完成圖像的理解。

例如,描述一只斑馬,可以用“馬的輪廓+虎的皮毛+熊貓的黑白”。這樣,網(wǎng)絡(luò)就能從沒見過的數(shù)據(jù)中,找出“斑馬”的圖像。

最后,CLIP將文本和圖像理解結(jié)合起來,預(yù)測哪些圖像,與數(shù)據(jù)集中的哪些文本能完成最好的配對。

網(wǎng)友:機(jī)器人(bot)可能不太高興

在驚嘆CLIP用“大白話”搜索圖片效果之余,一位Reddit網(wǎng)友還發(fā)現(xiàn)了一個(gè)比較有意思的搜索結(jié)果。

他在文本描述的代碼部分輸入:

What image best represents how you feel right now?

這句話在我們?nèi)祟愌壑校瑧?yīng)當(dāng)是詢問AI的語氣了,然后出來的圖片結(jié)果是這樣的:

還有這樣的:

嗯,看來是被“玩多了”,AI寶寶有點(diǎn)小脾氣了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 搜索
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    16999
  • OpenAT
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8881
  • 圖片
    +關(guān)注

    關(guān)注

    0

    文章

    203

    瀏覽量

    16538
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    7260
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10055
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    京東圖片搜索API深度解析:以圖搜貨賦能電商全場景

    京東圖片搜索API 是京東開放平臺提供的一項(xiàng)基于圖像識別技術(shù)的視覺搜索服務(wù),能夠通過上傳圖片圖片
    的頭像 發(fā)表于 02-08 14:56 ?663次閱讀

    淘寶圖片搜索API(taobao.item_search_img)

    商運(yùn)營、數(shù)據(jù)服務(wù)、供應(yīng)鏈管理等場景的重要技術(shù)支撐。淘寶開放平臺推出的圖片搜索 API,依托阿里生態(tài)成熟的計(jì)算機(jī)視覺技術(shù)與全量商品數(shù)據(jù)沉淀,將專業(yè)的圖像識別能力標(biāo)準(zhǔn)化、開放化,為開發(fā)者、
    的頭像 發(fā)表于 01-29 11:54 ?144次閱讀

    淘寶圖片搜索API接口指南

    一、前言 淘寶圖片搜索?API(核心為「拍立淘」相關(guān)接口)是淘寶開放平臺(TOP)提供的視覺檢索接口,核心能力是基于上傳的圖片?/?圖片?URL,檢索淘寶?/?天貓平臺的同款、相似商品
    的頭像 發(fā)表于 01-12 14:17 ?419次閱讀

    淘寶搜索API:長尾詞挖掘,SEO提升的利器!

    ? 在淘寶這個(gè)巨大的生態(tài)中,商品能否被買家精準(zhǔn)搜索到,直接關(guān)系到店鋪的流量和轉(zhuǎn)化。而搜索優(yōu)化的核心之一,就是關(guān)鍵詞策略。除了競爭激烈的頭部熱詞, 長尾關(guān)鍵詞 往往蘊(yùn)含著巨大的潛力。它們搜索
    的頭像 發(fā)表于 01-09 14:48 ?245次閱讀
    淘寶<b class='flag-5'>搜索</b>API:長尾詞挖掘,SEO提升的利器!

    1688拍立淘圖片搜索API概述

    1688 拍立淘是基于圖像識別技術(shù)的商品搜索服務(wù),允許用戶通過上傳圖片搜索相似商品。 1.主要功能特點(diǎn) 以圖搜圖:通過圖片內(nèi)容識別相似商品
    的頭像 發(fā)表于 12-17 14:56 ?368次閱讀

    淘寶圖片搜索商品API指南

    一、摘要 淘寶圖片搜索商品API是基于圖像識別技術(shù)的智能搜索接口,允許用戶通過上傳商品圖片搜索
    的頭像 發(fā)表于 12-08 14:26 ?1193次閱讀

    按圖搜索1688商品API接口技術(shù)實(shí)現(xiàn)指南

    ? 一、接口原理 1688的按圖搜索功能基于圖像特征匹配技術(shù),核心流程如下: 用戶上傳商品圖片 系統(tǒng)提取圖像特征向量 在商品庫中進(jìn)行相似度匹配 返回相似商品列表 匹配算法通常采用: $$ text
    的頭像 發(fā)表于 11-11 14:18 ?352次閱讀
    按圖<b class='flag-5'>搜索</b>1688商品API接口<b class='flag-5'>技術(shù)</b>實(shí)現(xiàn)指南

    京東拍立淘API開發(fā)指南:從零開始構(gòu)建圖像搜索應(yīng)用

    京東圖片識別搜索API(拍立淘)是基于深度學(xué)習(xí)的視覺搜索服務(wù),通過卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征向量,結(jié)合近似最近鄰搜索算法實(shí)現(xiàn)商品精準(zhǔn)匹配?。該
    的頭像 發(fā)表于 11-09 17:40 ?2156次閱讀

    TE Connectivity CROWN CLIP Sr. 420A電源連接器技術(shù)解析與應(yīng)用指南

    TE Connectivity (TE) CROWN CLIP Sr. 420A電源連接器采用緊湊、大電流、盲插設(shè)計(jì),易于安裝和使用。由于采用帶角度的浮動(dòng)式設(shè)計(jì),該連接器的盲插能力可最大限度地減少
    的頭像 發(fā)表于 11-07 11:24 ?528次閱讀

    蘇寧搜索接口深析:全品類智能分軌如何解決 O2O 電商的搜索痛點(diǎn)?

    本文深度解析蘇寧全品類O2O搜索接口核心技術(shù),涵蓋智能分軌引擎、庫存聯(lián)動(dòng)系統(tǒng)與高并發(fā)架構(gòu)設(shè)計(jì),解決多品類參數(shù)識別、線上線下庫存同步等電商搜索痛點(diǎn),助力構(gòu)建高效精準(zhǔn)的現(xiàn)代電商
    的頭像 發(fā)表于 10-28 16:20 ?884次閱讀
    蘇寧<b class='flag-5'>搜索</b>接口深析:全品類智能分軌如何解決 O2O 電商的<b class='flag-5'>搜索</b>痛點(diǎn)?

    按圖搜索1688商品的API接口

    ? ?在電商場景中,按圖搜索商品功能(即通過上傳圖片查找相似商品)極大提升了用戶體驗(yàn)和效率。1688作為阿里巴巴旗下的批發(fā)平臺,雖然沒有直接公開的“按圖搜索”API,但我們可以借助阿里云的圖像
    的頭像 發(fā)表于 10-22 15:05 ?601次閱讀
    按圖<b class='flag-5'>搜索</b>1688商品的API接口

    淘寶圖片搜索接口開發(fā)實(shí)戰(zhàn):從 CNN 特征提取到商品匹配(附避坑手冊 + 可復(fù)用代碼)

    本文詳解淘寶圖片搜索接口開發(fā)全流程,涵蓋CNN特征提取、商品匹配、參數(shù)配置及400/429等高頻報(bào)錯(cuò)解決方案,附合規(guī)避坑指南與可復(fù)用代碼,助你高效實(shí)現(xiàn)圖像搜商品功能。
    的頭像 發(fā)表于 10-21 10:03 ?520次閱讀

    1688 多模態(tài)搜索從 0 到 1:逆向接口解析與 CLIP 特征匹配實(shí)踐

    本文分享基于CLIP模型與逆向工程實(shí)現(xiàn)1688圖片搜同款的實(shí)戰(zhàn)方案。通過抓包分析破解接口簽名,結(jié)合CLIP多模態(tài)特征提取與Faiss向量檢索,提升搜索準(zhǔn)確率至91%,單次響應(yīng)低于80m
    的頭像 發(fā)表于 10-17 10:00 ?537次閱讀

    格靈深瞳三項(xiàng)成果獲得國際頂級學(xué)術(shù)會(huì)議認(rèn)可

    OpenAI CLIP為代表的多模態(tài)預(yù)訓(xùn)練模型,為安防、電商等應(yīng)用場景提供了強(qiáng)大的跨模態(tài)理解基礎(chǔ),但也存在多種技術(shù)局限性。
    的頭像 發(fā)表于 09-15 14:43 ?1356次閱讀

    無刷直流電機(jī)電流檢測新技術(shù)

    開關(guān)管通態(tài)壓降的表現(xiàn)形式及電流波形重構(gòu)原理,實(shí)驗(yàn)結(jié)果表明該技術(shù)具有實(shí)現(xiàn)簡單、經(jīng)濟(jì)實(shí)用的特點(diǎn),值得推廣。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無刷直流電機(jī)電流檢測新技術(shù).pdf 【免責(zé)
    發(fā)表于 06-26 13:47