91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

HuggingGPT在線演示驚艷亮相

jf_8lIj6kO1 ? 來源:新智元 ? 2023-04-10 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導讀】浙大&微軟推出的HuggingGPT爆火之后,剛剛開放了demo,急不可待的網友自己上手體驗了一番。

最強組合HuggingFace+ChatGPT=「賈維斯」現(xiàn)在開放demo了。

f1276df6-d739-11ed-bfe3-dac502259ad0.png

前段時間,浙大&微軟發(fā)布了一個大模型協(xié)作系統(tǒng)HuggingGPT直接爆火。 研究者提出了用ChatGPT作為控制器,連接HuggingFace社區(qū)中的各種AI模型,完成多模態(tài)復雜任務。 整個過程,只需要做的是:用自然語言將你的需求輸出。 英偉達科學家稱,這是我本周讀到的最有意思的論文。它的思想非常接近我之前說的「Everything App」,即萬物皆App,被AI直接讀取信息。

f1593c28-d739-11ed-bfe3-dac502259ad0.png

上手體驗

現(xiàn)在,HuggingGPT增加了Gradio演示。

f17839c0-d739-11ed-bfe3-dac502259ad0.png

項目地址:https://github.com/microsoft/JARVIS 有網友便上手體驗了一番,先來「識別圖上有幾個人」?

f18c8f60-d739-11ed-bfe3-dac502259ad0.png

HuggingGPT根據(jù)推理結果,得出圖片中有2個人正在街道上行走。 具體過程如下: 首先使用圖像到文本模型nlpconnect/vit-gpt2-image-captioning進行圖像描述,生成的文本「2個女人在有火車的街道上行走」。 接著,使用了目標檢測模型facebook/detrresnet 50來檢測圖片中的人數(shù)。模型檢測出7個物體,2個人。 再使用視覺問題回答模型dandelin/vilt-b32-finetuned-vqa得出結果。最后,系統(tǒng)提供了詳細的響應和用于解答問題的模型信息。

f1f0da1a-d739-11ed-bfe3-dac502259ad0.png

另外,讓它理解「我愛你」這句話的情感,并將其翻譯成泰米爾語(Tami?)。 HuggingGPT調用了以下模型: 首先,使用了模型「dslim/bert-base-NER」對文本「l love you」進行情感分類,是「浪漫」。 然后,使用「ChatGPT」將文本翻譯成泰米爾語,即「Nan unnai kadalikiren」。 在推理結果中沒有生成的圖片、音頻或視頻文件。

f21945ae-d739-11ed-bfe3-dac502259ad0.png

轉錄MP3文件時,HuggingGPT卻失敗了。網友表示,「不確定這是否是我的輸入文件的問題?!?/p>

f239b596-d739-11ed-bfe3-dac502259ad0.gif

再來看看圖像生成的能力。 輸入「一只貓?zhí)琛箞D像上添加文字「I LOVE YOU」作為疊加層。 HuggingGPT首先使用了「runwayml/stable-diffusion-1-5」模型根據(jù)給定的文本生成「跳舞的貓」的圖片。 然后,使用同一個模型根據(jù)給定的文本生成了「I LOVE YOU」的圖片。 最后,將2個圖片合并在一起,輸出如下圖:

f271e1be-d739-11ed-bfe3-dac502259ad0.png

賈維斯照進現(xiàn)實

項目公開沒幾天,賈維斯已經在GitHub上收獲了12.5k星,以及811個fork。

f2c6a51e-d739-11ed-bfe3-dac502259ad0.png

研究者指出解決大型語言模型(LLMs)當前的問題,可能是邁向AGI的第一步,也是關鍵的一步。

因為當前大型語言模型的技術仍然存在著一些缺陷,因此在構建 AGI 系統(tǒng)的道路上面臨著一些緊迫的挑戰(zhàn)。

為了處理復雜的人工智能任務,LLMs應該能夠與外部模型協(xié)調,以利用它們的能力。 因此,關鍵點在于如何選擇合適的中間件來橋接LLMs和AI模型。 在這篇研究論文中,研究者提出在HuggingGPT中語言是通用的接口。其工作流程主要分為四步:

f46640d2-d739-11ed-bfe3-dac502259ad0.png

論文地址:https://arxiv.org/pdf/2303.17580.pdf 首先是任務規(guī)劃,ChatGPT解析用戶請求,將其分解為多個任務,并根據(jù)其知識規(guī)劃任務順序和依賴關系。 接著,進行模型選擇。LLM根據(jù)HuggingFace中的模型描述將解析后的任務分配給專家模型。 然后執(zhí)行任務。專家模型在推理端點上執(zhí)行分配的任務,并將執(zhí)行信息和推理結果記錄到LLM中。 最后是響應生成。LLM總結執(zhí)行過程日志和推理結果,并將摘要返回給用戶。

f4847c46-d739-11ed-bfe3-dac502259ad0.png

假如給出這樣一個請求:

請生成一個女孩正在看書的圖片,她的姿勢與example.jpg中的男孩相同。然后請用你的聲音描述新圖片。

可以看到HuggingGPT是如何將它拆解為6個子任務,并分別選定模型執(zhí)行得到最終結果的。

f49d67a6-d739-11ed-bfe3-dac502259ad0.png

通過將AI模型描述納入提示中,ChatGPT可以被視為管理人工智能模型的大腦。因此,這一方法可以讓ChatGPT能夠調用外部模型,來解決實際任務。 簡單來講,HuggingGPT是一個協(xié)作系統(tǒng),并非是大模型。 它的作用就是連接ChatGPT和HuggingFace,進而處理不同模態(tài)的輸入,并解決眾多復雜的人工智能任務。 所以,HuggingFace社區(qū)中的每個AI模型,在HuggingGPT庫中都有相應的模型描述,并將其融合到提示中以建立與ChatGPT的連接。 隨后,HuggingGPT將ChatGPT作為大腦來確定問題的答案。 到目前為止,HuggingGPT已經圍繞ChatGPT在HuggingFace上集成了數(shù)百個模型,涵蓋了文本分類、目標檢測、語義分割、圖像生成、問答、文本到語音、文本到視頻等24個任務。 實驗結果證明,HuggingGPT可以在各種形式的復雜任務上表現(xiàn)出良好的性能。

網友熱評

有網友稱,HuggingGPT類似于微軟此前提出的Visual ChatGPT,似乎他們把最初的想法擴展到了一組龐大的預訓練模型上。

f4d99d2a-d739-11ed-bfe3-dac502259ad0.png

Visual ChatGPT是直接基于ChatGPT構建,并向其注入了許多可視化模型(VFMs)。文中提出了Prompt Manage。 在PM的幫助下,ChatGPT可以利用這些VFMs,并以迭代的方式接收其反饋,直到滿足用戶的要求或達到結束條件。

f50ac79c-d739-11ed-bfe3-dac502259ad0.png

還有網友認為,這個想法確實與ChatGPT插件非常相似。以LLM為中心進行語義理解和任務規(guī)劃,可以無限提升LLM的能力邊界。通過將LLM與其他功能或領域專家相結合,我們可以創(chuàng)建更強大、更靈活的 AI 系統(tǒng),能夠更好地適應各種任務和需求。

f52ab804-d739-11ed-bfe3-dac502259ad0.png

這就是我一直以來對AGI的看法,人工智能模型能夠理解復雜任務,然后將較小的任務分派給其他更專業(yè)的AI模型。

f53daa4a-d739-11ed-bfe3-dac502259ad0.png

就像大腦一樣,它也有不同的部分來完成特定的任務,聽起來很符合邏輯。

f561ce0c-d739-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40001

    瀏覽量

    301637
  • 模型
    +關注

    關注

    1

    文章

    3764

    瀏覽量

    52135
  • ChatGPT
    +關注

    關注

    31

    文章

    1598

    瀏覽量

    10305

原文標題:炫到爆炸!HuggingGPT在線演示驚艷亮相,網友親測圖像生成絕了

文章出處:【微信號:玩轉VS Code,微信公眾號:玩轉VS Code】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    KM在線監(jiān)測實現(xiàn)設備高效管理#在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2026年02月27日 14:24:25

    “開源鴻蒙機器人方陣”入場秀驚艷亮相,M-Robots OS引領城市智慧環(huán)衛(wèi)變革

    深圳信息職業(yè)技術大學舉辦。作為大賽協(xié)辦單位之一,深開鴻攜開源鴻蒙生態(tài)創(chuàng)新成果精彩亮相,通過無人車隊協(xié)同作業(yè)演示、賽后點評與合作簽約等環(huán)節(jié),全面展現(xiàn)了開源鴻蒙生態(tài)的創(chuàng)
    的頭像 發(fā)表于 11-29 17:28 ?1063次閱讀
    “開源鴻蒙機器人方陣”入場秀<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>,M-Robots OS引領城市智慧環(huán)衛(wèi)變革

    KM在線監(jiān)測方案保障水泵安全生產#在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年11月28日 09:18:13

    破解平壓平模切機監(jiān)測難題!KMPHM在線監(jiān)測方案大揭秘 #在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年09月16日 16:26:25

    KM告訴你 人工監(jiān)測VS在線監(jiān)測 誰才是效率王者?#在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年08月15日 10:06:36

    KM在線監(jiān)測標桿計劃招募中#在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年07月25日 13:41:08

    KM亮相石油化工展#在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年06月20日 15:41:55

    KM告訴你什么是在線監(jiān)測?#

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年06月19日 14:07:22

    上能電氣重磅亮相SNEC 2025

    近日, 2025 SNEC國際太陽能光伏與智慧能源展覽會在上海隆重拉開帷幕。上能電氣以“大時代 · 新構想”為主題、攜創(chuàng)新成果驚艷亮相,全場景構網型光儲解決方案成為全場焦點,用科技創(chuàng)新力量為零碳未來注入無限可能。
    的頭像 發(fā)表于 06-13 15:13 ?1805次閱讀

    FLIR亮相2025北京國際工業(yè)自動化展覽會

    今天,第十九屆北京國際工業(yè)自動化展覽會在中國國際展覽中心朝陽館盛大啟幕,這是一場專注于智能工業(yè)的國際性展覽會,菲力爾攜多款工業(yè)自動化領域的FLIR在線式紅外熱像儀驚艷亮相
    的頭像 發(fā)表于 05-23 14:42 ?933次閱讀

    KMPHM在線監(jiān)測系統(tǒng) 讓設備故障無處遁形#在線監(jiān)測#振動在線監(jiān)測

    在線監(jiān)測
    KM預測性維護專家
    發(fā)布于 :2025年05月22日 16:30:08

    智多晶亮相2025慕尼黑上海電子展

    此前,4月15日-4月17日,2025慕尼黑上海電子展(electronica China 2025)在上海新國際博覽中心盛大開幕,智多晶應約而來,攜經典FPGA解決方案驚艷亮相,成為展會現(xiàn)場備受矚目的焦點。
    的頭像 發(fā)表于 04-22 18:11 ?1248次閱讀

    泰科電子亮相2025香港國際春季燈飾展

    四月的香港,燈光與創(chuàng)新交織成海。在剛剛落幕的2025香港國際春季燈飾展上,TE Connectivity(泰科電子,以下簡稱“TE”)攜智能連接解決方案驚艷亮相,演繹"不止于連接"的科技美學,與全球行業(yè)精英共話照明科技新篇章,共同探索技術創(chuàng)新、發(fā)展趨勢和未來合作機會。
    的頭像 發(fā)表于 04-11 10:30 ?922次閱讀

    天馬微電子精彩亮相CITE 2025

    2025年4月9日,第十三屆中國電子信息博覽會(CITE 2025)在深圳會展中心盛大啟幕。在全球中小尺寸顯示領域占據(jù)領軍地位的天馬微電子,攜多項前沿技術與創(chuàng)新產品驚艷亮相,全方位展示其在OLED顯示及車載顯示等應用領域的領先實力。
    的頭像 發(fā)表于 04-09 17:59 ?2241次閱讀

    中易騰達亮相2025國際星閃聯(lián)盟創(chuàng)新展

    2025國際星閃聯(lián)盟創(chuàng)新展圓滿落幕。中易騰達攜最新產品與技術成果驚艷亮相,與行業(yè)伙伴共繪星閃生態(tài)新圖景!
    的頭像 發(fā)表于 04-02 14:47 ?939次閱讀