91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓Transformer在多種模態(tài)下處理不同領(lǐng)域的廣泛應(yīng)用?

深度學(xué)習(xí)自然語言處理 ? 來源:AI公園 ? 作者:Synced ? 2021-03-08 10:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個(gè)模型完成了CV,NLP方向的7個(gè)任務(wù),每個(gè)任務(wù)上表現(xiàn)都非常好。

Transformer架構(gòu)在自然語言處理和其他領(lǐng)域的機(jī)器學(xué)習(xí)(ML)任務(wù)中表現(xiàn)出了巨大的成功,但大多僅限于單個(gè)領(lǐng)域或特定的多模態(tài)領(lǐng)域的任務(wù)。例如,ViT專門用于視覺相關(guān)的任務(wù),BERT專注于語言任務(wù),而VILBERT-MT只用于相關(guān)的視覺和語言任務(wù)。

一個(gè)自然產(chǎn)生的問題是:我們能否建立一個(gè)單一的Transformer,能夠在多種模態(tài)下處理不同領(lǐng)域的廣泛應(yīng)用?最近,F(xiàn)acebook的一個(gè)人工智能研究團(tuán)隊(duì)進(jìn)行了一個(gè)新的統(tǒng)一Transformer(UniT) encoder-decoder模型的挑戰(zhàn),該模型在不同的模態(tài)下聯(lián)合訓(xùn)練多個(gè)任務(wù),并通過一組統(tǒng)一的模型參數(shù)在這些不同的任務(wù)上都實(shí)現(xiàn)了強(qiáng)大的性能。

Transformer首先應(yīng)用于sequence-to-sequence模型的語言領(lǐng)域。它們已經(jīng)擴(kuò)展到視覺領(lǐng)域,甚至被應(yīng)用于視覺和語言的聯(lián)合推理任務(wù)。盡管可以針對各種下游任務(wù)中的應(yīng)用對預(yù)先訓(xùn)練好的Transformer進(jìn)行微調(diào),并獲得良好的結(jié)果,但這種模型微調(diào)方法會導(dǎo)致為每個(gè)下游任務(wù)創(chuàng)建不同的參數(shù)集。

Facebook的人工智能研究人員提出,一個(gè)Transformer可能就是我們真正需要的。他們的UniT是建立在傳統(tǒng)的Transformer編碼器-解碼器架構(gòu)上,包括每個(gè)輸入模態(tài)類型的獨(dú)立編碼器,后面跟一個(gè)具有簡單的每個(gè)任務(wù)特定的頭的解碼器。輸入有兩種形式:圖像和文本。首先,卷積神經(jīng)網(wǎng)絡(luò)骨干網(wǎng)提取視覺特征,然后BERT將語言輸入編碼成隱藏狀態(tài)序列。然后,Transformer解碼器應(yīng)用于編碼的單個(gè)模態(tài)或兩個(gè)編碼模態(tài)的連接序列(取決于任務(wù)是單模態(tài)還是多模態(tài))。最后,Transformer解碼器的表示將被傳遞到特定任務(wù)的頭,該頭將輸出最終的預(yù)測。

UniT模型概要

評估UniT的性能,研究人員進(jìn)行了實(shí)驗(yàn),需要共同學(xué)習(xí)來自不同領(lǐng)域的許多流行的任務(wù):COCO目標(biāo)檢測和 Visual Genome數(shù)據(jù)集,語言理解任務(wù)的GLUE基準(zhǔn)(QNLI, QQP、MNLI-mismatched SST-2),以及視覺推理任務(wù)VQAv2 SNLI-VE數(shù)據(jù)集。

8d044a88-7f2a-11eb-8b86-12bb97331649.png

多任務(wù)訓(xùn)練的UniT性能優(yōu)于單獨(dú)訓(xùn)練的目標(biāo)檢測和VQA

8d3f74fa-7f2a-11eb-8b86-12bb97331649.png

基于UniT模型的目標(biāo)檢測與VQA的分析

8d86f6fe-7f2a-11eb-8b86-12bb97331649.png

UniT模型在8個(gè)數(shù)據(jù)集的7個(gè)任務(wù)上的性能

具有共享解碼器的UniT模型的預(yù)測

結(jié)果表明,所提出的UniT 模型同時(shí)處理8個(gè)數(shù)據(jù)集上的7個(gè)任務(wù),在統(tǒng)一的模型參數(shù)集下,每個(gè)任務(wù)都有較強(qiáng)的性能。強(qiáng)大的性能表明UniT有潛力成為一種領(lǐng)域未知的transformer 架構(gòu),向更通用的智能的目標(biāo)邁進(jìn)了一步。

原文標(biāo)題:【多模態(tài)】來自Facebook AI的多任務(wù)多模態(tài)的統(tǒng)一Transformer:向更通用的智能邁出了一步

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301387
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265343
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136941

原文標(biāo)題:【多模態(tài)】來自Facebook AI的多任務(wù)多模態(tài)的統(tǒng)一Transformer:向更通用的智能邁出了一步

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Transformer如何自動(dòng)駕駛大模型獲得思考能力?

    在談及自動(dòng)駕駛時(shí),Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer自動(dòng)駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4160次閱讀

    功率放大器螺旋載荷下管中彎曲模態(tài)導(dǎo)波中的應(yīng)用

    管道工業(yè)中應(yīng)用廣泛,是油、氣、水等流體的主要運(yùn)輸方式,保障管道安全具有重要意義。超聲導(dǎo)波檢測具有高效便捷的特點(diǎn),非常適合管道檢測。當(dāng)前管道導(dǎo)波檢測主要采用軸對稱模態(tài)導(dǎo)波,使用彎曲模態(tài)
    的頭像 發(fā)表于 01-22 11:00 ?168次閱讀
    功率放大器<b class='flag-5'>在</b>螺旋載荷下管中彎曲<b class='flag-5'>模態(tài)</b>導(dǎo)波中的應(yīng)用

    CST軟件的廣泛應(yīng)用

    21世紀(jì)的科技浪潮中,電磁仿真技術(shù)已成為推動(dòng)眾多行業(yè)發(fā)展的關(guān)鍵力量。作為電磁仿真領(lǐng)域的佼佼者,CST軟件憑借其強(qiáng)大的功能、高精度的仿真結(jié)果以及廣泛的應(yīng)用領(lǐng)域,
    的頭像 發(fā)表于 12-17 10:22 ?400次閱讀
    CST軟件的<b class='flag-5'>廣泛應(yīng)用</b>

    探索onsemi FGY100T120RWD IGBT:高效性能與廣泛應(yīng)用的完美結(jié)合

    電子工程領(lǐng)域,IGBT(絕緣柵雙極型晶體管)作為一種重要的功率半導(dǎo)體器件,廣泛應(yīng)用于各種高功率、高效率的電子設(shè)備中。今天,我們將深入探討 onsemi 公司推出的 FGY100T120RWD IGBT,了解其特點(diǎn)、性能參數(shù)以及
    的頭像 發(fā)表于 12-04 11:11 ?881次閱讀
    探索onsemi FGY100T120RWD IGBT:高效性能與<b class='flag-5'>廣泛應(yīng)用</b>的完美結(jié)合

    ELLON合金電阻特性及廣泛應(yīng)用

    ELLON?合金電阻電子領(lǐng)域有著獨(dú)特地位。它具備高精度、高穩(wěn)定性等特性,廣泛應(yīng)用于電源與能源管理、電池管理系統(tǒng)等諸多領(lǐng)域。本文將深入解析?ELLON?合金電阻的相關(guān)知識,幫助您全面了
    的頭像 發(fā)表于 12-01 15:37 ?416次閱讀
    ELLON合金電阻特性及<b class='flag-5'>廣泛應(yīng)用</b>

    Lora技術(shù)應(yīng)用領(lǐng)域

    1. 物聯(lián)網(wǎng)應(yīng)用:Lora技術(shù)的遠(yuǎn)距離傳輸特性使其物聯(lián)網(wǎng)應(yīng)用中得到廣泛應(yīng)用。通過Lora技術(shù),可以實(shí)現(xiàn)智能城市、智能家居、智能農(nóng)業(yè)等多種物聯(lián)網(wǎng)應(yīng)用,為人們的生活帶來便利和舒適。 2. 工業(yè)控制
    發(fā)表于 11-26 08:10

    Transformer如何自動(dòng)駕駛變得更聰明?

    ]自動(dòng)駕駛中常提的Transformer本質(zhì)上是一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最早在自然語言處理里火起來。與卷積神經(jīng)網(wǎng)絡(luò)(CNN)或循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)不同,Transformer能夠自動(dòng)審視所有輸入信息,并動(dòng)態(tài)判斷哪些部分更為關(guān)鍵,同時(shí)
    的頭像 發(fā)表于 11-19 18:17 ?2271次閱讀

    格靈深瞳多模態(tài)大模型Glint-ME圖文互搜更精準(zhǔn)

    電商、安防等場景下,圖文互搜應(yīng)用廣泛。隨著以CLIP為代表的多模態(tài)表征方法相繼提出,過去單一模態(tài)搜索(文搜文、圖搜圖)被突破,模型可以同時(shí)理解文本、圖像、音頻乃至視頻,實(shí)現(xiàn)跨
    的頭像 發(fā)表于 11-02 15:56 ?1714次閱讀
    格靈深瞳多<b class='flag-5'>模態(tài)</b>大模型Glint-ME<b class='flag-5'>讓</b>圖文互搜更精準(zhǔn)

    環(huán)氧樹脂領(lǐng)域的應(yīng)用

    環(huán)氧樹脂的卓越特性與應(yīng)用領(lǐng)域環(huán)氧樹脂憑借其卓越的物理機(jī)械性能、電絕緣性能以及與多種材料的出色粘接性能,眾多領(lǐng)域展現(xiàn)出獨(dú)特優(yōu)勢。其使用工藝的靈活性更是使其
    的頭像 發(fā)表于 09-11 14:43 ?1202次閱讀
    環(huán)氧樹脂<b class='flag-5'>在</b>各<b class='flag-5'>領(lǐng)域</b>的應(yīng)用

    滾珠導(dǎo)軌工業(yè)制造領(lǐng)域如何實(shí)現(xiàn)高效運(yùn)行?

    工業(yè)制造領(lǐng)域中滾珠導(dǎo)軌憑借其高精度、低摩擦、高剛性等特點(diǎn),被廣泛應(yīng)用多種設(shè)備和場景,并在設(shè)備性能中起著關(guān)鍵作用。
    的頭像 發(fā)表于 09-02 17:52 ?712次閱讀
    滾珠導(dǎo)軌<b class='flag-5'>在</b>工業(yè)制造<b class='flag-5'>領(lǐng)域</b>如何實(shí)現(xiàn)高效運(yùn)行?

    自動(dòng)駕駛中Transformer大模型會取代深度學(xué)習(xí)嗎?

    持續(xù)討論。特別是自動(dòng)駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過時(shí)”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實(shí)際落地路徑等維度來看,
    的頭像 發(fā)表于 08-13 09:15 ?4184次閱讀
    自動(dòng)駕駛中<b class='flag-5'>Transformer</b>大模型會取代深度學(xué)習(xí)嗎?

    Transformer架構(gòu)概述

    由于Transformer模型的出現(xiàn)和快速發(fā)展,深度學(xué)習(xí)領(lǐng)域正在經(jīng)歷一場翻天覆地的變化。這些突破性的架構(gòu)不僅重新定義了自然語言處理(NLP)的標(biāo)準(zhǔn),而且拓寬了視野,徹底改變了AI的許多方面。
    的頭像 發(fā)表于 06-10 14:24 ?1286次閱讀
    <b class='flag-5'>Transformer</b>架構(gòu)概述

    VirtualLab 應(yīng)用:薄元近似(TEA)與傅里葉模態(tài)法(FMM)的光柵建模

    摘要 薄元近似(TEA)是傅里葉光學(xué)中廣泛應(yīng)用的計(jì)算光柵衍射效率的方法。然而,我們也知道,對于較小的光柵周期,也就是當(dāng)其更接近于光的波長時(shí),近似變得不準(zhǔn)確。本例中,選擇了兩種類型的傳輸光柵來展示
    發(fā)表于 05-22 08:56

    LMS Test.Lab:振動(dòng)噪聲測試領(lǐng)域的全能王者

    、航空航天、機(jī)械制造、能源等行業(yè),提供高精度的數(shù)據(jù)采集、信號處理、模態(tài)分析、聲學(xué)測試等功能。憑借其強(qiáng)大的硬件兼容性、靈活的軟件架構(gòu)和行業(yè)領(lǐng)先的算法,LMS Test.Lab 已成為工程測試領(lǐng)域的標(biāo)桿
    發(fā)表于 04-23 15:25

    AI多模態(tài)在建筑業(yè)安全領(lǐng)域廣泛應(yīng)用# 智慧工地#人工智能

    人工智能
    jf_60804796
    發(fā)布于 :2025年04月16日 11:05:07