91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-06-18 21:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

aff2221c-0ddb-11ee-962d-dac502259ad0.png ?背景

機(jī)器學(xué)習(xí)領(lǐng)域中,學(xué)習(xí)不平衡的標(biāo)注數(shù)據(jù)一直是一個常見而具有挑戰(zhàn)性的任務(wù)。近年來,視覺 Transformer 作為一種強(qiáng)大的模型,在多個視覺任務(wù)上展現(xiàn)出令人滿意的效果。然而,視覺 Transformer 處理長尾分布數(shù)據(jù)的能力和特性,還有待進(jìn)一步挖掘。

目前,已有的長尾識別模型很少直接利用長尾數(shù)據(jù)對視覺 Transformer(ViT)進(jìn)行訓(xùn)練?;诂F(xiàn)成的預(yù)訓(xùn)練權(quán)重進(jìn)行研究可能會導(dǎo)致不公平的比較結(jié)果,因此有必要對視覺 Transformer 在長尾數(shù)據(jù)下的表現(xiàn)進(jìn)行系統(tǒng)性的分析和總結(jié)。

b004ada6-0ddb-11ee-962d-dac502259ad0.png

論文鏈接:

https://arxiv.org/abs/2212.02015

代碼鏈接:

https://github.com/XuZhengzhuo/LiVT 本文旨在填補這一研究空白,詳細(xì)探討了視覺 Transformer 在處理長尾數(shù)據(jù)時的優(yōu)勢和不足之處。本文將重點關(guān)注如何有效利用長尾數(shù)據(jù)來提升視覺 Transformer 的性能,并探索解決數(shù)據(jù)不平衡問題的新方法。通過本文的研究和總結(jié),研究團(tuán)隊有望為進(jìn)一步改進(jìn)視覺 Transformer 模型在長尾數(shù)據(jù)任務(wù)中的表現(xiàn)提供有益的指導(dǎo)和啟示。這將為解決現(xiàn)實世界中存在的數(shù)據(jù)不平衡問題提供新的思路和解決方案。 文章通過一系列實驗發(fā)現(xiàn),在有監(jiān)督范式下,視覺 Transformer 在處理不平衡數(shù)據(jù)時會出現(xiàn)嚴(yán)重的性能衰退,而使用平衡分布的標(biāo)注數(shù)據(jù)訓(xùn)練出的視覺 Transformer 呈現(xiàn)出明顯的性能優(yōu)勢。相比于卷積網(wǎng)絡(luò),這一特點在視覺 Transformer 上體現(xiàn)的更為明顯。另一方面,無監(jiān)督的預(yù)訓(xùn)練方法無需標(biāo)簽分布,因此在相同的訓(xùn)練數(shù)據(jù)量下,視覺 Transformer 可以展現(xiàn)出類似的特征提取和重建能力。 基于以上觀察和發(fā)現(xiàn),研究提出了一種新的學(xué)習(xí)不平衡數(shù)據(jù)的范式,旨在讓視覺 Transformer 模型更好地適應(yīng)長尾數(shù)據(jù)。通過這種范式的引入,研究團(tuán)隊希望能夠充分利用長尾數(shù)據(jù)的信息,提高視覺 Transformer 模型在處理不平衡標(biāo)注數(shù)據(jù)時的性能和泛化能力。 b0232678-0ddb-11ee-962d-dac502259ad0.png ?文章貢獻(xiàn) 本文是第一個系統(tǒng)性的研究用長尾數(shù)據(jù)訓(xùn)練視覺 Transformer 的工作,在此過程中,做出了以下主要貢獻(xiàn): 首先,本文深入分析了傳統(tǒng)有監(jiān)督訓(xùn)練方式對視覺 Transformer 學(xué)習(xí)不均衡數(shù)據(jù)的限制因素,并基于此提出了雙階段訓(xùn)練流程,將視覺 Transformer 模型內(nèi)在的歸納偏置和標(biāo)簽分布的統(tǒng)計偏置分階段學(xué)習(xí),以降低學(xué)習(xí)長尾數(shù)據(jù)的難度。其中第一階段采用了流行的掩碼重建預(yù)訓(xùn)練,第二階段采用了平衡的損失進(jìn)行微調(diào)監(jiān)督。 b035076c-0ddb-11ee-962d-dac502259ad0.png ? ?其次,本文提出了平衡的二進(jìn)制交叉熵?fù)p失函數(shù),并給出了嚴(yán)格的理論推導(dǎo)。平衡的二進(jìn)制交叉熵?fù)p失的形式如下: b0498976-0ddb-11ee-962d-dac502259ad0.png ? ?與之前的平衡交叉熵?fù)p失相比,本文的損失函數(shù)在視覺 Transformer 模型上展現(xiàn)出更好的性能,并且具有更快的收斂速度。研究中的理論推導(dǎo)為損失函數(shù)的合理性提供了嚴(yán)密的解釋,進(jìn)一步加強(qiáng)了我們方法的可靠性和有效性。 b06900a8-0ddb-11ee-962d-dac502259ad0.png▲不同損失函數(shù)的收斂速度的比較 基于以上貢獻(xiàn),文章提出了一個全新的學(xué)習(xí)范式 LiVT,充分發(fā)揮視覺 Transformer 模型在長尾數(shù)據(jù)上的學(xué)習(xí)能力,顯著提升模型在多個數(shù)據(jù)集上的性能。該方案在多個數(shù)據(jù)集上取得了遠(yuǎn)好于視覺 Transformer 基線的性能表現(xiàn)。 b0827376-0ddb-11ee-962d-dac502259ad0.png▲不同參數(shù)量下在ImageNet-LT上的準(zhǔn)確性

b09d72de-0ddb-11ee-962d-dac502259ad0.png▲在ImagNet-LT(左)和iNaturalist18(右)數(shù)據(jù)集上的性能表現(xiàn)

同時,本文還驗證了在相同的訓(xùn)練數(shù)據(jù)規(guī)模的情況下,使用ImageNet的長尾分布子集(LT)和平衡分布子集(BAL)訓(xùn)練的 ViT-B 模型展現(xiàn)出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 數(shù)據(jù)集中,可以通過更大的模型和 MGP epoch 獲得更好的重建結(jié)果。 wKgZomTYg3CAQbicAARAkEpPjg4567.png ? ?b1201f86-0ddb-11ee-962d-dac502259ad0.png ?

總結(jié)

本文提供了一種新的基于視覺 Transformer 處理不平衡數(shù)據(jù)的方法 LiVT。LiVT 利用掩碼建模和平衡微調(diào)兩個階段的訓(xùn)練策略,使得視覺 Transformer 能夠更好地適應(yīng)長尾數(shù)據(jù)分布并學(xué)習(xí)到更通用的特征表示。該方法不僅在實驗中取得了顯著的性能提升,而且無需額外的數(shù)據(jù),具有實際應(yīng)用的可行性。 論文的更多細(xì)節(jié)請參考論文原文和補充材料。


原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    沐曦股份聯(lián)合清華大學(xué)發(fā)布磁性材料AI原子基座模型

    2月27日,沐曦股份聯(lián)合清華大學(xué)等多家研究機(jī)構(gòu)聯(lián)合發(fā)布了磁性材料AI原子基座模型。該模型是首個覆蓋寬溫壓域的磁性材料AI原子模型,經(jīng)權(quán)威專家鑒定,整體技術(shù)水平達(dá)到國際領(lǐng)先。
    的頭像 發(fā)表于 03-03 15:25 ?291次閱讀
    沐曦股份聯(lián)合<b class='flag-5'>清華大學(xué)</b>發(fā)布磁性材料AI原子基座模型

    清華大學(xué)研學(xué)團(tuán)到訪國民技術(shù)參觀交流

    近日,清華大學(xué)集成電路學(xué)院、社會科學(xué)學(xué)院、土木工程系的博士及碩士研究生一行16人走進(jìn)國民技術(shù)深圳總部,開展了一場別開生面的研學(xué)實踐活動。本次活動聚焦技術(shù)交流與人才培養(yǎng),推動校企合作邁向新階段。
    的頭像 發(fā)表于 02-11 14:54 ?438次閱讀

    清華大學(xué)“啟·創(chuàng)”計劃走進(jìn)拓維信息,校企共探AI時代產(chǎn)學(xué)研合作新范式

    1月13日,清華大學(xué)“啟·創(chuàng)”計劃第十三期赴湘社會實踐活動暨TalkwebHouse創(chuàng)業(yè)私董會第二期在拓維信息圓滿舉辦。清華大學(xué)創(chuàng)業(yè)團(tuán)隊20余名師生,與拓維信息團(tuán)隊深入對話,圍繞“AI+”產(chǎn)業(yè)融合
    的頭像 發(fā)表于 01-16 14:04 ?514次閱讀
    <b class='flag-5'>清華大學(xué)</b>“啟·創(chuàng)”計劃走進(jìn)拓維信息,校企共探AI時代產(chǎn)學(xué)研合作新范式

    沐曦與Arm、熠知一同到訪清華大學(xué)交流座談

    為助力頂尖學(xué)府清華大學(xué)在“AI+教科研”領(lǐng)域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,沐曦集成電路(上海)股份有限公司(股票代碼:688802)、半導(dǎo)體頭部企業(yè)Arm控股有限公司(納斯達(dá)克
    的頭像 發(fā)表于 01-14 13:52 ?349次閱讀

    時識科技DAVIS346傳感器助力清華大學(xué)突破LIBS技術(shù)瓶頸

    近日,清華大學(xué)深圳國際研究生院王希林教授團(tuán)隊創(chuàng)新性地引入時識科技(SynSense)的類腦動態(tài)視覺傳感器DAVIS346,首次將動態(tài)視覺傳感器(DVS)技術(shù)應(yīng)用于激光誘導(dǎo)等離子體光學(xué)信號的捕獲,并以
    的頭像 發(fā)表于 11-30 11:42 ?904次閱讀

    普華基礎(chǔ)軟件走進(jìn)清華大學(xué)研究生課堂

    近日,普華基礎(chǔ)軟件走進(jìn)清華大學(xué)車輛與運載學(xué)院,在《車輛控制工程》課堂上開展研究生專題授課和交流。本次授課聚焦智能駕駛汽車基礎(chǔ)軟件發(fā)展與關(guān)鍵技術(shù),旨在搭建校企知識傳遞橋梁,為高校學(xué)子帶來產(chǎn)業(yè)前沿視角,助力培養(yǎng)符合行業(yè)需求的復(fù)合型人才。
    的頭像 發(fā)表于 11-26 15:53 ?389次閱讀

    清華大學(xué)企業(yè)家協(xié)會一行到訪立訊精密參觀交流

    11月14日上午,立訊精密CPBG事業(yè)群與技術(shù)委員會在昆山園區(qū),熱情接待了到訪的清華大學(xué)企業(yè)家協(xié)會(TEEC)一行。此次交流,不僅是一次企業(yè)展示,更是一次思想碰撞與智慧交融的契機(jī)。
    的頭像 發(fā)表于 11-20 15:14 ?703次閱讀

    愛芯元智出席第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會

    近日,第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會暨校友論壇在蘇州市吳江區(qū)舉行。作為清華大學(xué)自動化系校友,愛芯元智創(chuàng)始人兼董事長仇肖莘博士應(yīng)邀發(fā)表主旨演講,深入剖析了高智價比AI芯片推動智能汽車普惠發(fā)展的實施路徑。
    的頭像 發(fā)表于 11-02 09:18 ?461次閱讀

    地平線H-RDT模型斬獲CVPR 2025大賽冠軍

    近日,在計算機(jī)視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機(jī)器人競賽中,地平線機(jī)器人實驗室與清華大學(xué)計算機(jī)系朱軍團(tuán)隊聯(lián)合提出的H-RDT憑強(qiáng)大性能和領(lǐng)先成功率
    的頭像 發(fā)表于 08-21 10:02 ?668次閱讀
    地平線H-RDT模型斬獲<b class='flag-5'>CVPR</b> 2025大賽冠軍

    清華大學(xué)五道口金融學(xué)院走進(jìn)賽目科技

    近日,聚焦自動駕駛未來路徑的專題沙龍在中關(guān)村國際創(chuàng)新大廈成功舉辦。此次活動由清華大學(xué)五道口金融學(xué)院主辦,北京賽目科技股份有限公司、北京海新域城市更新集團(tuán)提供活動支持,為清華-康奈爾雙學(xué)位金融MBA項目在讀學(xué)生及校友、自動駕駛領(lǐng)域的頂尖專家、企業(yè)家們搭建了一個交流與碰撞的平
    的頭像 發(fā)表于 07-18 16:15 ?763次閱讀

    清華大學(xué)TOP EE+項目參訪美光上海

    此前,2025年6月4日至6日,清華大學(xué)TOP EE+ 項目于美光上海的參訪活動圓滿舉行。為期三天的活動匯聚了來自清華大學(xué)電子工程系的優(yōu)秀留學(xué)生與美光的多位管理者和工程師,展開了深入的技術(shù)交流與文化互動之旅。
    的頭像 發(fā)表于 07-07 18:02 ?1496次閱讀

    導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院達(dá)成合作

    近日,導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院(以下簡稱:研究院)達(dá)成合作。導(dǎo)遠(yuǎn)科技將提供高精度定位產(chǎn)品及解決方案,以支持研究院在L4級自動駕駛和人形機(jī)器人領(lǐng)域的技術(shù)研發(fā)及轉(zhuǎn)化落地。
    的頭像 發(fā)表于 06-12 16:34 ?1021次閱讀

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅守!

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅守!近年來,珠海市鎵未來科技有限公司(以下簡稱“鎵未來”)在第三代半導(dǎo)體行業(yè)異軍突起,憑借領(lǐng)先的氮化鎵(GaN)技術(shù)儲備和不斷推出的新產(chǎn)品
    發(fā)表于 05-19 10:16

    清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)智能體

    清華大學(xué)響應(yīng)國家教育新基建戰(zhàn)略,正在加速推進(jìn)網(wǎng)絡(luò)管理平臺升級:為滿足在線教育、協(xié)同創(chuàng)新及智慧校園的發(fā)展需求,為清華大學(xué)躋身世界一流大學(xué)創(chuàng)造基礎(chǔ)條件,清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-07 09:51 ?849次閱讀

    2025年開放原子校源行清華大學(xué)站成功舉辦

    近日,由開放原子開源基金會、清華大學(xué)計算機(jī)科學(xué)與技術(shù)系、清華大學(xué)軟件學(xué)院主辦的開放原子“校源行”(清華站)在清華大學(xué)成功舉辦。
    的頭像 發(fā)表于 04-22 16:46 ?937次閱讀