91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深蘭科技DeepBlueAI團隊斬獲低分辨率視頻行為識別挑戰(zhàn)賽的冠軍

深蘭科技 ? 來源:DeepBlue深蘭科技 ? 作者:DeepBlue深蘭科技 ? 2021-06-30 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀近日,全球三大計算機視覺頂級會議之一CVPR如期舉行,深蘭科技DeepBlueAI團隊斬獲TinyAction Challenge(低分辨率視頻行為識別挑戰(zhàn)賽)的冠軍。

TinyAction Challenge是第六屆動作識別國際挑戰(zhàn)賽系列競賽之一,該系列競賽由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主辦,旨在推動視頻理解的進一步發(fā)展。

冠軍方案解讀

賽題介紹

TinyAction Challenge使用TinyVirat-v2[1]數(shù)據(jù)集,旨在提高低分辨率高噪聲等真實監(jiān)控場景下的視頻行為識別能力。比賽提供大量真實場景視頻片段及標注,每個視頻片段中可能含有多個動作,本質是一個多標簽的行為識別任務,比賽結果采用precision、recall、F1-score等多個指標來評測。

賽題難點

視頻分辨率很低,最小只有10x10像素尺度;

視頻尺度多樣,從10x10到128x128不等;

視頻質量較差,含有大量噪聲;

視頻場景多樣,行為多樣,每個視頻可能含有多個行為。

解決方案

算法選擇上,團隊廣泛嘗試了TSM[2]、TPN-Slowonly[3]等經(jīng)典算法,最終采用交互移除的CSN[4](ir-CSN)模型,在保證性能的前提下適當減少計算量,同時減輕對數(shù)據(jù)的過擬合。

數(shù)據(jù)增強方面,訓練時團隊首先隨機調(diào)整尺度裁剪,再統(tǒng)一調(diào)整尺度到128x128,最后再隨機翻轉。而在測試時,通過Tencrop,即對視頻幀及其水平翻轉在中心與四角區(qū)域分別裁剪求平均,有效提高了inference時單模型性能。

測試階段團隊進一步使用了五折交叉驗證的模型融合方法。另外由于觀察到在比賽數(shù)據(jù)集的26類行為中有些類別是互斥的,因而對最終的結果添加了后處理規(guī)則,使得F1指標進一步提高0.6個點。通過一步步優(yōu)化,DeepBlueAI團隊單模型的F1指標即超過了第二名達到0.4447,并最終達到0.4782,實現(xiàn)大幅度領先。

總結

在本次比賽中,團隊對任務及數(shù)據(jù)做了仔細的分析,合理地選擇了模型算法,進行了精細的模型訓練,同時在數(shù)據(jù)的后處理上做了大量的優(yōu)化,有效實現(xiàn)了低分辨率高噪聲視頻中行為識別,并最終獲得冠軍。相信隨著計算機視覺及多模態(tài)技術的深入發(fā)展,行為識別等視頻理解問題能夠得到更好的解決,并獲得越來越廣泛的實際應用。

參考文獻:

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47622
  • 高噪聲率
    +關注

    關注

    0

    文章

    2

    瀏覽量

    6086
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26186
  • CSN
    CSN
    +關注

    關注

    0

    文章

    2

    瀏覽量

    9007
  • 深蘭科技
    +關注

    關注

    1

    文章

    106

    瀏覽量

    6568

原文標題:賽道 | CVPR2021深蘭冠軍方案解讀- TinyAction Challenge低分辨率視頻行為識別挑戰(zhàn)賽

文章出處:【微信號:kmdian,微信公眾號:深蘭科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結果正式揭曉。在這場首次將評估焦點從“答案正確性”轉向“推理過程質量”的變革性賽事中,思必馳-上海交通大學聯(lián)合實驗室團隊憑借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研
    的頭像 發(fā)表于 02-28 14:13 ?429次閱讀

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術LiteGS出色的算法實力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程在新一代圖形渲染技術上的深度積累與全球學術界的高度認可。
    的頭像 發(fā)表于 12-22 18:01 ?1799次閱讀
    摩爾線程在SIGGRAPH Asia 2025<b class='flag-5'>斬獲</b>3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    第三屆ICPC與華為挑戰(zhàn)賽冠軍杯圓滿結束

    近日,第三屆ICPC&華為挑戰(zhàn)賽冠軍杯在上海練秋湖研發(fā)中心閉幕,來自佐治亞理工學院的中國選手褚寫庭獲得冠軍。這項賽事由ICPC(國際大學生程序設計競賽)基金會和華為聯(lián)合舉辦,匯聚全球頂尖
    的頭像 發(fā)表于 11-19 16:15 ?949次閱讀

    電能質量在線監(jiān)測裝置的暫態(tài)記錄分辨率如何影響故障類型識別?

    、相位差),低分辨率則會讓特征模糊或丟失,直接導致故障類型誤判。具體影響可按核心分辨率指標與故障識別邏輯拆解: 一、核心影響邏輯:分辨率決定 “故障特征的可
    的頭像 發(fā)表于 11-14 16:10 ?1880次閱讀
    電能質量在線監(jiān)測裝置的暫態(tài)記錄<b class='flag-5'>分辨率</b>如何影響故障類型<b class='flag-5'>識別</b>?

    德州市政府領導蒞臨深蘭科技考察調(diào)研

    2025年11月5日,山東省德州市市委副書記、市長朱開國市政府考察團一行蒞臨深蘭科技集團上海總部考察調(diào)研。深蘭科技創(chuàng)始人、董事長陳海波率團隊熱情接待。雙方圍繞人工智能與機器人產(chǎn)業(yè)生態(tài)
    的頭像 發(fā)表于 11-07 17:04 ?1185次閱讀

    廊坊市政府領導蒞臨深蘭科技調(diào)研考察

    2025年11月4日,河北省廊坊市市長劉媛市政府考察團一行蒞臨深蘭科技集團上??偛空{(diào)研考察。深蘭科技集團董事副總裁楊秀珂率團隊熱情接待。雙方圍繞人工智能產(chǎn)業(yè)發(fā)展、技術應用落地、機器人
    的頭像 發(fā)表于 11-05 17:57 ?1291次閱讀

    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰(zhàn)賽雙料亞軍

    近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發(fā)的創(chuàng)新技術方案,在復雜視頻目標分割和
    的頭像 發(fā)表于 10-31 09:42 ?549次閱讀
    傳音TEX AI<b class='flag-5'>團隊</b><b class='flag-5'>斬獲</b>ICCV 2025大型<b class='flag-5'>視頻</b>目標分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    山東大學與濟南市科技局領導蒞臨深蘭科技調(diào)研考察

    2025年10月27日,山東大學副校長王美琴山東大學及濟南市科技局領導一行蒞臨深蘭科技集團上海總部進行調(diào)研考察,并與深蘭科技創(chuàng)始人兼董事長陳海波及公司高層進行了卓有成效的座談交流。
    的頭像 發(fā)表于 10-30 15:19 ?662次閱讀

    深蘭科技發(fā)布AI法務大模型產(chǎn)品

    近日,深蘭科技發(fā)布面向律所與企業(yè)法務部門的AI法務大模型產(chǎn)品——“深蘭律師辦公自動化系統(tǒng)(AI版)”。通過AI技術賦能法律服務行業(yè),它能夠顯著提升法律文書處理效率與事務性工作自動化水平,為律所和法務團隊帶來全新的工作體驗。
    的頭像 發(fā)表于 10-23 17:58 ?1080次閱讀

    分辨率對于模擬到數(shù)字轉換器有什么重要性

    96dB以上,而低分辨率ADC(如8位)僅約48dB。這意味著高分辨率ADC能同時處理強信號和弱信號,避免弱信號被量化噪聲淹沒。信噪比(SNR)提升:分辨率每增加1位,理論SNR提升約6dB(實際因
    發(fā)表于 09-18 09:31

    如何構建帶有VGA輸出的低分辨率熱成像

    在本文中,我們將介紹如何構建帶有VGA輸出的低分辨率熱成像。該解決方案基于Melexis MLX90640紅外陣列、FPGA S7 50開發(fā)板(AMD-Xilinx Spartan-7 FPGA,帶VGA輸出)。
    的頭像 發(fā)表于 07-15 11:06 ?4203次閱讀
    如何構建帶有VGA輸出的<b class='flag-5'>低分辨率</b>熱成像

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質升級

    近日,在計算機視覺領域最具影響力的國際競賽CVPRNTIRE2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲高效超分辨率
    的頭像 發(fā)表于 06-24 17:03 ?909次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動<b class='flag-5'>視頻</b>畫質升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率
    的頭像 發(fā)表于 06-24 16:08 ?1626次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    分辨率 vs 噪聲 —— ADC的挑戰(zhàn)

    設計者常用高分辨率 ADC 以降低最低可量測單位(LSB),提高檢測精度。 比如一個 16 位 ADC 在 5V 范圍內(nèi), LSB ≈ 76 μV ;理想情況下可以檢測到微弱電信號。 問題是: 若
    的頭像 發(fā)表于 06-23 07:38 ?1877次閱讀
    <b class='flag-5'>分辨率</b> vs 噪聲 —— ADC的<b class='flag-5'>挑戰(zhàn)</b>

    FX3板是否兼容2k和4k分辨率視頻數(shù)據(jù)流?

    我們希望使用 FPGA 對 FX3 板進行配置,該板提供分辨率為 3264 * 2448(有效分辨率)和 2560 * 1440(有效分辨率)的視頻流。 我之前參考了應用說明 AN
    發(fā)表于 05-23 06:35