近期,特斯拉自動駕駛事故被頻頻報道,同時華為“自動駕駛”技術驚艷亮相,被廣大網(wǎng)友認為其已經(jīng)達到了L4的自動駕駛水平,這使得關于汽車輔助駕駛系統(tǒng)的討論再度熱鬧了起來。其中最關鍵的核心就是有關汽車視覺的感知系統(tǒng)。
事實上,隨著AR+AI時代的到來,AI視覺作為實現(xiàn)工業(yè)自動化和智能化的關鍵核心技術,正成為人工智能發(fā)展最快的一個分支。當機器可以“看懂這個世界”時,它將如眼睛之于人類的價值一般,不僅會改變我們的出行方式,還將改變我們的娛樂、學習等等與生活有關的一切。
一直以來,亮亮視野都在AR和AI上投入了巨大的精力,在為行業(yè)提供支撐企業(yè)數(shù)字化轉型的硬件和平臺的同時,與中科院自動化所建立聯(lián)合實驗室,通過對算法協(xié)同、多模態(tài)任務、環(huán)境測試等多方面進行綜合研究,努力實現(xiàn)AI多模態(tài)感知融合。近期,其多項研究成果成功入選計算機視覺世界的頂級會議。
“基于結構信息保持的弱監(jiān)督目標定位”
入選CVPR2021
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization. CVPR 2021.
CVPR2021是計算機視覺世界三大頂會之一!本次大會收到來自全球共7015篇有效投稿,最終有1663篇突出重圍被錄取,錄用率僅為23.7%。
本論文研究的是弱監(jiān)督目標定位(WSOL)能力,這是當下仍富有挑戰(zhàn)的計算機視覺任務,雖然現(xiàn)有的工作通過利用空間正則化策略可以明顯提高目標定位精度,但往往忽略了如何從訓練好的分類網(wǎng)絡中提取目標結構信息,使得性能和效率還有大幅提高的空間。
本次研究提出了一種兩階段的方法“結構保持激活(SPA)”,以充分利用WSOL卷積特征中包含的結構信息。在包括CUB-200-2011和ILSVRC在內(nèi)的兩個公開基準上進行的大量實驗表明,與基準方法相比,本文提出的SPA方法取得了顯著的性能提升。
分析并提醒行進中存在的警示和風險
而這種提升就可以在汽車駕駛時,對感知系統(tǒng)下的更多物體實現(xiàn)更為精準的檢測與判定,降低事故發(fā)生率。
“SiamCPN:基于孿生中心預測網(wǎng)絡的視覺跟蹤”
入選CVM 2021
SiamCPN: Visual tracking with the Siamese center-prediction network. CVM 2021.
CVM是亞洲圖形學學會(ASIA Graphics Association)旗下的三大系列會議之一,由清華大學圖形學實驗室于2012年在北京創(chuàng)辦,發(fā)展至今,已經(jīng)在國際上形成較大影響力。此次入選CVM2021的論文也同步入選SCI索引源。
本論文主要針對的是目標跟蹤問題,通過一種anchor-free的孿生網(wǎng)絡SiamCPN,給定初始幀中的參考追蹤對象,可直接預測后續(xù)幀中對象的中心點和大小。相比其它先進的孿生網(wǎng)絡算法,該方法GOT-10K、UAV123數(shù)據(jù)集上取得了更好的結果,推理速度也有1.5-2.0倍的提升。
這一成果可應用于互動游戲之中,可以讓虛擬的場景與現(xiàn)實自然融合,讓虛擬創(chuàng)造的NPC更真實的與玩家互動,從而讓玩家獲得更具沉浸感的增強現(xiàn)實游戲體驗。
讓虛擬NPC始終坐在人物肩膀上
其實不止于這些場景,這兩項科研成果還可以應用于更多領域。目前,亮亮視野正將這些技術帶到工業(yè)巡檢領域,從而促進技術快速成熟,更快更好的服務國民用戶的普通生活之中。
例如,“基于結構信息保持的弱監(jiān)督目標定位”現(xiàn)正應用于電力、制造、能源等領域的生產(chǎn)車間中,通過將技術賦予AVG機器人之中,機器人可以在復雜的環(huán)境中實現(xiàn)自主行走、避障等,從而提升機器人搬運、分揀等效率。此外,將該技術植入進AR智能眼鏡中,可以為現(xiàn)場人員提供實景導航、安全提示等,從而提高生產(chǎn)安全性。
而“基于孿生中心預測網(wǎng)絡的視覺跟蹤”技術則可以將數(shù)字孿生技術、三維建模技術更好的應用起來,工作人員可更方便的查看設備圖紙、操作設備虛擬三維模型,提高生產(chǎn)、運維、遠程培訓的效率。
AI是進入未來世界的關鍵,是成就改變世界夢想的鑰匙。截至目前,亮亮視野已經(jīng)有數(shù)篇AI科研成果登陸世界頂級會議,并將這些技術產(chǎn)業(yè)化,為不同行業(yè)帶去智能化的解決方案。未來,亮亮會繼續(xù)加大AI領域的研究工作,通過人工智能與增強現(xiàn)實技術,以第一視角交互讓人與人、人與機器、人與數(shù)據(jù)的溝通變得更自然高效。
原文標題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級會議
文章出處:【微信公眾號:亮亮視野】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
Ar
+關注
關注
25文章
5286瀏覽量
176436 -
AI
+關注
關注
91文章
40197瀏覽量
301795 -
自動駕駛
+關注
關注
794文章
14917瀏覽量
180337
原文標題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級會議
文章出處:【微信號:glxss-life,微信公眾號:亮亮視野LLVISION】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
亮亮視野AR翻譯眼鏡斬獲CES 2026多項大獎
北京祥龍公司領導蒞臨亮亮視野調(diào)研指導
亮亮視野AR翻譯眼鏡閃耀2025進博會國際論壇
亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會
亮亮視野榮登2025中國VR50強企業(yè)榜單
亮亮視野AR翻譯眼鏡亮相2025北京文化論壇
亮亮視野AR翻譯眼鏡亮相IFA 2025
易控智駕榮獲計算機視覺頂會CVPR 2025認可
思必馳與上海交大聯(lián)合實驗室研究成果入選兩大頂級會議
格靈深瞳六篇論文入選ICCV 2025
Nullmax端到端自動駕駛最新研究成果入選ICCV 2025
亮亮視野多項研究成果成功入選計算機視覺世界頂級會議
評論