91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

共熵服務中心 ? 來源:未知 ? 2022-11-16 20:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自《ACM技術(shù)洞察》科學雜志上的一篇文章:《Survey on Digital Video Stabilization: Concepts, Methods, and Challenges》,原文鏈接如下:

https://dl.acm.org/doi/pdf/10.1145/3494525


CSUR-IG是誰?

CSUR-IG是計算調(diào)研興趣小組 Computing SURveys Interest Group的縮寫。我們是ACM技術(shù)洞察研究團隊。我們是來自4個地方的同學:

1名深圳大學大三學生

2名中原工學院研一學生

1名安陽工學院大三學生

1名南通科技學院大三學生

我們在OpenHarmony成長計劃啃論文俱樂部里,與華為、軟通動力、鴻湖萬聯(lián)等公司一起,學習和研究操作系統(tǒng)技術(shù)…


1. 簡介

1.1 本文摘要

數(shù)字視頻穩(wěn)定是一項具有挑戰(zhàn)性的任務,旨在通過平滑相機軌跡將可能不穩(wěn)定的視頻轉(zhuǎn)換為令人愉快的視頻。

穩(wěn)定可以借助硬件(穩(wěn)定器)的方式實現(xiàn),也可以通過軟件算法的方式實現(xiàn)。本文談的是后者。

盡管在解決這一任務的文獻中發(fā)現(xiàn)了各種作品,但它們的組織和分析尚未受到太多關(guān)注。在這項工作中,我們根據(jù)提議的分類法對視頻穩(wěn)定的文獻進行了全面回顧。介紹了該問題的正式定義,以及物理術(shù)語的簡要解釋。我們還就這一活躍領(lǐng)域的主要挑戰(zhàn)和未來趨勢進行了全面討論。

1.2 數(shù)字視頻穩(wěn)定的定義

數(shù)字視頻穩(wěn)定就是通過平滑相機軌跡將可能不穩(wěn)定的視頻轉(zhuǎn)換為令人愉快的視頻。視頻可以表示為一系列照片(幀)。

圖中,真實世界裁剪(白色)產(chǎn)生的照片和視頻(藍色)的表示。左:以矩形表示的照片。中間和右側(cè):以音量表示的穩(wěn)定和不穩(wěn)定視頻。

數(shù)字視頻穩(wěn)定就想解決不用設備(直接用手)的情況下,把視頻拍得好看,很有商業(yè)價值。


2. 正式定義和分類

2.1 相機運動方法

我拿著相機,可以前后左右走,舉高舉低(第一個圖),我拍特別角度,拿著相機轉(zhuǎn)(第二個圖),合起來就是復雜運動(第三個圖)。

2.2數(shù)字視頻穩(wěn)定的一些方法

2.2.1 經(jīng)典的方法(三步走):

數(shù)字視頻穩(wěn)定的典型過程涉及三個不同的步驟,如下圖所示:(1) 攝像機運動估計,(2) 不需要的運動確定,以及 (3) 穩(wěn)定視圖渲染。

2.2.2 基于深度學習的方法:

深度學習的方法提出了深度神經(jīng)網(wǎng)絡架構(gòu),以有監(jiān)督或無監(jiān)督的方式穩(wěn)定視頻。


3.主要挑戰(zhàn)場景

3.1相機的估計運動

拍攝的過程中,人會帶著相機運動,拍攝的事物也會運動,組合起來就是表觀運動,也就是拍出來的東西。相機的估計運動就是通過表觀運動(拍出來的東西)估計出相機本身是怎么運動的。

相機運動估計技術(shù)地圖,主要講了估計出相機本身是怎么運動中2D(二維),3D(三維)和2.5D(混合方法)的一些處理方法,并且給出了相應的描述和優(yōu)缺點比較:

表 1. 對數(shù)字視頻穩(wěn)定中攝像機運動估計的進步做出貢獻的一些主要工作總結(jié)

3.2怎么確定不需要的運動

拍攝過程中因為不必要的抖動導致畫質(zhì)不好,這種運動需要確定,就是確定不需要的運動。

不需要的運動確認技術(shù)地圖,主要講了為了去除的不需要的運動部分以獲得更平滑的路徑中基于過濾的方法,基于插值的方法,基于優(yōu)化的方法,并且給出了相應的描述和優(yōu)缺點比較:

表 2. 有助于推動數(shù)字視頻穩(wěn)定中的無用運動確定的一些主要工作總結(jié)

3.3穩(wěn)定視圖渲染

我們要處理一些丟失或者模糊的幀,也就是幀的修復。

穩(wěn)定渲染的技術(shù)地圖,主要講了渲染穩(wěn)定的幀中中基于填充的方法和基于裁剪的方法,并且給出了相應的描述和優(yōu)缺點比較:

表 3. 推動數(shù)字視頻穩(wěn)定渲染新視圖的一些主要工作總

4.基于深度學習的方法

基于深度學習的視頻穩(wěn)定方法,大多數(shù)使用帶有配對視頻的數(shù)據(jù)集進行訓練,其中每一對都有一個不穩(wěn)定的和一個真實穩(wěn)定的視頻。在這種情況下,如下圖所示,目標是找到一個網(wǎng)絡,該網(wǎng)絡從不穩(wěn)定版本中預測幀,使其與穩(wěn)定版本盡可能相似。

圖中,基于深度學習的方法中常用的方法。不穩(wěn)定的幀和一些時間信息提供給深度網(wǎng)絡,以在訓練/推理階段預測穩(wěn)定/穩(wěn)定的幀。

深度學習數(shù)字視頻穩(wěn)定技術(shù)地圖,這種方法沒有明確地估計相機運動,但他們使用的是表觀運動。通常,不需要的運動的確定和移除是隱式完成的:網(wǎng)絡學習預測類似于真實穩(wěn)定視頻的視頻,以下就是給出論文技術(shù)的盤點:

表 4. 基于深度神經(jīng)網(wǎng)絡執(zhí)行數(shù)字視頻穩(wěn)定的方法總結(jié)

5.結(jié)論

5.1 過去的回顧
這項工作對數(shù)字視頻穩(wěn)定文獻中可用的方法進行了回顧。我們根據(jù)使用的方法對方法進行分類,無論是經(jīng)典的還是基于深度學習的。經(jīng)典方法分為三個主要階段:(1)相機運動估計,(2)確定不需要的運動,以及(3)穩(wěn)定幀的渲染。對于這些步驟中的每一個,我們定義并分類了這些方法。
5.2本文結(jié)論
  • 一些實際應用可以受益于數(shù)字視頻穩(wěn)定及其開發(fā)所產(chǎn)生的知識。

  • 需要更好地定義使用這些方法的場景。

  • 與其計算機視覺領(lǐng)域類似,深度學習已成為近年來視頻穩(wěn)定的趨勢。

  • 數(shù)字視頻穩(wěn)定文獻中的關(guān)鍵點之一是還沒有明確定義的評估指標。

<本文完>


寫在最后


OpenHarmony 成長計劃—“啃論文俱樂部”(以下簡稱“啃論文俱樂部”)是在 2022年 1 月 11 日的一次日?;顒又姓Q生的。截至 3 月 31 日,啃論文俱樂部已有 87 名師生和企業(yè)導師參與,目前共有十二個技術(shù)方向并行探索,每個方向都有專業(yè)的技術(shù)老師帶領(lǐng)同學們通過啃綜述論文制定技術(shù)地圖,按“降龍十八掌”的學習方法編排技術(shù)開發(fā)內(nèi)容,并通過專業(yè)推廣培養(yǎng)高校開發(fā)者成為軟件技術(shù)學術(shù)級人才。


啃論文俱樂部的宗旨是希望同學們在開源活動中得到軟件技術(shù)能力提升、得到技術(shù)寫作能力提升、得到講解技術(shù)能力提升。大學一年級新生〇門檻參與,已有俱樂部來自多所高校的大一同學寫出高居榜首的技術(shù)文章。


如今,搜索“啃論文”,人們不禁想到、而且看到的都是我們——OpenHarmony 成長計劃—“啃論文俱樂部”的產(chǎn)出。






OpenHarmony開源與開發(fā)者成長計劃—“啃論文俱樂部”學習資料合集


1)入門資料:啃論文可以有怎樣的體驗

https://docs.qq.com/slide/DY0RXWElBTVlHaXhi?u=4e311e072cbf4f93968e09c44294987d


2)操作辦法:怎么從啃論文到開源提交以及深度技術(shù)文章輸出https://docs.qq.com/slide/DY05kbGtsYVFmcUhU


3)企業(yè)/學校/老師/學生為什么要參與 & 啃論文俱樂部的運營辦法https://docs.qq.com/slide/DY2JkS2ZEb2FWckhq


4)往期啃論文俱樂部同學分享會精彩回顧:

同學分享會No1.成長計劃啃論文分享會紀要(2022/02/18)https://docs.qq.com/doc/DY2RZZmVNU2hTQlFY

同學分享會No.2 成長計劃啃論文分享會紀要(2022/03/11)https://docs.qq.com/doc/DUkJ5c2NRd2FRZkhF

同學們分享會No.3 成長計劃啃論文分享會紀要(2022/03/25)

https://docs.qq.com/doc/DUm5pUEF3ck1VcG92?u=4e311e072cbf4f93968e09c44294987d


現(xiàn)在,你是不是也熱血沸騰,摩拳擦掌地準備加入這個俱樂部呢?當然歡迎啦!啃論文俱樂部向任何對開源技術(shù)感興趣的大學生開發(fā)者敞開大門。



掃碼添加 OpenHarmony 高校小助手,加入“啃論文俱樂部”微信群


后續(xù),我們會在服務中心公眾號陸續(xù)分享一些 OpenHarmony 開源與開發(fā)者成長計劃—“啃論文俱樂部”學習心得體會和總結(jié)資料。記得呼朋引伴來看哦。

























原文標題:數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

文章出處:【微信公眾號:開源技術(shù)服務中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    389

    瀏覽量

    8749
  • OpenHarmony
    +關(guān)注

    關(guān)注

    33

    文章

    3960

    瀏覽量

    21173

原文標題:數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

文章出處:【微信號:開源技術(shù)服務中心,微信公眾號:共熵服務中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深入解析 TVP5146M2:高性能數(shù)字視頻解碼器的技術(shù)洞察

    深入解析 TVP5146M2:高性能數(shù)字視頻解碼器的技術(shù)洞察 在當今數(shù)字化的時代,視頻處理技術(shù)日新月異,數(shù)字視頻解碼器作為其中的關(guān)鍵組件,對于實現(xiàn)高質(zhì)量
    的頭像 發(fā)表于 03-17 15:20 ?96次閱讀

    RENESAS ICS664 - 02 PECL數(shù)字視頻時鐘源:高清電視時鐘解決方案

    RENESAS ICS664 - 02 PECL數(shù)字視頻時鐘源:高清電視時鐘解決方案 在高清電視(HDTV)數(shù)字視頻設備的設計中,穩(wěn)定且高質(zhì)量的時鐘源至關(guān)重要。今天要介紹的RENESAS
    的頭像 發(fā)表于 03-13 16:10 ?90次閱讀

    深入剖析 TVP5147M1:高性能數(shù)字視頻解碼器的技術(shù)解析與應用指南

    深入剖析 TVP5147M1:高性能數(shù)字視頻解碼器的技術(shù)解析與應用指南 在當今數(shù)字化浪潮中,視頻處理技術(shù)的發(fā)展日新月異,數(shù)字視頻解碼器作為視頻
    的頭像 發(fā)表于 03-13 15:55 ?96次閱讀

    PI3VDP411LST:雙模式DP信號數(shù)字視頻電平轉(zhuǎn)換器

    PI3VDP411LST:雙模式DP信號數(shù)字視頻電平轉(zhuǎn)換器 在當今多元化的顯示設備連接需求下,尋找一款能夠靈活轉(zhuǎn)換信號、適應不同顯示標準的解決方案至關(guān)重要。Pericom Semiconductor
    的頭像 發(fā)表于 03-11 17:25 ?513次閱讀

    MAX4886:高性能HDMI/DVI數(shù)字視頻開關(guān)的深度解析

    MAX4886:高性能HDMI/DVI數(shù)字視頻開關(guān)的深度解析 在當今數(shù)字化的時代,高清視頻傳輸和切換技術(shù)變得越來越重要。對于電子工程師而言,選擇合適的視頻開關(guān)芯片是實現(xiàn)高質(zhì)量
    的頭像 發(fā)表于 02-09 10:25 ?141次閱讀

    探索TS3DV520:數(shù)字視頻切換的理想之選

    探索TS3DV520:數(shù)字視頻切換的理想之選 在數(shù)字視頻領(lǐng)域,信號的高效切換和處理至關(guān)重要。德州儀器(TI)的TS3DV520作為一款5通道差分10:20多路復用器開關(guān),專為DVI/HDMI應用而設
    的頭像 發(fā)表于 01-15 09:25 ?295次閱讀

    深入剖析LMH0031:SMPTE標準數(shù)字視頻解串器的卓越性能與應用指南

    深入剖析LMH0031:SMPTE標準數(shù)字視頻解串器的卓越性能與應用指南 在數(shù)字視頻處理領(lǐng)域,SMPTE(電影與電視工程師協(xié)會)標準為視頻信號的傳輸和處理設定了嚴格規(guī)范。TI推出的LMH0031
    的頭像 發(fā)表于 12-30 14:10 ?339次閱讀

    深入剖析LMH0030:SMPTE標準數(shù)字視頻序列化器的卓越之選

    深入剖析LMH0030:SMPTE標準數(shù)字視頻序列化器的卓越之選 在當今數(shù)字化的時代,數(shù)字視頻處理技術(shù)日新月異。對于電子工程師而言,選擇一款性能卓越、功能豐富的數(shù)字視頻序列化器至關(guān)重要
    的頭像 發(fā)表于 12-30 14:00 ?314次閱讀

    ARK7028模擬高清數(shù)字視頻解碼器深度解析,完全P2P TP9951,TP9950,TP2855技術(shù)黨必看!

    ARK7028模擬高清數(shù)字視頻解碼器深度解析,技術(shù)黨必看! 各位電子圈的大佬、技術(shù)發(fā)燒友們看過來!今天給大家扒一款超實用的芯片——ARK7028模擬高清數(shù)字視頻解碼器,從功能到應用全解析,不管是做
    的頭像 發(fā)表于 12-29 14:32 ?509次閱讀
    ARK7028模擬高清<b class='flag-5'>數(shù)字視頻</b>解碼器深度解析,完全P2P TP9951,TP9950,TP2855技術(shù)黨必看!

    深度剖析TVP5160:高性能數(shù)字視頻解碼器的卓越之選

    深度剖析TVP5160:高性能數(shù)字視頻解碼器的卓越之選 在當今數(shù)字化浪潮席卷的時代,數(shù)字視頻解碼技術(shù)在眾多領(lǐng)域發(fā)揮著至關(guān)重要的作用。TI公司推出的TVP5160數(shù)字視頻解碼器,憑借其出
    的頭像 發(fā)表于 12-29 14:20 ?478次閱讀

    探索TVP5146M2:高性能數(shù)字視頻解碼器的深度剖析

    探索TVP5146M2:高性能數(shù)字視頻解碼器的深度剖析 在數(shù)字視頻處理領(lǐng)域,解碼器的性能直接影響著視頻質(zhì)量和系統(tǒng)的穩(wěn)定性。今天,我們要深入探討的是德州儀器(Texas Instrume
    的頭像 發(fā)表于 12-29 11:20 ?3306次閱讀

    探索TVP5147M1:高性能數(shù)字視頻解碼器的深度剖析

    探索TVP5147M1:高性能數(shù)字視頻解碼器的深度剖析 在當今數(shù)字化的時代,視頻處理技術(shù)不斷發(fā)展,數(shù)字視頻解碼器在各種視頻設備中扮演著至關(guān)重
    的頭像 發(fā)表于 12-29 11:15 ?492次閱讀

    DS90UB924-Q1:汽車信息娛樂系統(tǒng)的數(shù)字視頻音頻解決方案

    DS90UB924-Q1:汽車信息娛樂系統(tǒng)的數(shù)字視頻音頻解決方案 在汽車電子領(lǐng)域,對于數(shù)字視頻和音頻的高效分配有著持續(xù)的需求。DS90UB924-Q1作為一款具有雙向控制通道的5MHz至96MHz
    的頭像 發(fā)表于 12-19 13:50 ?302次閱讀

    視頻光端機的使用方法

    視頻光端機使用指南 視頻光端機,全稱為視頻光端傳輸終端,是安防監(jiān)控、智能交通、廣播電視等領(lǐng)域中不可或缺的設備。它的核心作用是將攝像頭的模擬或數(shù)字視頻信號轉(zhuǎn)換成光信號,通過光纖進行遠距離
    的頭像 發(fā)表于 12-03 10:00 ?1489次閱讀

    混合信號設計的概念、挑戰(zhàn)與發(fā)展趨勢

    本文介紹了集成電路設計領(lǐng)域中混合信號設計的概念挑戰(zhàn)與發(fā)展趨勢。
    的頭像 發(fā)表于 04-01 10:30 ?1813次閱讀