91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3D視頻會議系統(tǒng)VirtualCube打開未來辦公的更多可能

微軟科技 ? 來源:微軟科技 ? 作者:微軟科技 ? 2022-06-13 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

小編說:常言道:“眼睛是心靈的窗戶”,眼神交流所傳達的信息也可以進一步提升人們的溝通效果。然而,隨著視頻聊天、視頻會議逐漸成為常態(tài),大家不禁要問,我們有多久沒有與同事、朋友、家人確認過眼神了?

而微軟亞洲研究院的研究項目 3D 視頻會議系統(tǒng) VirtualCube,可以讓在線會議的與會者建立自然的眼神交互,沉浸式的體驗就像在同一個房間內面對面交流一樣。該技術的相關論文被全球虛擬現(xiàn)實學術會議 IEEE Virtual Reality 2022 接收并獲得了大會的最佳論文獎(Best Paper Award – Journal Papers Track)。

在日常交談中,相互注視和擺動頭部等動作都是自然對話的組成部分,尤其是當我們在面對面交流中變換話題、控制發(fā)言或轉換交流對象時,都會伴隨眼神和肢體動作的交流。然而,當前的視頻會議技術卻存在著一定的缺陷——由于攝像頭和屏幕不在同一高度,如果看向屏幕眼神往往很不自然,如果看向攝像頭則無法關注到其他與會者的反應,因此視頻會議缺少了線下交流的真實感和互動感。而且在實際的工作中,我們還會有各種不同的會議場景,比如多人會議、同排而坐協(xié)同工作等情況,對于捕捉與會者的側方視線和動作來說,現(xiàn)有的視頻會議系統(tǒng)就更無能為力了。

如果有一個會議系統(tǒng),可以讓人們即使身處不同的地方,也能像在同一房間里一樣交流,視線轉動就能與同伴建立起眼神溝通,這是否會給遠程辦公增添一份沉浸式的真實感呢?

1利用現(xiàn)有的普通硬件設備搭建的 3D 視頻系統(tǒng)

為了解決這些問題,微軟亞洲研究院提出了創(chuàng)新的 3D 視頻會議系統(tǒng)——VirtualCube,它可以在遠程視頻會議中建立起真人等大的 3D 形象,無論是正面溝通,還是側方交流,系統(tǒng)都能夠正確捕捉到與會者的眼神、動態(tài),建立起眼神和肢體交流。相關論文被全球虛擬現(xiàn)實學術會議 IEEE Virtual Reality 2022 接收并獲得了大會的最佳論文獎(Best Paper Award – Journal Papers Track)。(點擊閱讀原文,了解論文細節(jié))

VirtualCube 系統(tǒng)具有三大優(yōu)勢:

標準化、簡單化,全部使用現(xiàn)有的普通硬件設備。與辦公場所中常見的格子間(Cubicle)類似,每個 VirtualCube 都提供了一致的物理環(huán)境和設備配置:與會者正前方安裝有6個 Azure Kinect RGBD 攝像頭,以捕捉真人的圖像和眼神等動作;在與會者的正面和左右兩側還各有一個大尺寸的顯示屏,以創(chuàng)造出身臨其境的參會感。使用現(xiàn)有的、標準化的硬件能夠大大簡化用戶設備校準的工作量,從而實現(xiàn) 3D 視頻系統(tǒng)的快速部署和應用。

多人、多場景,任意組合。作為在線視頻會議的基礎構建,VirtualCube 的虛擬會議環(huán)境可由多個空間(Cube)按照不同的布局組成,以支持不同的會議場景,例如兩人的面對面會議、兩人并排會議,以及多人的圓桌會議等。

實時、高質量渲染真人圖像。VirtualCube 可以捕捉到參與者的各種細微變化,包括人的皮膚顏色、紋理,面部或衣服上的反射光澤等,并實時渲染生成真人大小的 3D 形象,顯示在遠程與會者的屏幕中。而且虛擬會議環(huán)境的背景也可以根據用戶的需求自由選擇。

2V-Cube View和V-Cube Assembly算法雙劍合璧,沉浸式會議體驗不再是難題

其實業(yè)界對 3D 視頻會議的研究從未間斷過。早在2000年,就有人曾提出過與類似混合現(xiàn)實技術有關的暢想?;谶@個設想,科研人員一直在探索如何將視頻會議以更逼真、更自然的方式呈現(xiàn),期間也出現(xiàn)了不同的技術路線和解決方案,但都沒有達到理想的效果。對此,微軟亞洲研究院主管研究員張譯中和楊蛟龍表示,過往的研究仍然有很多沒有解決的問題:首先,在真實環(huán)境下,無論放置怎樣的單目攝像設備,即使圖像質量再高,與會者也很難形成自然的眼神交流,特別是多人會議的情況;其次,很多研究針對特定的會議場景進行優(yōu)化,如兩個人面對面的會議或三人的圓桌會議,很難支持不同的會議設置;第三,雖然在影視界我們能夠看到一些逼真的虛擬人,但那是需要專業(yè)的技術和影視團隊長時間打磨和優(yōu)化才能實現(xiàn)的,仍然需要一定的手工勞動,目前無法進行實時捕捉和實時渲染。

為此,微軟亞洲研究院提出了 V-Cube View 和 V-Cube Assembly 兩大全新算法,在 VirtualCube 中實現(xiàn)了自動捕捉參與者的手勢動作和眼神變化,實時渲染形成高保真圖像,讓參與者在虛擬會議中體驗到真實會議的氛圍。

“兩個人在交談且相互注視對方時,對方看到的自己就相當于在自己眼睛的位置放置一個攝像頭。但屏幕和攝像頭的位置存在高低差,所以當一方注視屏幕中對方的眼睛時,攝像頭捕捉到的眼神就會偏離。因此在 VirtualCube 中,我們在與會者正前方的屏幕邊緣放置了六個攝像頭,通過 V-Cube View 算法合成正確的視點圖像,并利用 V-Cube Assembly 確定正確的相對位置,進而給與會者一個沉浸式的會議體驗”,張譯中介紹道。

基于深度學習的 V-Cube View 算法,通過 VirtualCube 中的六個攝像頭的 RGBD 圖像作為輸入,實時渲染任意目標視點下人的高保真視頻。這里的技術挑戰(zhàn)是如何同時做到高保真和實時。對此,微軟亞洲研究院主管研究員楊蛟龍解釋道:“實時渲染高保真的人像,特別是高保真的人臉一直是個具有挑戰(zhàn)性的研究課題。傳統(tǒng)的三維重建和紋理貼圖的做法雖然可以做到實時繪制,卻無法重現(xiàn)出真實人臉復雜的材質和在不同視點下外觀的變化。為此我們提出了一種新的 Lumi-Net 渲染方法,其核心思想是利用重構的三維幾何作為參考來實現(xiàn)一個四維光場的實時渲染,并結合神經網絡進行圖像增強,從而提高了渲染的質量,特別是人臉區(qū)域的高保真度?!?/p>

具體而言,V-Cube View 算法分為三步進行。首先,研究員設計了一個神經網絡來快速求解目標視點深度圖作為人體的幾何參考(geometry proxy)。然后,算法在給定的幾何參考下將獲取的多視角 RGB 圖像(即光線)進行融合,實現(xiàn)繪制。在這一步中,研究員受傳統(tǒng)的非結構化流明圖(Unstructured Lumigraph)方法啟發(fā),將輸入光線與目標像素光線的方向和深度差異作為先驗,通過神經網絡學習最合適的融合權重。最后,為了進一步提升繪制質量,研究員們使用了神經網絡對上一步的繪制結果進行圖像增強。整個算法實現(xiàn)了端到端的訓練,并在訓練過程中引入了感知損失函數及對抗學習技術,使得算法可以自動學習出最優(yōu)的神經網絡,實現(xiàn)高保真的繪制。而且為了保證繪制的實時性,算法的前兩步都在低分辨率圖像上執(zhí)行,這樣可以在不損失太多精度的情況下大大降低所需計算量。經過精心設計和優(yōu)化的 V-Cube View 算法,將實時的三維人物渲染質量提升到了一個新的高度。

另外,為了讓 VirtualCube 的使用者擁有和線下交流同樣的體驗,在將與會者映射到虛擬環(huán)境時,系統(tǒng)還要考慮他們之間的相對位置關系,這時 V-Cube Assembly 算法就發(fā)揮了重要的作用?!霸谡麄€虛擬會議環(huán)境中,V-Cube Assembly 可以被定義為全局坐標系統(tǒng),單個的 VirtualCube 則為局部坐標系統(tǒng)。全局坐標系與局部坐標系之間的正確 3D 幾何變化,對在視頻顯示器上正確呈現(xiàn)遠程與會者的圖像至關重要”楊蛟龍介紹。

研究員們首先會在 VirtualCube 中捕捉與會者的 3D 幾何體,形成局部坐標系,然后將這些局部坐標系的 3D 幾何體數據,投射到全局坐標系,經過 V-Cube Assembly 處理,在全局虛擬會議環(huán)境中確定每個 VirtualCube 參與者正確的相對位置,最后再將全局 3D 幾何體轉換為 VirtualCube 的局部坐標系,影射到 VirtualCube 的屏幕上。

3拋磚引玉,暢想未來辦公無限可能

VirtualCube 給 3D 視頻會議系統(tǒng)提供了一種全新的思路。無論從算法設計、端到端設備部署還是工程調試上,VirtualCube 都證明了利用現(xiàn)有的普通硬件設備就可以實現(xiàn)沉浸式的 3D 視頻會議體驗。

除了讓與會者“共享”同一個物理空間外,研究員們還在探索利用 VirtualCube 系統(tǒng)滿足遠程辦公中的更多協(xié)作需求。例如,研究員們展示了這樣一種場景:在協(xié)同工作時,兩位與會者及其電腦桌面都將是視頻會議的一部分,因此與會者并排而坐,并且跨屏幕傳遞自己桌面上的文檔和應用程序會讓遠程協(xié)作更加方便。

隨著技術的不斷精進,未來,大家或許都可以實現(xiàn)身隔萬里,卻能親臨其境一起辦公,自然溝通的遙在體驗,而這將極大地提高混合辦公的效率。微軟亞洲研究院的研究員們也希望 VirtualCube 可以成為一顆探索的種子,給更多研究人員帶來啟發(fā),在大家共同的努力下,找到更好的虛擬空間交互形式,打開未來辦公的更多可能。

原文標題:遠在萬里也像近在咫尺般的3D會議是什么體驗?

文章出處:【微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6741

    瀏覽量

    107876
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115089
  • 視頻會議系統(tǒng)

    關注

    2

    文章

    51

    瀏覽量

    18287

原文標題:遠在萬里也像近在咫尺般的3D會議是什么體驗?

文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Dante數字化會議系統(tǒng)、分布式視頻系統(tǒng)、“AI”人工智能在會議運維中的應用

    Dante數字化會議系統(tǒng)、分布式視頻系統(tǒng)、“AI”人工智能在會議運維中的應用
    的頭像 發(fā)表于 02-08 14:19 ?1407次閱讀

    索尼FCB-EV9520L相機模塊與CM2002V編碼板在視頻會議系統(tǒng)中的技術協(xié)同與視覺優(yōu)化

    視頻會議系統(tǒng)的核心在于提供清晰、穩(wěn)定且自然的視覺交流體驗。索尼FCB-EV9520L相機模塊與CM2002V主控板的組合,為這一需求提供了技術解決方案。這一組合注重實際功能,通過硬件與軟件的協(xié)同
    的頭像 發(fā)表于 11-18 09:56 ?314次閱讀

    SDI編碼板CM2001S與CM8236KB:重構專業(yè)視頻會議的畫質與實時性標準

    在遠程協(xié)作成為常態(tài)的今天,視頻會議系統(tǒng)已從"可選項"升級為企業(yè)運營的"核心基礎設施",而前端音視頻采集與編碼模塊的性能直接影響了會議體驗的專業(yè)度。SDI編碼板CM2001S與攝像模組CM8236KB
    的頭像 發(fā)表于 10-22 16:18 ?446次閱讀

    分布式智能會議系統(tǒng):解鎖高效會議協(xié)作新范式!

    會議室也叫多媒體會議室或多功能會議廳,是舉行會議的主要場所, 能夠滿足人與人、部門與部門甚至是國與國之間的協(xié)作和溝通平臺。而會議系統(tǒng)
    的頭像 發(fā)表于 10-13 10:53 ?511次閱讀
    分布式智能<b class='flag-5'>會議系統(tǒng)</b>:解鎖高效<b class='flag-5'>會議</b>協(xié)作新范式!

    季豐電子邀您相約2025國際3D視覺感知與應用大會

    9月20日 - 21日,國際3D視覺感知與應用大會將在蘇州太湖國際會議中心盛大啟幕,大會議題涵蓋3D成像與測量、3D視覺、
    的頭像 發(fā)表于 09-08 15:03 ?1060次閱讀

    高精度云臺馬達驅動技術:以零延遲響應與流暢軌跡達成會議攝像機目標高效跟蹤

    在當今數字化辦公的時代,視頻會議成為了企業(yè)溝通協(xié)作的重要方式。會議攝像機作為視頻會議的核心設備之一,其性能的優(yōu)劣直接影響著會議的質量和效果。
    的頭像 發(fā)表于 08-04 17:58 ?727次閱讀

    SIP 廣播對講與華為視頻會議融合解決方案

    SIP 廣播對講與華為視頻會議融合解決方案 SIP 廣播對講與華為視頻會議融合解決方案,是基于 SIP 協(xié)議將廣播對講系統(tǒng)與華為視頻會議系統(tǒng)進行整合,實現(xiàn)通信資源共享與業(yè)務流程聯(lián)動,可
    發(fā)表于 07-12 10:57

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】視頻會議場景下的 AI 應用(電子云臺 EPTZ、人像居中 / 追蹤、畫中畫)

      近幾年由于各種原因,很多的會議都轉到了線上,各種視頻會議軟件用戶也都呈幾何倍數增長。   視頻會議場景下,對于音視頻處理都有一定要求,AI 時代下,人們已經不僅僅滿足于聽的到,看的
    發(fā)表于 07-09 20:56

    炬力芯片方案:專業(yè)視頻信號轉換UVC轉HDMI解決方案,支持大疆Pocket3

    二、基礎性能與適用場景在 USB 2.0 環(huán)境下,炬力 AM8271D 芯片方案可確保上述設備實現(xiàn)穩(wěn)定的視頻轉換,適配多種實用場景: · 會議系統(tǒng):支持網絡攝像頭信號投屏,提升遠程會議
    發(fā)表于 07-04 17:08

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    索尼FCB-CR8530+一體化機芯控制板:引領視頻會議的“超清革命”

    “硬件+控制”的協(xié)同創(chuàng)新,為視頻會議系統(tǒng)注入革命性動能。這一組合不僅突破了傳統(tǒng)設備的性能邊界,更通過場景化技術融合,重新定義了“零距離溝通”的數字化體驗。 一、技術融合:從“超清捕捉”到“無損傳輸”的端到端升級 索尼FCB-C
    的頭像 發(fā)表于 05-12 15:25 ?714次閱讀

    基于RK3588的分體式視頻會議終端應用解決方案

    混合辦公時代,遠程辦公和在線協(xié)作成為企業(yè)內外部溝通的重要方式。傳統(tǒng)的會議解決方案難以滿足現(xiàn)代企業(yè)對音視頻質量和靈活性的雙重需求。分體式視頻會議
    的頭像 發(fā)表于 04-24 17:25 ?821次閱讀
    基于RK3588的分體式<b class='flag-5'>視頻會議</b>終端應用解決方案

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢,本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?2451次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    降本增效新路徑!華為云 Flexus 云會議打破距離限制、革新會議體驗

    在云計算技術持續(xù)進步以及企業(yè)轉型對降本增效的迫切需求雙重推動下,國內視頻會議領域正歷經深刻變革,逐步從傳統(tǒng)視頻會議系統(tǒng)邁向云會議時代。相較于傳統(tǒng)模式,云會議憑借其輕資產、易維護、便捷擴
    的頭像 發(fā)表于 03-13 10:33 ?3617次閱讀
    降本增效新路徑!華為云 Flexus 云<b class='flag-5'>會議</b>打破距離限制、革新<b class='flag-5'>會議</b>體驗

    英倫科技在光場裸眼3D顯示技術領域取得的成就和未來發(fā)展方向

    英倫科技將通過技術創(chuàng)新和應用實踐,推動整個裸眼3D顯示行業(yè)的發(fā)展。通過與行業(yè)內外的合作伙伴建立緊密的合作關系,英倫科技將共同推動裸眼3D技術在更多領域的應用和發(fā)展,為人們的生活帶來更多
    的頭像 發(fā)表于 03-13 10:24 ?37次閱讀
    英倫科技在光場裸眼<b class='flag-5'>3D</b>顯示技術領域取得的成就和<b class='flag-5'>未來</b>發(fā)展方向