91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook研究人員利用視覺和音頻探索人工智能技術(shù)

lhl545545 ? 來源:比特網(wǎng) ? 作者:Yu ? 2021-01-12 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

平面布置圖對于可視化空間、規(guī)劃路線和溝通建筑設(shè)計非常有用。例如,一個進入新建筑的機器人可以使用平面圖快速感知總體布局。創(chuàng)建平面圖通常需要一個完整的布局,這樣3D傳感器和攝像機就可以捕捉到整個空間。

1月11日消息,據(jù)外媒報道,近日,來自Facebook、德克薩斯大學奧斯汀分校和卡內(nèi)基梅隆大學的研究人員正在探索一種人工智能技術(shù),利用視覺和音頻,從一個短視頻剪輯中重建一個平面圖。

研究人員斷言,音頻提供了空間和語義信號,補充了圖像的映射能力。他們說,這是因為聲音天生是由物體的幾何形狀所驅(qū)動的。聲音從表面反射回來,揭示了房間的形狀,遠遠超出了相機的視野。從遠處聽到的聲音,甚至是多個房間之外的聲音,可以揭示自由空間的存在,聲音物體可能存在。此外,從不同方向聽到的聲音暴露了基于這些聲音所代表的活動或事物的布局。例如,淋浴的聲音可能暗示著浴室的方向,而微波爐的聲音則暗示著廚房的方向。

研究人員的方法被稱為AV-Map,旨在將帶有多通道音頻的短視頻轉(zhuǎn)換成2D樓層平面圖。機器學習模型利用音頻和視覺數(shù)據(jù)序列來推理樓層平面圖的結(jié)構(gòu)和語義,最終使用解碼組件融合音頻和視頻信息。AV-Map生成的平面圖大大超出了視頻中直接可見的區(qū)域,顯示了劃分為離散語義房間標簽(如家庭房間和廚房)的自由空間和被占用區(qū)域。

該團隊在來自Matternet3D和SoundSpaces數(shù)據(jù)集的數(shù)字環(huán)境中試驗了兩種設(shè)置,即主動和被動。在第一個實驗中,使用一個虛擬攝像機在模型房屋的房間內(nèi)移動時發(fā)出一種已知的聲音。在第二種情況下,只依賴家中物體或人自然發(fā)出的聲音。

研究人員表示,在未來的工作中,將計劃考慮擴展多層平面圖,并將繪圖想法與機器人連接起來,主動控制攝像頭。
責任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31109

    瀏覽量

    222406
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    58965
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265588
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    融合多場耦合效應:生成式人工智能技術(shù)演進及其在航空發(fā)動機復雜工程系統(tǒng)中的賦能機制研究

    人工智能技術(shù)正經(jīng)歷著從感知智能向生成智能、再向代理智能與物理智能演進的深刻變革。在這一進程中,生成式AI
    的頭像 發(fā)表于 02-26 10:07 ?422次閱讀
    融合多場耦合效應:生成式<b class='flag-5'>人工智能技術(shù)</b>演進及其在航空發(fā)動機復雜工程系統(tǒng)中的賦能機制<b class='flag-5'>研究</b>

    成都華微出席人工智能技術(shù)創(chuàng)新能力供需對接活動

    近日,成都華微電子科技股份有限公司受邀參加了由成都市科技局主辦,四川省人工智能行業(yè)協(xié)會、四川省人工智能研究院承辦的“科創(chuàng)天府·智匯蓉城”成都市人工智能技術(shù)創(chuàng)新能力供需對接活動。作為西南
    的頭像 發(fā)表于 12-10 16:17 ?572次閱讀

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    (Agentic AI)技術(shù)的行業(yè)影響,以及未來跨界合作的前景。此次圓桌討論不僅展現(xiàn)了雙方的戰(zhàn)略協(xié)同,以及他們在開發(fā)市場領(lǐng)先解決方案方面的共同努力,也勾勒出人工智能是如何驅(qū)動工程、電信、制藥等行業(yè)變革的新藍圖。
    的頭像 發(fā)表于 11-30 09:48 ?419次閱讀

    【艾為視角】保證大方向正確!利用人工智能解決一線實際問題

    改變作業(yè)模式人工智能的核心在于應用,研究海量重復性活動的智能化自動化,提升人的效率和輔助人的工作。在人工智能和自動化推動過程中,要關(guān)注交付服務流程以及
    的頭像 發(fā)表于 09-26 19:03 ?702次閱讀
    【艾為視角】保證大方向正確!<b class='flag-5'>利用人工智能</b>解決一線實際問題

    航天宏圖人工智能技術(shù)深度賦能社會治理現(xiàn)代化

    航天宏圖多年來持續(xù)重點投入技術(shù)研發(fā),尤其專注人工智能深度探索。航天宏圖多以自主研發(fā)“天權(quán)大模型” 是一款基于多模態(tài)大模型技術(shù)的遙感解譯專用AI大模型,它以
    的頭像 發(fā)表于 09-06 10:35 ?1176次閱讀
    航天宏圖<b class='flag-5'>人工智能技術(shù)</b>深度賦能社會治理現(xiàn)代化

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    中科創(chuàng)達旗下創(chuàng)通聯(lián)達即將舉辦RUBIK Pi 3端側(cè)人工智能技術(shù)巡演

    人工智能技術(shù)加速向端側(cè)滲透,驅(qū)動產(chǎn)業(yè)智能化轉(zhuǎn)型的戰(zhàn)略機遇期,全球領(lǐng)先的智能物聯(lián)網(wǎng)產(chǎn)品和解決方案提供商Thundercomm(創(chuàng)通聯(lián)達)將于2025年9月至10月期間,攜手Atlantik
    的頭像 發(fā)表于 08-15 15:56 ?1224次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能
    發(fā)表于 08-07 14:23

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術(shù)迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機視覺到自然語言處理,從自動駕駛到醫(yī)療診斷,AI的應用場景不斷擴展,推動社會向
    的頭像 發(fā)表于 07-16 15:01 ?1921次閱讀

    CES Asia 2025同期低空智能感知與空域管理技術(shù)論壇即將啟幕

    安全、UTM/UAM管理系統(tǒng)發(fā)展與互操作性、人工智能在空域動態(tài)管理中的應用等前沿議題,將匯聚全球頂尖專家、企業(yè)代表,共同探索低空領(lǐng)域的未來發(fā)展方向。 低空通信導航監(jiān)視技術(shù)作為低空飛行的關(guān)鍵支撐
    發(fā)表于 07-10 10:16

    最新人工智能硬件培訓AI 基礎(chǔ)入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術(shù)
    發(fā)表于 07-04 11:10

    中科曙光亮相2025全球人工智能技術(shù)大會

    此前,6月7日-8日,2025全球人工智能技術(shù)大會(GAITC 2025)在杭州舉辦。中科曙光攜全棧AI基礎(chǔ)設(shè)施多項核心成果深度參與本次大會,并攜手中國人工智能學會成功舉辦“大模型時代的AI基礎(chǔ)設(shè)施”專題活動,全方位展示在智能
    的頭像 發(fā)表于 06-10 16:19 ?1293次閱讀

    傳統(tǒng)工廠如何利用人工智能技術(shù)實現(xiàn)運籌優(yōu)化與效率提升

    要素拓撲關(guān)系的深度重構(gòu)。本文將結(jié)合西井實踐與觀點,探討傳統(tǒng)工廠如何利用人工智能技術(shù)實現(xiàn)運籌優(yōu)化與效率提升。
    的頭像 發(fā)表于 03-18 15:39 ?1157次閱讀

    人工智能視覺識別技術(shù)的應用領(lǐng)域及場景

    人工智能視覺識別技術(shù)的應用領(lǐng)域及場景
    的頭像 發(fā)表于 03-14 11:41 ?2988次閱讀