91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種讓機(jī)器人能夠與人們遞接物體的人機(jī)交互方法

NVIDIA英偉達(dá) ? 來源:英偉達(dá)NVIDIA中國 ? 2020-04-29 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在倉庫與家庭場(chǎng)景中,為了進(jìn)一步打造出能夠與人類進(jìn)行安全、有效合作的機(jī)器人,NVIDIA 西雅圖 AI 機(jī)器人研究實(shí)驗(yàn)室(Seattle AI Robotics Research Lab)的研究人員,開發(fā)出了一種讓機(jī)器人能夠與人們遞接物體的人機(jī)交互方法。

該系統(tǒng)目前還處于概念驗(yàn)證階段。與以往方法相比,這個(gè)方法可以實(shí)現(xiàn)更流暢的遞接,進(jìn)而幫助倉庫機(jī)器人,甚至廚房助手機(jī)器人更好地進(jìn)行人機(jī)交互。

解決這個(gè)問題的關(guān)鍵在于,需要開發(fā)一套感知系統(tǒng)來精確識(shí)別手和遞接物體的各種姿態(tài)。在遞接物體時(shí),人們可能正在專注于其他事情,手和物體通常會(huì)相互遮擋。為了解決這個(gè)問題,研究團(tuán)隊(duì)將該方法分成了多個(gè)階段。

首先,該團(tuán)隊(duì)定義了一組握持動(dòng)作,這組動(dòng)作描述了人手進(jìn)行遞接時(shí)握持物體的方式。

研究人員在其論文中解釋道:“當(dāng)用手握住一個(gè)物體時(shí),手的姿勢(shì)可分為打開手掌、捏住底部、捏住頂部、捏住側(cè)面或拿起。如果手中沒有任何物體,那么可能是在等待機(jī)器人遞交物體或者未發(fā)生這個(gè)動(dòng)作?!?/p>

然后他們?cè)邳c(diǎn)云上訓(xùn)練了一個(gè)深層神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)人類的握持類別。研究人員使用 Microsoft Azure Kinect RGBD 攝像頭創(chuàng)建了一個(gè)數(shù)據(jù)集,這組數(shù)據(jù)集包含了 8 個(gè)實(shí)驗(yàn)對(duì)象的不同手形和手勢(shì)。

研究人員表示:“我們向?qū)嶒?yàn)對(duì)象展示了一張用手握持物體的圖片,接著記錄實(shí)驗(yàn)對(duì)象執(zhí)行相似動(dòng)作時(shí)的姿勢(shì),記錄時(shí)間為 20 至 60 秒,隨后在整個(gè)圖像序列中標(biāo)出相應(yīng)的人類握持類別。在記錄期間,實(shí)驗(yàn)對(duì)象的身體和手可以移動(dòng)到不同的位置,以使攝像頭的視角多樣化。我們分別記錄了每名實(shí)驗(yàn)對(duì)象的左手和右手,整個(gè)數(shù)據(jù)集總共包含 151551 張圖像?!?/p>

5 種人類握持類型與2種空手類型涵蓋了人們所習(xí)慣的各種物體握持方式。研究人員將這些動(dòng)作與機(jī)器人的各種典型握持方向相關(guān)聯(lián),最大程度上減少了遞接過程中人們的負(fù)擔(dān)(以坐標(biāo)系統(tǒng)和黃色箭頭表示)。

在下一階段,研究人員根據(jù)人類的握持動(dòng)作調(diào)整了機(jī)器人的握持方向。

鑒于 PointNet ++ 架構(gòu)在許多機(jī)器人應(yīng)用上都取得了極佳效果(如無標(biāo)記遠(yuǎn)程操作系統(tǒng)和握持生成等),因此為了完成這項(xiàng)任務(wù),研究人員使用該架構(gòu)訓(xùn)練人類握持分類網(wǎng)絡(luò)。

研究人員表示:“手的周圍分布著點(diǎn)云,該網(wǎng)絡(luò)可以根據(jù)定義的握持類別對(duì)手的動(dòng)作進(jìn)行分類。定義的握持類別也可以被用于進(jìn)一步的機(jī)器人握持動(dòng)作設(shè)計(jì)?!?/p>

遞接框架概述。該框架采用以手部檢測(cè)為中心的點(diǎn)云,然后使用基于 PointNet ++ 的模型,根據(jù) 7 種握持類別對(duì)手的動(dòng)作進(jìn)行分類。這七種握持類別涵蓋了人們所習(xí)慣的各種物體握持方式。然后,該任務(wù)模型據(jù)此調(diào)整機(jī)器人握持動(dòng)作的設(shè)計(jì)。

在該步驟中,團(tuán)隊(duì)為機(jī)器人設(shè)計(jì)了典型的握持方向,減少了機(jī)器人抓住人手的可能性,使機(jī)器人的運(yùn)動(dòng)和軌跡盡可能自然。

研究人員使用一個(gè)內(nèi)置 CUDA 10.2 和 PyTorch 框架的 NVIDIA TITAN X GPU 對(duì)該系統(tǒng)進(jìn)行了訓(xùn)練,并通過 1 個(gè) NVIDIA RTX 2080 Ti GPU 完成了測(cè)試。

研究人員總結(jié)道:“與兩種基礎(chǔ)方法相比,這種方法能夠不斷提高握持的成功率,縮短總執(zhí)行時(shí)間和試驗(yàn)時(shí)間。這證明了該方法的有效性和可靠性。”

(a)人手握持分類的準(zhǔn)確性。(b)人類手部狀態(tài)分類和 PoseCNN 之間的物體遺漏檢出率比較。在很多情況下,手會(huì)遮擋物體,因此很難獲得準(zhǔn)確的物體姿態(tài)估計(jì)值。

在未來的測(cè)試中,研究人員計(jì)劃訓(xùn)練該系統(tǒng)掌握更多握持類型,進(jìn)一步增強(qiáng)他們的數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1288

    瀏覽量

    57948
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31098

    瀏覽量

    222383
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26208

原文標(biāo)題:NVIDIA 研究人員變身機(jī)器人 AI 訓(xùn)練師 ,改善人機(jī)交互

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    破解“人機(jī)共舞”難題,利爾達(dá)UWB方案為機(jī)器人賦予“空間直覺”

    地“跟住”我們、“理解”我們?目前,業(yè)界焦點(diǎn)正從“機(jī)器人動(dòng)起來”轉(zhuǎn)向“人機(jī)更好地協(xié)同共生”。在復(fù)雜多變的環(huán)境下實(shí)現(xiàn)對(duì)安全、精準(zhǔn)的自主跟
    的頭像 發(fā)表于 02-28 11:53 ?219次閱讀
    破解“<b class='flag-5'>人機(jī)</b>共舞”難題,利爾達(dá)UWB方案為<b class='flag-5'>機(jī)器人</b>賦予“空間直覺”

    眼電EOG人機(jī)交互會(huì)是未來交互一種主流嗎?

    HUIYING基于眼電的人機(jī)交互系統(tǒng)概述基于眼電(EOG)的人機(jī)交互系統(tǒng)(HMI)的研發(fā)源于對(duì)非侵入式、高精度且持久可穿戴的醫(yī)療輔助設(shè)備的需求。傳統(tǒng)人機(jī)交互方式如觸摸屏、操縱桿或基于肌電(EMG
    的頭像 發(fā)表于 11-07 18:01 ?5919次閱讀
    眼電EOG<b class='flag-5'>人機(jī)交互</b>會(huì)是未來<b class='flag-5'>交互</b>的<b class='flag-5'>一種</b>主流嗎?

    重構(gòu)未來自適應(yīng)人機(jī)交互的創(chuàng)新技術(shù)

    人機(jī)交互的概念可以追溯到工業(yè)革命時(shí)期,在當(dāng)時(shí)機(jī)器開始取代人類勞動(dòng)。然而,直到20世紀(jì)中葉,人機(jī)交互領(lǐng)域才受到廣泛關(guān)注。人機(jī)界面(HMI)是
    的頭像 發(fā)表于 10-31 16:30 ?1288次閱讀
    重構(gòu)未來自適應(yīng)<b class='flag-5'>人機(jī)交互</b>的創(chuàng)新技術(shù)

    大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬真人互動(dòng)”?玩具讀懂你的情緒

    ,全方位重構(gòu)了智能硬件的人機(jī)交互范式,為行業(yè)提供了從技術(shù)底層到商業(yè)應(yīng)用的完整路徑。 ? 從人機(jī)交互的技術(shù)演進(jìn)邏輯來看,經(jīng)歷了文本交互(CUI)、圖像交互(GUI)到自然語言多模態(tài)
    的頭像 發(fā)表于 10-31 09:21 ?6453次閱讀
    大模型驅(qū)動(dòng)下<b class='flag-5'>的人機(jī)交互</b>革命,“超擬真人互動(dòng)”?<b class='flag-5'>讓</b>玩具讀懂你的情緒

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    ,已經(jīng)成為機(jī)器人開發(fā)者不容忽視的核心處理器。而米爾電子的MYD-LR3576開發(fā)板,則以其豐富的接口、穩(wěn)定的性能和成熟的軟硬件支持,為快速原型驗(yàn)證和產(chǎn)品開發(fā)提供了絕佳的平臺(tái)。如果您正在尋找能夠同時(shí)處理復(fù)雜視覺任務(wù)和豐富
    發(fā)表于 10-29 16:41

    機(jī)器人看點(diǎn):宇樹新專利可提升機(jī)器人表演效果 蔚來資本入股具身智能公司原力靈機(jī) 美信科技新設(shè)機(jī)器人

    給大家?guī)?b class='flag-5'>一些機(jī)器人相關(guān)訊息: 宇樹新專利可提升機(jī)器人表演效果 據(jù)企查查APP信息顯示,宇樹科技股份有限公司“一種基于數(shù)字孿生的機(jī)器人運(yùn)動(dòng)控
    的頭像 發(fā)表于 09-01 16:55 ?2003次閱讀

    人機(jī)交互:連接人類與數(shù)字世界的橋梁

    人機(jī)交互(Human-Computer Interaction, HCI)是研究與計(jì)算機(jī)系統(tǒng)之間信息交流方式的學(xué)科,旨在優(yōu)化用戶體驗(yàn),提高交互效率。隨著人工智能、虛擬現(xiàn)實(shí)(VR)和物聯(lián)網(wǎng)(IoT
    的頭像 發(fā)表于 08-11 15:21 ?2087次閱讀

    文了解人形機(jī)器人

    人形機(jī)器人是仿照人類形態(tài)設(shè)計(jì)的通用雙足機(jī)器人,旨在與人起工作以提高生產(chǎn)力。它們能夠學(xué)習(xí)和執(zhí)行各種任務(wù),例如抓取
    的頭像 發(fā)表于 06-13 09:42 ?2037次閱讀

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)語音信號(hào)進(jìn)行分析、處理和轉(zhuǎn)換。在實(shí)時(shí)語音交互場(chǎng)景中,無論是
    發(fā)表于 05-28 11:36

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    校正,消除定位誤差的積累,確保機(jī)器人始終能夠準(zhǔn)確知道自己在機(jī)場(chǎng)中的位置。 導(dǎo)航系統(tǒng) 路徑規(guī)劃 :當(dāng)旅客向機(jī)器人提出目的地請(qǐng)求后,導(dǎo)航系統(tǒng)會(huì)根據(jù)機(jī)器人當(dāng)前的位置和目標(biāo)地點(diǎn),在機(jī)場(chǎng)地圖上
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的結(jié)果) 最后有個(gè)優(yōu)化算法(改進(jìn)模型它越來越好) 甚至還有電路的搭建,比如電源電路,電機(jī)H橋電路 還有編碼器的PID閉環(huán),麥克納姆輪的運(yùn)動(dòng)分解,人機(jī)交互(蜂鳴器和畫面顯示)都有涉及 總的來說 寫
    發(fā)表于 04-30 01:05

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    當(dāng)你的智能音箱能在嘈雜的客廳“聽懂”指令、AI 耳機(jī)能在地鐵的轟鳴聲中精準(zhǔn)捕捉你的語音、AI硬件能辨識(shí)自然界中的各類聲音事件、機(jī)器人能通過聲紋與笑聲識(shí)別情緒時(shí),場(chǎng)“聲音智能”的革命正悄然重塑
    的頭像 發(fā)表于 04-14 13:50 ?1352次閱讀

    具身智能工業(yè)機(jī)器人人機(jī)交互設(shè)計(jì):重新定義人機(jī)協(xié)作新體驗(yàn)

    在工業(yè) 4.0 時(shí)代,機(jī)器人不再是冰冷的機(jī)械臂,而是成為與人類協(xié)同創(chuàng)造價(jià)值的 “智能伙伴”。富唯智能憑借具身智能工業(yè)機(jī)器人人機(jī)交互設(shè)計(jì),突破傳統(tǒng)操作界面的局限,通過自然語言、手勢(shì)識(shí)別、力控反饋等多模態(tài)
    的頭像 發(fā)表于 04-07 15:02 ?1237次閱讀

    EtherCAT科普系列(4):EtherCAT技術(shù)在人形機(jī)器人靈巧手領(lǐng)域應(yīng)用

    人形機(jī)器人又稱仿生機(jī)器人,是一種模仿人類外形的機(jī)器人,除具備人形和模擬人類動(dòng)作外還兼具智慧化和可交互性等特點(diǎn)。人形
    的頭像 發(fā)表于 04-02 16:56 ?3314次閱讀
    EtherCAT科普系列(4):EtherCAT技術(shù)在人形<b class='flag-5'>機(jī)器人</b>靈巧手領(lǐng)域應(yīng)用

    愛普生XV7021BB陀螺儀傳感器在人機(jī)交互中的應(yīng)用

    超低溫度漂移及石英晶體物理架構(gòu),重新定義了人機(jī)交互的精準(zhǔn)邊界,為虛擬現(xiàn)實(shí)(VR)、智能穿戴、工業(yè)協(xié)作機(jī)器人等場(chǎng)景注入獨(dú)特優(yōu)勢(shì)。愛普生XV7021BB陀螺儀傳感器在人機(jī)
    的頭像 發(fā)表于 04-01 14:13 ?1156次閱讀
    愛普生XV7021BB陀螺儀傳感器在<b class='flag-5'>人機(jī)交互</b>中的應(yīng)用