91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

具備情境理解能力的個(gè)人助理機(jī)器人研究進(jìn)展

Arvinhw ? 來源:DevicePlus ? 作者:DevicePlus ? 2023-02-27 10:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這篇文章來源于DevicePlus.com英語網(wǎng)站的翻譯稿。

poYBAGPzJJKAdp6QAAES5vu24a0064.jpg

盡管語音交互正像觸摸屏那樣為數(shù)字接口帶來重大變革,但語言處理有其局限性。特別是,數(shù)字語言處理僅限于有限且特定的指令,尚未具備人類對(duì)話中的情境理解能力。

在相關(guān)領(lǐng)域的前沿研究中,麻省理工學(xué)院(MIT)計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員致力于構(gòu)建一個(gè)更好的處理單元,使機(jī)器人不需要循序漸進(jìn)的指令,而是可以從指令和語境中的上下文來對(duì)事物進(jìn)行推斷。

因此,“ComText”誕生了,這是一個(gè)處理系統(tǒng),代表“上下文中的指令”,使機(jī)器人可以理解聊天背景信息,如語言線索和周圍環(huán)境。

為什么上下文很重要?

在自然語言的使用中,經(jīng)常說類似于“把它撿起來”這樣的話。雖然人類能夠根據(jù)情境來理解這里的“它”指的是什么,但如今的數(shù)字化助手或機(jī)器人需要更多的信息才能夠理解,因?yàn)橹噶钊狈μ囟ㄐ浴?/p>

MIT 解釋說:“撿起它意味著能夠看到并識(shí)別物體,理解指令,識(shí)別出問題中的“它”指的是你放下的工具,回到你放下手中工具的記憶中,并將你放下的工具與其他類似形狀和尺寸的工具區(qū)分開來。

目前,像Alexa和Siri這樣的數(shù)字化助手正在徹底改變我們與科技互動(dòng)的方式,但要讓機(jī)器人個(gè)人助理不斷發(fā)展,這種對(duì)于情境的理解能力是必不可少的。

pYYBAGPzJJSAEuLpAACptCrJXJE591.jpg

ComText 的實(shí)際應(yīng)用:語言處理

ComText 的實(shí)際應(yīng)用:空間理解

挑戰(zhàn)

RAGE Frameworks的首席執(zhí)行官Venkat Srinivasan認(rèn)為這種交互的挑戰(zhàn)主要有三點(diǎn)。

首先,許多支持語音的人工智能工具,比如IBM Watson和Google AlphaGo,在處理人類語言方面存在困難,因?yàn)椤爱?dāng)前大多數(shù)應(yīng)用是將文本視為數(shù)據(jù),而不是語言”。

第二點(diǎn)是情境理解:“只有當(dāng)技術(shù)專注于語言結(jié)構(gòu),而不是像目前大多數(shù)技術(shù)所做的那樣僅僅注意文本中的單詞時(shí),才能進(jìn)行正確的情境理解?!?/p>

最后一個(gè)挑戰(zhàn)是邏輯:使用這個(gè)解決方法得出的結(jié)論,其推理之間的可追溯性。

“情境學(xué)習(xí)”的研究與發(fā)展

根據(jù)這篇研究論文,為了開發(fā)ComText,一個(gè)研究團(tuán)隊(duì)使用了“強(qiáng)化自然語言的概率模型”。

“主要貢獻(xiàn)在于告訴了我們機(jī)器人應(yīng)該像人類那樣有多種類型的記憶,” 首席研究員Andrei Barbu表示,“我們有了解決這個(gè)問題的第一個(gè)數(shù)學(xué)公式,現(xiàn)在正在探索這兩種類型的記憶是如何相互配合并發(fā)揮作用的?!?/p>

為了測(cè)試這個(gè)工具,研究者使用了一個(gè)名叫Baxter Research Robot(百特研究機(jī)器人)的雙臂人形機(jī)器人,在頻率~20Hz、分辨率1080×760的條件下,使用交叉校準(zhǔn)的Kinect 2版 RGB-D觀察工作區(qū)。配置有一個(gè)Amazon Echo Dot(亞馬遜回聲點(diǎn)),可以將語音指令轉(zhuǎn)換為文本。

為了研究該機(jī)器如何有效地對(duì)上下文線索進(jìn)行評(píng)估,要求獨(dú)立操作的人員直接指示機(jī)器人完成五項(xiàng)任務(wù),最后制作了96個(gè)用戶與機(jī)器人交互的短視頻。通過對(duì)視頻進(jìn)行分析,研究者發(fā)現(xiàn)在90.2%到94.7%的時(shí)間,推斷出的命令以“在目標(biāo)位置,對(duì)正確的物品執(zhí)行正確的操作”的方式被執(zhí)行。

發(fā)生失敗主要是由于感知錯(cuò)誤,或由于障礙物遮擋了視線,或因?yàn)槲矬w直接朝向或遠(yuǎn)離相機(jī)的移動(dòng)。

這個(gè)實(shí)驗(yàn)成功的證明了ComText從以往的語言陳述中搜集線索,并將它們與視覺觀察相結(jié)合,然后對(duì)移動(dòng)物體進(jìn)行追蹤的能力。隨著時(shí)間的推移,通過更多的交互和觀察,這些積累起來的經(jīng)驗(yàn)也會(huì)被逐漸細(xì)化。

個(gè)人助理機(jī)器人的潛在應(yīng)用

雖然關(guān)于AI倫理問題的偏見仍然存在,但ComText在發(fā)展成為具有更接近“人類交互能力”的機(jī)器人方面依然取得了重大進(jìn)展。不過,現(xiàn)實(shí)情況是,要實(shí)現(xiàn)一個(gè)能理解人類互動(dòng)細(xì)微差別全功能助手機(jī)器人,我們還有很長(zhǎng)的路要走。
首席研究員Rohan Paul 表示:“目前,我們還沒有生產(chǎn)產(chǎn)品?!?與之相對(duì)的是,他們?nèi)匀粓?jiān)持如何在機(jī)器搜集更大范圍的上下文信息并得出結(jié)論的能力方面得到提高,Paul說:“我們真正想做的是讓人類和機(jī)器人的能力相結(jié)合,一起來創(chuàng)造出更復(fù)雜的東西?!?/p>

pYYBAGPbhjqAbi1JAAAGd6_rQT0867.png

DevicePlus 編輯團(tuán)隊(duì)

設(shè)備升級(jí)版適用于所有熱愛電子和機(jī)電一體化的人。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31303

    瀏覽量

    223322
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Neway電機(jī)方案在機(jī)器人技術(shù)方面的優(yōu)勢(shì)

    Neway電機(jī)方案在機(jī)器人技術(shù)方面的優(yōu)勢(shì)Neway電機(jī)方案在機(jī)器人技術(shù)方面展現(xiàn)出顯著優(yōu)勢(shì),其通過全國產(chǎn)器件替代、高功率密度設(shè)計(jì)、多重保護(hù)功能、寬溫工作能力以及快速交付與供應(yīng)鏈穩(wěn)定性等核心特性,精準(zhǔn)
    發(fā)表于 03-30 09:39

    清華大學(xué)深圳國際研究生院:研發(fā)“鴿眼”傳感器,讓機(jī)器人感知逼近人類!

    重要性日益凸顯。然而,當(dāng)前機(jī)器人的觸覺系統(tǒng)在感知維度、分辨率和信號(hào)理解能力上仍遠(yuǎn)遜于人類,難以支撐復(fù)雜、動(dòng)態(tài)的真實(shí)場(chǎng)景任務(wù)。 近日,清華大學(xué)深圳國際研究生院丁文伯團(tuán)隊(duì)聯(lián)合多所研究機(jī)構(gòu),
    的頭像 發(fā)表于 01-20 16:09 ?910次閱讀
    清華大學(xué)深圳國際<b class='flag-5'>研究</b>生院:研發(fā)“鴿眼”傳感器,讓<b class='flag-5'>機(jī)器人</b>感知逼近人類!

    基于NVIDIA VLA模型打造通用人形機(jī)器人能力

    要讓人形機(jī)器人真正有用,它們需要具備認(rèn)知能力和移動(dòng)操作能力,涵蓋感知、規(guī)劃以及在動(dòng)態(tài)環(huán)境中的全身控制。
    的頭像 發(fā)表于 01-14 09:53 ?2061次閱讀

    稚暉君發(fā)布全球最小全身力控人形機(jī)器人,上緯啟元開啟個(gè)人機(jī)器人時(shí)代

    控人形機(jī)器人,啟元Q1在關(guān)節(jié)系統(tǒng)、整機(jī)尺寸與應(yīng)用場(chǎng)景上均實(shí)現(xiàn)了多項(xiàng)突破,將實(shí)驗(yàn)室級(jí)的人形機(jī)器人能力濃縮至背包大小的體量中。它重新定義了小型化人形機(jī)器人的可能性,旨在打造
    的頭像 發(fā)表于 12-31 16:34 ?754次閱讀

    探索RISC-V在機(jī)器人領(lǐng)域的潛力

    SLAM等輕量級(jí)算法時(shí)表現(xiàn)出了不錯(cuò)的性能,CPU占用率在可接受范圍內(nèi)。整個(gè)系統(tǒng)響應(yīng)及時(shí),證明了MUSE Pi Pro完全有能力作為小型移動(dòng)機(jī)器人的“大腦”。 四、 其他功能淺嘗 ? AI模型部署
    發(fā)表于 12-03 14:40

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運(yùn)動(dòng)控制方案

    ,MYD-LT536 具備以下突出優(yōu)勢(shì): 1. 高算力與實(shí)時(shí)性兼顧 四核 Cortex-A55 架構(gòu)可并行運(yùn)行多線程控制任務(wù),滿足多軸機(jī)器人同步控制與動(dòng)態(tài)補(bǔ)償算法的實(shí)時(shí)計(jì)算需求; T536 AMP多核
    發(fā)表于 11-14 15:48

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機(jī)器人領(lǐng)域帶來革新。米爾電子MYD-LR3576開發(fā)板實(shí)測(cè)數(shù)據(jù)顯示,在高負(fù)載下CPU占用僅34%,完美實(shí)現(xiàn)多路視覺
    發(fā)表于 10-29 16:41

    安霸前端AI SoC助力開發(fā)新一代協(xié)作機(jī)器人

    協(xié)作機(jī)器人(cobots)正在重塑我們與機(jī)器的互動(dòng)方式。它們可以在人機(jī)共享環(huán)境中安全運(yùn)行,搭載 AI 的協(xié)作機(jī)器人已廣泛應(yīng)用于制造業(yè)、物流業(yè)、醫(yī)療保健甚至家庭領(lǐng)域。但它們的作用遠(yuǎn)不止自動(dòng)化——它們是協(xié)作伙伴,能夠?qū)崟r(shí)適應(yīng)、
    的頭像 發(fā)表于 08-28 14:59 ?1928次閱讀

    工業(yè)機(jī)器人的特點(diǎn)

    的基礎(chǔ),也是三者的實(shí)現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動(dòng)化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動(dòng)化焊接線、柔性自動(dòng)化生產(chǎn)線、智能農(nóng)機(jī)、3D 打印機(jī)等領(lǐng)域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    輪式移動(dòng)機(jī)器人電機(jī)驅(qū)動(dòng)系統(tǒng)的研究與開發(fā)

    【摘 要】以嵌入式運(yùn)動(dòng)控制體系為基礎(chǔ),以移動(dòng)機(jī)器人研究對(duì)象,結(jié)合三輪結(jié)構(gòu)輪式移動(dòng)機(jī)器人,對(duì)二輪差速驅(qū)動(dòng)轉(zhuǎn)向自主移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)空間模型進(jìn)行了分析和計(jì)算,
    發(fā)表于 06-11 14:30

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)語音信號(hào)進(jìn)行分析、處理和轉(zhuǎn)換。在實(shí)時(shí)語音交互場(chǎng)景中,無論是
    發(fā)表于 05-28 11:36

    盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)

    地瓜機(jī)器人RDK X5開發(fā)套件地瓜機(jī)器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開發(fā)套件 Kria KR260機(jī)器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    負(fù)責(zé)接收旅客的語音指令,以便機(jī)器人理解旅客的需求。 環(huán)境感知與信息融合 :這些傳感器收集到的信息會(huì)進(jìn)行融合處理。例如,激光雷達(dá)提供的距離信息和攝像頭捕捉的視覺信息相結(jié)合,能讓機(jī)器人更準(zhǔn)確地識(shí)別周圍環(huán)境
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會(huì):ROS2機(jī)器人視覺與地圖構(gòu)建技術(shù) 通過對(duì)本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對(duì)機(jī)器人視覺感知和自主導(dǎo)航的核心技術(shù)有了更深入的理解。以下是我的心得體會(huì)
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的非常好的,特別是一些流程圖,很清晰的闡釋了概念 很適合作為初學(xué)者入門的引路書 還能了解很多技術(shù)和框架,破除初學(xué)者的自負(fù)困境,讓初學(xué)者知道功能是由很多開發(fā)者維護(hù)的,前人已經(jīng)為各種產(chǎn)品搭建了完善的框架。避免陷入得一個(gè)人單打獨(dú)斗的錯(cuò)覺 一直蠢蠢欲動(dòng)ros2和機(jī)器人的同學(xué),有了
    發(fā)表于 04-30 01:05