91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UC伯克利新機(jī)器人成果:靈活自由地使用工具

jmiy_worldofai ? 來源:YXQ ? 2019-04-15 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

之前我們剛剛介紹了加州大學(xué)伯克利分校 Pieter Abbeel 教授領(lǐng)導(dǎo)伯克利機(jī)器人學(xué)習(xí)實驗室(UC Berkeley's Robot Learning Lab)開發(fā)的會疊衣服的家務(wù)向機(jī)器人 BLUE,今天伯克利人工智能實驗室(BAIR)這邊也帶來了一項新的機(jī)器人科研成果——教會機(jī)器人使用工具完成任務(wù)。這篇論文的作者之一是知名青年機(jī)器學(xué)習(xí)研究員、谷歌大腦研究科學(xué)家ChelseaFinn,她目前正在BAIR做博士后。論文成果的介紹博客編譯如下。

一個有難度的目標(biāo):學(xué)習(xí)使用工具

在許多動物身上,使用工具的能力都來自于觀察學(xué)習(xí)和動手嘗試兩者的共同作用。比如,大猩猩可以通過觀察自己已經(jīng)掌握了技能的同伴學(xué)會如何用樹枝從白蟻窩里“釣”白蟻吃,人類也觀察到卷尾猴能夠把樹枝作為掃和撥的工具,把較遠(yuǎn)的食物弄到他們身邊。有人也許會提出這只不過是猴子們依葫蘆畫瓢,但這篇論文的作者們認(rèn)為使用工具的能力顯然體現(xiàn)了更為高級的智慧。

大猩猩釣白蟻

在這項新研究中作者們探索的問題是:我們能否讓機(jī)器人也擁有相似的使用工具的能力——通過觀察和自己動手實驗學(xué)會使用工具。

在執(zhí)行復(fù)雜的多物體控制任務(wù)時,有一項必須的要素是理解物理層面的因果關(guān)系,所以預(yù)測不同的物體之間會如何相互作用就非常關(guān)鍵。在之前的視覺深度強(qiáng)化學(xué)習(xí)研究(https://arxiv.org/abs/1812.00568)中,作者們已經(jīng)探究了如何在機(jī)器人與世界的無監(jiān)督交互過程中學(xué)習(xí)包含因果關(guān)系的視覺預(yù)測模型。在學(xué)習(xí)到這樣的模型之后,機(jī)器人就可以開始規(guī)劃并完成一系列簡單的任務(wù),包括疊衣服、整理物品。不過,如果考慮到使用工具的任務(wù)中更為復(fù)雜的物理交互,比如用掃帚把塵土掃進(jìn)簸箕里,非指向性的動手實驗就不夠了。

因此,考慮到動物們是如何學(xué)習(xí)的,作者們設(shè)計了一個新的算法,它可以讓機(jī)器人通過類似的模仿、互動的范式學(xué)習(xí)如何使用工具。具體來說作者們展示了,借助一組演示數(shù)據(jù)以及無監(jiān)督的動手實驗,機(jī)器人可以學(xué)會把新的物體作為工具使用,甚至可以在傳統(tǒng)工具缺失的情況下靈活使用現(xiàn)有的工具完成任務(wù)。更進(jìn)一步地,根據(jù)任務(wù)要求的不同,作者們的方法還讓機(jī)器人有能力決定是否使用當(dāng)前給定的工具。


作者們提出的方法讓機(jī)器人有能力學(xué)習(xí)如何把不同的物體當(dāng)作工具以完成用戶給定的任務(wù)(第一行圖中用黃色箭頭標(biāo)出)。任務(wù)中并沒有指定機(jī)器人必須使用給定的工具,但機(jī)器人決定使用它們。

在指導(dǎo)中學(xué)習(xí)視覺預(yù)測

從演示中學(xué)習(xí)

首先,作者們需要使用一個演示動作數(shù)據(jù)集,其中展示了各種不同的工具是如何使用的。由于最終的目標(biāo)是希望學(xué)習(xí)到一個具有多種多樣的工具使用能力的模型,作者們采集的演示動作數(shù)據(jù)也就包含了多種不同的工具和多種不同的任務(wù)。對于每一個演示,作者們都讓機(jī)器人自己的攝像頭錄制了圖像序列和動作指令。

幾個引導(dǎo)運(yùn)動的例子

通過這些數(shù)據(jù),作者們得到了一個模型,它可以提出把當(dāng)前場景內(nèi)存在的物體作為工具的運(yùn)動序列。并且,為了能夠從演示中捕捉更為豐富的行為,這個模型的輸出形式是不同動作序列的分布。

為視覺預(yù)測模型的學(xué)習(xí)收集無監(jiān)督數(shù)據(jù)

由于作者們希望機(jī)器人的行為不要局限于演示數(shù)據(jù)中出現(xiàn)的那些動作,并最終泛化到新的物體和新的情境中,他們就還需要很多不同的數(shù)據(jù)。最理想的來源當(dāng)然是由機(jī)器人自己采集,而且是通過大規(guī)??赏卣沟姆绞?。比如,作者們希望機(jī)器人能夠理解抓取姿態(tài)不好之類的小錯誤對后續(xù)的動作會有什么影響,所以他們就讓機(jī)器人從現(xiàn)有的經(jīng)驗基礎(chǔ)上繼續(xù)動手實驗、繼續(xù)收集更多的數(shù)據(jù)。

具體來說,論文作者們設(shè)計了兩種不同的數(shù)據(jù)自動采集方式:一種方式是執(zhí)行隨機(jī)的動作序列,另一種是從上一節(jié)中提到的動作序列提出模型中采樣。后一種方式中,機(jī)器人可以把工具拿起來然后在空間中隨機(jī)移動它。對于學(xué)習(xí)多物體的交互方式來說,在這一環(huán)節(jié)中學(xué)習(xí)到的經(jīng)驗非常重要。

根據(jù)日常物體和工具進(jìn)行無監(jiān)督交互學(xué)習(xí)

最終,作者們使用的數(shù)據(jù)集一共由這幾部分構(gòu)成:專家演示、機(jī)器人使用多種不同工具的無監(jiān)督實驗、以及BAIR機(jī)器人交互數(shù)據(jù)集中的數(shù)據(jù)。作者們用這些數(shù)據(jù)訓(xùn)練了一個動態(tài)模型。模型的實現(xiàn)方式是循環(huán)卷積神經(jīng)網(wǎng)絡(luò),它在每個時間步驟的輸入是前一副圖像和一個動作,輸出是一副生成的圖像。

在指導(dǎo)中學(xué)習(xí)規(guī)劃

在測試時,機(jī)器人可以使用模仿學(xué)習(xí)訓(xùn)練的模型來指導(dǎo)規(guī)劃過程,然后用預(yù)測模型來覺得哪些動作可以讓它完成目前的任務(wù)。

新任務(wù)的創(chuàng)建需要用戶給定關(guān)鍵點(diǎn)的移動。比如下圖中,我們希望機(jī)器人把地上的垃圾掃到簸箕中,就在圖中選中垃圾的中心點(diǎn),然后畫出希望的最終位置。用這種方式指定任務(wù)并不會告訴機(jī)器人如何使用工具,在有多種工具可以選的環(huán)境下甚至都沒有指明要用哪一種工具,機(jī)器人需要自己思考并規(guī)劃。

作者們使用了一個簡單的基于采樣的規(guī)劃過程,它會使用動作提議模型和圖像預(yù)測模型的輸出,并讓機(jī)器人有能力用多種不同的工具和物品完成多種不同的任務(wù)。具體來說,動作序列最初是從隨機(jī)采樣的,然后,根據(jù)圖像預(yù)測模型可以預(yù)測出每一種動作序列規(guī)劃的結(jié)果。

同一個初始場景中,針對不同動作序列的預(yù)測結(jié)果

通過選出當(dāng)前最佳的規(guī)劃并根據(jù)它生成一個分布,系統(tǒng)可以進(jìn)行反復(fù)的迭代采樣,在當(dāng)前最佳的規(guī)劃的基礎(chǔ)上一直優(yōu)化改進(jìn),最后在機(jī)器人上執(zhí)行。

系統(tǒng)運(yùn)行框圖

實驗

作者們對這種方法進(jìn)行了實驗,讓它使用新的工具執(zhí)行用戶設(shè)定的目標(biāo)。

從左到右:初始場景和任務(wù)目標(biāo);根據(jù)最佳運(yùn)動規(guī)劃的預(yù)測結(jié)果;機(jī)器人的實際執(zhí)行結(jié)果

在前面提到過的清掃任務(wù)中,機(jī)器人可以抓起附近的掃帚,高效地完成任務(wù)。

在另一個場景中,雖然機(jī)器人從未見過海綿,但它能夠思考如何用它把盤子中的碎渣掃走。

在下面的例子中,作者們設(shè)定只允許機(jī)器人在綠色陰影范圍內(nèi)移動,目標(biāo)是把藍(lán)色圓柱體向自己的方向移動。顯然,這個任務(wù)的關(guān)鍵就是機(jī)器人想到了如何使用L型的木塊把圓柱體鉤過來。

以及,即便只給機(jī)器人提供礦泉水瓶之類的日常物體,它也能推理出如何把它作為工具完成任務(wù)。

最后,在最好不使用工具的環(huán)境中,機(jī)器人也會選擇直接用自己的夾鉗完成任務(wù)。

左:任務(wù)目標(biāo)是把兩個物體都移向左邊,機(jī)器人選擇用工具高效地完成;右:任務(wù)目標(biāo)只需移動一個物體,機(jī)器人用自己的夾鉗把它移過去

除了這些例子之外,論文中的量化實驗結(jié)果表明他們的方法比單獨(dú)使用從演示學(xué)習(xí)有更好的泛化通用性,也比單獨(dú)從經(jīng)驗學(xué)習(xí)有更強(qiáng)的完成任務(wù)能力。

關(guān)于其他機(jī)器人使用工具研究的對比討論

論文《A Relational Approach to Tool-Use Learning in Robots》研究了如何在任務(wù)和運(yùn)動規(guī)劃框架下通過邏輯編程和已知模型控制工具。然而,基于邏輯的系統(tǒng)和基于解析模型的系統(tǒng)都容易受到建模誤差的影響,這會在測試執(zhí)行時累積并影響表現(xiàn)。

其它的研究中把工具看作了面向任務(wù)的抓取動作控制,并根據(jù)規(guī)劃或者策略學(xué)習(xí)來使用工具。這些方法都限制了涉及到工具的運(yùn)用的范圍,而這篇論文中的方法不論場景中有沒有工具都可以完成運(yùn)動規(guī)劃。

也有一些別的方法(1,2)提出在使用工具中學(xué)習(xí)動態(tài)模型。然而,這些方法需要額外使用手工設(shè)計的感知流水線,或者完全忽略感知,這篇論文中的方法就可以直接從原始圖像像素中學(xué)習(xí)物體間的交互。

結(jié)論

會出現(xiàn)從未見過的物體的多樣、復(fù)雜任務(wù)是機(jī)器人領(lǐng)域正在嘗試攻克的問題。為了研究這個問題,這篇論文的作者們研究了需要把物體作為工具的多種任務(wù)。作者們提出了結(jié)合模仿學(xué)習(xí)和自我監(jiān)督交互學(xué)習(xí)的新方法,并展示了這種方法可以讓機(jī)器人完成復(fù)雜的多物體交互任務(wù),其中可以含有多種多樣的物體,甚至可以在新的環(huán)境中靈活運(yùn)用物體作為工具。作者們希望這項研究展示了讓機(jī)器人同時變得更通用和更能干的新方法,以便未來機(jī)器人可以在日常生活環(huán)境中執(zhí)行有用的任務(wù)。

論文原文:

《ImprovisationthroughPhysicalUnderstanding:UsingNovelObjectsasToolswithVisualForesight》

論文地址:https://arxiv.org/abs/1904.05538

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31079

    瀏覽量

    222234
  • UC
    UC
    +關(guān)注

    關(guān)注

    2

    文章

    58

    瀏覽量

    61985
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

    Station兩款個人AI電腦/計算機(jī),首款開源人形機(jī)器人功能模型——GR00T N1等解決方案,還有新機(jī)器人亮相。 ? ? 黃仁勛表示,AI發(fā)展的過程中涉及三個基本問
    的頭像 發(fā)表于 03-19 09:05 ?3722次閱讀
    揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,<b class='flag-5'>新機(jī)器人</b>壓軸

    再談低溫?zé)Y(jié)銀的應(yīng)用:從春晚四家機(jī)器人出鏡的幕后推手說起

    科技:《武 BOT》:H2機(jī)器人31個高精度關(guān)節(jié)、單臂7自由度,完成醉拳、雙截棍、舞劍,同步誤差**< 0.1秒;核心是高功率密度伺服電機(jī)+高速控制+**強(qiáng)散熱。 **魔法原子:《智造
    發(fā)表于 02-17 14:07

    深度解析48V系統(tǒng)如何革新機(jī)器人技術(shù)

    工業(yè)自動化對更強(qiáng)大、更高效機(jī)器的需求持續(xù)增長,機(jī)器人技術(shù)正以驚人的速度迅猛發(fā)展。這一趨勢推動了供電電子系統(tǒng)的重大變革——從傳統(tǒng)的 12V 架構(gòu)向更高電壓,尤其是 48V 系統(tǒng)轉(zhuǎn)型。
    的頭像 發(fā)表于 12-30 11:11 ?9478次閱讀
    深度解析48V系統(tǒng)如何革<b class='flag-5'>新機(jī)器人</b>技術(shù)

    MCU微控制器,N32H47x高性能MCU機(jī)器人關(guān)節(jié)控制方案

    在工業(yè)自動化領(lǐng)域,關(guān)節(jié)作為機(jī)器人的核心運(yùn)動部件,其控制精度直接決定了整機(jī)性能。英尚微電子基于國民技術(shù)MCU微控制器N32H47x系列,推出創(chuàng)新機(jī)器人關(guān)節(jié)控制方案,為工業(yè)機(jī)器人提供高精度、高穩(wěn)定性的運(yùn)動控制解決方案。
    的頭像 發(fā)表于 11-07 16:28 ?733次閱讀

    小蘿卜機(jī)器人的故事

    經(jīng)過我的申請, 馬老師發(fā)放了, 小蘿卜機(jī)器人的, 開發(fā)權(quán)限, 原來的小蘿卜公司, 因為經(jīng)營不善倒閉, 作為科研產(chǎn)品, 幾個技術(shù)對此惋惜, 自掏腰包, 要讓小蘿卜機(jī)器人, 再生, 每次聽到小蘿卜說
    發(fā)表于 10-23 05:24

    具身智能家務(wù)機(jī)器人黑客松報名通道已開啟

    在家庭服務(wù)場景中,機(jī)器人自主完成烹飪、家務(wù)處理等任務(wù)已成為技術(shù)探索熱點(diǎn)。為了助力開發(fā)者打造適用于家務(wù)場景的創(chuàng)新機(jī)器人應(yīng)用,NVIDIA、Seeed Studio 和 Hugging Face 發(fā)起
    的頭像 發(fā)表于 09-04 11:29 ?1168次閱讀

    工業(yè)機(jī)器人的特點(diǎn)

    的基礎(chǔ),也是三者的實現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動化焊接線、柔性自動化生產(chǎn)線、智能農(nóng)機(jī)、3D 打印機(jī)等領(lǐng)域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1417次閱讀

    當(dāng)機(jī)器人遇上“語言障礙”:CCLINKIE轉(zhuǎn)Profinet的“破冰外掛”來啦\\!

    已成為核心競爭力。CCLINKIE轉(zhuǎn)Profinet網(wǎng)關(guān)的價值,不僅是解決“語言不通”的表層問題,更是通過協(xié)議互聯(lián)釋放設(shè)備潛能——正如某主機(jī)廠技術(shù)總監(jiān)所言:“在智能制造時代,能讓10年前的設(shè)備與最新機(jī)器人并肩作戰(zhàn),才是真正的降本增效?!?
    發(fā)表于 06-04 14:31

    NVIDIA推出適用于機(jī)器人的OpenUSD資產(chǎn)結(jié)構(gòu)管線

    在物理 AI 快速發(fā)展的推動下,機(jī)器人領(lǐng)域正在經(jīng)歷一場重大變革。它正在加快新機(jī)器人解決方案的上市時間,增強(qiáng)人們對其安全性的信心,并推動物理 AI 在工廠和倉庫中的應(yīng)用。
    的頭像 發(fā)表于 05-20 16:12 ?1022次閱讀
    NVIDIA推出適用于<b class='flag-5'>機(jī)器人</b>的OpenUSD資產(chǎn)結(jié)構(gòu)管線

    盤點(diǎn)#機(jī)器人開發(fā)平臺

    地瓜機(jī)器人RDK X5開發(fā)套件地瓜機(jī)器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開發(fā)套件 Kria KR260機(jī)器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】機(jī)器人入門的引路書

    ROS的全稱:Robot Operating System 機(jī)器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫,是通信總線,協(xié)調(diào)多個傳感器 為了解決機(jī)器人里各廠商模塊不通用的問題,讓機(jī)器人快速開發(fā)
    發(fā)表于 04-30 01:05

    大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    末端執(zhí)行器。 全棧開源 從RISC-V指令集、芯片SDK到機(jī)器人控制代碼100%開放,開發(fā)者可自由定制算法與控制邏輯。 官方apt倉庫提供deepseek-r1-distill-qwen-1.5b
    發(fā)表于 04-25 17:59

    佛山智能裝備院與華數(shù)機(jī)器人在具身智能工業(yè)機(jī)器人領(lǐng)域的研究成果

    近日,佛山智能裝備技術(shù)研究院(簡稱“佛山智能裝備院”)與佛山華數(shù)機(jī)器人有限公司(簡稱“華數(shù)機(jī)器人”)在具身智能工業(yè)機(jī)器人領(lǐng)域的研究成果“Advancing general roboti
    的頭像 發(fā)表于 04-09 15:40 ?1312次閱讀
    佛山智能裝備院與華數(shù)<b class='flag-5'>機(jī)器人</b>在具身智能工業(yè)<b class='flag-5'>機(jī)器人</b>領(lǐng)域的研究<b class='flag-5'>成果</b>

    工業(yè)機(jī)器人工作站的建設(shè)意義

    的工作條件。桐爾的工業(yè)機(jī)器人工作站不僅提升了生產(chǎn)效率,還優(yōu)化了工作環(huán)境,實現(xiàn)了生產(chǎn)與人文關(guān)懷的雙贏。 此外,工業(yè)機(jī)器人工作站便于生產(chǎn)過程的統(tǒng)計和反饋,提高了作業(yè)的靈活度。整個機(jī)器人系統(tǒng)
    發(fā)表于 03-17 14:49