91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個開源的低成本機(jī)器人學(xué)習(xí)平臺ROBEL

機(jī)器人技術(shù)與應(yīng)用 ? 來源:機(jī)器人技術(shù)與應(yīng)用 ? 2019-11-25 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了讓機(jī)器人研究走向大眾,加州大學(xué)伯克利分校(UC Berkeley)和谷歌大腦的研究人員提出了一個開源的低成本機(jī)器人學(xué)習(xí)平臺ROBEL(RoboticsBenchmarks for Learning with Low-Cost Robots)。

ROBEL可以作為快速實驗平臺,支持各種實驗需求,以及新的強(qiáng)化學(xué)習(xí)和控制方法的開發(fā),同時提供主要用于促進(jìn)現(xiàn)實世界物理硬件研究和開發(fā)的基準(zhǔn)任務(wù)。其由D’Claw和D'Kitty組成,D'Claw是一個有三只手臂的機(jī)械臂型機(jī)器人,可以幫助學(xué)習(xí)靈巧的操作任務(wù);D'Kitty是一個有四條腿的機(jī)器人,可以幫助學(xué)習(xí)靈活的腿部運動任務(wù)。該機(jī)器人平臺具有低成本、模塊化、可靠性高、易于維護(hù)等特點,并且功能強(qiáng)大,可支持基于硬件的強(qiáng)化學(xué)習(xí)。

圖中左:十二自由度D'Kitty;中:9 自由度D'Claw;右:功能齊全的D'Claw 裝置D’Lantern。

為了使機(jī)器人成本便宜和易于構(gòu)建,研究人員基于現(xiàn)成的組件和常見的原型工具(3D打印或激光切割)設(shè)計了ROBEL。該設(shè)計很容易組裝,只需要幾個小時即可構(gòu)建。

為了使機(jī)器人成本低且易于構(gòu)建,研究人員基于現(xiàn)成的組件和常用的原型制作工具(3D打印或激光切割)設(shè)計出ROBEL,并提供詳細(xì)的零件清單、組裝說明和入門軟件說明。ROBEL設(shè)計易于組裝,僅需幾個小時即可構(gòu)建。

谷歌設(shè)計了一套對 D’Claw和D’Kitty兩個平臺都適用的任務(wù),可用于對現(xiàn)實世界的機(jī)器人學(xué)習(xí)進(jìn)行基準(zhǔn)測試。ROBEL的任務(wù)定義包括密集和稀疏任務(wù)目標(biāo),并在任務(wù)定義中引入硬件安全指標(biāo),例如,指示關(guān)節(jié)是否超過“安全”操作界限或作用力閾值。此外,ROBEL還為所有任務(wù)提供模擬器,以促進(jìn)算法開發(fā)和快速原型設(shè)計。D’Claw 任務(wù)主要圍繞三種常見的操作行為展開:擺形(Pose)、旋轉(zhuǎn)(Turn)和擰(Screw);D’Kitty任務(wù)主要圍繞三種常見的移動行為——站立、定向和行走展開。針對這些基準(zhǔn)任務(wù),研究人員評估了幾種深度強(qiáng)化學(xué)習(xí)方法,評估結(jié)果和最終策略被作為baseline包含在軟件包中以供比較。

ROBEL平臺支持直接的硬件訓(xùn)練,迄今已積累了超過1.4萬h的實際經(jīng)驗。為了確保平臺和基準(zhǔn)方法的可重復(fù)性,研究人員通過兩個不同的實驗室分別對ROBEL進(jìn)行了研究,本研究僅使用軟件分發(fā)和文檔、不允許親自訪問,利用ROBEL的設(shè)計文檔和組裝說明,兩者都可以復(fù)制兩個硬件平臺?;鶞?zhǔn)任務(wù)訓(xùn)練在兩個實驗室分別構(gòu)建的機(jī)器人上進(jìn)行,實驗表明,在兩個不同地點打造的兩個D'Claw機(jī)器人,它們不僅訓(xùn)練進(jìn)度相似,而且最終收斂到了相同的性能,這說明ROBEL基準(zhǔn)具備良好的可重復(fù)性。

ROBEL在各種強(qiáng)化學(xué)習(xí)研究中都非常有用。D’Claw平臺是完全自主的,可以在很長一段時間內(nèi)維持實驗的可靠性,而且可以使用剛性和柔性對象的各種強(qiáng)化學(xué)習(xí)范例和任務(wù)改進(jìn)實驗。重要的是,D'Claw平臺是高度模塊化的,而且具備高度可重復(fù)性,便于進(jìn)行擴(kuò)展實驗。通過擴(kuò)展設(shè)置,研究人員發(fā)現(xiàn)多個D'Claws可以通過共享經(jīng)驗更快地對任務(wù)進(jìn)行集體學(xué)習(xí),通過共享SAC的分布式版本的硬件訓(xùn)練流程,其可以面向多個目標(biāo)任務(wù)實現(xiàn)任意角度的結(jié)合。在多任務(wù)定制中,完成五個任務(wù)只需要單個任務(wù)經(jīng)驗的2倍時間即可。

同時,研究人員成功地在D’Kitty平臺上部署了強(qiáng)大的移動策略,比如,D'Kitty可以在“盲眼”條件下在室內(nèi)和室外地形上穩(wěn)定行走,展現(xiàn)了步態(tài)的穩(wěn)健性。

具體而言,在雜亂的室內(nèi)環(huán)境行走時,通過MuJoCo模擬通過自然策略梯度訓(xùn)練的Sim2Real策略,機(jī)器人可以在隨機(jī)擾動的條件下實現(xiàn)行走,并跨過障礙物;在布滿碎石和樹枝的室外環(huán)境行走時,通過自然策略梯度在MuJoCo模擬中訓(xùn)練的Sim2Real策略具有隨機(jī)的高度場,機(jī)器人可以學(xué)習(xí)在分布著碎石和樹枝的戶外環(huán)境中行走;在室外斜坡和草叢環(huán)境中,通過自然策略梯度在MuJoCo模擬中訓(xùn)練的Sim2Real策略具有隨機(jī)高度場,機(jī)器人可以學(xué)習(xí)在緩坡上行走。

當(dāng)D’Kitty收到有關(guān)其軀干和場景中目標(biāo)的信息時,其可以學(xué)會與表現(xiàn)出復(fù)雜行為的目標(biāo)進(jìn)行交互。比如,通過HierarchicalSim2Real訓(xùn)練的策略可以學(xué)習(xí)躲避移動障礙物,到達(dá)目標(biāo)位置;通過Hierarchical Sim2Real訓(xùn)練的策略學(xué)習(xí)將目標(biāo)推向移動目標(biāo)(由手中的控制器標(biāo)記);雙機(jī)器人協(xié)同-通過Hi-Herarchical Sim2Real訓(xùn)練的策略,可以學(xué)習(xí)協(xié)調(diào)兩個D'Kitty機(jī)器人,將沉重的障礙物推向目標(biāo)位置。

總之,ROBEL可以滿足新興的基于學(xué)習(xí)范式的需求,這些范式需要高度的可擴(kuò)展性和彈性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31094

    瀏覽量

    222360
  • 3D打印
    +關(guān)注

    關(guān)注

    28

    文章

    3638

    瀏覽量

    118106

原文標(biāo)題:加州大學(xué)伯克利分校和谷歌大腦聯(lián)合推出低成本機(jī)器人訓(xùn)練平臺

文章出處:【微信號:robotmagazine,微信公眾號:機(jī)器人技術(shù)與應(yīng)用】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于NVIDIA Isaac Lab拓展多模態(tài)機(jī)器人學(xué)習(xí)

    構(gòu)建強(qiáng)大的智能機(jī)器人需要在復(fù)雜環(huán)境中進(jìn)行測試。然而,在現(xiàn)實世界中收集數(shù)據(jù)不僅成本高昂、耗時漫長,還常常伴隨高風(fēng)險。針對關(guān)鍵危險場景(例如高速碰撞或硬件故障)進(jìn)行安全訓(xùn)練幾乎是不可能的。更嚴(yán)重的是,現(xiàn)實世界的數(shù)據(jù)往往偏向“正?!边\行條件,導(dǎo)致
    的頭像 發(fā)表于 03-09 16:26 ?475次閱讀
    基于NVIDIA Isaac Lab拓展多模態(tài)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA Isaac Lab 2.3新增功能助力簡化機(jī)器人學(xué)習(xí)

    基于真實世界演示訓(xùn)練機(jī)器人策略,不僅成本高、速度慢,還容易出現(xiàn)過擬合問題,進(jìn)而限制其在不同任務(wù)與環(huán)境中的泛化能力。而仿真優(yōu)先的方法可簡化開發(fā)流程、降低風(fēng)險與成本,同時部署到真實環(huán)境也將更安全、適應(yīng)性更強(qiáng)。
    的頭像 發(fā)表于 10-21 10:50 ?1120次閱讀

    NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)

    開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機(jī)器人項巨大的技術(shù)挑戰(zhàn)。這類機(jī)器人需具備與人類接近的靈巧性、感知能力、認(rèn)知能力和全身協(xié)調(diào)性,以便于實時應(yīng)對充滿不確定性的真實環(huán)境。
    的頭像 發(fā)表于 10-13 11:15 ?1003次閱讀

    NVIDIA 發(fā)布三大利器,推動人形機(jī)器人邁向新紀(jì)元

    電子發(fā)燒友網(wǎng)綜合報道 在節(jié)前的機(jī)器人學(xué)習(xí)大會(CoRL)上,NVIDIA 發(fā)布了系列突破性技術(shù),包括開源物理引擎 Newton、機(jī)器人基礎(chǔ)模型 Isaac GROOT N1.6以及全
    的頭像 發(fā)表于 10-13 04:42 ?5769次閱讀

    英偉達(dá)發(fā)布機(jī)器人 “新大腦”,黃仁勛:人形機(jī)器人三年普及

    完成如 “烤面包” 這樣的復(fù)雜任務(wù)。結(jié)合 Omniverse 仿真平臺,訓(xùn)練效率提高了10倍,大大縮短了機(jī)器人學(xué)習(xí)和適應(yīng)現(xiàn)實環(huán)境的時間。 英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在鏈博會上發(fā)表演講時指出,物理 AI 將推動 AI 從虛擬世界邁向?qū)嶓w領(lǐng)域,重構(gòu)工業(yè)和日常生活
    的頭像 發(fā)表于 08-25 18:34 ?447次閱讀

    易控智駕與中科院端到端自動駕駛方案入選CoRL 2025

    近日,旨在分享和探討機(jī)器人技術(shù)與機(jī)器學(xué)習(xí)交叉領(lǐng)域最新進(jìn)展的國際頂級機(jī)器人學(xué)習(xí)會議CoRL 2025 (Conference on Robot Learning)論文接收結(jié)果揭曉。
    的頭像 發(fā)表于 08-18 14:43 ?2392次閱讀
    易控智駕與中科院端到端自動駕駛方案入選CoRL 2025

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了系列推動機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1432次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是適用于機(jī)器人學(xué)習(xí)開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)
    的頭像 發(fā)表于 07-14 15:29 ?2357次閱讀
    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>腳本使用指南

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨關(guān)鍵挑戰(zhàn):
    的頭像 發(fā)表于 07-14 11:49 ?1100次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    盤點#機(jī)器人開發(fā)平臺

    Athena機(jī)器人****開發(fā)平臺思嵐推出Athena機(jī)器人開發(fā)平臺,有望主導(dǎo)機(jī)器人開發(fā)平臺未來
    發(fā)表于 05-13 15:02

    大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    全球80多個國家和地區(qū)。 近日,大象機(jī)器人聯(lián)合進(jìn)迭時空推出全球首款RISC-V全棧開源六軸機(jī)器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的機(jī)器人
    發(fā)表于 04-25 17:59

    構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運動生成流程

    通用人形機(jī)器人需要能夠快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動機(jī)器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機(jī)構(gòu),它們的價值日益凸顯。
    的頭像 發(fā)表于 04-10 09:36 ?1355次閱讀
    構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>的合成運動生成流程

    深度解讀英偉達(dá)Newton機(jī)器人平臺:技術(shù)革新與跨界生態(tài)構(gòu)建

    的基礎(chǔ)上,它使機(jī)器人能夠學(xué)習(xí)如何以更高的精度處理復(fù)雜的任務(wù),與MuJoCo Playground或 NVIDIA Isaac Lab 等學(xué)習(xí)框架兼容,這是
    的頭像 發(fā)表于 03-20 15:15 ?2869次閱讀
    深度解讀英偉達(dá)Newton<b class='flag-5'>機(jī)器人平臺</b>:技術(shù)革新與跨界生態(tài)構(gòu)建

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)?;瘮?shù)據(jù)平臺

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實驗室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺,通過構(gòu)建大規(guī)模、多模態(tài)的真實世界數(shù)據(jù)集與通用政策模型,為機(jī)器人學(xué)習(xí)
    的頭像 發(fā)表于 03-12 11:42 ?1992次閱讀
    AgiBot World Colosseo:構(gòu)建通用<b class='flag-5'>機(jī)器人</b>智能的規(guī)?;瘮?shù)據(jù)<b class='flag-5'>平臺</b>

    開源項目!教你如何制作開源教育機(jī)械臂

    和適應(yīng)性強(qiáng)的機(jī)器人平臺。 作為開源項目,構(gòu)建Pedro所需的所有文件都可以在Pedro Github頁面上找到: 用于3D打印和定制的STL文件。 Gerber文件來制造您自己的
    發(fā)表于 03-10 11:22