91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美國(guó)陸軍研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型

姚小熊27 ? 來(lái)源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-01-06 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

美國(guó)陸軍面向未來(lái)多域作戰(zhàn)概念研發(fā)了一種高效的地面機(jī)器人學(xué)習(xí)模型,該模型提出基于強(qiáng)化學(xué)習(xí)的策略,可有效減少當(dāng)前訓(xùn)練強(qiáng)化學(xué)習(xí)策略的不可預(yù)測(cè)性,使自主智能體能夠推理并適應(yīng)不斷變化的戰(zhàn)場(chǎng)條件。

強(qiáng)化學(xué)習(xí)是智能體(Agent)以“試錯(cuò)”的方式進(jìn)行學(xué)習(xí),通過(guò)與環(huán)境進(jìn)行交互獲得的獎(jiǎng)賞指導(dǎo)行為,目標(biāo)是使智能體獲得最大的獎(jiǎng)賞。強(qiáng)化學(xué)習(xí)技術(shù)具備解決復(fù)雜問題的能力,近年來(lái)在如圍棋、象棋和電子游戲等領(lǐng)域有較為長(zhǎng)足的發(fā)展。美國(guó)陸軍將這種強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用在地面機(jī)器人面臨著兩個(gè)巨大挑戰(zhàn)。首先是算法的限制。在強(qiáng)化學(xué)習(xí)中,策略梯度方法(Policy Gradient Methods)是連續(xù)空間可伸縮算法的基礎(chǔ),但是現(xiàn)有技術(shù)無(wú)法支持更廣泛的決策目標(biāo),例如風(fēng)險(xiǎn)敏感性、安全約束、對(duì)先驗(yàn)知識(shí)的探索和發(fā)散。其次就是數(shù)據(jù)量的問題。強(qiáng)化學(xué)習(xí)需要大量的樣本復(fù)雜性,而美國(guó)陸軍多域作戰(zhàn)概念和下一代戰(zhàn)斗車輛(NGCV)項(xiàng)目目前數(shù)據(jù)匱乏并不支持現(xiàn)有訓(xùn)練機(jī)制。

在陸軍多域作戰(zhàn)概念和NGCV項(xiàng)目中應(yīng)用強(qiáng)化學(xué)習(xí),訓(xùn)練機(jī)制必須提高連續(xù)空間中的樣本效率和可靠性,ARL通過(guò)將現(xiàn)有的策略搜索方案推廣到通用工具,取得了重要突破。研究人員為通用程序開發(fā)了新的策略搜索方案,并且還確定了其樣本復(fù)雜度。由此產(chǎn)生的策略搜索方案減少了獎(jiǎng)勵(lì)積累的波動(dòng)性,形成了對(duì)未知領(lǐng)域的有效探索和先驗(yàn)的機(jī)制。值得注意的是,地面機(jī)器人獲取數(shù)據(jù)的成本很高。減少獎(jiǎng)勵(lì)積累的波動(dòng)性,確保以有效的方式探索未知領(lǐng)域,或者吸收以前的經(jīng)驗(yàn),都將有助于打破強(qiáng)化學(xué)習(xí)中現(xiàn)行實(shí)踐的樣本效率壁壘。通過(guò)減少隨機(jī)抽樣的數(shù)量,可以實(shí)現(xiàn)策略優(yōu)化。

這項(xiàng)研究為強(qiáng)化學(xué)習(xí)中的經(jīng)典策略梯度定理做出了貢獻(xiàn)。裝備有強(qiáng)化學(xué)習(xí)功能的自主機(jī)器人將能夠協(xié)助戰(zhàn)士在未來(lái)戰(zhàn)場(chǎng)上進(jìn)行偵察探索和風(fēng)險(xiǎn)評(píng)估。研究人員下一步計(jì)劃在強(qiáng)化學(xué)習(xí)中將更廣泛的決策目標(biāo)納入多主體設(shè)置,并研究強(qiáng)化學(xué)習(xí)主體之間的交互設(shè)置如何在團(tuán)隊(duì)之間產(chǎn)生協(xié)同和對(duì)抗性推理。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31079

    瀏覽量

    222273
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑機(jī)器人學(xué)習(xí)

    目前,機(jī)器人在受控的環(huán)境中能夠有出色的表現(xiàn),但在面對(duì)現(xiàn)實(shí)世界任務(wù)時(shí),仍難以應(yīng)對(duì)其中的不可預(yù)測(cè)性、操作靈活性和細(xì)微的交互需求,例如組裝精密組件或是以接近人類的精度操控日常物體。
    的頭像 發(fā)表于 10-21 11:07 ?1959次閱讀
    NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA Isaac Lab 2.3新增功能助力簡(jiǎn)化機(jī)器人學(xué)習(xí)

    基于真實(shí)世界演示訓(xùn)練機(jī)器人策略,不僅成本高、速度慢,還容易出現(xiàn)過(guò)擬合問題,進(jìn)而限制其在不同任務(wù)與環(huán)境中的泛化能力。而仿真優(yōu)先的方法可簡(jiǎn)化開發(fā)流程、降低風(fēng)險(xiǎn)與成本,同時(shí)部署到真實(shí)環(huán)境也將更安全、適應(yīng)性更強(qiáng)。
    的頭像 發(fā)表于 10-21 10:50 ?1114次閱讀

    NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)

    開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機(jī)器人項(xiàng)巨大的技術(shù)挑戰(zhàn)。這類機(jī)器人需具備與人類接近的靈巧性、感知能力、認(rèn)知能力和全身協(xié)調(diào)性,以便于實(shí)時(shí)應(yīng)對(duì)充滿不確定性的真實(shí)環(huán)境。
    的頭像 發(fā)表于 10-13 11:15 ?994次閱讀

    NVIDIA 發(fā)布三大利器,推動(dòng)人形機(jī)器人邁向新紀(jì)元

    電子發(fā)燒友網(wǎng)綜合報(bào)道 在節(jié)前的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上,NVIDIA 發(fā)布了系列突破性技術(shù),包括開源物理引擎 Newton、機(jī)器人基礎(chǔ)模型 Isaac GROOT N1.6以及全
    的頭像 發(fā)表于 10-13 04:42 ?5760次閱讀

    英偉達(dá)發(fā)布機(jī)器人 “新大腦”,黃仁勛:人形機(jī)器人三年普及

    完成如 “烤面包” 這樣的復(fù)雜任務(wù)。結(jié)合 Omniverse 仿真平臺(tái),訓(xùn)練效率提高了10倍,大大縮短了機(jī)器人學(xué)習(xí)和適應(yīng)現(xiàn)實(shí)環(huán)境的時(shí)間。 英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在鏈博會(huì)上發(fā)表演講時(shí)指出,物理 AI 將推動(dòng) AI 從虛擬世界邁向?qū)嶓w領(lǐng)域,重構(gòu)工業(yè)和日常生活
    的頭像 發(fā)表于 08-25 18:34 ?438次閱讀

    易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025

    近日,旨在分享和探討機(jī)器人技術(shù)與機(jī)器學(xué)習(xí)交叉領(lǐng)域最新進(jìn)展的國(guó)際頂級(jí)機(jī)器人學(xué)習(xí)會(huì)議CoRL 2025 (Conference on Robot Learning)論文接收結(jié)果揭曉。
    的頭像 發(fā)表于 08-18 14:43 ?2386次閱讀
    易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會(huì)議 (RSS) 上,NVIDIA 研究中心展示了系列推動(dòng)機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實(shí)世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1423次閱讀

    通過(guò)NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來(lái),這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨個(gè)關(guān)鍵挑戰(zhàn):
    的頭像 發(fā)表于 07-14 11:49 ?1089次閱讀
    通過(guò)NVIDIA Cosmos<b class='flag-5'>模型</b>增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機(jī)器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機(jī)器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機(jī)器人的開發(fā)。
    的頭像 發(fā)表于 05-28 10:06 ?2131次閱讀

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    地圖構(gòu)建,包括算法原理介紹、安裝與配置方法、仿真環(huán)境中的SLAM以及真實(shí)機(jī)器人上的SLAM。 這過(guò)程不僅涉及到計(jì)算機(jī)視覺和機(jī)器人學(xué)的知識(shí),還需要對(duì)ROS 2的節(jié)點(diǎn)管理和數(shù)據(jù)處理有
    發(fā)表于 04-27 11:42

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    大象機(jī)器人成立于2016年,專注協(xié)作機(jī)器人研發(fā)與應(yīng)用,產(chǎn)品線涵蓋輕量級(jí)協(xié)作機(jī)器人、人形機(jī)器人、仿生機(jī)器人
    發(fā)表于 04-25 17:59

    構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程

    通用人形機(jī)器人需要能夠快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動(dòng)機(jī)器人經(jīng)過(guò)設(shè)計(jì),能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機(jī)構(gòu),它們的價(jià)值日益凸顯。
    的頭像 發(fā)表于 04-10 09:36 ?1349次閱讀
    構(gòu)建人形<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>的合成運(yùn)動(dòng)生成流程

    深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建

    的基礎(chǔ)上,它使機(jī)器人能夠學(xué)習(xí)如何以更高的精度處理復(fù)雜的任務(wù),與MuJoCo Playground或 NVIDIA Isaac Lab 等學(xué)習(xí)框架兼容,這是個(gè)開源的
    的頭像 發(fā)表于 03-20 15:15 ?2858次閱讀
    深度解讀英偉達(dá)Newton<b class='flag-5'>機(jī)器人</b>平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建

    機(jī)器人Blue亮相 搭載英偉達(dá)最新GR00T N1人形機(jī)器人通用基礎(chǔ)模型

    GR00T N1以及新的數(shù)據(jù)生成和機(jī)器人學(xué)習(xí)框架,我們將共同開啟AI時(shí)代的新邊疆?!?黃仁勛還強(qiáng)調(diào)其泛化能力和多任務(wù)執(zhí)行潛力?。 機(jī)器人Blue由英偉達(dá)公司、谷歌DeepMind、迪士尼聯(lián)合開發(fā),行走動(dòng)作流暢自然,聲音設(shè)計(jì)可愛,具備擬人化交互表現(xiàn)?很好。?
    的頭像 發(fā)表于 03-20 10:50 ?1991次閱讀
    <b class='flag-5'>機(jī)器人</b>Blue亮相 搭載英偉達(dá)最新GR00T N1人形<b class='flag-5'>機(jī)器人</b>通用基礎(chǔ)<b class='flag-5'>模型</b>

    AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模化數(shù)據(jù)平臺(tái)

    數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實(shí)驗(yàn)室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺(tái),通過(guò)構(gòu)建大規(guī)模、多模態(tài)的真實(shí)世界數(shù)據(jù)集與通用政策模型,為機(jī)器人學(xué)習(xí)
    的頭像 發(fā)表于 03-12 11:42 ?1986次閱讀
    AgiBot World Colosseo:構(gòu)建通用<b class='flag-5'>機(jī)器人</b>智能的規(guī)?;瘮?shù)據(jù)平臺(tái)