10月27日消息,據(jù)外媒報(bào)道,約翰斯霍普金斯大學(xué)博士生安德魯洪特(Andrew Hundt) 近日發(fā)布一篇新論文,指出應(yīng)通過正強(qiáng)化法訓(xùn)練機(jī)器人學(xué)習(xí)新技能。
這篇論文的核心思想是,在訓(xùn)練機(jī)器人的過程中,應(yīng)采用正強(qiáng)化法,即相比于在它做錯(cuò)時(shí)進(jìn)行懲罰,更應(yīng)在它做對(duì)時(shí)進(jìn)行激勵(lì)。而對(duì)于機(jī)器人來說,這種激勵(lì)機(jī)制是以評(píng)分系統(tǒng)的形式呈現(xiàn)的,類似玩游戲一樣,根據(jù)執(zhí)行任務(wù)的情況獲得積分。
安德魯表示,這種方法能夠大大縮短訓(xùn)練機(jī)器人執(zhí)行任務(wù)的時(shí)間?!皺C(jī)器人希望能得到更高的分?jǐn)?shù),所以它們很快就可以完成相關(guān)任務(wù)。過去機(jī)器人需要一個(gè)月的練習(xí)才能達(dá)到100%的準(zhǔn)確性,現(xiàn)在只用兩天就能做到?!?/p>
不過他也指出,目前機(jī)器人執(zhí)行的這些任務(wù)仍然是比較初級(jí)的,比如堆積木。但在未來,機(jī)器人有望通過正強(qiáng)化法完成更復(fù)雜和有意義的任務(wù)。
責(zé)任編輯:YYX
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31073瀏覽量
222179
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA神經(jīng)網(wǎng)絡(luò)創(chuàng)新研究重塑機(jī)器人學(xué)習(xí)
NVIDIA Isaac Lab 2.3新增功能助力簡(jiǎn)化機(jī)器人學(xué)習(xí)
NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)
NVIDIA 發(fā)布三大利器,推動(dòng)人形機(jī)器人邁向新紀(jì)元
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
英偉達(dá)發(fā)布機(jī)器人 “新大腦”,黃仁勛:人形機(jī)器人三年普及
易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025
海默智能噴涂機(jī)器人——為工業(yè)噴涂解鎖新技能
NVIDIA展示機(jī)器人領(lǐng)域的研究成果
NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南
通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預(yù)覽版
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程
深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建
如何訓(xùn)練機(jī)器人學(xué)習(xí)新技能
評(píng)論