伊人激情久久在线观看视频 ,丁香五月婷婷Av,一级AAA黄色视频

DeepMind 的新項(xiàng)目是什么？

開發(fā)機(jī)器人技術(shù)的一大挑戰(zhàn)，就在于必須投入大量精力來為每臺(tái)機(jī)器人、每項(xiàng)任務(wù)和每種環(huán)境訓(xùn)練機(jī)器學(xué)習(xí)模型。近日，谷歌 DeepMind 團(tuán)隊(duì)及其他 33 個(gè)研究機(jī)構(gòu)正共同發(fā)起新項(xiàng)目，旨在創(chuàng)建一套通用 AI 系統(tǒng)來應(yīng)對(duì)這個(gè)挑戰(zhàn)。據(jù)稱該系統(tǒng)能夠與不同類型的物理機(jī)器人協(xié)同運(yùn)作，成功執(zhí)行多種任務(wù)。

谷歌機(jī)器人部門高級(jí)軟件工程師 Pannag Sanketi 在采訪中表示，“我們觀察到，機(jī)器人在專項(xiàng)領(lǐng)域表現(xiàn)極佳，但在通用領(lǐng)域卻缺乏靈性。一般來講，大家需要為每項(xiàng)任務(wù)、每臺(tái)機(jī)器人和每種環(huán)境分別訓(xùn)練一套模型，從零開始調(diào)整每一個(gè)變量?！?/p>

為了克服這個(gè)問題，讓機(jī)器人的訓(xùn)練和部署變得更加輕松、快捷，谷歌 DeepMind 在名為 Open X-Embodiment 的大型共享數(shù)據(jù)庫項(xiàng)目中引入了兩大關(guān)鍵組件：一套包含了 22 種機(jī)器人類型數(shù)據(jù)的數(shù)據(jù)集，外加一系列能夠跨多種任務(wù)進(jìn)行技能遷移的模型 RT-1-X（這是一個(gè)源自 RT-1 的機(jī)器人變壓器模型）。為了開發(fā) Open X-Embodiment 數(shù)據(jù)集，研發(fā)人員在超過 100 萬個(gè)場(chǎng)景中展示了 500 多種技能和 150,000 項(xiàng)任務(wù)，因此，該數(shù)據(jù)集也是同類中最全面的機(jī)器人數(shù)據(jù)集。

此外，研究人員還在機(jī)器人實(shí)驗(yàn)室和不同類型的物理裝置之上對(duì)模型進(jìn)行了測(cè)試，并發(fā)現(xiàn)與傳統(tǒng)機(jī)器人訓(xùn)練方法相比，新方案確實(shí)能取得更好的成績(jī)。

來自 Open X-Embodiment 數(shù)據(jù)集的樣本展示了 500 多種技能和 150,000 項(xiàng)任務(wù)。

Open X-Embodiment 數(shù)據(jù)集結(jié)合了跨實(shí)施例、數(shù)據(jù)集和技能的數(shù)據(jù)。

結(jié)合機(jī)器人數(shù)據(jù)

通常來講，不同類型的機(jī)器人往往擁有獨(dú)特的傳感器和執(zhí)行器，所以需要配合專門的軟件模型。這就類似于不同生物體的大腦和神經(jīng)系統(tǒng)需要專門進(jìn)化，從而適應(yīng)該生物的身體結(jié)構(gòu)與所處環(huán)境。

但 Open X-Embodiment 的誕生卻出于這樣一條先驗(yàn)性的假設(shè)：將來自不同機(jī)器人和任務(wù)的數(shù)據(jù)結(jié)合起來，就能創(chuàng)建一套優(yōu)于專用模型的通用模型，足以驅(qū)動(dòng)所有類型的機(jī)器人。這個(gè)概念在一定程度上受到大語言模型（LLM）的啟發(fā)，即在使用大型通用數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí)，模型成果的匹配度甚至可以優(yōu)于在特定數(shù)據(jù)集上訓(xùn)練的小型針對(duì)性模型。而研究人員驚喜地發(fā)現(xiàn)，此項(xiàng)原理果然也適用于機(jī)器人領(lǐng)域。

為了創(chuàng)建 Open X-Embodiment 數(shù)據(jù)集，研究團(tuán)隊(duì)收集了來自不同國(guó)家 20 個(gè)機(jī)構(gòu)的 22 臺(tái)機(jī)器人具身的真實(shí)數(shù)據(jù)。該數(shù)據(jù)集包含超 100 萬種情節(jié)（所謂情節(jié)，是指機(jī)器人每次嘗試執(zhí)行任務(wù)時(shí)所采取的一系列動(dòng)作），其中具體涉及 500 多種技能和 15 萬個(gè)任務(wù)示例。

隨附的各模型均基于 Transformer，一套在大語言模型中也得以應(yīng)用的深度學(xué)習(xí)架構(gòu)。RT-1-X 建立在 Robotics Transformer 1（簡(jiǎn)稱 RT-1）之上，是一套適用于在真實(shí)環(huán)境下實(shí)現(xiàn)機(jī)器人技術(shù)規(guī)?；亩嗳蝿?wù)模型。RT-2-X 則建立在 RT-1 后繼者 RT-2 的基礎(chǔ)之上——RT-2 是一種視覺語言動(dòng)作（VLA）模型，能夠從機(jī)器人和網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)，并具備響應(yīng)自然語言命令的能力。

研究人員在五所不同研究實(shí)驗(yàn)室的五臺(tái)常用機(jī)器人上測(cè)試了 RT-1-X 對(duì)各類任務(wù)的執(zhí)行能力。與針對(duì)這些機(jī)器人開發(fā)的專用模型相比，RT-1-X 在拾取和移動(dòng)物體、以及開門等任務(wù)上的成功率高出 50%。該模型還能將技能遷移至多種不同環(huán)境，這也是在特定視覺場(chǎng)景下訓(xùn)練出的專用模型所做不到的。由此可見，由不同示例集訓(xùn)練而成的模型在大多數(shù)任務(wù)中都優(yōu)于專用模型。論文還提到，此模型適用于從機(jī)械手臂到四足動(dòng)物在內(nèi)的多種機(jī)器人。

加州大學(xué)伯克利分校副教授、論文聯(lián)合作者 Sergey Levine 寫道，“對(duì)于任何曾有機(jī)器人研究經(jīng)驗(yàn)的朋友來說，都能意識(shí)到這是多么了不起：這類模型「從來」就沒能第一次就嘗試成功，但這個(gè)模型卻做到了?！?/p>

值得注意的是，即使是規(guī)模較小的 RT-1-X 模型，也實(shí)現(xiàn)了對(duì)各實(shí)驗(yàn)室內(nèi)部專用模型的超越！對(duì)于任何曾有機(jī)器人研究經(jīng)驗(yàn)的朋友來說，都能意識(shí)到這是多么了不起：這類模型“從來”就沒能第一次就嘗試成功，但這個(gè)模型卻做到了。

在應(yīng)急技能和處理訓(xùn)練數(shù)據(jù)集中未涉及的新任務(wù)方面，RT-2-X 的成功率可達(dá) RT-2 的 3 倍。具體來講，RT-2-X 在需要空間認(rèn)知的任務(wù)上表現(xiàn)出更好的性能，例如理解“將蘋果放到布旁邊”和“將蘋果放到布上”兩種要求間的區(qū)別。

研究人員在 Open X 和 RT-X 的發(fā)布博文中寫道，“我們的結(jié)果表明，與其他平臺(tái)的數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練之后，RT-2-X 獲得了原始數(shù)據(jù)集中并不具備的額外技能，使其能夠執(zhí)行前所未見的新任務(wù)。”

步步邁向機(jī)器人研究的新未來

展望未來，科學(xué)家們正在考慮將這些進(jìn)展與 DeepMind 開發(fā)的自我改進(jìn)模型 RoboCat 的見解相結(jié)合，希望探索出新的研究方向。RoboCat 能夠?qū)W會(huì)在不同機(jī)械臂上執(zhí)行各種任務(wù)，然后自動(dòng)設(shè)計(jì)出新的訓(xùn)練數(shù)據(jù)以提高自身性能。

Sanketi 認(rèn)為，另一個(gè)潛在的研究方向，也可能是進(jìn)一步研究不同數(shù)據(jù)集間的混合會(huì)如何影響跨機(jī)器人具身的能力泛化與改進(jìn)效果。

該團(tuán)隊(duì)目前已經(jīng)開源了 Open X-Embodiment 數(shù)據(jù)集和小型 RT-1-X 模型，但并未公開 RT-2-X 模型。

Sanketi 總結(jié)道，“我們相信，這些工具將改變機(jī)器人的訓(xùn)練方式，并加速該領(lǐng)域的研究進(jìn)展。我們希望開源相關(guān)數(shù)據(jù)，并提供安全但受限的模型以減少障礙、加速研究。機(jī)器人技術(shù)的未來離不開機(jī)器人之間的相互學(xué)習(xí)，而這一切的前提，首先要求研究人員之間能夠相互學(xué)習(xí)?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴