91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind又出AI大招

機器人技術(shù)與應(yīng)用 ? 來源:機器人技術(shù)與應(yīng)用 ? 作者:機器人技術(shù)與應(yīng)用 ? 2021-03-11 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DeepMind 公司因為研制出會下棋的人工智能AlphaGo和AlphaZero而聲名鵲起,如今他們將注意力轉(zhuǎn)向了另一種棋盤游戲:強權(quán)外交(Diplomacy),也被稱為外交或者外交風(fēng)云,是經(jīng)典的桌面游戲之一。該游戲與圍棋不同,它是七人游戲,需要游戲玩家既競爭又合作,并且每回合玩家都會同時進(jìn)行移動,因此,每個玩家都必須推理其他玩家的想法,非常復(fù)雜。

研制一個能玩外交游戲的人工智能軟件,DeepMind公司的計算機專家Andrea Tacchetti表示:“與游戲Go或國際象棋相比,這是一個本質(zhì)上不同的問題?!?去年12月,Tacchetti和合作者在NeurIPS會議上就其系統(tǒng)發(fā)表了一篇論文,該論文介紹了能玩外交游戲的AI系統(tǒng)策略。

“外交”是一種策略游戲,在歐洲地圖上劃分為75個省。玩家建立并動員軍隊占領(lǐng)各省,直到控制了大部分補給中心的玩家獲勝。玩家每回合寫下自己的行動,然后執(zhí)行。他們可以攻擊或防御對方玩家,或者支援對方玩家的進(jìn)攻和防御,建立聯(lián)盟。在完整版中,玩家可以協(xié)商,為了方便人工智能研究,DeepMind公司使用了簡單版的“No Press”策略,不需要人工智能軟件發(fā)布策略與其他玩家進(jìn)行溝通。

從歷史上看,人工智能使用人工制定的策略來發(fā)揮決策作用。2019年,蒙特利爾研究所的Mila通過使用深度學(xué)習(xí)系統(tǒng)取得了勝利。他們基于150000個人類游戲的數(shù)據(jù)集,訓(xùn)練了一個稱為DipNet的神經(jīng)網(wǎng)絡(luò)來模仿人類。DeepMind從DipNet版本開始,使用強化學(xué)習(xí)(一種反復(fù)試驗)來完善它。但是,僅通過反復(fù)試驗來探索可能性會帶來問題。因此,他們調(diào)整了強化學(xué)習(xí)算法。在訓(xùn)練過程中,他們在每一步中都對對手的可能舉動進(jìn)行采樣,計算出在這些情況下平均效果最佳的行動,然后訓(xùn)練自己的權(quán)重以偏向于此行動。經(jīng)過訓(xùn)練,它跳過了采樣過程,僅根據(jù)其學(xué)習(xí)的知識進(jìn)行工作。Tacchetti說:“我們論文的信息是:我們可以在這樣的環(huán)境中進(jìn)行強化學(xué)習(xí)。” 他們設(shè)計的一個AI玩家與六個DipNet的AI贏了30%的時間(有14%的機會)。一個DipNet對抗他們的七個,僅贏得了3%的時間。

今年4月,F(xiàn)acebook將在ICLR會議上發(fā)表一篇論文,描述他們在“No Press”版本的外交游戲中的研究成果。他們建立了類似DipNet的網(wǎng)絡(luò),但是沒有添加強化學(xué)習(xí)的元素,而是添加了一個“SearchBot”搜索玩家策略,SearchBot通過玩幾回合來評估玩家的每種潛在策略(假設(shè)每個人都根據(jù)神經(jīng)網(wǎng)絡(luò)的首選選擇后續(xù)行動)。策略不是一個最佳行動組合,而是由50個可能行動組成的一組概率(由神經(jīng)網(wǎng)絡(luò)建議)。

在真實游戲中進(jìn)行這樣的探索會減慢SearchBot的速度,但可以使它更優(yōu)于DipNet。SearchBot在外交游戲網(wǎng)站上與人類進(jìn)行了匿名比賽,在玩家中排名前2%。Facebook的計算機專家、論文的共同作者亞當(dāng)·勒勒(Adam Lerer)說:“這是第一個被證明具有能與人類競爭的機器人。”

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50095

    瀏覽量

    265307
  • 強化學(xué)習(xí)
    +關(guān)注

    關(guān)注

    4

    文章

    270

    瀏覽量

    11967
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12286

原文標(biāo)題:DeepMind又出AI大招

文章出處:【微信號:robotmagazine,微信公眾號:機器人技術(shù)與應(yīng)用】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    Nordic 的 Edge AI 主要有以下幾個好處(基于官方資料總結(jié)): 極低功耗、延長電池壽命 在本地運行 AI,減少無線傳輸次數(shù),而無線收發(fā)是最耗電的部分。設(shè)備只需上傳“結(jié)果/事件”,而不是
    發(fā)表于 01-31 23:16

    全功能AI降噪消回音USB聲卡模組AP-0316#AI降噪#回聲消除

    AI
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 17:06:38

    純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件

    *附件:ai study.zip*附件:融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件.pdf 基于開源鴻蒙編寫的ai輔助學(xué)習(xí)軟件
    發(fā)表于 11-12 15:38

    VS680 HDMI AI分析解決方案 #目標(biāo)識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    沒屏幕也能AI,無屏AI玩具成了全年齡時尚單品?

    AI
    腦極體
    發(fā)布于 :2025年11月09日 00:52:57

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實驗科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)動科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI開創(chuàng)了新的時代,經(jīng)歷了三次熱潮和兩次低谷
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實現(xiàn)。 而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺濕潤的軟組織
    發(fā)表于 09-06 19:12

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊
    發(fā)表于 07-09 18:30

    AI岸橋理貨系統(tǒng)高效精準(zhǔn)

    AI
    jf_60141436
    發(fā)布于 :2025年05月30日 11:49:13

    湖南重大招商引資駐京工作專班蒞臨ALVA調(diào)研

    近日,湖南省央企對接合作暨重大招商引資駐京工作專班主任鄭建新一行赴 ALVA Systems 考察調(diào)研。
    的頭像 發(fā)表于 04-16 10:14 ?851次閱讀

    AI 時代開啟,企業(yè)跟風(fēng)做 AI 產(chǎn)品是明智之舉?

    AI
    華成工控
    發(fā)布于 :2025年04月10日 17:28:44