91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們不是嫌棄世界冠軍OG團隊實力太水嗎?“你行你上”的機會來了

電子工程師 ? 來源:lp ? 2019-04-22 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你們不是嫌棄世界冠軍 OG 團隊實力太水嗎?“你行你上”的機會來了。

4 月 14 日凌晨,OpenAI Five 以 2:0 擊敗了 DOTA 世界冠軍團隊 OG 引發(fā)熱議。比賽當天,OpenAI 也宣布要開放 OpenAI Five 競技場模式,讓每個感興趣的人都參與其中。

4 月 18 日(太平洋標準時間)下午 6 點,OpenAI 如約開放了這一模式,全世界各路玩家都可以免費進行體驗。開放時間為期三天,4 月 21 日(太平洋標準時間)晚上 11 點 59 分關(guān)閉,要體驗一把人機對戰(zhàn)的話可得抓緊時間。

參賽鏈接:https://arena.openai.com/#/

目前從其官網(wǎng)賽況來看,截止今天早上 10 點,OpenAI Five 與參與者打了 424 場比賽,AI 以 112-0 完勝人類玩家。

以下是人類參與者的部分賽況:

據(jù) OpenAI 官方介紹,參與者可以在競爭模式和合作模式下體驗 OpenAI Five。他們的 1v1 機器人可以通過巧妙的策略加以利用,但他們也并不知道 OpenAI Five 能在多大程度上可以做到這一點。

在此前決賽中,他們展示了 OpenAI Five 和人類在合作模式打游戲。一組是 Sheever、Blitz 和三個 OpenAI Five,對手是由 Capitalist、ODPixel 和三個 OpenAI Five 組成的團隊。

不過,通過 OpenAI Five 在決賽上的表現(xiàn),OpenAI 團隊在最新的博客中分享了兩個驚喜:

盡管訓練 OpenAI Five 系統(tǒng)的目的是為了打敗其他機器人,但他們卻發(fā)現(xiàn) OpenAI Five 其實還有與人類成為隊友的基本能力,也就是說可以將一個競爭型 AI 變?yōu)楹献餍?AI。他們認為,如果能更努力去開發(fā),未來 AI 系統(tǒng)能為人類做出非常多的貢獻。

4 月 18 日 到 21 日的競技場模式測試將回答一個很重要的研究問題——OpenAI Five 的潛能可以被人類運用到何種程度,或者它們在其他哪些方面必定會被打敗。OpenAI Five 這一深度強化學習智能體系統(tǒng),可能會成為有史以來人類能與之交互的最大的 AI 部署系統(tǒng)。

OG戰(zhàn)隊與OpenAI開發(fā)團隊

對于 OpenAI Five 競技場模式,有很多人報以期待,reddit 上有網(wǎng)友評論稱,“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經(jīng)要求要在網(wǎng)上跟機器人玩游戲了,現(xiàn)在它真的發(fā)生了!”

只是,如果在競爭模式跟 AI 打 DOTA,作為人類玩家的你會不會慘遭OpenAI Five 的虐殺,而輸?shù)煤翢o懸念呢?祝你們好運。

當然,玩游戲之余,你可能也想知道:OpenAI Five 取得勝利背后的“秘訣”是什么?為什么這次的 OpenAI Five 系統(tǒng)要比去年在 TI 表演賽上敗給人類的AI系統(tǒng)更強?OpenAI 是如何訓練 OpenAI Five 系統(tǒng)的?OpenAI 團隊最近給出了解讀。

為什么是 DOTA2?

一開始,OpenAI 團隊研究 OpenAI Five 是為了解決超出現(xiàn)有深度強化學習算法能力范圍的問題,他們希望通過現(xiàn)有的方法解決當下無法解決的問題,原以為這需要復雜的算法思想(比如分層強化學習(Hierarchical RL)),但他們驚訝地發(fā)現(xiàn)只需要改進的是規(guī)模,但實現(xiàn)和利用這個規(guī)模并不容易,這成了其研究的主要內(nèi)容。

OpenAI Five 把世界看作是一串必須破譯的數(shù)字。無論這些數(shù)字是以 DOTA 游戲形式(約 20000 個數(shù)字),還是以機械手形式(約 200 個),使用的都是通用學習代碼。

為了創(chuàng)建 OpenAI Five,OpenAI 團隊創(chuàng)造了一個名為 Rapid 的系統(tǒng),用來以從未有過的規(guī)模去運行 PPO(Proximal Policy Optimization),結(jié)果出人意料,居然創(chuàng)造了一個不受任何基本性能限制的世界級 DOTA 機器人。

如今,RL 算法表現(xiàn)出了驚人的能力,但它在游戲或模擬環(huán)境之外卻用處不大,但這個限制可能并沒有聽起來的那么糟糕,例如可以使用 Rapid 來控制機械手來重新移動一個模塊,這需要首先進行模擬訓練,然后在物理機器人上執(zhí)行。他們認為,對于 RL 的下一個挑戰(zhàn)是減少對經(jīng)驗的依賴。

雖然他們決定不再讓 OpenAI Five 成為競爭對手,但社會進步和技術(shù)發(fā)展將繼續(xù)推動未來的研究,這也并非 DOTA 比賽研究的終點,他們認為 DOTA 比賽對 RL 開發(fā)來說是一個比現(xiàn)在使用的標準環(huán)境更有趣、更復雜、也更好理解的環(huán)境。

算力

與 DOTA2 在去年的 TI 表演賽的失利相比,OpenAI Five 在 4 月 14 日戰(zhàn)勝 OG 團隊的主要原因是其訓練的計算量增加了 8 倍。去年比賽后,OpenAI 團隊將項目中的絕大部分計算用于訓練 OpenAI Five 模型,同時還增加了訓練時間。

OpenAI Five 的 TrueSkill,由于已經(jīng)使用了額外的訓練計算,所以用線來劃分主要的系統(tǒng)變化。這張圖的走向大致是線性的,意味著 OpenAI Five 不斷從額外計算中獲益。

總之 ,OpenAI Five 的當前版本已經(jīng)訓練了 800 petaflop/s /天,并且在10個實時月的時間內(nèi)進行相當于人類大約 45000 年時長的 DOTA 游戲自我訓練,相當于人類每天平均有 250 年的模擬訓練。OpenAI Five 的最終版本與 TI 版本相比,勝率是 99.9%。

18 個英雄

從訓練 5 名英雄到 18 名英雄時的訓練進度幾乎沒有放緩,他們已經(jīng)假設同樣的情況如果發(fā)生在更多的英雄身上會怎樣。TI比賽后,又花了很多精力去整合新的英雄。

他們花了幾周時間去訓練多達 25 個英雄的英雄池,將這些英雄帶到大約 5k MMR(大約是95% DOTA 玩家的水平)。雖然在進步,但學習速度不夠快,無法在決賽前達到職業(yè)水平。研究人員還沒有時間去找到原因,但后來發(fā)現(xiàn)模型容量不足,需要更好的匹配來擴展英雄池,還需要更多的訓練時間來讓新英雄趕上老英雄。但想象一下,當一個人掌握了自己的英雄時,再去學習一個新英雄是多么困難。

對了,這里明明說訓練了 18 個英雄,但為什么在與 OG 比賽時只放了 17 個英雄?因為還有一個英雄在 DOTA v7.20 版本中出現(xiàn)了明顯變化,所以就沒用。

最后,這么好的機會,要不要去體驗下被機器人在 DOTA 中碾壓的酸爽感?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31246

    瀏覽量

    223098
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    523

    瀏覽量

    11628
  • 強化學習
    +關(guān)注

    關(guān)注

    4

    文章

    272

    瀏覽量

    11988

原文標題:“你行你上”:有本事跟OpenAI Five打一把DOTA?| 極客頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    的EMC瓶頸,不是經(jīng)驗不夠,是體系不全

    EMC的EMC瓶頸,不是經(jīng)驗不夠,是體系不全現(xiàn)在的狀態(tài),是不是這樣?產(chǎn)品送測前,心里完全沒底,不知道哪一項會掛傳導發(fā)射超標,換了十幾種電容電感,還是壓不下去靜電打幾下,系統(tǒng)重啟,
    的頭像 發(fā)表于 03-10 16:41 ?410次閱讀
    <b class='flag-5'>你</b>的EMC瓶頸,<b class='flag-5'>不是</b>經(jīng)驗不夠,是體系不全

    PCB板是普通油墨,我是低損耗油墨,能一樣嗎?

    一博高速先生成員--黃剛 文章一開始就先給各位選擇困難癥的粉絲們出一道題,如果今天讓你們來設計下面的這組25G光口信號的布線,會選擇走內(nèi)層還是表層呢? 其實高速先生相信在座的各位PCB工程師更愿
    發(fā)表于 01-23 11:40

    華為賦能 + 黑科技亮相!希影投影儀閃耀南山羽企同行展會,林丹為決賽冠軍頒獎

    冠軍隊伍頒獎,為活動增添重磅亮點。 作為特邀參展企業(yè),希影投影儀攜華為技術(shù)支持的新款希影 RS 80 Ultra 投影儀亮相 “超級品牌展區(qū)秀”,在政企領(lǐng)導與世界冠軍共同見證的高端場景中,以硬核科技實力收獲全場一致贊譽。 展會
    的頭像 發(fā)表于 12-12 16:02 ?427次閱讀
    華為賦能 + 黑科技亮相!希影投影儀閃耀南山羽企同行展會,林丹為決賽<b class='flag-5'>冠軍</b>頒獎

    網(wǎng)絡接口:數(shù)字世界的“門鈴”,了解多少?

    插上網(wǎng)線,連接Wi-Fi,可曾想過數(shù)據(jù)是如何在網(wǎng)絡世界穿梭的?今天,讓我們一起揭開網(wǎng)絡接口的神秘面紗! 是否曾好奇,當我們插上網(wǎng)線或連接Wi-Fi時,數(shù)據(jù)是如何在網(wǎng)絡世界中穿梭的?這一切都離不開
    發(fā)表于 11-26 18:53

    【社區(qū)之星】歐小龍——保護的好奇心:它是所有創(chuàng)造力的源泉

    者的角度來回答這個問題。 對于應屆生,我深知是一張“白紙”,不可能有深厚的行業(yè)經(jīng)驗。所以,我關(guān)注的不是過去做了什么”,而是“未來能做什么”的潛力。首先是態(tài)度與協(xié)作精神,一個態(tài)度
    發(fā)表于 11-26 16:31

    嵌入式開發(fā)工具版本的選擇策略

    兼容性測試標準過渡期支持策略 二、可靈活選擇軟件版本,但建議統(tǒng)一 有些工具,它對項目的“依耐性”不強,基本不同版本之間都能用,團隊之間可以不用統(tǒng)一軟件版本。 比如J-Link 、ST-Link等這種
    發(fā)表于 11-25 06:11

    側(cè)方電子后視鏡技術(shù)領(lǐng)軍企業(yè)昂星科技簽約跳水冠軍連婕

    近日,側(cè)方電子后視鏡技術(shù)領(lǐng)軍企業(yè)昂星科技正式宣布,國際泳聯(lián)跳水世界冠軍連婕成為其品牌形象代言人。此次戰(zhàn)略合作以"0.1秒的精準守護"為核心理念,將體育競技對毫秒級精準的極致追求,與行車安全技術(shù)的前沿創(chuàng)新完美融合。
    的頭像 發(fā)表于 08-20 14:41 ?929次閱讀

    科普|關(guān)于GPS和GNSS,了解多少?

    定位(Positioning)為萬物互聯(lián)提供了最基礎信息;當今以GPS、GLONASS、Galileo和Beidou為代表的全球定位系統(tǒng)為人們帶來了極大便利;而對于它們不是真正的了解,回答完以下
    的頭像 發(fā)表于 06-28 07:06 ?3113次閱讀
    科普|關(guān)于GPS和GNSS,<b class='flag-5'>你</b>了解多少?

    所以做出來了

    所以做出來了嗎,求
    發(fā)表于 06-16 01:43

    2025 MAMA移動互聯(lián)網(wǎng)高層峰會成功召開,百位業(yè)領(lǐng)袖共話AI驅(qū)動下的變局應對與增長新范式

    、世界冠軍、行業(yè)前瞻領(lǐng)袖以及資深媒體人,他們圍繞 AI 驅(qū)動增長、隱私時代的歸因新解、中國品牌全球化等熱點議題展開深度探討。
    的頭像 發(fā)表于 06-14 15:18 ?1042次閱讀

    放大的信號,點亮世界——運算放大器大揭秘

    嘿,電子迷們!今天,我們要聊一個超級厲害的小玩意兒——運算放大器(Op-Amp)!聽起來是不是有點高大?別擔心,我保證讓輕松搞懂它,還能讓覺得它超酷!1什么是運算放大器想象一下,
    的頭像 發(fā)表于 06-13 20:06 ?892次閱讀
    放大<b class='flag-5'>你</b>的信號,點亮<b class='flag-5'>你</b>的<b class='flag-5'>世界</b>——運算放大器大揭秘

    亞洲首位斯諾克世界錦標賽冠軍趙心童成為比亞迪冠軍形象大使

    5月23日,比亞迪宣布亞洲首位斯諾克世界錦標賽冠軍趙心童正式成為比亞迪冠軍形象大使。 斯諾克運動起源于英國,憑借巧妙的球路規(guī)劃、精準的擊球技巧以及選手間復雜的心理博弈,在全球擁有眾多愛好者。在剛剛
    的頭像 發(fā)表于 05-27 14:42 ?467次閱讀

    失去工作不是因為AI,而是因為使用AI的人

    當算法能精準預測消費者需求時,當AI生成的文案比人類更懂傳播心理學時,當自動化系統(tǒng)開始取代基礎決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?914次閱讀
    <b class='flag-5'>你</b>失去工作<b class='flag-5'>不是</b>因為AI,而是因為使用AI的人

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個命令

    CFA科普系列01|EDA工具裝不?可能不是技術(shù)差,而是少了這兩個命令 在芯片設計工作中,EDA工具的安裝往往是新手或運維人員最容易卡住的一步。不少人曾因一個 RPM 包的依賴安裝失敗,陷入漫長
    發(fā)表于 05-09 15:27

    比亞迪海鷗榮膺2025世界汽車大獎“世界城市車”冠軍

    近日,全球汽車行業(yè)權(quán)威獎項“2025世界汽車大獎”(World Car Awards)于紐約國際車展正式揭曉。比亞迪海鷗憑借其創(chuàng)新的設計理念、卓越的城市通勤性能及全球市場的高度認可,從全球12款候選車型中脫穎而出,榮膺“2025世界城市車(World Urban Car)
    的頭像 發(fā)表于 04-18 17:52 ?994次閱讀