91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI“里程碑”的含金量到底高不高?

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周,OpenAI Five擊敗DOTA2業(yè)余人類玩家,轟動游戲圈和AI圈,連比爾·蓋茨都忍不住發(fā)推特點贊,稱之為“里程碑事件”。這個事件對業(yè)界帶來的影響有多大?技術含量有多高?新智元采訪了數(shù)位國內外專家,他們并不全都贊同“里程碑”的觀點。

上周,OpenAI自學習多智能體5v5團隊戰(zhàn)擊敗DOTA2業(yè)余人類玩家,成為轟動人工智能圈的一件大事。

這個事件的意義,不僅僅局限于AI“攻克”星際爭霸或者Dota這樣的復雜電子競技游戲,而是代表著AI在決策智能上的能力大幅向前推進。

對于這件事,比爾·蓋茨也發(fā)推文稱贊:這是一件大事,因為它們的勝利需要團隊合作和協(xié)作——這是推進人工智能的一個巨大里程碑。

不過,也有觀點認為OpenAI這個“里程碑”只是在算力上的巨大勝利,并沒有在算法上創(chuàng)新,他們只是擴展了已有的方法。

OpenAI“里程碑”的含金量到底高不高?

先來看技術:強化學習能夠進行大但是可實現(xiàn)規(guī)模的長期規(guī)劃

OpenAI Five之所以戰(zhàn)勝DOTA2的業(yè)余選手,成為比爾·蓋茨眼里的里程碑事件,主要原因在于它使用“近端策略優(yōu)化”(PPO)的擴展版算法,在256個GPU和128000個CPU內核上進行訓練。每個英雄都使用單獨的LSTM,不使用人類數(shù)據,最終AI能夠學會識別策略。

這種做法表明,強化學習能夠進行大但卻可實現(xiàn)規(guī)模(large but achievable scale)的長期規(guī)劃,而不發(fā)生根本性的進展。

國內首家決策智能公司啟元世界研究科學家、香港科技大學彭鵬博士認為,從Dota2中展現(xiàn)出來的群體智能來看,OpenAI Five無論從對整體局勢的判斷還是對局部戰(zhàn)場的應對,都展現(xiàn)了很高的智能決策能力。

整體戰(zhàn)略上,通過前期給輔助英雄一定的資源,讓輔助英雄可以通過gank和push幫助隊伍快速進入中期階段,加快并試圖掌握游戲節(jié)奏;能夠快速集結起部分隊員進行連續(xù)有效的gank;集中push敵方優(yōu)勢路和中路,逼迫對方在較難防守的位置交戰(zhàn)。在團戰(zhàn)中,對切入時機、距離控制、英雄的職責分配、集火目標選擇和多種裝備的靈活運用做的非常到位。

最令人驚訝的是,OpenAI Five直接在微操級別的動作空間中進行探索和學習,僅僅通過幾天的訓練就達到了上述的效果。雖然有12800 CPU cores和256 P100 GPU的加持,這一結果足以使大家對深度強化學習有更強的信心。

此外,盡管當前版本的OpenAI Five的補兵能力表現(xiàn)不佳,但它在選擇優(yōu)先攻擊目標上已經達到專業(yè)水平。獲得長期回報往往需要犧牲短期回報,例如發(fā)育后的金錢,因為團推時也需要耗費時間。這表明系統(tǒng)真正在進行長期的優(yōu)化。

(關于更具體的實現(xiàn)過程,新智元此前有詳細報道,讀者可移步新智元知乎專欄閱讀:

https://zhuanlan.zhihu.com/p/38499219)

OpenAI自有過人之處,Smerity高度評價

彭鵬博士認為,從技術角度來講,OpenAI Five延續(xù)了OpenAI在1v1中所采用的建模方式,相比Deepmind主打的端到端學習(end-to-end learning),OpenAI Five直接使用語義信息作為模型的輸入,極大地降低模型訓練所需的計算力,這算是一個新進展。

另外,OpenAI Five也在reward function的構造也很有特色,在個人reward和團隊reward之間做了很好的平衡;模型會在訓練前期重視優(yōu)化個人reward,而在訓練后期開始注重團隊reward。最后,OpenAI大規(guī)模高性能的Rapid系統(tǒng)設計也體現(xiàn)了他們的功力,同時調度上萬的CPU和GPU資源,在自我對弈的過程中不斷變強。

如果僅僅是通過算力提升來訓練模型,恐怕不能稱之為“里程碑”。

Metamind高級研究科學家Stephen Merity(即Smerity)在OpenAI Five的研究發(fā)布當天,連發(fā)數(shù)條推特,高度評價了這項成果。

Smerity本身是一名DOTA的深度玩家,他從WC3時代開始并且已經打了830小時的DOTA2,他認為這一影響遠遠超出了DOTA本身。

這些機器人從來沒有見過傳統(tǒng)的人類策略,它們只是按照規(guī)則和目標來玩游戲。如果有一種正和(positive sum)的方式來玩“人”的零和游戲,它一定會找到的。

我們可以預見未來社會中很多錯綜復雜的東西都沒有了,為什么呢?因為這些自主系統(tǒng)將讓我們意識到,現(xiàn)在我們的一些優(yōu)化措施實際上是不成熟的,反而讓問題變得復雜;這些系統(tǒng)還能讓我們少走很多彎路,現(xiàn)在我們都是走了彎路以后才意識到自己繞了道。

作為人類,我們還不夠聰明,無法看穿復雜和復雜交互的迷霧,但我們編寫的系統(tǒng)或許可以。它們可能幫助我們實現(xiàn)幾百年來我們一直不情愿地、迷茫地走向的目標——協(xié)作。

OpenAI并沒有在算法上創(chuàng)新,談不上“里程碑式的成就”

倫敦大學學院(UCL)的計算機教授汪軍告訴新智元,AlphaGo之后,AI領域的下一大挑戰(zhàn)就是多智能體強化學習(Multi-Agent reinforcement learning,MARL),也即讓多個智能體學會合作與競爭。

DOTA、星際爭霸,還有更多人熟悉的王者榮耀,都屬于多智能體強化學習(MARL),但DOTA 5v5的設置相對更加簡單。從去年開始,汪軍在UCL的團隊與上海的一家游戲公司合作,研究如何讓AI玩王者榮耀。目前,包括DeepMind、Facebook、阿里、騰訊在內的很多機構,都在這些游戲上從事MARL研究,但尚未有團隊公開實質性的突破。

OpenAI的工作讓更多學者和公眾關注MARL,這是一件好事,但如果說這是一項“里程碑式的成就”,則遠遠談不上。

汪軍說,OpenAI僅發(fā)布了blog,沒有發(fā)布學術論文,目前對其科學性還比較難以評估。但從發(fā)布的blog上看不到算法的創(chuàng)新。他們只是擴展了已有的方法,然后上了大量的計算力——整整128000 CPU和 256 GPU,這樣的硬件基礎設施是一般的高校所不具備的?!?/p>

“OpenAI證明了使用現(xiàn)有的算法和trick,加上強大的計算力、工程力量和足夠的耐心,是可以把這件事情做出來的。”

很可惜的是,OpenAI并沒有針對游戲中AI如何合作去明晰建模,沒有嘗試去理解AI彼此合作的機制,模型還是單獨的強化學習,把其他的英雄當成環(huán)境的一部分,并使用普通的團隊和個體結合的獎勵機制,通過大量試錯取得了最后的結果?!爸灰凶銐蚨嗟臅r間(也就是足夠多的計算資源),你總能試出一些結果?!蓖糗娬f,因此它不太具有創(chuàng)新性。

汪軍呼吁大家重視并扶持基礎性的長期研究,將眼光放長遠,“多多資助我們這些搞基礎研究的一些GPU”,對領域長期健康發(fā)展做出積極貢獻。

不過,汪軍也非??隙ˋlphaGo、OpenAI等機構的研究對產業(yè)帶來的潛移默化的影響。“目前,阿里巴巴、百度、滴滴、京東、華為這些公司都在嘗試把強化學習用在不同的場景,比如直接用在互聯(lián)網廣告、倉儲物流、自動駕駛等場景上面,這就是AlphaGo帶來的影響,大家都對強化學習非常關注?!?/p>

“據我所知,DeepMind已經把研究的一些能量輸入到谷歌內部中,好像我們看到DeepMind還沒有實現(xiàn)經濟價值,其實已經讓谷歌內部產生了效率?!蓖糗娬f。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1819

    文章

    50193

    瀏覽量

    266331
  • 智能體
    +關注

    關注

    1

    文章

    523

    瀏覽量

    11628
  • 強化學習
    +關注

    關注

    4

    文章

    272

    瀏覽量

    11988

原文標題:OpenAI戰(zhàn)勝DOTA2人類玩家是“里程碑式成就”?有專家評含金量不高

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    上揚軟件迎來成立25周年的里程碑時刻

    時光落筆,新程再啟。2026年3月底,我們迎來了公司成立25周年的里程碑時刻。
    的頭像 發(fā)表于 04-01 13:49 ?55次閱讀

    中軟國際在金融科技出海征程再添關鍵里程碑

    近日,中軟國際金融業(yè)務集團成功斬獲馬來西亞某知名數(shù)字銀行移動應用開發(fā)項目。該項目是金融業(yè)務集團在東南亞區(qū)域突破的又一家核心數(shù)字銀行客戶,為公司金融科技出海征程再添關鍵里程碑。
    的頭像 發(fā)表于 02-06 18:06 ?2473次閱讀

    億緯鋰能綠色制造體系建設取得里程碑式突破

    ,將于2025-2030年,以園中園形式進行建設。這標志著億緯鋰能"CREATE碳中和行動"初見成效,綠色制造體系建設取得里程碑式突破。
    的頭像 發(fā)表于 01-05 17:55 ?1086次閱讀

    立訊精密在高速互連領域取得里程碑式突破

    近日,立訊精密自主研發(fā)的HDMI 2.2連接器及配套測試治具,正式通過HDMI Forum首批官方認證。公司成為全球首家同時獲得產品端與測試端雙認證的供應商,標志著在高速互連領域取得里程碑式突破。
    的頭像 發(fā)表于 12-24 15:55 ?575次閱讀
    立訊精密在高速互連領域取得<b class='flag-5'>里程碑</b>式突破

    回顧那些具有里程碑意義的Arm架構產品(1)

    在 Arm 成立 35 周年之際,我們將分三期內容,與你一同回顧 35 款具有里程碑意義的 Arm 架構產品 —— 它們憑借智能、性能與能效的深度融合,重塑了現(xiàn)代計算格局,更推動了全球科技變革的浪潮。本周我們就將從 Arm 成立初期開始盤點!
    的頭像 發(fā)表于 12-15 14:59 ?804次閱讀

    奧托立夫祝賀一汽大眾達成3000萬輛里程碑

    2025年10月30日,我們重要的合作伙伴一汽-大眾迎來第3000萬輛整車下線的歷史性時刻,標志著其成為國內首家達成這一里程碑的乘用車企業(yè)!奧托立夫受邀出席下線儀式,共同見證這一中國汽車工業(yè)發(fā)展的重大里程碑。
    的頭像 發(fā)表于 11-03 09:56 ?600次閱讀

    產業(yè)里程碑 | 星閃數(shù)字車鑰匙藍皮書在京成功發(fā)布

    和信息化部、國際星閃聯(lián)盟、東風汽車、華為、海思、銀基科技、遠峰科技等政府主管機構、主機廠及核心供應鏈的50余位嘉賓,共同到場見證這一凝聚產業(yè)智慧的里程碑文件正式“啟封”。 規(guī)格陣容:聯(lián)盟搭臺引領,政府站臺助力 發(fā)布會在國際
    的頭像 發(fā)表于 10-20 15:38 ?422次閱讀
    產業(yè)<b class='flag-5'>里程碑</b> | 星閃數(shù)字車鑰匙藍皮書在京成功發(fā)布

    意法半導體衛(wèi)星數(shù)字廣播芯片組榮獲IEEE里程碑

    1799年,Alessandro Volta向世界展示了電能儲存技術;一個世紀后,Guglielmo Marconi向世界證明無線電波可以跨洋傳輸。IEEE里程碑獎正是為紀念這些改變世界的技術突破而設立,提醒我們,當銳意創(chuàng)新、產品化和造福社會融合到一起時,社會進步便會隨之而來。
    的頭像 發(fā)表于 09-11 09:59 ?836次閱讀

    北京奔馳迎來成立20周年的重要里程碑

    今日,北京奔馳汽車有限公司(以下簡稱“北京奔馳”)迎來成立20周年的重要里程碑。作為梅賽德斯-奔馳在華唯一乘用車生產基地,北京奔馳始終踐行高質量發(fā)展理念,以持續(xù)積淀的硬核制造實力、前瞻的智能布局和穩(wěn)健的人才戰(zhàn)略,成為中國高端制造的一張重要名片,也成為中德企業(yè)合資合作、協(xié)同共進的典范樣本。
    的頭像 發(fā)表于 08-16 09:09 ?1405次閱讀

    新思科技與TeraSignal在光網絡領域達成兩大里程碑

    新思科技與TeraSignal在光網絡領域達成兩大里程碑,展示了基于線性光學技術的PCIe 6.x和112 Gbps以太網的無縫互操作性。
    的頭像 發(fā)表于 08-15 15:42 ?1105次閱讀
    新思科技與TeraSignal在光網絡領域達成兩大<b class='flag-5'>里程碑</b>

    愛立信攜手Telstra創(chuàng)下全新行業(yè)里程碑

    愛立信近日攜手Telstra創(chuàng)下全新行業(yè)里程碑,在悉尼北部50多個商用5G-A站點成功部署自動載波聚合技術,使Telstra成為首個在商用網絡環(huán)境中應用該功能的運營商。
    的頭像 發(fā)表于 08-06 16:45 ?1.7w次閱讀

    里程碑!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    年中之際,屹立芯創(chuàng)迎來里程碑時刻 —— 公司自主研發(fā)生產的真空壓力除泡系統(tǒng),已正式交付頭部通信模組企業(yè),馬來西亞檳城研發(fā)中心。這一成果不僅是對其在先進制造領域技術實力的硬核驗證,更標志著企業(yè)在 IoT 領域實現(xiàn)了更深層次的突破,為其海外市場拓展與先進封裝領域的深耕筑牢了根基。
    的頭像 發(fā)表于 07-15 10:07 ?753次閱讀
    <b class='flag-5'>里程碑</b>!屹立芯創(chuàng)除泡系統(tǒng)落地馬來檳城,深耕 IoT 與先進封裝

    Agentic AI再豎里程碑,這次引爆革命的還是亞馬遜云科技

    科技云報到原創(chuàng)。 誰都知道AI發(fā)展的速度日新月異,但當里程碑即將出現(xiàn)時,所有人依然心潮澎湃。 在亞馬遜云科技中國峰會上,Agentic AI就是這顆耀眼的科技新星。亞馬遜全球副總裁、亞馬遜云科技大
    的頭像 發(fā)表于 06-25 10:28 ?631次閱讀
    Agentic AI再豎<b class='flag-5'>里程碑</b>,這次引爆革命的還是亞馬遜云科技

    仰望U8見證中國深空探測里程碑時刻

    近日,行星探測工程天問二號探測器在西昌衛(wèi)星發(fā)射中心發(fā)射,并已成功進入地球至小行星2016HO3轉移軌道,發(fā)射任務取得圓滿成功。仰望U8車隊赴發(fā)射現(xiàn)場,與航天專家、公眾共同見證中國深空探測又一里程碑
    的頭像 發(fā)表于 06-04 15:51 ?841次閱讀

    四創(chuàng)電子水利監(jiān)測設備取得里程碑式進展

    近日,四創(chuàng)電子自主研發(fā)的相控陣型水利測雨雷達,完成全部技術驗證并工程化落地。該型雷達不僅攻克了相控陣體制下水利測雨全要素技術指標的工程實現(xiàn)難題,更在核心算法、軟計架構等關鍵技術實現(xiàn)完全自主可控,標志著公司水利監(jiān)測設備取得里程碑式進展。
    的頭像 發(fā)表于 05-06 16:06 ?1162次閱讀