91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI賭神贏的背后,只是8天的訓(xùn)練

mK5P_AItists ? 來源:YXQ ? 2019-08-15 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2017年年初,Brain vs AI的德州撲克人機(jī)大戰(zhàn)在卡耐基梅隆大學(xué)(CMU)落幕,由4名人類職業(yè)玩家組成的人類大腦不敵人工智能程序Libratus。

獲勝后人類還遭到了Libratus的無情嘲諷。

但是那時候Libratus還只是個只能在1V1局里稱霸的超級玩家,要說人類最喜歡的6人局這樣的“大場面”,當(dāng)時的Libratus還沒有拿到入場券。

而就在昨天,F(xiàn)acebook與CMU學(xué)Noam Brown、Tuomas Sandholm的最新研究成果——Pluribus,就在人類最常見的無限制德州撲克6人局里,戰(zhàn)勝了人類頂尖選手。

跟還是不跟?高手之間的對決

Darren Elias(1986年11月18日出生)是一名美國職業(yè)撲克玩家,曾獲得四項世界撲克巡回賽冠軍。

在他與Pluribus的對決過程中,Darren Elias從來沒有遇到過如此不害怕的對手。

一個有經(jīng)驗的撲克玩家,當(dāng)有兩個J(一個面朝上,另一個藏起來,一手既不好也不壞)時,都會謹(jǐn)慎行事。但是Elias的對手看起來好像不知道該怎么做。即使當(dāng)Elias決定虛張聲勢(bluff),下注時看起來很有信心,而他的對手似乎在鼓勵他繼續(xù)!好像一點都沒有被嚇到。

最后,Elias的虛張聲勢沒有起作用,他輸了。

Elias

正如埃利亞斯先生意識到的,Pluribus知道什么時候該虛張聲勢,也知道別人在虛張聲勢,還知道什么時候該改變自己的行為,這樣其他玩家就無法確定自己的策略。32歲 Elias先生說: 它確實做了一些人類很難做到的事情。

贏的背后,只是8天的訓(xùn)練

之前AI和人玩游戲,要么是雙人游戲,如國際象棋、跳棋等,要么就是雙方之間的零和博弈(一方贏一方輸),AI可以在游戲中找到Nash equilibrium strategy(納什平衡)來保證自己不會輸。

關(guān)于Nash equilibrium strategy(納什平衡)屬于博弈論范疇(注:納什證明了,如果允許混合策略,那么任何一個博弈,只要參與者數(shù)量是有限的、參與者可以選擇的純策略也是有限的,那么這個博弈至少有一個納什均衡)。

以經(jīng)典的“石頭剪刀布”游戲為例,AI可以在游戲中找到對方的弱點和常出的手勢進(jìn)行學(xué)習(xí),以達(dá)到最終的勝利,而多人撲克意味著玩家數(shù)量的增多,在更復(fù)雜的游戲中,AI難以確定如何與納什均衡相抗衡;采用固定策略不能很快觀察到的對手的策略傾向,而且需要監(jiān)控到多個玩家在游戲中策略的轉(zhuǎn)變,這對于AI多人撲克博弈來說,是一項挑戰(zhàn)。

鑒于多人游戲,如果學(xué)習(xí)多個玩家的出牌習(xí)慣等特征的訓(xùn)練數(shù)據(jù)集成本過大,這里Pluribus采用的策略是自己與自己博弈,不使用人類對手的數(shù)據(jù)作為模型訓(xùn)練的輸入。在開始時,隨機(jī)的選擇玩法,通過不斷的訓(xùn)練來提升自己的性能,這里采用的博弈策略是改良版本的迭代的蒙特卡洛CFR(MCCFR),通過自我博弈,左右手互博,自己制定了一個blueprint strategy(藍(lán)圖策略),最后對每個可能的狀況進(jìn)行概率分布統(tǒng)計,通過搜索決策樹來決定下一步的行為,是叫牌還是出牌。

CFR是一種迭代的自我游戲算法,AI從完全隨機(jī)游戲開始,然后通過學(xué)習(xí)擊敗早期版本的自己逐漸改進(jìn)。

在算法的每次迭代中,MCCFR指定一個玩家作為其當(dāng)前策略在迭代中更新的標(biāo)記。在迭代開始時,MCCFR根據(jù)當(dāng)前所有玩家的策略(最初是完全隨機(jī)的)模擬一手撲克牌。一旦模擬完成,人工智能就會回顧每一個玩家做出的決定,然后通過選擇其他可用的行動來預(yù)測這個決定的好壞程度。

Pluribus玩家博弈樹

在解決不完全信息博弈中搜索的問題,Pluribus跟蹤每一手,根據(jù)其策略達(dá)到目前狀況的可能性。不管Pluribus實際上握著的牌,它首先會計算如何使用可能的每一手,謹(jǐn)慎地平衡所有的策略,以保持對于對手的不可預(yù)測性。

Pluribus 中的實時搜索

撲克以外的事

之前在1V1局中大勝人類的Libratus后來去五角大樓上班去了,國防部認(rèn)為這種策略型人工智能或許可以幫助他們進(jìn)行戰(zhàn)略的制定。

負(fù)責(zé) Pluribus 項目的 研究員Noam Brown說:“Pluribus的技術(shù)可以用于華爾街交易、拍賣、政治談判和網(wǎng)絡(luò)安全這些活動中,這些活動就像撲克一樣,涉及隱藏信息,因為你并不總是知道真實世界的狀態(tài)?!?/p>

盡管像谷歌這樣的公司,有著“Don't be evil”的信條,但是,不可避免的是這樣能夠理解人類策略的人工智能,還是會引發(fā)大眾對于人工智能的某種恐懼,或者說,如果這樣的人工智能被運用到軍事決策中,將會帶來多嚴(yán)重的后果?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40005

    瀏覽量

    301652
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137036

原文標(biāo)題:AI賭神升級!無懼bluff,6人局德?lián)渫陝偈澜绻谲姡?xùn)練只用了8天

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RA8P1部署ai模型指南:從訓(xùn)練模型到部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓(xùn)練好的模型”穩(wěn)定地“跑在板子上”,決定了項目能否落地。我們帶你基于RA8P1平臺,跑通從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、量化轉(zhuǎn)換,到工程部署的整個流程,幫助你快速實現(xiàn)
    的頭像 發(fā)表于 11-20 18:06 ?2114次閱讀
    RA<b class='flag-5'>8</b>P1部署<b class='flag-5'>ai</b>模型指南:從<b class='flag-5'>訓(xùn)練</b>模型到部署?|?本周六

    800G 光模塊:AI 算力洪流的 “超級傳動軸”

    當(dāng) AI 大模型幾小時內(nèi)完成訓(xùn)練、自動駕駛實時處理海量數(shù)據(jù),這些場景背后,800G 光模塊是不可或缺的高速傳輸?shù)鬃?。它?b class='flag-5'>只是 “網(wǎng)線升級品”,更是支撐全球數(shù)字基礎(chǔ)設(shè)施運轉(zhuǎn)的核心組件,而
    的頭像 發(fā)表于 10-30 16:54 ?1039次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點:基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號計算 三、AGI芯片的實現(xiàn) 1、技術(shù)需
    發(fā)表于 09-18 15:31

    睿海光電800G光模塊助力全球AI基建升級

    領(lǐng)先的技術(shù)研發(fā)實力、行業(yè)領(lǐng)先的交付速度(較同行快2-3)以及高度兼容的解決方案,迅速崛起為AI光模塊領(lǐng)域的標(biāo)桿企業(yè)。目前,睿海光電已為全球1560余家客戶提供包括800G SR8在內(nèi)的多場景產(chǎn)品矩陣
    發(fā)表于 08-13 19:05

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    引領(lǐng)AI時代網(wǎng)絡(luò)變革:睿海光電的核心競爭力 在AI時代,數(shù)據(jù)中心正經(jīng)歷從傳統(tǒng)架構(gòu)向AI工廠與AI云的轉(zhuǎn)型。AI工廠依賴超大規(guī)模GPU集群驅(qū)動
    發(fā)表于 08-13 19:01

    在K230中,如何使用AI Demo中的object_detect_yolov8n,YOLOV8多目標(biāo)檢測模型?

    在K230的AI開發(fā)教程文檔中,可以看到有源碼的AI Demo,其中包括yolov8n模型,在倉庫里可以看到源碼 我想請問各位大佬,如何使用這個程序?如何更改程序,替換為我自己的數(shù)據(jù)集和
    發(fā)表于 08-07 06:48

    兆芯攜手聯(lián)想開在WAIC 2025展示AI公文寫作神器

    2025世界人工智能大會正在火熱召開。本屆大會,兆芯攜手聯(lián)想開展示了一套AI公文寫作神器,基于開AIPC終端,搭載定制AI算力卡,推理、數(shù)據(jù)完全本地化,內(nèi)置基于海量權(quán)威語料
    的頭像 發(fā)表于 08-04 10:01 ?1110次閱讀

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    使用 ai cude 里面自帶的案例訓(xùn)練UI顯示異常的原因?怎么解決?

    案例的配置是默認(rèn)的,顯示訓(xùn)練ui更改顯示異常
    發(fā)表于 06-23 06:21

    海思SD3403邊緣計算AI數(shù)據(jù)訓(xùn)練概述

    AI數(shù)據(jù)訓(xùn)練:基于用戶特定應(yīng)用場景,用戶采集照片或視頻,通過AI數(shù)據(jù)訓(xùn)練工程師**(用戶公司****員工)** ,進(jìn)行特征標(biāo)定后,將標(biāo)定好的訓(xùn)練
    發(fā)表于 04-28 11:11

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應(yīng)用場景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    OPPO Find X8s/X8s+搭載MediaTek璣9400+芯片

    OPPO Find X8s 和 Find X8s+ 搭載 MediaTek 璣 9400+ 旗艦芯。作為新發(fā)布的旗艦 5G 智能體 AI 芯片,其擁有卓越的生成式
    的頭像 發(fā)表于 04-22 11:22 ?2287次閱讀

    首創(chuàng)開源架構(gòu),AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級的AI開發(fā)套件2.0,在模型庫規(guī)模、架構(gòu)開放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓(xùn)練落地等方面均迎來全面躍遷,為開發(fā)者提供了更全面、更開放、更強(qiáng)大的端側(cè)
    發(fā)表于 04-13 19:52

    利用RAKsmart服務(wù)器托管AI模型訓(xùn)練的優(yōu)勢

    AI模型訓(xùn)練需要強(qiáng)大的計算資源、高效的存儲和穩(wěn)定的網(wǎng)絡(luò)支持,這對服務(wù)器的性能提出了較高要求。而RAKsmart服務(wù)器憑借其核心優(yōu)勢,成為托管AI模型訓(xùn)練的理想選擇。下面,
    的頭像 發(fā)表于 03-18 10:08 ?718次閱讀

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓(xùn)練策略和高性能算子庫,這兩大框架在國產(chǎn)全功能GPU上實現(xiàn)了高效的混合
    的頭像 發(fā)表于 03-17 17:05 ?1550次閱讀
    摩爾線程GPU原生FP<b class='flag-5'>8</b>計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>