91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI棋牌應用的現(xiàn)實意義

bzSh_drc_iite ? 來源:YXQ ? 2019-07-29 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI在棋牌類游戲的應用,將促進博弈決策的研究,以棋牌類AI應用為基礎的相關AI博弈工具,在經濟金融領域的風險預測、軍事領域的戰(zhàn)局預測等方向有著廣泛的應用前景。

半個多世紀以來,棋牌類游戲一直是人工智能(AI)發(fā)展創(chuàng)新的舞臺。利用AI在被視作智力游戲的棋牌中打敗人類,也一直是AI研究所追求的目標。從1997年IBM的超級電腦“深藍”擊敗國際象棋世界冠軍卡斯帕羅夫,到2016年谷歌開發(fā)的AI機器人AlphaGo戰(zhàn)勝圍棋世界冠軍李世石,AI在棋牌類比賽中屢獲突破。2019年7月,卡耐基梅隆大學與Facebook公司共同開發(fā)的AI機器人“Pluribus”,在無限制德州撲克6人對決比賽中戰(zhàn)勝5名專家級人類玩家,AI在德州撲克戰(zhàn)場再下一城。

Pluribus概況

Pluribus與人類的比賽分為兩種模式:1個AI與5個人類玩家和5個AI與1個人類玩家,Pluribus在這兩種模式中都取得了勝利。而為了戰(zhàn)勝人類,Pluribus在策略、算法和能耗上進行了多次優(yōu)化。

Pluribus研發(fā)的核心策略是運用改進版本的蒙特卡洛遺憾最小化算法(Monte Carlo Counter factual Regret Minimization,MCCFR),通過自我博弈的方式學習。Pluribus首先隨機地選擇玩法,通過蠻力計算得到收斂的結果,并對這些行動擬合概率分布,使得其實力在不斷自我博弈中逐步變強。在整個學習過程中,AI機器人和自己進行對戰(zhàn),不使用任何人類游戲數(shù)據(jù)作為輸入。

算法上,為了解決6名玩家的額外復雜性,Pluribus整合了新的在線搜索算法,使AI能夠在游戲中向前預測并決定下一步該做什么,這種機制被稱為搜索功能。以往的棋牌類算法的每一步決策都需要計算到游戲結束,而在線搜索算法只需搜索前面的幾步即可。此外,Pluribus還利用了速度更快的新型self-play非完美信息游戲算法。基于上述兩種算法,使得憑借極少的處理能力和內存來訓練Pluribus成為可能。

能耗上,研究人員使用一個64核的服務器,利用不大于512GB的內存,在8天時間里完成了Pluribus的自我博弈訓練,其成本大約為150美元,同其他自我對弈的AI研究相比,成本極低。而且算法上的進步,讓研究人員可憑借較少的資源消耗實現(xiàn)極大的性能提升。

撲克AI和其他棋牌類AI的對比

撲克AI與棋類AI的基本原理相同,都采用蒙特卡洛搜索樹算法作為基本算法,不依賴人類所提供的策略,在不斷迭代的過程中實現(xiàn)自我學習。不同的是,棋類游戲中的棋子都展現(xiàn)在棋盤上,結果種類有限,所有的結果都是可推算的,這種情況被稱為“完美信息博弈”;牌類游戲中無法知道對手的底牌,含有隱藏信息,結果可能是多樣的,導致其計算難度和計算量大大增加,被稱為“不完美信息博弈”。

棋類AI

棋類游戲包括西洋雙陸棋、國際象棋、圍棋等,比賽中所有的信息和決策公開,并且游戲對于玩家來說只有贏或輸兩種可能的結果,從某種意義上說,這使得訓練AI變得更容易。棋類在理論上可通過計算機模擬出每一種可能的情況,從而進行完美信息動態(tài)博弈。這類完美信息博弈中AI機器人往往使用實時搜索。例如,當模型在決定下一步該如何走時,國際象棋AI通常會考慮以后的一些移動步驟,直到算法的前瞻到達深度上限。而圍棋的棋盤變化可能性比可觀測宇宙范圍的原子總數(shù)還多,因此圍棋AI主要通過深度學習技術訓練用于判斷結果輸贏概率的價值網絡,來增強AI對弈能力。

麻將AI

麻將AI的策略需要更多地增加得點的期望值,盡量增大和大牌的可能性,同時盡量避免對手的大牌點炮,這一打牌策略顯然是有最優(yōu)解的。為了有更大的可能性和大牌,AI需要通過手牌和棄牌池里的牌,計算進張(摸到有效牌)和鳴牌(吃、碰、杠)使手牌有進展的概率,進而計算和牌得分的期望值。目前最強的麻將AI機器人是日本東京大學開發(fā)的“暴打”。

撲克AI

以德州撲克為例,由于在游戲中,玩家無法獲取已發(fā)生事件的全部信息(如對手的底牌等),因此這個游戲屬于“不完美信息”(Imperfect Information)類游戲。德州撲克一直是人工智能領域最難以攻克的重大問題之一,因為和棋類游戲不同,撲克AI必須推理隱藏的信息,并慎重平衡自己策略。同時,相比棋類比賽,在撲克游戲中需要使用Bluff(嚇唬)等更多游戲策略。

在Pluribus之前,AI機器人曾在兩個參與者的完美信息零和博弈中取得了多次引人注目的成功,但大多數(shù)真實世界中的策略交互都涉及隱藏信息,且并非兩個參與者的零和博弈。Pluribus的成功表明,在復雜的多參與者場景中,基于自我博弈和搜索算法的AI能夠獲得很好的效果。

AI棋牌應用的現(xiàn)實意義

Pluribus提出了在大型狀態(tài)空間、隱藏信息中有效地解決博弈論推理挑戰(zhàn)的方法,所開發(fā)出的技術很大程度上獨立于撲克領域,可用于大量不完美信息博弈。Pluribus處理的諸多問題,與真實世界中的通用問題相對應,“不知道對手的牌”對應現(xiàn)實中的“不完整信息”,“下注策略和由此帶來的結果”對應現(xiàn)實中的“風險管理”,“確認對手的模式,并進行利用”對應現(xiàn)實中的“智能體建?!?,“Bluffing(撲克中的恐嚇技巧)”對應現(xiàn)實中的“欺騙”,“處理對手欺騙的牌”對應現(xiàn)實中的“不可靠信息”。

事實上,棋牌類游戲的本質是競爭和對抗,由游戲規(guī)則定義其目標(評價標準),玩家使用各種策略達成目標,其中涉及數(shù)量可觀的博弈過程。AI在棋牌類游戲的應用,將促進博弈決策的研究。以棋牌類AI應用為基礎的相關AI博弈工具,在經濟金融領域的風險預測、軍事領域的戰(zhàn)局預測等方向有著廣泛的應用前景。

在經濟金融領域,不論對經濟發(fā)展的總體趨勢預測,還是銀行、保險、股市等細分行業(yè)的風險模型建立,都需要依靠大量“不完美信息”來決策。AI博弈工具可通過處理不完美信息來獲得最佳決策。政府可利用AI博弈工具對社會行業(yè)的未來趨勢進行預測,判斷供需關系,合理有序引導行業(yè)健康發(fā)展。銀行、保險公司可利用AI工具判斷短期行業(yè)走勢,高效評估企業(yè)風險,以決定是否達成交易。

在軍事領域,具有自主學習功能的AI博弈工具與兵棋推演相結合,將爆發(fā)出極強的戰(zhàn)斗力,幫助軍隊獲取制勝先機。從上個世紀70年代初開始,美國陸軍就按照“全自動兵棋”概念建立起“地面作戰(zhàn)模擬系統(tǒng)”。20世紀90年代初,美軍在海灣戰(zhàn)爭爆發(fā)前就使用兵棋游戲對整個戰(zhàn)爭進行了推演,而戰(zhàn)爭的過程幾乎和美軍事前的推演如出一轍。隨著技術的進步,算法不斷成熟使得算力需求進一步降低,同時計算技術朝著系統(tǒng)微型化和處理高速化方向發(fā)展,具備超強自主學習和計算能力的AI系統(tǒng)與作戰(zhàn)模擬系統(tǒng)相結合,將提升對戰(zhàn)局的預測和把控。未來,AI系統(tǒng)將有希望直接與戰(zhàn)場指揮系統(tǒng)對接,其快速戰(zhàn)局推演能力、高效制定作戰(zhàn)方案的能力,將主導戰(zhàn)爭的勝負走向。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31079

    瀏覽量

    222274
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301443

原文標題:人工智能技術在棋牌中的應用“Pluribus”及其現(xiàn)實意義

文章出處:【微信號:drc_iite,微信公眾號:全球技術地圖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI 服務器電源測試項目研究報告

    01項目背景隨著人工智能技術的飛速發(fā)展,AI服務器的需求急劇增加。電源作為AI服務器的關鍵組件,其性能直接影響服務器的穩(wěn)定性、可靠性和能源效率。因此,開展AI服務器電源測試項目具有重要的現(xiàn)實意
    的頭像 發(fā)表于 12-16 10:22 ?664次閱讀
    <b class='flag-5'>AI</b> 服務器電源測試項目研究報告

    源網荷儲:從概念到實踐的全面解析

    能源生產、傳輸、消費、存儲全鏈條的系統(tǒng)工程。本文將從概念內核、核心價值、實踐場景到發(fā)展路徑,帶你全面讀懂源網荷儲的“前世今生”與現(xiàn)實意義
    的頭像 發(fā)表于 11-21 10:23 ?1265次閱讀

    通用接口芯片國產替代進程:以ASM1042為例看自主可控的現(xiàn)實意義

    摘要 :在全球科技競爭日益激烈的背景下,芯片國產替代對于保障國家安全及推動科技自主化具有重要意義。通用接口芯片作為諸多關鍵領域不可或缺的硬件組件,其國產化進程備受矚目。本文以廈門國科安芯科技有限公司
    的頭像 發(fā)表于 09-15 17:31 ?1699次閱讀

    ChatGPT 智能體發(fā)布的觀點解析及對科義相關系統(tǒng)的現(xiàn)實意義

    7月18日凌晨,OpenAI 發(fā)布通用人工智能代理 ChatGPT 智能體。這一事件蘊含著多層面的深刻意義,同時也為科義巡檢機器人和科義視頻行為分析系統(tǒng)帶來了諸多現(xiàn)實影響。 從技術層面來看,這標志著
    的頭像 發(fā)表于 07-18 16:31 ?1.3w次閱讀

    基于FPGA YOLO算法的掃描式SMT焊點缺陷檢測系統(tǒng)設計

    作為電子產品最重要的組成部分,印刷電路板(PCB)的設計日趨復雜和器件尺寸的縮小,促使對 SMT 可靠性提出了更高的要求。因此對于 SMT 電路板的檢測研究具有深刻的現(xiàn)實意義和經濟價值。
    的頭像 發(fā)表于 07-16 11:16 ?3564次閱讀
    基于FPGA YOLO算法的掃描式SMT焊點缺陷檢測系統(tǒng)設計

    森瑟傳感器在風電葉片監(jiān)測行業(yè)的應用

    通過風機葉片在線監(jiān)測系統(tǒng)及早發(fā)現(xiàn)葉片振動超限、載荷過大等問題,通過實時監(jiān)測 和超限報警及時調整風機運行狀態(tài),防止出現(xiàn)葉片發(fā)生事故,這對風機安全有非常重要的現(xiàn)實意義
    的頭像 發(fā)表于 07-15 10:02 ?517次閱讀
    森瑟傳感器在風電葉片監(jiān)測行業(yè)的應用

    巨頭押寶AI眼鏡,DPVR AI Glasses將成“現(xiàn)實助手”?

    VR同期曝光的戰(zhàn)略級產品DPVR AI Glasses,其技術架構與功能設計理念同樣指向更廣闊的現(xiàn)實應用場景,展現(xiàn)出國產科技企業(yè)在智能穿戴領域的前瞻性戰(zhàn)略布局。 影像技術預研突破,定義沉浸式記錄新標準 DPVR AI Glass
    的頭像 發(fā)表于 05-30 10:49 ?772次閱讀

    開關柜防誤可視化順控操作為什么有必要做?

    蜀瑞創(chuàng)新科普:開關柜防誤可視化順控操作(通常指基于可視化技術的順序控制防誤操作)即使在已有傳統(tǒng)五防系統(tǒng)的基礎上,仍然具有重要的現(xiàn)實意義和必要性,主要原因如下:
    的頭像 發(fā)表于 05-29 09:22 ?557次閱讀
    開關柜防誤可視化順控操作為什么有必要做?

    【「零基礎開發(fā)AI Agent」閱讀體驗】+讀《零基礎開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    Agent的開發(fā)基本過程和應該具備的知識有了一個認識,具有相當?shù)?b class='flag-5'>現(xiàn)實實在意義,希望您也能讀一讀它,也希望的的分享對您有意義。 感謝電子發(fā)燒友?。。?
    發(fā)表于 05-14 19:51

    安防智能制造有了新的指引

    安防行業(yè)正向智能化、數(shù)字化方向發(fā)展,而2025年以DeepSeek為代表的大模型技術讓安防+AI2.0更具現(xiàn)實意義
    的頭像 發(fā)表于 05-09 09:21 ?696次閱讀
    安防智能制造有了新的指引

    隧道調頻廣播覆蓋的實現(xiàn)路徑:隧道無線廣播技術賦能行車安全升級

    實施,該系統(tǒng)不僅能夠解決隧道內的廣播盲區(qū)問題,還能在安全應急、交通管理等方面發(fā)揮重要作用。因此,實現(xiàn)隧道調頻廣播全覆蓋具有重要的現(xiàn)實意義和安全價值。
    的頭像 發(fā)表于 04-23 18:24 ?650次閱讀
    隧道調頻廣播覆蓋的實現(xiàn)路徑:隧道無線廣播技術賦能行車安全升級

    基于RV1126開發(fā)板的人臉姿態(tài)估計算法開發(fā)

    )、左右旋轉(yaw)以及平面內角度旋轉(roll)。因此,姿態(tài)估計在多姿態(tài)人臉的識別和司機行為檢測等應用場景,具有巨大的現(xiàn)實意義和實用價值。
    的頭像 發(fā)表于 04-14 17:21 ?2211次閱讀
    基于RV1126開發(fā)板的人臉姿態(tài)估計算法開發(fā)

    蛙跳算法驅動,重塑電動汽車有序充電革新路徑

    挑戰(zhàn)。因此,研究電動汽車有序充電策略具有重要的現(xiàn)實意義。 近年來,國內外學者在電動汽車有序充電領域開展了廣泛研究。主要方法包括基于電價引導的策略、分層優(yōu)化方法和智能算法等。其中,智能算法因其強大的全局搜索能力
    的頭像 發(fā)表于 04-08 14:04 ?890次閱讀
    蛙跳算法驅動,重塑電動汽車有序充電革新路徑

    智慧路燈的成本是多少

    叁仟智慧路燈的成本構成,對推動智慧城市建設的高質量發(fā)展,有著極為重要的現(xiàn)實意義。 叁仟智慧路燈成本究竟幾何?下面將從設備采購、安裝調試與運營維護這三個維度,為大家揭開謎底。 集成了多種先進設備的叁仟智慧路燈 一、
    的頭像 發(fā)表于 03-27 22:50 ?1165次閱讀
    智慧路燈的成本是多少