91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度強化學(xué)習(xí)平臺為玩家?guī)硇碌娜斯ぶ悄荏w驗

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-07 16:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

得益于索尼 AI 、索尼互動娛樂( SIE )以及 GT Sport 的開發(fā)者 Polyphony Digital Inc 。的最新合作, Gran Turismo ( GT ) Sport 的競爭對手正面臨一個新的、 AI 超級強大的競爭者。

被稱為 Gran Turismo Sophy ( GT Sophy )的自主人工智能賽車代理最近擊敗了 GT 運動領(lǐng)域的世界最佳車手。發(fā)表在 Nature, 上的 工作 介紹了一種新的深度強化學(xué)習(xí)平臺,用于創(chuàng)建 GT Sophy ,并可能為全球玩家?guī)硇碌娜斯ぶ悄荏w驗。

索尼集團公司董事長、總裁兼首席執(zhí)行官吉田健一郎在一份 發(fā)布。 的聲明中說:“索尼的目的是‘通過創(chuàng)造力和技術(shù)的力量,讓世界充滿情感’,而大圖里斯莫·索菲就是這一點的完美體現(xiàn)?!?/p>

“我們?yōu)橛螒蛲婕掖蛟炝艘豢钣螒?AI ,這是索尼作為一家創(chuàng)意娛樂公司的獨特之處。它標(biāo)志著 AI 發(fā)展的重大飛躍,同時也為全球 GT 粉絲提供了增強的體驗?!?/p>

Smart gaming

人工智能對游戲來說并不新鮮。 2017 年,來自 DeepMind 的 Alpha Zero 項目在學(xué)會玩和征服國際象棋、日本象棋和使用深度強化學(xué)習(xí)( deep RL )圍棋時成為新聞

作為機器學(xué)習(xí)的一種補償, deep RL 在基本術(shù)語中使用計算 RL 代理通過試錯來做出決策,以解決問題。在算法中引入深度學(xué)習(xí)后,智能體從非常大的數(shù)據(jù)集做出決策,并決定有效地實現(xiàn)其目標(biāo)的行動。

Alpha Zero 程序使用了一種算法,一個未經(jīng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對自己進(jìn)行了數(shù)百萬次游戲,并根據(jù)其結(jié)果調(diào)整游戲。

然而,賽車人工智能對來自不同汽車、賽道、駕駛員、天氣和對手的無數(shù)變量提出了更復(fù)雜的推理需求。作為最逼真的駕駛模擬器之一, GT Sport 使用真實的賽車和賽道尺寸,通過考慮空氣阻力和輪胎摩擦等因素再現(xiàn)比賽環(huán)境。

強化良好行為

該團隊創(chuàng)建了一個能夠適應(yīng)實時因素的賽車代理,并使用新開發(fā)的 deep RL 算法對 GT Sophy 進(jìn)行了賽車控制、賽車戰(zhàn)術(shù)和賽車禮儀三項具體技能的培訓(xùn)。根據(jù) project’s website ,該算法使用最新的強化學(xué)習(xí)技術(shù),根據(jù)賽車經(jīng)紀(jì)人的行為對其進(jìn)行獎勵或懲罰。

研究人員在研究報告中寫道:“使用 deep RL 開發(fā)賽車代理的優(yōu)點之一是,工程師無需編程如何以及何時執(zhí)行贏得比賽所需的技能,只要它暴露在正確的條件下,代理通過反復(fù)試驗學(xué)會做正確的事?!?。

該團隊定制了一個基于網(wǎng)絡(luò)的分布式異步部署和培訓(xùn)( DART )平臺,使用 SIE 的全球云基礎(chǔ)設(shè)施研究人員在 PlayStation 4 控制臺上培訓(xùn) GT Sophy ,然后使用 DART 收集培訓(xùn)數(shù)據(jù)并評估代理的版本。

使用這個系統(tǒng),研究人員指定一個實驗,自動運行,并在網(wǎng)絡(luò)瀏覽器中查看數(shù)據(jù)。每個實驗都在一個計算節(jié)點上使用一個培訓(xùn)師,該培訓(xùn)師使用 cuDNN 加速的 TensorFlow 深度學(xué)習(xí)框架和 NVIDIA V100 GPU 或 NVIDIA A100 GPU 的一半,再加上大約 8 個 CPU 和 55 個 記憶的碎片。

據(jù) project’s website 報道,“該系統(tǒng)允許索尼人工智能的研究團隊無縫地同時運行數(shù)百個實驗,同時探索將 GT Sophy 提升到下一個水平的技術(shù)?!?。

增壓燃?xì)廨啓C

在 2021 ,世界上最好的 GT 賽車手中有四人在兩個單獨的比賽中與 GT Suffy 競爭。這些比賽包括三個賽馬場、四名 GT Sophy 經(jīng)紀(jì)人和賽車。在首次亮相時, GT Sophy 在計時賽中表現(xiàn)出色,但在同一賽道上挑戰(zhàn)賽車手時表現(xiàn)不佳。

該隊在第一場比賽結(jié)果的基礎(chǔ)上進(jìn)行了改進(jìn),升級了訓(xùn)練體系,增加了網(wǎng)絡(luò)規(guī)模,調(diào)整了特征和獎勵,增強了對手。

這一結(jié)果造就了一名賽車經(jīng)紀(jì)人,他可以在急轉(zhuǎn)彎處超越一名人類駕駛員,處理擁擠的起跑,在滑流中進(jìn)行彈弓傳球,并執(zhí)行防守動作。經(jīng)紀(jì)人這樣做的同時,也遵守了人類駕駛員理解和實踐的微妙的體育道德考慮。在計時賽和 FIA 認(rèn)證的格蘭賽車錦標(biāo)賽系列賽中,它也擊敗了頂尖的人力車手。

據(jù)報道, GT Sophy 在短短幾個小時內(nèi)就學(xué)會了繞道而行。在大約兩天的時間里,它可以擊敗大約 95% 的人類玩家。給它 10 到 12 天,大約 45 , 00 個駕駛小時, GT Sophy 就等于或超過了世界頂級車手。

憑借其賽車實力, GT Sophy 的目標(biāo)是讓 GT 運動更有趣、更具競爭力和教育性。一些與 GT Sophy 競爭的專家報告說,他們學(xué)習(xí)了轉(zhuǎn)彎和駕駛技術(shù)的新方法。

研究人員還發(fā)現(xiàn), deep RL 有可能改善協(xié)作機器人、無人機自動駕駛車輛等系統(tǒng)的實際應(yīng)用。

關(guān)于作者

Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31079

    瀏覽量

    222280
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109758
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14883

    瀏覽量

    179909
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?126次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    自動駕駛中常提的離線強化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號]在之前談及自動駕駛模型學(xué)習(xí)時,詳細(xì)聊過強化學(xué)習(xí)的作用,由于強化學(xué)習(xí)能讓大模型通過交互學(xué)到策略,不需要固定的規(guī)則,從而給自動駕駛的落地創(chuàng)造了更多可能。 強化學(xué)習(xí)
    的頭像 發(fā)表于 02-07 09:21 ?214次閱讀
    自動駕駛中常提的離線<b class='flag-5'>強化學(xué)習(xí)</b>是什么?

    人工智能與機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    人工智能和機器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?484次閱讀

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛大模型訓(xùn)練時,有的技術(shù)方案會采用模仿學(xué)習(xí),而有些會采用強化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強化學(xué)習(xí)有何不同?又有什么特點呢? 什么是強化學(xué)習(xí)
    的頭像 發(fā)表于 01-31 09:34 ?646次閱讀
    <b class='flag-5'>強化學(xué)習(xí)</b>會讓自動駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    智能強化學(xué)習(xí)(MARL)核心概念與算法概覽

    訓(xùn)練單個RL智能體的過程非常簡單,那么我們現(xiàn)在換一個場景,同時訓(xùn)練五個智能體,而且每個都有自己的目標(biāo)、只能看到部分信息,還能互相幫忙。這就是多智能強化學(xué)習(xí)
    的頭像 發(fā)表于 01-21 16:21 ?198次閱讀
    多<b class='flag-5'>智能</b>體<b class='flag-5'>強化學(xué)習(xí)</b>(MARL)核心概念與算法概覽

    上汽別克至境E7首發(fā)搭載Momenta R6強化學(xué)習(xí)大模型

    別克至境家族迎來新成員——大五座智能SUV別克至境E7首發(fā)。新車將搭載Momenta R6強化學(xué)習(xí)大模型,帶來全場景的智能出行體驗。
    的頭像 發(fā)表于 01-12 16:23 ?333次閱讀

    嵌入式系統(tǒng)中的人工智能

    本文編譯自ElectronicDesign人工智能(AI)正徹底變革嵌入式系統(tǒng),改變技術(shù)融入日常生活的方式。如今的人工智能不再局限于執(zhí)行基礎(chǔ)任務(wù),它還被應(yīng)用于智能汽車、工業(yè)自動化、醫(yī)療設(shè)備和
    的頭像 發(fā)表于 12-18 11:49 ?1038次閱讀
    嵌入式系統(tǒng)中<b class='flag-5'>的人工智能</b>

    自動駕駛中常提的“強化學(xué)習(xí)”是個啥?

    下,就是一個智能體在環(huán)境里行動,它能觀察到環(huán)境的一些信息,并做出一個動作,然后環(huán)境會給出一個反饋(獎勵或懲罰),智能體的目標(biāo)是把長期得到的獎勵累積到最大。和監(jiān)督學(xué)習(xí)不同,強化學(xué)習(xí)沒有一
    的頭像 發(fā)表于 10-23 09:00 ?677次閱讀
    自動駕駛中常提的“<b class='flag-5'>強化學(xué)習(xí)</b>”是個啥?

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與人工智能平臺

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運用數(shù)據(jù)分析和先進(jìn)的人工智能自動化,提供可擴展的面向未來的解決方案。Altair數(shù)據(jù)分析和人工智能平臺包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)科學(xué)、MLOps、編排
    的頭像 發(fā)表于 09-18 17:56 ?846次閱讀
    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與<b class='flag-5'>人工智能</b><b class='flag-5'>平臺</b>

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學(xué)習(xí)實踐需求,既節(jié)省經(jīng)費又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法 所有實驗全部開源,這對于想要深入
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學(xué)習(xí)實踐需求,既節(jié)省經(jīng)費又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法 所有實驗全部開源,這對于想要深入
    發(fā)表于 08-07 14:23

    CES Asia 2025蓄勢待發(fā),聚焦低空經(jīng)濟與AI,引領(lǐng)未來產(chǎn)業(yè)新變革

    可能性。智能無人機在物流配送、巡檢監(jiān)測等領(lǐng)域的應(yīng)用愈發(fā)成熟,大大提高了工作效率和精準(zhǔn)度。低空經(jīng)濟的發(fā)展,不僅帶動了相關(guān)技術(shù)的進(jìn)步,還創(chuàng)造了新的就業(yè)機會和經(jīng)濟增長點。 人工智能領(lǐng)域同樣發(fā)展迅猛,深度
    發(fā)表于 07-09 10:29

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應(yīng)/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55