完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:226個(gè) 瀏覽:11994次 帖子:1個(gè)
星際爭(zhēng)霸2頂級(jí)人工智能AlphaStar帶來(lái)哪些新思路?
另一種理解方式是,游戲信息被組織成若干個(gè)網(wǎng)格,每份網(wǎng)格代表某一項(xiàng)特定信息(見(jiàn)上圖右側(cè))。比如說(shuō)“fog-of-war”網(wǎng)格代表是否存在戰(zhàn)爭(zhēng)迷霧;“hei...
2019-02-13 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí)DeepMind 5.3k 0
上海的谷歌開(kāi)發(fā)者大會(huì)還沒(méi)結(jié)束,14日,在北京,谷歌也舉行了一個(gè)小范圍的面向?qū)W生的宣講,李飛飛教授出席。昨天在上海,主旨演講后,李飛飛和李佳等谷歌的AI研...
2017-12-28 標(biāo)簽:AI深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 5.2k 0
神經(jīng)學(xué)家卡爾·弗里斯頓最初將自由能原理用在神經(jīng)科學(xué),是為了治療神經(jīng)疾病以及合理的解釋世界,卻未想到數(shù)學(xué)化之后的自由能原理可以應(yīng)用于人工智能領(lǐng)域,但對(duì)于許...
2018-12-28 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 5.1k 0
知名創(chuàng)投研究機(jī)構(gòu)CB Insights調(diào)研了25種最大的AI趨勢(shì),以確定2019年該技術(shù)的下一步趨勢(shì),他們根據(jù)行業(yè)采用率和市場(chǎng)優(yōu)勢(shì)評(píng)估了每種趨勢(shì),并將其...
2019-02-25 標(biāo)簽:人工智能開(kāi)源強(qiáng)化學(xué)習(xí) 5.1k 0
簡(jiǎn)單隨機(jī)搜索:無(wú)模型強(qiáng)化學(xué)習(xí)的高效途徑
讓我們?cè)趶?qiáng)化學(xué)習(xí)社區(qū)感興趣的問(wèn)題上應(yīng)用隨機(jī)搜索。深度強(qiáng)化學(xué)習(xí)領(lǐng)域一直把大量時(shí)間和精力用于由OpenAI維護(hù)的、基于MuJoCo模擬器的一套基準(zhǔn)測(cè)試中。這...
2018-04-01 標(biāo)簽:強(qiáng)化學(xué)習(xí) 5k 0
谷歌AI發(fā)布足球游戲強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境“足球引擎”
該強(qiáng)化學(xué)習(xí)環(huán)境的核心是一種先進(jìn)的足球游戲模擬,稱為“足球引擎”,它基于一個(gè)足球游戲版本經(jīng)大量修改而成。根據(jù)兩支對(duì)方球隊(duì)的輸入動(dòng)作,模擬了足球比賽中的常見(jiàn)...
2019-06-15 標(biāo)簽:谷歌AI強(qiáng)化學(xué)習(xí) 5k 0
OpenAI宣布他們的AI僅通過(guò)一次人類演示,蒙特祖瑪?shù)膹?fù)仇游戲中玩出歷史最高分
這次,OpenAI的研究團(tuán)隊(duì)訓(xùn)練了一個(gè)智能體,僅通過(guò)一次人類demo,就在蒙特祖瑪?shù)膹?fù)仇游戲中獲得了74500分的成績(jī),比以往公布的任何結(jié)果都要好。
2018-07-09 標(biāo)簽:算法智能體強(qiáng)化學(xué)習(xí) 4.9k 0
如果不避讓就會(huì)撞上一群人,避讓就會(huì)撞上另一個(gè)人,它應(yīng)該避開(kāi)人群?jiǎn)??它?yīng)該保護(hù)乘客,還是保護(hù)行人?它應(yīng)該保護(hù)年輕人還是老年人?盡管這些情況極為罕見(jiàn),但很顯...
2018-11-12 標(biāo)簽:谷歌AI強(qiáng)化學(xué)習(xí) 4.7k 0
簡(jiǎn)單來(lái)說(shuō)就是,不管你是亞馬遜云、微軟云、谷歌云、阿里云還是 IBM 云,公有云、私有云還是混合云,Watson 微服務(wù)都能跑。這就使得那些使用 Wats...
2019-02-18 標(biāo)簽:IBMAI強(qiáng)化學(xué)習(xí) 4.5k 0
谷歌推出新的基于Tensorflow的強(qiáng)化學(xué)習(xí)框架,稱為Dopamine
強(qiáng)化學(xué)習(xí)(RL)研究在過(guò)去幾年取得了許多重大進(jìn)展。強(qiáng)化學(xué)習(xí)的進(jìn)步使得 AI 智能體能夠在一些游戲上超過(guò)人類,值得關(guān)注的例子包括 DeepMind 攻破 ...
2018-08-31 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí) 4.5k 0
只有提高算力才能發(fā)展AI? 強(qiáng)化學(xué)習(xí)之父薩頓與牛津教授掀起隔空論戰(zhàn)
關(guān)系到AI的方向問(wèn)題!
2019-03-25 標(biāo)簽:AI強(qiáng)化學(xué)習(xí) 4.5k 0
微軟亞洲研究院開(kāi)發(fā)的麻將AI系統(tǒng)Suphx成為首個(gè)在國(guó)際知名專業(yè)麻將平臺(tái)“天鳳”
2019-09-13 標(biāo)簽:微軟AI強(qiáng)化學(xué)習(xí) 4.4k 0
人工智能的強(qiáng)化學(xué)習(xí)要點(diǎn)
強(qiáng)化學(xué)習(xí)(RL)是現(xiàn)代人工智能領(lǐng)域中最熱門的研究主題之一,其普及度還在不斷增長(zhǎng)。 讓我們看一下開(kāi)始學(xué)習(xí)RL需要了解的5件事。
2020-05-04 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 4.3k 0
除此之外,這場(chǎng)比賽與正常的Dota 2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地...
2019-04-19 標(biāo)簽:機(jī)器人AI強(qiáng)化學(xué)習(xí) 4.2k 0
不像現(xiàn)在的許多四足機(jī)器人,ANYmal有防水能力,是專門為穿越不太理想的環(huán)境而設(shè)計(jì)的,比如森林、工業(yè)場(chǎng)所和雪地。根據(jù)ANYbotics的說(shuō)法,這款機(jī)器人...
2019-01-21 標(biāo)簽:強(qiáng)化學(xué)習(xí)波士頓動(dòng)力機(jī)器狗 4.2k 0
ICLR 2019共接收1591篇投稿,創(chuàng)下歷年新高
我建議你們將會(huì)議視為一種“必須申請(qǐng)的免費(fèi)推廣機(jī)會(huì)”,它會(huì)對(duì)已經(jīng)很好的論文有幫助,但評(píng)分多少并沒(méi)有論文的實(shí)際影響那么重要。如果以后每個(gè)人都開(kāi)始使用你的re...
2018-11-08 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)GAN強(qiáng)化學(xué)習(xí) 4.2k 0
2018-2019年十項(xiàng)最具特色的成長(zhǎng)性技術(shù)的AI技術(shù)
膠囊網(wǎng)絡(luò)。是指在深度神經(jīng)網(wǎng)絡(luò)中構(gòu)建多層神經(jīng)元模塊,用以發(fā)現(xiàn)并存儲(chǔ)物體詳細(xì)空間位置和姿態(tài)等信息的技術(shù)。該技術(shù)能使機(jī)器在樣本數(shù)據(jù)較少情形下,快速識(shí)別不同情境...
2018-08-19 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)人工智能強(qiáng)化學(xué)習(xí) 4.2k 0
谷歌、DeepMind重磅推出PlaNet 強(qiáng)化學(xué)習(xí)新突破
Google AI 與 DeepMind 合作推出深度規(guī)劃網(wǎng)絡(luò) (PlaNet),這是一個(gè)純粹基于模型的智能體,能從圖像輸入中學(xué)習(xí)世界模型,完成多項(xiàng)規(guī)劃...
2019-02-17 標(biāo)簽:谷歌強(qiáng)化學(xué)習(xí)DeepMind 4.1k 0
一個(gè)基于TF2.0的強(qiáng)化學(xué)習(xí)訓(xùn)練工具
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(...
2019-02-25 標(biāo)簽:強(qiáng)化學(xué)習(xí)tensorflow開(kāi)源工具 4.1k 0
讓我們一起來(lái)感受夏威夷撲面而來(lái)的AI暖風(fēng)吧
AAAI19的教程在27號(hào)和28號(hào)舉行,基本上包括了人工智能基礎(chǔ)研究領(lǐng)域近年來(lái)的最新進(jìn)展。在教程中可以學(xué)習(xí)到對(duì)于某個(gè)細(xì)分領(lǐng)域問(wèn)題的理論框架和模型工具。無(wú)...
2019-01-29 標(biāo)簽:人工智能智慧城市強(qiáng)化學(xué)習(xí) 4.1k 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |