完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > 強化學(xué)習(xí)
文章:226個 瀏覽:11994次 帖子:1個
MoDem解決了視覺強化學(xué)習(xí)領(lǐng)域的三個挑戰(zhàn)
他表示,僅給出5個演示,MoDem就能在100K交互步驟中解決具有稀疏獎勵和高維動作空間的具有挑戰(zhàn)性的視覺運動控制任務(wù),大大優(yōu)于現(xiàn)有的最先進方法。
2023-01-05 標簽:解碼器Meta強化學(xué)習(xí) 1.3k 0
復(fù)雜應(yīng)用中運用人工智能核心 強化學(xué)習(xí)
近期,有不少報道強化學(xué)習(xí)算法在 GO、Dota 2 和 Starcraft 2 等一系列游戲中打敗了專業(yè)玩家的新聞。強化學(xué)習(xí)是一種機器學(xué)習(xí)類型,能夠在電...
2020-07-27 標簽:人工智能機器學(xué)習(xí)強化學(xué)習(xí) 1.3k 0
83篇文獻、萬字總結(jié)強化學(xué)習(xí)之路
深度強化學(xué)習(xí)是深度學(xué)習(xí)與強化學(xué)習(xí)相結(jié)合的產(chǎn)物,它集成了深度學(xué)習(xí)在視覺等感知問題上強大的理解能力,以及強化學(xué)習(xí)的決策能力,實現(xiàn)了...
2020-12-10 標簽:人工智能強化學(xué)習(xí) 1.2k 0
Facebook開源Horizon主要是為了推進AI強化學(xué)習(xí)的發(fā)展
11月1日,F(xiàn)acebook開源了Horizon,一個由Facebook的AI研究人員、推薦系統(tǒng)專家和工程師共同搭建的強化學(xué)習(xí)平臺,其框架的構(gòu)建工作開始...
2018-11-05 標簽:AIFacebook強化學(xué)習(xí) 1.2k 0
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型...
2024-04-23 標簽:微軟移動設(shè)備強化學(xué)習(xí) 1.2k 0
特斯拉自動駕駛團隊再受重挫,頂尖工程師Paril Jain離任,高層人事變動
數(shù)周內(nèi),特斯拉已在各部門實施多輪裁員。此外,還有報道顯示部分員工因士氣低落而選擇離司。種種跡象表明,特斯拉正面臨嚴重的人才流失問題。
2024-05-15 標簽:特斯拉自動駕駛強化學(xué)習(xí) 1.2k 0
谷歌AlphaChip強化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用
近日,谷歌在芯片設(shè)計領(lǐng)域取得了重要突破,詳細介紹了其用于芯片設(shè)計布局的強化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望...
2024-09-30 標簽:谷歌芯片設(shè)計強化學(xué)習(xí) 1.1k 0
靠強化學(xué)習(xí)來調(diào)整機器人假肢的系統(tǒng) 讓假肢更加靈活
來自北卡羅來納州立大和亞利桑那州立大學(xué)的研究人員開發(fā)了一種智能系統(tǒng),可以“調(diào)節(jié)”動力假肢膝蓋,讓患者在幾分鐘內(nèi)就能自如地使用假肢行走,而不是由訓(xùn)練有素的...
2019-04-05 標簽:機器人智能機器人強化學(xué)習(xí) 1.1k 0
近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面...
2025-01-03 標簽:模型強化學(xué)習(xí)智譜 1k 0
就在幾年前,能夠感知周圍環(huán)境、識別重要細節(jié)——并忽略其余部分——然后利用這些細節(jié)來完成任務(wù)的技術(shù)應(yīng)用似乎還只是科幻小說中的內(nèi)容。
2022-12-30 標簽:AI機器學(xué)習(xí)強化學(xué)習(xí) 952 0
螞蟻集團全模態(tài)代碼算法團隊自研OpAgent技術(shù)框架
為應(yīng)對真實 Web 環(huán)境的非結(jié)構(gòu)化復(fù)雜性、時序不穩(wěn)定性與交互隱式邏輯等挑戰(zhàn),螞蟻集團全模態(tài)代碼算法團隊提出了一套結(jié)合了多任務(wù)微調(diào)、在線強化學(xué)習(xí)與模塊化協(xié)...
2026-03-18 標簽:Web強化學(xué)習(xí)螞蟻集團 908 0
適合初學(xué)者的神經(jīng)網(wǎng)絡(luò)理論到實踐(3):打破概念束縛:什么是強化學(xué)習(xí)?
專欄中《零神經(jīng)網(wǎng)絡(luò)實戰(zhàn)》系列持續(xù)更新介紹神經(jīng)元怎么工作,最后使用python從0到1不調(diào)用任何依賴神經(jīng)網(wǎng)絡(luò)框架(不使用tensorflow等框架)...
2020-12-10 標簽:人工智能強化學(xué)習(xí) 744 0
Momenta榮獲一汽豐田2025年度技術(shù)開發(fā)豐采獎
3月12日,一汽豐田2025年供應(yīng)商大會在天津召開。會上,Momenta獲頒“技術(shù)開發(fā)·豐采獎”。
2026-03-16 標簽:豐田一汽強化學(xué)習(xí) 693 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |