91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

強(qiáng)化學(xué)習(xí)/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)三者有何區(qū)別?

我快閉嘴 ? 來源:智能制造網(wǎng) ? 作者:智能制造網(wǎng) ? 2020-12-22 15:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能技術(shù)進(jìn)步的速度越來越快,每種細(xì)分技術(shù)所創(chuàng)造的價(jià)值正日益得到展現(xiàn)。

2013年,DeepMind發(fā)明了DQN算法,成功將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來,開啟了深度強(qiáng)化學(xué)習(xí)的新紀(jì)元。此后數(shù)年,強(qiáng)化學(xué)習(xí)的成果日新月異,很多非常困難的問題都被深度強(qiáng)化學(xué)習(xí)算法解決。

2016年,谷歌阿爾法圍棋以4:1戰(zhàn)勝圍棋世界冠軍、職業(yè)九段棋手李世石,不僅讓深度學(xué)習(xí)為人們所知,而且掀起了人工智能的“大眾熱”,大家由此更加關(guān)注強(qiáng)化學(xué)習(xí)這一技術(shù)要點(diǎn)。

使用強(qiáng)化學(xué)習(xí)的一個(gè)很好的例子是讓機(jī)器人學(xué)習(xí)如何走路。機(jī)器人首先向前邁出一大步然后跌倒。這一大步和摔倒是強(qiáng)化學(xué)習(xí)系統(tǒng)關(guān)注的響應(yīng)點(diǎn)。由于反饋是負(fù)面的,所以繼續(xù)調(diào)整,系統(tǒng)會(huì)根據(jù)多個(gè)負(fù)反饋的比對(duì)最終確定機(jī)器人應(yīng)該把步子邁的小一點(diǎn),不停地小,直到機(jī)器人走路不會(huì)摔倒為止。

通過強(qiáng)化學(xué)習(xí),Boston Dynamics公司的機(jī)器人已經(jīng)掌握了托舉、后空翻、跳上窗臺(tái)的要點(diǎn)。而迪斯尼幻想工程已經(jīng)把這一點(diǎn)帶到了一個(gè)新的層面,那就是讓人形機(jī)器人來執(zhí)行玩命的特技。

有業(yè)內(nèi)人士指出,強(qiáng)化學(xué)習(xí)和其他的人工智能技術(shù)有一個(gè)很大的差異,那就是它的學(xué)習(xí)范式和其它技術(shù)不太一樣。它不需要我們?nèi)ナ占瘮?shù)據(jù),也不需要我們?nèi)プ鋈魏螛?biāo)記,而是我們把稱之為智能體(Agent),放在一個(gè)環(huán)境里,就像動(dòng)物或者我們自己生存的一個(gè)環(huán)境里,它會(huì)和環(huán)境自己打交道,自己學(xué)會(huì)在環(huán)境里如何完成一個(gè)任務(wù),解決一個(gè)問題。

強(qiáng)化學(xué)習(xí)主要由智能體(Agent)、環(huán)境(Environment)、狀態(tài)(State)和動(dòng)作(Action)、獎(jiǎng)勵(lì)(Reward)組成。智能體將在環(huán)境的當(dāng)前狀態(tài)下,根據(jù)獎(jiǎng)勵(lì)信號(hào)做出動(dòng)作,從而達(dá)到環(huán)境中的不同狀態(tài)并得到獎(jiǎng)勵(lì)。

除了強(qiáng)化學(xué)習(xí)外,機(jī)器學(xué)習(xí)也備受關(guān)注。機(jī)器學(xué)習(xí)是AI的一個(gè)子集,是通過不同場(chǎng)景中的經(jīng)驗(yàn)來訓(xùn)練系統(tǒng)的能力。隨著車輛變得越來越自動(dòng)化,開發(fā)人員可以使用機(jī)器學(xué)習(xí)訓(xùn)練系統(tǒng)來識(shí)別對(duì)象,并用更少的數(shù)據(jù)更好地解釋其環(huán)境。

再來看一下深度學(xué)習(xí)。深度學(xué)習(xí)就是從有限樣例中通過算法總結(jié)出一般性的規(guī)律,并可以應(yīng)用到新的未知數(shù)據(jù)上。例如,我們可以從一些歷史病例的集合中總結(jié)出癥狀和疾病之間的規(guī)律。這樣,當(dāng)有新的病人到來時(shí),我們可以利用總結(jié)出來的規(guī)律來判斷這個(gè)病人得了什么疾病。

那么,強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)三者的區(qū)別是什么?簡(jiǎn)單說,人工智能范圍最大,涵蓋機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。如果把人工智能比喻成孩子大腦,那么機(jī)器學(xué)習(xí)是讓孩子去掌握認(rèn)知能力的過程,而深度學(xué)習(xí)是這種過程中很有效率的一種教學(xué)體系。

由強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù)構(gòu)成的人工智能,其良好的發(fā)展前景引人期待。從全國(guó)來看,據(jù)艾瑞咨詢測(cè)算,2022年國(guó)內(nèi)人工智能核心產(chǎn)業(yè)規(guī)模有望達(dá)到1573億元,復(fù)合增速達(dá)58%,產(chǎn)業(yè)將持續(xù)快速增長(zhǎng)。如此廣闊的市場(chǎng)空間,吸引著社會(huì)各界投資者的關(guān)注。

值得一提的是,發(fā)展“以人為本”的人工智能是全社會(huì)的課題,需要政府、商界、學(xué)界及所有利益相關(guān)方共擔(dān)責(zé)任,協(xié)力推動(dòng)。作為技術(shù)應(yīng)用與推廣的主體,企業(yè)負(fù)有不可推卸的社會(huì)責(zé)任。在研究強(qiáng)化學(xué)習(xí)相關(guān)技術(shù)時(shí),企業(yè)要自覺遵守法規(guī)制度和社會(huì)公約,以此促進(jìn)其有序、可持續(xù)應(yīng)用。

未來,全球的可持續(xù)發(fā)展越來越依賴于數(shù)據(jù)創(chuàng)造的價(jià)值,而人工智能是數(shù)字經(jīng)濟(jì)中應(yīng)用十分廣泛的技術(shù)之一。或許再過幾年,AI將在精準(zhǔn)農(nóng)業(yè)、智能家居、遠(yuǎn)程醫(yī)療、自動(dòng)駕駛等領(lǐng)域發(fā)揮更加重要的作用。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40320

    瀏覽量

    301894
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50170

    瀏覽量

    266056
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137079
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Momenta R6強(qiáng)化學(xué)習(xí)大模型上車東風(fēng)日產(chǎn)NX8

    3月20日,東風(fēng)日產(chǎn)NX8技術(shù)暨預(yù)售發(fā)布會(huì)在廣州舉辦,官宣Momenta R6強(qiáng)化學(xué)習(xí)大模型正式上車東風(fēng)日產(chǎn)新能源SUV——NX8。以全球頂級(jí)大廠合力,融合先鋒科技力量,打造更適配全家出行的智能SUV,開啟合資品牌智能化全新賽道。
    的頭像 發(fā)表于 03-24 09:08 ?529次閱讀

    Momenta強(qiáng)化學(xué)習(xí)大模型助力別克至境世家純電版正式上市

    3月17日,別克至境世家純電版正式上市,這是別克與Momenta強(qiáng)化學(xué)習(xí)大模型的又一次深度聯(lián)手。融合別克在MPV市場(chǎng)深耕27年的技術(shù)積淀,以更從容的智慧駕控,重新定義豪華與自在的出行體驗(yàn)。
    的頭像 發(fā)表于 03-18 15:48 ?139次閱讀

    自動(dòng)駕駛中常提的離線強(qiáng)化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在之前談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),詳細(xì)聊過強(qiáng)化學(xué)習(xí)的作用,由于強(qiáng)化學(xué)習(xí)能讓大模型通過交互學(xué)到策略,不需要固定的規(guī)則,從而給自動(dòng)駕駛的落地創(chuàng)造了更多可能。 強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 02-07 09:21 ?255次閱讀
    自動(dòng)駕駛中常提的離線<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>是什么?

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?569次閱讀

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛大模型訓(xùn)練時(shí),有的技術(shù)方案會(huì)采用模仿學(xué)習(xí),而有些會(huì)采用強(qiáng)化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強(qiáng)化學(xué)習(xí)何不同?又有什么特點(diǎn)呢? 什么是
    的頭像 發(fā)表于 01-31 09:34 ?722次閱讀
    <b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    多智能體強(qiáng)化學(xué)習(xí)(MARL)核心概念與算法概覽

    (Multi-AgentReinforcementLearning,MARL),但是這樣會(huì)很快變得混亂。什么是多智能體強(qiáng)化學(xué)習(xí)MARL是多個(gè)決策(智能體)在同一環(huán)境中交互的強(qiáng)化學(xué)習(xí)。環(huán)境類型可
    的頭像 發(fā)表于 01-21 16:21 ?232次閱讀
    多智能體<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>(MARL)核心概念與算法概覽

    上汽別克至境E7首發(fā)搭載Momenta R6強(qiáng)化學(xué)習(xí)大模型

    別克至境家族迎來新成員——大五座智能SUV別克至境E7首發(fā)。新車將搭載Momenta R6強(qiáng)化學(xué)習(xí)大模型,帶來全場(chǎng)景的智能出行體驗(yàn)。
    的頭像 發(fā)表于 01-12 16:23 ?385次閱讀

    機(jī)器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?256次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場(chǎng)景

    深度學(xué)習(xí)視覺應(yīng)用場(chǎng)景大全 工業(yè)制造領(lǐng)域 復(fù)雜缺陷檢測(cè):處理傳統(tǒng)算法難以描述的非標(biāo)準(zhǔn)化缺陷模式 非標(biāo)產(chǎn)品分類:對(duì)形狀、顏色、紋理多變的產(chǎn)品進(jìn)行智能分類 外觀質(zhì)量評(píng)估:基于學(xué)習(xí)的外觀質(zhì)量標(biāo)準(zhǔn)判定 精密
    的頭像 發(fā)表于 11-27 10:19 ?259次閱讀

    今日看點(diǎn):智元推出真機(jī)強(qiáng)化學(xué)習(xí);美國(guó)軟件公司SAS退出中國(guó)市場(chǎng)

    智元推出真機(jī)強(qiáng)化學(xué)習(xí)機(jī)器人訓(xùn)練周期從“數(shù)周”減至“數(shù)十分鐘” ? 近日,智元機(jī)器人宣布其研發(fā)的真機(jī)強(qiáng)化學(xué)習(xí)技術(shù),已在與龍旗科技合作的驗(yàn)證產(chǎn)線中成功落地。據(jù)介紹,此次落地的真機(jī)
    發(fā)表于 11-05 09:44 ?1122次閱讀

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),有些方案中會(huì)提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡(jiǎn)稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯(cuò)來學(xué)會(huì)做決策的技術(shù)。簡(jiǎn)單理解
    的頭像 發(fā)表于 10-23 09:00 ?752次閱讀
    自動(dòng)駕駛中常提的“<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>”是個(gè)啥?

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)?b class='flag-5'>深度學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?958次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)哪些幫助

    、實(shí)施路徑個(gè)維度展開分析: 一、深度學(xué)習(xí)如何突破工業(yè)物聯(lián)網(wǎng)的技術(shù)瓶頸? 1. 非結(jié)構(gòu)化數(shù)據(jù)處理:解鎖“沉睡數(shù)據(jù)”價(jià)值 傳統(tǒng)困境 :工業(yè)物聯(lián)網(wǎng)中70%以上的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù)(如設(shè)備振動(dòng)波形、紅外圖像、日志文本),傳統(tǒng)方法難以
    的頭像 發(fā)表于 08-20 14:56 ?1090次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)化學(xué)習(xí)(在嘗試和錯(cuò)誤中進(jìn)行學(xué)習(xí)),為所有
    的頭像 發(fā)表于 07-14 15:29 ?2448次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>腳本使用指南

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過程,旨在通過理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?1669次閱讀
    18個(gè)常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)