91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳談機器學(xué)習(xí)及其三大分類

如意 ? 來源:大數(shù)據(jù)DT ? 作者:小川雄太郎 ? 2020-08-14 12:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01 術(shù)語整理

本節(jié)概述機器學(xué)習(xí)及其三個分類(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí))。首先,與機器學(xué)習(xí)相關(guān)的術(shù)語有人工智能(Artificial Intelligence,AI)、機器學(xué)習(xí)(Machine Learning,ML)、強化學(xué)習(xí)、深度學(xué)習(xí)等,這里對這些術(shù)語進行簡單的整理。

AI意味著人工智能,其定義因研究人員而異。從廣義上講,它指“像人類一樣具有智能的系統(tǒng)和配備這種系統(tǒng)的機器人”。實現(xiàn)AI的方法之一是機器學(xué)習(xí)。

機器學(xué)習(xí)可以簡單地描述為“向系統(tǒng)提供數(shù)據(jù)(稱為訓(xùn)練數(shù)據(jù)或?qū)W習(xí)數(shù)據(jù))并通過數(shù)據(jù)自動確定系統(tǒng)的參數(shù)(變量值)”。相反,基于規(guī)則的系統(tǒng)是非機器學(xué)習(xí)系統(tǒng)的一個例子。在基于規(guī)則的系統(tǒng)中,由人類來清楚地定義分支條件的參數(shù),例如實現(xiàn)代碼中所存在的if語句等。

另一方面,機器學(xué)習(xí)自動根據(jù)訓(xùn)練數(shù)據(jù)確定代碼中的參數(shù),以使系統(tǒng)運行良好。之所以稱為機器學(xué)習(xí),正是因為系統(tǒng)能根據(jù)訓(xùn)練數(shù)據(jù)計算和確定系統(tǒng)運行所需的參數(shù)。

強化學(xué)習(xí)是機器學(xué)習(xí)中的一種。機器學(xué)習(xí)可分為三大類:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。我們稍后會討論這三個分類,這里只需要認識到強化學(xué)習(xí)是機器學(xué)習(xí)的一部分即可。

接下來是深度學(xué)習(xí)。深度學(xué)習(xí)是實現(xiàn)機器學(xué)習(xí)的算法之一。機器學(xué)習(xí)的算法包括邏輯回歸、支持向量機(Support Vector Machine,SVM)、決策樹、隨機森林和神經(jīng)網(wǎng)絡(luò)等。深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)中的一種。

最后是深度強化學(xué)習(xí)。深度強化學(xué)習(xí)是強化學(xué)習(xí)和深度學(xué)習(xí)的結(jié)合。

02 監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)

這里對三種機器學(xué)習(xí)(監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí))分別進行介紹。

首先說明監(jiān)督學(xué)習(xí)。

例如,“對郵政編碼中的手寫數(shù)字進行分類”是一種監(jiān)督學(xué)習(xí)。郵政編碼分類系統(tǒng)將每個數(shù)字的手寫圖像分類為0~9中的一個。諸如0到9的數(shù)據(jù)的分類目標被稱為標簽或類。這種系統(tǒng)被稱為監(jiān)督學(xué)習(xí),因為給事先提供的訓(xùn)練數(shù)據(jù)預(yù)先標記出了正確的標簽。換句話說,帶標簽的訓(xùn)練數(shù)據(jù)成了系統(tǒng)的教師。

監(jiān)督學(xué)習(xí)包括學(xué)習(xí)階段和推理階段。我們將以圖為例來解釋手寫數(shù)字的分類(見圖1.1)。

詳談機器學(xué)習(xí)及其三大分類

▲圖1.1 使用監(jiān)督學(xué)習(xí)區(qū)分手寫數(shù)字的示例

在學(xué)習(xí)階段,準備許多0到9的手寫數(shù)字圖像數(shù)據(jù),這些數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)有一個標簽(0到9中的某個數(shù)值),根據(jù)標簽可以找到關(guān)于手寫數(shù)字圖像的正確答案信息,例如“此手寫數(shù)字圖像為1”。在學(xué)習(xí)階段,當將手寫數(shù)字圖像輸入系統(tǒng)時,調(diào)整(學(xué)習(xí))系統(tǒng)的參數(shù)以盡量將輸入圖像分類為正確的標簽。

在應(yīng)用階段,將無標簽的未知手寫數(shù)字圖像數(shù)據(jù)輸入系統(tǒng),圖像被分類為0到9中的某一個輸出標簽并給出結(jié)果。如果已經(jīng)學(xué)習(xí)到正確的結(jié)果,當輸入未知的手寫數(shù)字圖像時,系統(tǒng)將輸出正確的數(shù)值標簽。除了手寫數(shù)字的分類之外,還可使用監(jiān)督學(xué)習(xí)來對圖像、聲音和文本數(shù)據(jù)進行分類。

此外,除了上面例子中提到的分類任務(wù),監(jiān)督學(xué)習(xí)也用于回歸等任務(wù)。

接下來,介紹非監(jiān)督學(xué)習(xí)。用一個詞表達非監(jiān)督學(xué)習(xí)就是“分組”。它將大量數(shù)據(jù)中類似的數(shù)據(jù)分為一組(稱為聚類)。例如,“根據(jù)購買數(shù)據(jù)對客戶進行分組的系統(tǒng)”是非監(jiān)督學(xué)習(xí)。根據(jù)購買歷史記錄的特征對客戶進行分組,可以為每個組實施不同的銷售策略。

我們使用圖來說明購買數(shù)據(jù)分析的例子(見圖1.2)。假設(shè)存儲了每個客戶過去一年的購買數(shù)量和每次平均消費金額的數(shù)據(jù),并對此數(shù)據(jù)進行分析。根據(jù)這些數(shù)據(jù),客戶可以分為兩組。A組(左上角)是以較低頻次購買高價商品的組,B組(右下角)是多次重復(fù)但每次消費金額較低的組。

詳談機器學(xué)習(xí)及其三大分類

▲圖1.2 使用非監(jiān)督學(xué)習(xí)根據(jù)購買數(shù)據(jù)對客戶分組的示例

使用非監(jiān)督學(xué)習(xí)進行分組將有助于了解每個客戶所屬的組,并針對每個組實施最佳銷售策略(盡管部分業(yè)務(wù)還需要更詳細的分析)。除了本例中提到的分組(聚類)以外,非監(jiān)督學(xué)習(xí)也用于降維和推薦系統(tǒng)。

最后,我們討論強化學(xué)習(xí)。強化學(xué)習(xí)是一種主要用于“時變系統(tǒng)控制規(guī)則構(gòu)建”和“對戰(zhàn)博弈策略構(gòu)建”的方法。例如,強化學(xué)習(xí)用于機器人的步行控制和圍棋對戰(zhàn)程序。

在我們熟悉的例子中,可能更容易想象一個孩子學(xué)會騎自行車的情形。當一個孩子學(xué)習(xí)騎自行車時,并沒有人去教其諸如牛頓力學(xué)等力學(xué)法則以及如何騎車的詳細方法,也不必通過觀看視頻來學(xué)習(xí)騎自行車。事實上,自己嘗試騎自行車,在多次失敗的過程中找到一種騎自行車的方法。

強化學(xué)習(xí)正如學(xué)騎自行車的例子,它是一種學(xué)習(xí)方法,它在不知道控制對象的物理定律的情況下重復(fù)試錯,以學(xué)習(xí)到所希望的控制方法。

強化學(xué)習(xí)中沒有帶標簽的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),但這并不意味著根本沒有監(jiān)督信息。系統(tǒng)根據(jù)強化學(xué)習(xí)程序運行,在獲得所需結(jié)果時給出稱為獎勵的信號。例如,在機器人的步行控制中,可以走的距離就是獎勵。在圍棋的比賽程序中,贏或輸?shù)慕Y(jié)果就是獎勵。失敗時的獎勵是負值,也稱為懲罰。

如果想通過監(jiān)督學(xué)習(xí)來學(xué)習(xí)機器人的步行控制,就需要盡可能多的“如果腿的關(guān)節(jié)處于這個角度并且速度是某值,那么就像這樣轉(zhuǎn)動電動機A”這樣的模式,并預(yù)先給出其正確的做法。然而,當機器人行走時,對于每個時刻變化的狀態(tài),很難預(yù)先給出控制該電動機的正確做法。

另一方面,在強化學(xué)習(xí)中,將行走距離作為獎勵提供給步行控制系統(tǒng),并且重復(fù)試驗多次。

這樣一來,強化學(xué)習(xí)系統(tǒng)會根據(jù)重復(fù)試驗和獲得的獎勵自行改變控制規(guī)則,以“如果之前的試驗中所做改變使我可以走得更遠,則這種改變是正確的”為基礎(chǔ)。因此,可以在不教導(dǎo)機器人如何行走的情況下讓機器人能漸漸行走更長的距離。

即使在像圍棋這樣的對戰(zhàn)游戲的策略構(gòu)建中,也無須在每個階段將強者視為教師數(shù)據(jù)來進行教導(dǎo),僅通過將成功或失敗作為獎勵來重復(fù)試驗即可。這樣做,強化學(xué)習(xí)系統(tǒng)會一點一點地改變游戲方式并變得更強。

學(xué)到的圍棋或?qū)⑵逑到y(tǒng)比設(shè)計者本人更強大,這一點通過強化學(xué)習(xí)可以很容易實現(xiàn)。只聽這個解釋,強化學(xué)習(xí)就像魔術(shù),但在實踐中卻存在著種種困難。

強化學(xué)習(xí)主要適用于“時變系統(tǒng)控制規(guī)則構(gòu)建”和“對戰(zhàn)博弈策略構(gòu)建”,本書以前者“系統(tǒng)控制”為目標任務(wù),通過編寫相關(guān)程序來學(xué)習(xí)強化學(xué)習(xí)。

關(guān)于作者:小川雄太郎,東京大學(xué)博士,曾在東京大學(xué)從事腦機能測量及計算論的神經(jīng)科學(xué)研究?,F(xiàn)就職于株式會社電通國際信息服務(wù)技術(shù)開發(fā)部,從事機器學(xué)習(xí)相關(guān)技術(shù)的研究開發(fā)。

本文摘編自《邊做邊學(xué)深度強化學(xué)習(xí):PyTorch程序設(shè)計實踐》,經(jīng)出版方授權(quán)發(fā)布。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265284
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136929
  • 強化學(xué)習(xí)
    +關(guān)注

    關(guān)注

    4

    文章

    270

    瀏覽量

    11967
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的
    的頭像 發(fā)表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:<b class='flag-5'>分類</b>變量的數(shù)值化處理方法

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?185次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    交流伺服電機及其調(diào)速分類和特點

    工作原理、調(diào)速分類及技術(shù)特點個維度展開系統(tǒng)闡述。 一、交流伺服電機的工作原理與結(jié)構(gòu)特性 交流伺服電機本質(zhì)上是一種采用閉環(huán)控制的交流電動機,其運行機理基于電磁感應(yīng)定律。定子繞組通入相交流電后產(chǎn)生旋轉(zhuǎn)磁場,帶動
    的頭像 發(fā)表于 12-13 07:37 ?402次閱讀
    交流伺服電機<b class='flag-5'>及其</b>調(diào)速<b class='flag-5'>分類</b>和特點

    如何深度學(xué)習(xí)機器視覺的應(yīng)用場景

    深度學(xué)習(xí)視覺應(yīng)用場景大全 工業(yè)制造領(lǐng)域 復(fù)雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標準化缺陷模式 非標產(chǎn)品分類:對形狀、顏色、紋理多變的產(chǎn)品進行智能分類 外觀質(zhì)量評估:基于學(xué)習(xí)的外觀質(zhì)量標
    的頭像 發(fā)表于 11-27 10:19 ?220次閱讀

    機器視覺維成像技術(shù)簡介(一)

    本文討論了機器視覺維成像技術(shù),涵蓋了各種成像技術(shù)的原理、特點、優(yōu)缺點及應(yīng)用場景等內(nèi)容。關(guān)鍵要點包括: 1. 維成像技術(shù)分類 2. 飛行時間法(ToF) 3. 結(jié)構(gòu)光 4.
    的頭像 發(fā)表于 10-20 14:04 ?596次閱讀
    <b class='flag-5'>機器</b>視覺<b class='flag-5'>三</b>維成像技術(shù)簡介(一)

    機器視覺系統(tǒng)中工業(yè)相機的常見類型及其特點、應(yīng)用

    工業(yè)相機的分類及其特點
    的頭像 發(fā)表于 09-26 13:30 ?778次閱讀
    <b class='flag-5'>機器</b>視覺系統(tǒng)中工業(yè)相機的常見類型<b class='flag-5'>及其</b>特點、應(yīng)用

    量子機器學(xué)習(xí)入門:種數(shù)據(jù)編碼方法對比與應(yīng)用

    在傳統(tǒng)機器學(xué)習(xí)中數(shù)據(jù)編碼確實相對直觀:獨熱編碼處理類別變量,標準化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機器學(xué)習(xí)的編碼完全是另一回事。傳統(tǒng)算
    的頭像 發(fā)表于 09-15 10:27 ?771次閱讀
    量子<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>入門:<b class='flag-5'>三</b>種數(shù)據(jù)編碼方法對比與應(yīng)用

    什么是機器視覺及其功能?

    機器視覺本質(zhì)上是一個系統(tǒng)(例如一臺計算機)查看的能力。系統(tǒng)通過該能力分析圖像,然后作出決策或進行分類。
    的頭像 發(fā)表于 09-10 17:23 ?752次閱讀
    什么是<b class='flag-5'>機器</b>視覺<b class='flag-5'>及其</b>功能?

    N9H30 可以支持最大分辨率是多少?

    [i]N9H30 可以支持最大分辨率是多少?
    發(fā)表于 09-05 06:14

    AI 驅(qū)動維逆向:點云降噪算法工具與機器學(xué)習(xí)建模能力的前沿應(yīng)用

    維逆向工程領(lǐng)域,傳統(tǒng)方法在處理復(fù)雜數(shù)據(jù)和構(gòu)建高精度模型時面臨諸多挑戰(zhàn)。隨著人工智能(AI)技術(shù)的發(fā)展,點云降噪算法工具與機器學(xué)習(xí)建模能力的應(yīng)用,為維逆向工程帶來了創(chuàng)新性解決方案,
    的頭像 發(fā)表于 08-20 10:00 ?692次閱讀
    AI 驅(qū)動<b class='flag-5'>三</b>維逆向:點云降噪算法工具與<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>建模能力的前沿應(yīng)用

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2885次閱讀

    機器學(xué)習(xí)異常檢測實戰(zhàn):用Isolation Forest快速構(gòu)建無標簽異常檢測系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無監(jiān)督異常檢測作為機器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常檢測技術(shù)的理論基礎(chǔ)與實踐應(yīng)用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1409次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>異常檢測實戰(zhàn):用Isolation Forest快速構(gòu)建無標簽異常檢測系統(tǒng)

    工業(yè)相機:機器視覺的“核心之眼”,四大分類詳解

    在智能制造和自動化生產(chǎn)中,工業(yè)相機作為機器視覺系統(tǒng)的核心組件,憑借其高精度、高穩(wěn)定性和快速響應(yīng)能力,被廣泛應(yīng)用于產(chǎn)品質(zhì)量檢測、尺寸測量、定位識別等領(lǐng)域。它通常與工業(yè)鏡頭、機器視覺光源及圖像處理軟件協(xié)同工作,共同構(gòu)成高效的視覺檢測系統(tǒng)。
    的頭像 發(fā)表于 05-13 16:30 ?1771次閱讀
    工業(yè)相機:<b class='flag-5'>機器</b>視覺的“核心之眼”,四<b class='flag-5'>大分類</b>詳解

    基于RV1126開發(fā)板實現(xiàn)自學(xué)習(xí)圖像分類方案

    在RV1126開發(fā)板上實現(xiàn)自學(xué)習(xí):在識別前對物體圖片進行模型學(xué)習(xí),訓(xùn)練完成后通過算法分類得出圖像的模型ID。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成圖像,算法代碼負責訓(xùn)練和檢測功能
    的頭像 發(fā)表于 04-21 13:37 ?11次閱讀
    基于RV1126開發(fā)板實現(xiàn)自<b class='flag-5'>學(xué)習(xí)</b>圖像<b class='flag-5'>分類</b>方案

    請問STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34