91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從四個(gè)經(jīng)典角度看機(jī)器學(xué)習(xí)的本質(zhì)

DPVg_AI_era ? 來源:cc ? 2019-02-13 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

何謂“機(jī)器學(xué)習(xí)”,學(xué)界尚未有統(tǒng)一的定義。本文摘取Tom Mitchell、Christopher M. Bishop、去年出版的《深度學(xué)習(xí)》和側(cè)重實(shí)戰(zhàn)的《數(shù)據(jù)挖掘》,總結(jié)了四種機(jī)器學(xué)習(xí)主流定義。更好地研究“機(jī)器學(xué)習(xí)”,并繼續(xù)擴(kuò)展和完善它的定義,也有助于我們理解機(jī)器學(xué)習(xí)的本質(zhì)。

你或許已經(jīng)讀過許多關(guān)于機(jī)器學(xué)習(xí)的深度和和半深度的文章,并探討了機(jī)器學(xué)習(xí)與眾多其他主題的關(guān)系。在討論如此復(fù)雜的概念時(shí),回到最初的一些共同參考資料總是一個(gè)好主意;問題是,對于機(jī)器學(xué)習(xí)這樣的主題,存在無數(shù)這樣的參考資料。

所以我想,為什么不研究一下這些參考點(diǎn)呢?

這是一篇不那么嚴(yán)肅的帖子,旨在探討機(jī)器學(xué)習(xí)的本質(zhì)。

話不多說,作為一個(gè)看似屬于語義學(xué)的練習(xí),讓我們來探索一下關(guān)于機(jī)器學(xué)習(xí)的定義。

Tom Mitchell:根據(jù)優(yōu)化過程抽象定義機(jī)器學(xué)習(xí)

第一個(gè)定義,是我個(gè)人最喜歡的,來自著名的計(jì)算機(jī)科學(xué)家、機(jī)器學(xué)習(xí)研究者,卡內(nèi)基梅隆大學(xué)的 Tom Mitchell 教授。

對于某類任務(wù) T 和性能度量 P,如果一個(gè)計(jì)算機(jī)程序在 T 上以 P 衡量的性能隨著經(jīng)驗(yàn) E 而自我完善,那么我們稱這個(gè)計(jì)算機(jī)程序在從經(jīng)驗(yàn) E 中學(xué)習(xí)。[1]

Mitchell 的這個(gè)定義在機(jī)器學(xué)習(xí)領(lǐng)域是眾所周知的,并且經(jīng)受了時(shí)間的考驗(yàn)。這句話首次出現(xiàn)在他 1997 年出版的Machine Learning一書中。

這句話對我個(gè)人產(chǎn)生了很大的影響,多年來我多次提到它,并在碩士論文中引用了這個(gè)定義。在 Goodfellow, Bengio & Courville 最近出版的權(quán)威著作《深度學(xué)習(xí)》(Deep Learning) 的第 5 章中,這段引文也占據(jù)了突出位置,成為該書對學(xué)習(xí)算法的解釋的出發(fā)點(diǎn)。

下圖是 Mitchell 定義的圖示:

圖 1:The Mitchell Paradigm

“花書”《深度學(xué)習(xí)》:論計(jì)算在機(jī)器學(xué)習(xí)中的重要性

說到 Goodfellow、Bengio 和 Courville,就不得不提他們合著的《深度學(xué)習(xí)》,這本書對機(jī)器學(xué)習(xí)是這樣定義的:

機(jī)器學(xué)習(xí)本質(zhì)上屬于應(yīng)用統(tǒng)計(jì)學(xué),更多地關(guān)注如何用計(jì)算機(jī)統(tǒng)計(jì)地估計(jì)復(fù)雜函數(shù),不太關(guān)注為這些函數(shù)提供置信區(qū)間。[2]

Mitchell 對機(jī)器學(xué)習(xí)的定義在應(yīng)用中不再適用;它側(cè)重于優(yōu)化過程的具體組成部分,這些組成部分通常與機(jī)器學(xué)習(xí)有關(guān),但它沒有規(guī)定應(yīng)該如何在實(shí)踐中接近它。

《深度學(xué)習(xí)》中對機(jī)器學(xué)習(xí)的定義在本質(zhì)上要規(guī)范得多,它指出計(jì)算能力得到了利用 (實(shí)際上強(qiáng)調(diào)了對計(jì)算能力的使用),而傳統(tǒng)的統(tǒng)計(jì)概念置信區(qū)間則不再強(qiáng)調(diào)。

實(shí)戰(zhàn)數(shù)據(jù)挖掘:“學(xué)習(xí)”必須是有意地去學(xué)習(xí)

在我看來,另一個(gè)特別值得注意的關(guān)于機(jī)器學(xué)習(xí)的定義來自 Witten, Frank & Hall 所著的《數(shù)據(jù)挖掘:實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù)》,這是我第一本完整閱讀了的關(guān)于這個(gè)主題的書。

《數(shù)據(jù)挖掘》這本書很少涉及數(shù)學(xué),但有很多實(shí)用性的解釋。對于剛進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域的人,“數(shù)據(jù)挖掘” 很長一段時(shí)間是我的首選推薦。

作者對機(jī)器學(xué)習(xí)最初定義有點(diǎn)零散,他們試圖在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的背景中將學(xué)習(xí)、性能和知識(shí)這些概念編織在一起。但其中一些語句值得注意:

我們感興趣的是在新的情況下得到性能的改進(jìn),或至少有性能改進(jìn)的潛力。

當(dāng)系統(tǒng)以一種使它們在未來表現(xiàn)更好的方式改變自己的行為時(shí),它們就會(huì)學(xué)習(xí)。

學(xué)習(xí)意味著思考和目標(biāo)。學(xué)習(xí)必須是有意地去學(xué)習(xí)。

經(jīng)驗(yàn)表明,在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的許多應(yīng)用中,所獲得的顯式知識(shí)結(jié)構(gòu)、結(jié)構(gòu)描述,至少與在新實(shí)例中表現(xiàn)良好的能力同等重要。人們經(jīng)常使用數(shù)據(jù)挖掘來獲取知識(shí),而不僅僅是用來預(yù)測。

“數(shù)據(jù)挖掘”這個(gè)術(shù)語被用作機(jī)器學(xué)習(xí)的補(bǔ)充術(shù)語。上面引用的語句出自這本書的第三版,出版于 2011 年,當(dāng)時(shí)數(shù)據(jù)挖掘這個(gè)詞比現(xiàn)在更有吸引力;即使不說是引用自數(shù)據(jù)挖掘的書,上面所寫的內(nèi)容對機(jī)器學(xué)習(xí)本身也適用。

Witten, Frank & Hall 為機(jī)器學(xué)習(xí)的定義提供了一個(gè)不同的角度:Mitchell 專注于優(yōu)化過程的特定組成部分,Goodfellow, Bengio & Courville 傾向于一種更規(guī)范的定義,并強(qiáng)調(diào)計(jì)算能力的相對重要性,這個(gè)定義則嘗試側(cè)重 “l(fā)earning” 的哪些方面在機(jī)器學(xué)習(xí)過程中是類似和重要的。

上面引用的語句還提供了一個(gè)重要的點(diǎn),兼具實(shí)用性和哲學(xué)性,即最后一段,指出獲得知識(shí)和使用這些知識(shí)的能力都是機(jī)器學(xué)習(xí)的重要方面。

Christopher Bishop:從算法的角度定義

最后,讓我們來看 Christopher Bishop 在《模式識(shí)別和機(jī)器學(xué)習(xí)》一書中對機(jī)器學(xué)習(xí)的定義。值得注意的是,Bishop 沒有開門見山地定義這個(gè)術(shù)語,但是很好地隱式地提供了以算法為中心的機(jī)器學(xué)習(xí)的定義 (在一個(gè)數(shù)字分類任務(wù)中討論到):

機(jī)器學(xué)習(xí)算法的結(jié)果表示為一個(gè)函數(shù) y (x),它以一個(gè)新的數(shù)字的圖像 x 作為為輸入,產(chǎn)生向量 y,與 target vector 的形式相同。

函數(shù) y (x) 的精確形式是在訓(xùn)練階段(trainingphase) 確定的,也稱為學(xué)習(xí)階段 (learningphase),以訓(xùn)練數(shù)據(jù)為基礎(chǔ)。

一旦模型被訓(xùn)練出來,就可以用來判斷新的數(shù)字圖像 (新樣本) 對應(yīng)的標(biāo)簽,這些新樣本的集合被稱為測試集。

正確分類與訓(xùn)練集不同的新樣本的能力叫做泛化(generalization)。在實(shí)際應(yīng)用中,輸入向量的可變性使得訓(xùn)練數(shù)據(jù)只能包含所有可能輸入向量的很小一部分,因此泛化是模式識(shí)別的一個(gè)中心目標(biāo)。[4]

首先,除了我們討論的機(jī)器學(xué)習(xí)是有監(jiān)督學(xué)習(xí),而不是無監(jiān)督學(xué)習(xí)或強(qiáng)化學(xué)習(xí) (或其他形式的機(jī)器學(xué)習(xí)) 外,上面的引用對 “模式識(shí)別” 沒有更多的解釋。

其次,也是更重要的一點(diǎn),這是唯一對機(jī)器學(xué)習(xí)所需步驟逐步處理的定義,無論這些步驟在這個(gè)例子中可能多么簡短。

同樣有趣的是,隨后的頁面,以及 Bishop 的書一半的篇幅概述了許多額外的機(jī)器學(xué)習(xí)概念,并將它們很好地結(jié)合在一起,提供了具有可讀性的介紹,而不至于陷入數(shù)學(xué)的困境 (書中的其余部分解釋了數(shù)學(xué))。

這樣,我們已經(jīng)有四種方法來定義機(jī)器學(xué)習(xí):一種是根據(jù)它的優(yōu)化過程,抽象地定義它機(jī)器學(xué)習(xí);第二種更有規(guī)范性,并指出計(jì)算在機(jī)器學(xué)習(xí)中的重要性;第三定義側(cè)重于“學(xué)習(xí)”的哪些方面在機(jī)器學(xué)習(xí)過程中是類似的和重要的;最后一個(gè)定義從算法的角度概述了機(jī)器學(xué)習(xí)。

這些定義都不是不正確,但都不完整。探討先驅(qū)者和受人尊敬的研究人員所認(rèn)為的 “機(jī)器學(xué)習(xí)”,將擴(kuò)展我們自己對機(jī)器學(xué)習(xí)的定義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:機(jī)器學(xué)習(xí)的本質(zhì)是什么?

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PCBA生產(chǎn)過程的四個(gè)主要環(huán)節(jié)?

    PCBA生產(chǎn)過程的四個(gè)主要環(huán)節(jié) PCBA(Printed Circuit Board Assembly)生產(chǎn)過程是將電子元器件組裝到印刷電路板(PCB)上,形成完整電子產(chǎn)品的過程。雖然直接參考資料
    的頭像 發(fā)表于 03-05 11:13 ?142次閱讀

    再談低溫?zé)Y(jié)銀的應(yīng)用:春晚機(jī)器人出鏡的幕后推手說起

    戴:10萬次彎折電阻穩(wěn)定,適配柔性基材。 光伏逆變器:壽命10萬小時(shí)延至15萬小時(shí),多發(fā)電5個(gè)季度。 、春晚機(jī)器人與低溫?zé)Y(jié)銀:產(chǎn)業(yè)共振 1技術(shù)驗(yàn)證:春晚高動(dòng)態(tài)、高可靠場景,是低溫
    發(fā)表于 02-17 14:07

    架構(gòu)到驅(qū)動(dòng):這三本經(jīng)典書,承包了我的嵌入式Linux入門與進(jìn)階

    私房菜(基礎(chǔ)學(xué)習(xí)篇 第版)》《Linux 設(shè)備驅(qū)動(dòng)開發(fā)(第 2 版)》,這三本書恰好構(gòu)成了 “底層架構(gòu)” 到 “系統(tǒng)基礎(chǔ)” 再到 “驅(qū)動(dòng)開發(fā)” 的完整學(xué)習(xí)鏈路。
    的頭像 發(fā)表于 02-09 17:02 ?1164次閱讀

    合科泰MOSFET選型的四個(gè)核心步驟

    面對數(shù)據(jù)手冊中繁雜的參數(shù),如何快速鎖定適合應(yīng)用的 MOSFET?遵循以下四個(gè)核心步驟,您能系統(tǒng)化地完成選型,避免因關(guān)鍵參數(shù)遺漏導(dǎo)致的設(shè)計(jì)風(fēng)險(xiǎn)。
    的頭像 發(fā)表于 12-19 10:33 ?734次閱讀

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    下,就是一個(gè)智能體在環(huán)境里行動(dòng),它能觀察到環(huán)境的一些信息,并做出一個(gè)動(dòng)作,然后環(huán)境會(huì)給出一個(gè)反饋(獎(jiǎng)勵(lì)或懲罰),智能體的目標(biāo)是把長期得到的獎(jiǎng)勵(lì)累積到最大。和監(jiān)督學(xué)習(xí)不同,強(qiáng)化
    的頭像 發(fā)表于 10-23 09:00 ?676次閱讀
    自動(dòng)駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個(gè)</b>啥?

    如何 MCU/MPU 角度保護(hù)物聯(lián)網(wǎng)應(yīng)用?

    如何 MCU/MPU 角度保護(hù)物聯(lián)網(wǎng)應(yīng)用?
    發(fā)表于 09-08 07:33

    多個(gè)角度分析什么是自承式光纜

    自承式光纜是一種無需額外支撐結(jié)構(gòu)即可自行承受自身重量及外部負(fù)荷的特殊光纜,其核心在于通過內(nèi)置承重元件實(shí)現(xiàn)架空敷設(shè)的獨(dú)立性。以下結(jié)構(gòu)、類型、應(yīng)用場景及優(yōu)勢四個(gè)方面進(jìn)行詳細(xì)說明: 一、結(jié)構(gòu)設(shè)計(jì) 自承式
    的頭像 發(fā)表于 08-22 09:48 ?2548次閱讀

    技術(shù)角度,一款優(yōu)秀的煮蛋器 PCBA 方案能帶來哪些體驗(yàn)升級(jí)?

    作為一個(gè)每天早餐離不開雞蛋的人,用過不下十款煮蛋器后發(fā)現(xiàn):決定產(chǎn)品體驗(yàn)的核心,往往藏在看不見的 PCBA 方案里。最近入手的新款煮蛋器,讓我真切感受到了技術(shù)迭代帶來的差異。 一、溫控精度:
    的頭像 發(fā)表于 07-14 11:10 ?464次閱讀

    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有
    發(fā)表于 05-28 18:33
    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個(gè)</b>線性 TRx 開關(guān)端口 skyworksinc

    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有
    發(fā)表于 05-28 18:33
    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個(gè)</b>線性 TRx 開關(guān)端口 skyworksinc

    用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個(gè)線性 TRx 開關(guān)端口和雙頻 TD-SCDMA skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個(gè)線性 TRx 開關(guān)端口和雙頻 TD-SCDMA相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于頻 GSM
    發(fā)表于 05-28 18:31
    用于<b class='flag-5'>四</b>頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有<b class='flag-5'>四個(gè)</b>線性 TRx 開關(guān)端口和雙頻 TD-SCDMA skyworksinc

    ADAU1787四個(gè)ADC、兩個(gè)DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    ADAU1787 是一款具有四個(gè)輸入和兩個(gè)輸出的編解碼器,其中整合了兩個(gè)數(shù)字信號(hào)處理器 (DSP)。模擬輸入到 DSP 內(nèi)核再到模擬輸出的路徑已針對低延遲進(jìn)行優(yōu)化,適用于噪聲消除耳機(jī)。通過加入少量無源組件,ADAU1787 提
    的頭像 發(fā)表于 05-12 14:57 ?1519次閱讀
    ADAU1787<b class='flag-5'>四個(gè)</b>ADC、兩<b class='flag-5'>個(gè)</b>DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    PLC產(chǎn)品故障問題測試的四個(gè)部分

    ,必須對故障問題進(jìn)行系統(tǒng)化測試。本文將詳細(xì)介紹PLC產(chǎn)品故障問題測試的四個(gè)關(guān)鍵部分,幫助技術(shù)人員快速定位和解決問題。 一、硬件測試 硬件測試是PLC故障診斷的首要環(huán)節(jié),主要針對PLC設(shè)備的物理部件進(jìn)行檢查。首先,需要檢查電源模塊是否
    的頭像 發(fā)表于 05-11 17:00 ?1784次閱讀
    PLC產(chǎn)品故障問題測試的<b class='flag-5'>四個(gè)</b>部分

    四個(gè)方面深入剖析富捷電阻的優(yōu)勢

    理成本的電阻產(chǎn)品系列,為電子行業(yè)提供了一個(gè)可靠的選擇。本文將從產(chǎn)品結(jié)構(gòu)、同業(yè)對比、成本分析以及品質(zhì)保障四個(gè)方面深入剖析富捷電阻的優(yōu)勢,展現(xiàn)其如何在激烈的市場競爭中脫穎而出。
    的頭像 發(fā)表于 05-09 10:47 ?1092次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>四個(gè)</b>方面深入剖析富捷電阻的優(yōu)勢

    四個(gè)輪子到兩條腿:汽車工廠的 “新工人”

    在全球汽車產(chǎn)業(yè)加速向電動(dòng)化、智能化轉(zhuǎn)型的浪潮中,一個(gè)令人矚目的跨界趨勢正悄然興起 —— 車企紛紛涉足人形機(jī)器人領(lǐng)域。這一轉(zhuǎn)變絕非偶然的跟風(fēng)之舉,而是在產(chǎn)業(yè)變革壓力下,車企為尋求新的增長曲線、重構(gòu)核心
    的頭像 發(fā)表于 04-24 09:57 ?888次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>四個(gè)</b>輪子到兩條腿:汽車工廠的 “新工人”