91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種

lviY_AI_shequ ? 來源:未知 ? 作者:李倩 ? 2018-09-19 17:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.引言

頂級數(shù)據(jù)挖掘會議ICDM于2006年12月評選出了數(shù)據(jù)挖掘領(lǐng)域的十大經(jīng)典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Na?ve Bayes與 CART。 以前看過關(guān)于這些數(shù)據(jù)挖掘算法,但對背后數(shù)學(xué)原理未做過多探究,因而借此整理以更深入地理解這些算法。

本文討論的kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種。所謂監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí),是指訓(xùn)練數(shù)據(jù)是否有標注類別,若有則為監(jiān)督學(xué)習(xí),若否則為非監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是根據(jù)輸入數(shù)據(jù)(訓(xùn)練數(shù)據(jù))學(xué)習(xí)一個模型,能對后來的輸入做預(yù)測。在監(jiān)督學(xué)習(xí)中,輸入變量與輸出變量可以是連續(xù)的,也可以是離散的。若輸入變量與輸出變量均為連續(xù)變量,則稱為回歸;輸出變量為有限個離散變量,則稱為分類;輸入變量與輸出變量均為變量序列,則稱為標注[2]。

2.kNN算法

kNN算法的核心思想非常簡單:在訓(xùn)練集中選取離輸入的數(shù)據(jù)點最近的k個鄰居,根據(jù)這個k個鄰居中出現(xiàn)次數(shù)最多的類別(最大表決規(guī)則),作為該數(shù)據(jù)點的類別。

算法描述

訓(xùn)練,其類別,訓(xùn)練集中樣本點數(shù)為N,類別數(shù)為K。輸入待預(yù)測數(shù)據(jù),則預(yù)測類別

其中,涵蓋的k鄰域記作,當時指示函數(shù),否則。

分類決策規(guī)則

kNN學(xué)習(xí)模型:輸入,通過學(xué)習(xí)得到?jīng)Q策函數(shù):輸出類別。假設(shè)分類損失函數(shù)為0-1損失函數(shù),即分類正確時損失函數(shù)值為0,分類錯誤時則為1。假如給預(yù)測類別為,即;同時由式子(1)可知k鄰域的樣本點對學(xué)習(xí)模型的貢獻度是均等的,則kNN學(xué)習(xí)模型誤分類率為

若要最小化誤分類率,則應(yīng)

所以,最大表決規(guī)則等價于經(jīng)驗風(fēng)險最小化。

存在問題

k值得選取對kNN學(xué)習(xí)模型有著很大的影響。若k值過小,預(yù)測結(jié)果會對噪音樣本點顯得異常敏感。特別地,當k等于1時,kNN退化成最近鄰算法,沒有了顯式的學(xué)習(xí)過程。若k值過大,會有較大的鄰域訓(xùn)練樣本進行預(yù)測,可以減小噪音樣本點的減少;但是距離較遠的訓(xùn)練樣本點對預(yù)測結(jié)果會有貢獻,以至于造成預(yù)測結(jié)果錯誤。下圖給出k值的選取對于預(yù)測結(jié)果的影響:

前面提到過,k鄰域的樣本點對預(yù)測結(jié)果的貢獻度是相等的;但距離更近的樣本點應(yīng)有更大的相似度,其貢獻度應(yīng)比距離更遠的樣本點大。可以加上權(quán)值進行修正,則最大表決原則變成:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98038
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    25082

原文標題:【十大經(jīng)典數(shù)據(jù)挖掘算法】kNN

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用MATLAB進行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進行無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機器監(jiān)督學(xué)習(xí)下面的分類問題?

    人工智能下面有哪些機器學(xué)習(xí)分支?如何用卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法去解決機器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題?
    發(fā)表于 06-16 08:09

    基于半監(jiān)督學(xué)習(xí)框架的識別算法

    問題,對半監(jiān)督學(xué)習(xí)中的協(xié)同訓(xùn)練算法進行改進,提出了一種基于多學(xué)習(xí)器協(xié)同訓(xùn)練模型的人體行為識別方法.這是
    發(fā)表于 01-21 10:41 ?1次下載

    你想要的機器學(xué)習(xí)課程筆記在這:主要討論監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)

    with experience E(個程序從經(jīng)驗E中學(xué)習(xí)解決任務(wù)T進行某任務(wù)量度P,通過P測量在T的表現(xiàn)而提高經(jīng)驗E(另一種定義:機器學(xué)習(xí)
    發(fā)表于 12-03 17:12 ?923次閱讀

    如何用Python進行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)一種用于在數(shù)據(jù)中查找模式的機器學(xué)習(xí)技術(shù)。無監(jiān)督算法給出的數(shù)據(jù)不帶標記,只給出輸入變量(X),沒有相應(yīng)的輸出變量。在無
    的頭像 發(fā)表于 01-21 17:23 ?5172次閱讀

    詳解機器學(xué)習(xí)分類算法KNN

    本文主要介紹個被廣泛使用的機器學(xué)習(xí)分類算法,K-nearest neighbors(KNN),中文叫K近鄰
    的頭像 發(fā)表于 10-31 17:18 ?7061次閱讀

    機器學(xué)習(xí)算法中有監(jiān)督和無監(jiān)督學(xué)習(xí)的區(qū)別

    監(jiān)督學(xué)習(xí)的好處之是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費力的數(shù)據(jù)標記過程。但是,要權(quán)衡的是,評估其性能的有效性也非常困難。相反,通過將監(jiān)督學(xué)習(xí)算法
    的頭像 發(fā)表于 07-07 10:18 ?6577次閱讀

    最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

    導(dǎo)讀 最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家個感性的認識。 半監(jiān)督學(xué)習(xí)(SSL)是一種機器學(xué)習(xí)技術(shù),其中任務(wù)是從
    的頭像 發(fā)表于 11-02 16:08 ?3316次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個概念

    導(dǎo)讀 今天給大家介紹半監(jiān)督學(xué)習(xí)中的3個最基礎(chǔ)的概念:致性正則化,熵最小化和偽標簽,并介紹了兩個經(jīng)典的半監(jiān)督學(xué)習(xí)方法。 沒看的點這里哈:半監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 11-02 16:14 ?3701次閱讀
    半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個概念

    監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

    監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精...
    的頭像 發(fā)表于 12-08 23:32 ?2086次閱讀

    一種基于光滑表示的半監(jiān)督分類算法

    。文中提岀了一種基于光滑表示的半監(jiān)督分類算法。具體來說,此方法通過應(yīng)用個低通濾波器來實現(xiàn)數(shù)據(jù)的
    發(fā)表于 04-08 10:47 ?17次下載
    <b class='flag-5'>一種</b>基于光滑表示的半<b class='flag-5'>監(jiān)督</b><b class='flag-5'>分類</b><b class='flag-5'>算法</b>

    一種基于DE和ELM的半監(jiān)督分類方法

    演化算法和分析方法的結(jié)合是機器學(xué)習(xí)領(lǐng)域近幾年的個研究熱點。研究如何將差分進化(DE)演化算法與基于超限
    發(fā)表于 04-09 16:16 ?5次下載
    <b class='flag-5'>一種</b>基于DE和ELM的半<b class='flag-5'>監(jiān)督</b><b class='flag-5'>分類</b><b class='flag-5'>方法</b>

    機器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域

    解決數(shù)據(jù)中心、云計算、人工智能和邊緣計算等各個行業(yè)的問題,為人們帶來極大便益。 自監(jiān)督學(xué)習(xí)是什么? 自監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的關(guān)系 自我監(jiān)督
    發(fā)表于 01-20 10:52 ?5559次閱讀
    機器<b class='flag-5'>學(xué)習(xí)</b>中的無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域

    一種基于偽標簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識別算法

    一種基于偽標簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識別算法 來源:《西北工業(yè)大學(xué)學(xué)報》,作者史蘊豪等 摘 要:針對有標簽樣本較少條件下的通信信號調(diào)制識別問題,提出了一種基于偽標簽半
    發(fā)表于 02-10 11:37 ?1431次閱讀

    KNN算法、分類回歸樹、隨機森林的優(yōu)缺點及應(yīng)用實例

    KNN屬于一種監(jiān)督學(xué)習(xí)分類算法,用于訓(xùn)練的數(shù)據(jù)集是完全正確且已分好類的。
    的頭像 發(fā)表于 11-11 10:11 ?7562次閱讀