91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

常見的幾種聚類算法

倩倩 ? 來源:淮安海之聲旗艦店 ? 2020-04-15 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,聚類算法被廣泛應(yīng)用于用戶畫像、廣告推薦、新聞推送和圖像分割等等。聚類算法是機(jī)器學(xué)習(xí)中一種“數(shù)據(jù)探索”的分析方法,它幫助我們?cè)诖罅康臄?shù)據(jù)中探索和發(fā)現(xiàn)數(shù)據(jù)的結(jié)構(gòu)。那么機(jī)器學(xué)習(xí)中的聚類算法有哪幾種呢?下面我將為大家一一介紹常見的幾種聚類算法,分別是高斯聚類模型、基于密度的聚類算法、凝聚層次聚類和均值漂移算法。

1、高斯聚類模型

事實(shí)上,GMM 和 k-means 很像,不過 GMM 是學(xué)習(xí)出一些概率密度函數(shù)來,簡(jiǎn)單地說,k-means 的結(jié)果是每個(gè)數(shù)據(jù)點(diǎn)被 assign 到其中某一個(gè) cluster 了,而 GMM 則給出這些數(shù)據(jù)點(diǎn)被 assign 到每個(gè) cluster 的概率,又稱作 soft assignment 。

2、基于密度的聚類算法

基于密度的聚類算法最大的優(yōu)點(diǎn)在于無需定義類的數(shù)量,其次可以識(shí)別出局外點(diǎn)和噪聲點(diǎn)、并且可以對(duì)任意形狀的數(shù)據(jù)進(jìn)行聚類。DBSCAN同樣是基于密度的聚類算法,但其原理卻與均值漂移大不相同:首先從沒有被遍歷的任一點(diǎn)開始,利用鄰域距離epsilon來獲取周圍點(diǎn);如果鄰域內(nèi)點(diǎn)的數(shù)量滿足閾值則此點(diǎn)成為核心點(diǎn)并以此開始新一類的聚類;其鄰域內(nèi)的所有點(diǎn)也屬于同一類,將所有的鄰域內(nèi)點(diǎn)以epsilon為半徑進(jìn)行步驟二的計(jì)算;重復(fù)步驟二、三直到變量完所有核心點(diǎn)的鄰域點(diǎn);此類聚類完成,同時(shí)又以任意未遍歷點(diǎn)開始步驟一到四直到所有數(shù)據(jù)點(diǎn)都被處理;最終每個(gè)數(shù)據(jù)點(diǎn)都有自己的歸屬類別或者屬于噪聲。

3、K均值聚類

這一最著名的聚類算法主要基于數(shù)據(jù)點(diǎn)之間的均值和與聚類中心的聚類迭代而成。它主要的優(yōu)點(diǎn)是十分的高效,由于只需要計(jì)算數(shù)據(jù)點(diǎn)與劇類中心的距離,其計(jì)算復(fù)雜度只有O(n)。其工作原理主要分為以下四步:首先我們需要預(yù)先給定聚類的數(shù)目同時(shí)隨機(jī)初始化聚類中心。我們可以初略的觀察數(shù)據(jù)并給出較為準(zhǔn)確的聚類數(shù)目;每一個(gè)數(shù)據(jù)點(diǎn)通過計(jì)算與聚類中心的距離了來分類到最鄰近的一類中;根據(jù)分類結(jié)果,利用分類后的數(shù)據(jù)點(diǎn)重新計(jì)算聚類中心;重復(fù)步驟二三直到聚類中心不再變化。

4、凝聚層次聚類

層次聚類法主要有自頂向下和自底向上兩種方式。其中自底向上的方式,最初將每個(gè)點(diǎn)看作是獨(dú)立的類別,隨后通過一步步的凝聚最后形成獨(dú)立的一大類,并包含所有的數(shù)據(jù)點(diǎn)。這會(huì)形成一個(gè)樹形結(jié)構(gòu),并在這一過程中形成聚類。

5、均值漂移算法

這是一種基于滑動(dòng)窗口的均值算法,用于尋找數(shù)據(jù)點(diǎn)中密度最大的區(qū)域。其目標(biāo)是找出每一個(gè)類的中心點(diǎn),并通過計(jì)算滑窗內(nèi)點(diǎn)的均值更新滑窗的中心點(diǎn)。最終消除臨近重復(fù)值的影響并形成中心點(diǎn),找到其對(duì)應(yīng)的類別。其工作原理主要是以下幾點(diǎn):首先以隨機(jī)選取的點(diǎn)為圓心r為半徑做一個(gè)圓形的滑窗。其目標(biāo)是找出數(shù)據(jù)點(diǎn)中密度最高點(diǎn)并作為中心;在每個(gè)迭代后滑動(dòng)窗口的中心將為想著較高密度的方向移動(dòng);連續(xù)移動(dòng),直到任何方向的移動(dòng)都不能增加滑窗中點(diǎn)的數(shù)量,此時(shí)滑窗收斂;將上述步驟在多個(gè)滑窗上進(jìn)行以覆蓋所有的點(diǎn)。當(dāng)過個(gè)滑窗收斂重疊時(shí),其經(jīng)過的點(diǎn)將會(huì)通過其滑窗聚類為一個(gè)類。

以上就是機(jī)器學(xué)習(xí)中常見的五種聚類算法,大家都了解了嗎?如果還想深入學(xué)習(xí)聚類算法的相關(guān)內(nèi)容,比如原理、算法效果的衡量標(biāo)準(zhǔn)以及基于Kmeans算法進(jìn)行改進(jìn)的優(yōu)化方法,可以上博學(xué)谷官網(wǎng)進(jìn)行有關(guān)課程的在線學(xué)習(xí)。希望大家通過課程可以學(xué)會(huì)使用聚類算法進(jìn)行數(shù)據(jù)分析,挖掘商業(yè)價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98064
  • 聚類
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14725
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136954
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    :自動(dòng)化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團(tuán)隊(duì)協(xié)作開發(fā)(如分支管理、代碼合并)。 機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決策樹、SVM等。無監(jiān)督學(xué)習(xí):(K-Means)、降維
    發(fā)表于 02-27 10:53

    C語(yǔ)言增量式PID的通用算法

    式PID算法,可以直接使用,不用更改什么東西,頂多改一下初始化時(shí)候的幾個(gè)參數(shù)限制范圍。 該算法的思想是設(shè)計(jì)一個(gè)PID控制器,使用的時(shí)候直接實(shí)例化一個(gè)PID對(duì)象即可,也可以實(shí)例化多個(gè),每個(gè)都是獨(dú)立
    發(fā)表于 01-14 08:28

    LED顯示屏常見故障分類及處理方法

    常見故障分類LED顯示屏常見故障分為三:LED模組常見故障、室內(nèi)全彩顯示屏故障及戶外全彩顯示屏故障。針對(duì)每一故障,我們將詳細(xì)分析可能的原
    的頭像 發(fā)表于 12-18 15:48 ?1144次閱讀
    LED顯示屏<b class='flag-5'>常見</b>故障分類及處理方法

    看懂C語(yǔ)言程序中的內(nèi)和耦合

    一、原理篇 在軟件工程中,模塊的內(nèi)和耦合是度量模塊化質(zhì)量的標(biāo)準(zhǔn)之一。內(nèi)是指模塊的功能強(qiáng)度的度量,即一個(gè)模塊內(nèi)部各個(gè)元素彼此結(jié)合的緊密程度的度量。若一個(gè)模塊內(nèi)各元素(語(yǔ)名之間、程序段之間)聯(lián)系
    發(fā)表于 12-08 06:37

    用于單片機(jī)幾種C語(yǔ)言算法

    為克服隨機(jī)干擾引起的誤差,硬件上可采用濾波技術(shù),軟件上可采用軟件算法實(shí)現(xiàn)數(shù)字濾波。濾波算法往往是系統(tǒng)測(cè)控算法的一個(gè)重要組成部分,實(shí)時(shí)性很強(qiáng)。 采用數(shù)字濾波算法克服隨機(jī)干擾的誤差具有以下
    發(fā)表于 11-27 06:00

    C語(yǔ)言的常見算法

    # C語(yǔ)言常見算法 C語(yǔ)言中常用的算法可以分為以下幾大類: ## 1. 排序算法 ### 冒泡排序 (Bubble Sort) ```c void bubbleSort(int
    發(fā)表于 11-24 08:29

    國(guó)密系列算法簡(jiǎn)介及SM4算法原理介紹

    算法可用于無線局域網(wǎng)產(chǎn)品;SM7算法可用于身份識(shí)別、票務(wù)、支付與通卡業(yè)務(wù)。ZUC算法可用于移動(dòng)通信網(wǎng)絡(luò)。 密碼雜湊算法:SM3
    發(fā)表于 10-24 08:25

    加密算法的應(yīng)用

    加密算法和非對(duì)稱加密算法。 對(duì)稱加密是一種加密方式,也稱為共享密鑰加密。加密和解密使用同一個(gè)密鑰。這種加密算法的優(yōu)點(diǎn)是加密和解密速度快,適用于數(shù)據(jù)量較大的場(chǎng)景。但是,密鑰的傳輸和管
    發(fā)表于 10-24 08:03

    有哪些常見的AI算法可以用于裝置數(shù)據(jù)的異常檢測(cè)?

    (如邊緣 / 云端)。以下按 算法類型分類 ,詳細(xì)介紹常見 AI 算法的原理、適用場(chǎng)景、優(yōu)缺點(diǎn)及裝置數(shù)據(jù)適配性: 一、無監(jiān)督式異常檢測(cè)算法(主流選擇) 裝置數(shù)據(jù)多為 無標(biāo)注數(shù)據(jù) (僅記
    的頭像 發(fā)表于 09-18 09:27 ?775次閱讀
    有哪些<b class='flag-5'>常見</b>的AI<b class='flag-5'>算法</b>可以用于裝置數(shù)據(jù)的異常檢測(cè)?

    正確的連接電機(jī)傳動(dòng)軸的幾種常見連接方式及其優(yōu)缺點(diǎn)

    在工業(yè)機(jī)械和自動(dòng)化設(shè)備中,電機(jī)與傳動(dòng)軸的連接方式直接影響設(shè)備的運(yùn)行效率、穩(wěn)定性和使用壽命。選擇合適的連接方式需要綜合考慮負(fù)載特性、安裝精度、維護(hù)便利性以及成本等因素。以下是幾種常見的電機(jī)傳動(dòng)軸連接
    的頭像 發(fā)表于 09-10 07:41 ?3236次閱讀

    【HarmonyOS 5】鴻蒙中常見的標(biāo)題欄布局方案

    【HarmonyOS 5】鴻蒙中常見的標(biāo)題欄布局方案 ##鴻蒙開發(fā)能力 ##HarmonyOS SDK應(yīng)用服務(wù)##鴻蒙金融應(yīng)用 (金融理財(cái)# 一、問題背景: 鴻蒙中常見的標(biāo)題欄:矩形區(qū)域,左邊
    的頭像 發(fā)表于 07-11 18:30 ?876次閱讀
    【HarmonyOS 5】鴻蒙中<b class='flag-5'>常見</b>的標(biāo)題欄布局方案

    飛光電總部大廈正式啟用

    飛光電大廈位于平湖金融與現(xiàn)代服務(wù)業(yè)基地核心商圈,占地面積4,186平方米,總建筑面積40,519平方米,樓高99米,是面向未來的企業(yè)總部,集綜合辦公、總部運(yùn)營(yíng)、技術(shù)研發(fā)、商業(yè)配套等功能于一身
    的頭像 發(fā)表于 06-06 15:26 ?1029次閱讀

    STM32的幾種開發(fā)方式,你都知道嗎?(可下載)

    經(jīng)常有人會(huì)問,你們 STM32 編程是用庫(kù)函數(shù) 還是用寄存器的...會(huì)說庫(kù)函數(shù)方便,容 易,都用庫(kù)函數(shù)...等等這樣的問題,今天我們就來 dis 一下這幾種編程方式,STM32 編程 目前常見幾種
    發(fā)表于 04-03 11:24 ?0次下載

    高速比較器的幾種典型應(yīng)用

    高速比較器的幾種典型應(yīng)用
    的頭像 發(fā)表于 03-28 17:40 ?878次閱讀
    高速比較器的<b class='flag-5'>幾種</b>典型應(yīng)用

    幾種常見涌浪保護(hù)元件介紹及其工作原理

    耐受是針對(duì)產(chǎn)品由于瞬間開關(guān)或閃電瞬變引起的過電壓,定義了幾個(gè)不同的測(cè)試級(jí)別以適用于不同環(huán)境。本文將討論幾種能用于抑制涌浪電壓的方式,并比較其保護(hù)效能。
    的頭像 發(fā)表于 03-27 09:41 ?1693次閱讀
    <b class='flag-5'>幾種</b><b class='flag-5'>常見</b>涌浪保護(hù)元件介紹及其工作原理