91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

半監(jiān)督學習最基礎的3個概念

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

今天給大家介紹半監(jiān)督學習中的3個最基礎的概念:一致性正則化,熵最小化和偽標簽,并介紹了兩個經(jīng)典的半監(jiān)督學習方法。

沒看一的點這里哈:半監(jiān)督學習入門基礎(一)

半監(jiān)督學習 (SSL) 是一種非常有趣的方法,用來解決機器學習中缺少標簽數(shù)據(jù)的問題。SSL利用未標記的數(shù)據(jù)和標記的數(shù)據(jù)集來學習任務。SSL的目標是得到比單獨使用標記數(shù)據(jù)訓練的監(jiān)督學習模型更好的結果。這是關于半監(jiān)督學習的系列文章的第2部分,詳細介紹了一些基本的SSL技術。

一致性正則化,熵最小化,偽標簽

SSL的流行方法是在訓練期間往典型的監(jiān)督學習中添加一個新的損失項。通常使用三個概念來實現(xiàn)半監(jiān)督學習,即一致性正則化、熵最小化和偽標簽。在進一步討論之前,讓我們先理解這些概念。

一致性正則化強制數(shù)據(jù)點的實際擾動不應顯著改變預測器的輸出。簡單地說,模型應該為輸入及其實際擾動變量給出一致的輸出。我們?nèi)祟悓τ谛〉母蓴_是相當魯棒的。例如,給圖像添加小的噪聲(例如改變一些像素值)對我們來說是察覺不到的。機器學習模型也應該對這種擾動具有魯棒性。這通常通過最小化對原始輸入的預測與對該輸入的擾動版本的預測之間的差異來實現(xiàn)。

模型對輸入x及其擾動x^的一致性度量

d(.,.) 可以是均方誤差或KL散度或任何其他距離度量。

一致性正則化是利用未標記數(shù)據(jù)找到數(shù)據(jù)集所在的平滑流形的一種方法。這種方法的例子包括π模型、Temporal Ensembling,Mean Teacher,Virtual Adversarial Training等。

熵最小化鼓勵對未標記數(shù)據(jù)進行更有信心的預測,即預測應該具有低熵,而與ground truth無關(因為ground truth對于未標記數(shù)據(jù)是未知的)。讓我們從數(shù)學上理解下這個。

熵的計算

這里,K是類別的數(shù)量,是模型對x預測是否屬于類別k的置信度。

此外,輸入示例中所有類的置信度之和應該為1。這意味著,當某個類的預測值接近1,而其他所有類的預測值接近0時,熵將最小化。因此,這個目標鼓勵模型給出高可信度的預測。

理想情況下,熵的最小化將阻止決策邊界通過附近的數(shù)據(jù)點,否則它將被迫產(chǎn)生一個低可信的預測。請參閱下圖以更好地理解此概念。

由不同的半監(jiān)督學習方法生成的決策邊界

偽標簽是實現(xiàn)半監(jiān)督學習最簡單的方法。一個模型一開始在有標記的數(shù)據(jù)集上進行訓練,然后用來對沒有標記的數(shù)據(jù)進行預測。它從未標記的數(shù)據(jù)集中選擇那些具有高置信度(高于預定義的閾值)的樣本,并將其預測視為偽標簽。然后將這個偽標簽數(shù)據(jù)集添加到標記數(shù)據(jù)集,然后在擴展的標記數(shù)據(jù)集上再次訓練模型。這些步驟可以執(zhí)行多次。這和自訓練很相關。

在現(xiàn)實中視覺和語言上擾動的例子

視覺:

翻轉,旋轉,裁剪,鏡像等是圖像常用的擾動。

語言

反向翻譯是語言中最常見的擾動方式。在這里,輸入被翻譯成不同的語言,然后再翻譯成相同的語言。這樣就獲得了具有相同語義屬性的新輸入。

NLP中的反向翻譯

半監(jiān)督學習方法

π model:

這里的目標是一致性正則化。

π模型鼓勵模型對兩個相同的輸入(即同一個輸入的兩個擾動變量)輸出之間的一致性。

π模型有幾個缺點,首先,訓練計算量大,因為每個epoch中單個輸入需要送到網(wǎng)絡中兩次。第二,訓練目標zi?是有噪聲的。

Temporal Ensembling:

這個方法的目標也是一致性正則化,但是實現(xiàn)方法有點不一樣。

眾所周知,與單一模型相比,模型集成通常能提供更好的預測。通過在訓練期間使用單個模型在不同訓練時期的輸出來形成集成預測,這一思想得到了擴展。

簡單來說,不是比較模型的相同輸入的兩個擾動的預測(如π模型),模型的預測與之前的epoch中模型對該輸入的預測的加權平均進行比較。

這種方法克服了π模型的兩個缺點。它在每個epoch中,單個輸入只進入一次,而且訓練目標zi? 的噪聲更小,因為會進行滑動平均。

這種方法的缺點是需要存儲數(shù)據(jù)集中所有的zi? 。

英文原文:https://medium.com/analytics-vidhya/a-primer-on-semi-supervised-learning-part-2-803f45edac2

責任編輯:xj

原文標題:半監(jiān)督學習入門基礎(二):最基礎的3個概念

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SSL
    SSL
    +關注

    關注

    0

    文章

    132

    瀏覽量

    26747
  • 半監(jiān)督

    關注

    0

    文章

    5

    瀏覽量

    6456
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136919
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124387

原文標題:半監(jiān)督學習入門基礎(二):最基礎的3個概念

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    :自動化任務(如數(shù)據(jù)預處理、模型訓練調度)。Git版本控制:團隊協(xié)作開發(fā)(如分支管理、代碼合并)。 機器學習監(jiān)督學習:線性回歸、邏輯回歸、決策樹、SVM等。無監(jiān)督學習:聚類(K-Means)、降維
    發(fā)表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監(jiān)督學習不同,監(jiān)督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環(huán)境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發(fā)表于 01-31 09:34 ?636次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    自動駕駛中常提的模仿學習是什么?

    當談及自動駕駛模型學習時,經(jīng)常會提到模仿學習概念。所謂模仿學習,就是模型先看別人怎么做,然后學著去做。自動駕駛中的模仿學習,就是把人類司機
    的頭像 發(fā)表于 01-16 16:41 ?1986次閱讀

    請問-88dBm的接收靈敏度是什么概念?

    -88dBm的接收靈敏度是什么概念?我看官方的CW32R030介紹說其靈敏度達到-88dBm,是說明其接收的靈敏度非常好嗎?
    發(fā)表于 01-16 07:14

    InGaP HBT 瓦高 IP3 放大器 HMC455LP3/455LP3E 深度解析

    InGaP HBT 瓦高 IP3 放大器 HMC455LP3/455LP3E 深度解析 在當今的無線通信領域,對于高性能放大器的需求與日俱增。特別是在多載波系統(tǒng)、GSM、GPRS、E
    的頭像 發(fā)表于 01-04 09:45 ?650次閱讀

    分享一嵌入式開發(fā)學習路線

    拓展期(3-4月) 學習嵌入式操作系統(tǒng)(RTOS)和物聯(lián)網(wǎng)通信技術,能開發(fā)“多任務、聯(lián)網(wǎng)”的復雜項目,理解企業(yè)級嵌入式開發(fā)的“架構思維”。這一階段的學習需要一定的自律和毅力,但與學
    發(fā)表于 12-04 11:01

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    趨勢: 無監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(無監(jiān)督缺陷檢測篇)提供無需標注即可
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    趨勢: 無監(jiān)督學習普及 當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列(無監(jiān)督缺陷檢測篇)提供無需標注即可
    發(fā)表于 12-03 13:50

    自動駕駛中常提的“強化學習”是啥?

    下,就是一智能體在環(huán)境里行動,它能觀察到環(huán)境的一些信息,并做出一動作,然后環(huán)境會給出一反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監(jiān)督學習不同,強化
    的頭像 發(fā)表于 10-23 09:00 ?658次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是<b class='flag-5'>個</b>啥?

    學習物聯(lián)網(wǎng)怎么入門?

    隨著物聯(lián)網(wǎng)技術的不斷發(fā)展,越來越多的人開始關注學習這一領域。但是對于初學者來說,物聯(lián)網(wǎng)似乎是一龐雜的概念學習起來很困難。因此,從哪里開始學習
    發(fā)表于 10-14 10:34

    XM3橋電源模塊系列CREE

    XM3橋電源模塊系列是 Wolfspeed(原CREE)推出的高功率碳化硅(SiC)電源模塊平臺,專為電動汽車、工業(yè)電源和牽引驅動等高要求應用設計。XM3橋電源模塊系列采用第三代
    發(fā)表于 09-11 09:48

    【「Yocto項目實戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗】+基礎概念學習理解

    是 Yocto 項目的核心部分之一,書中對元數(shù)據(jù)的概念、文件、語法以及菜譜和層的相關內(nèi)容進行了詳細闡述。通過學習這部分內(nèi)容,我了解到元數(shù)據(jù)在 Yocto 項目中的重要性,它定義了構建系統(tǒng)的各個方面,包括
    發(fā)表于 08-04 22:29

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    的基本理論。了解監(jiān)督學習、無監(jiān)督學習和強化學習的基本原理。例如,在監(jiān)督學習中,理解如何通過標注數(shù)據(jù)來訓練模型進行分類或回歸任務,像通過大量的貓和狗的圖片標注數(shù)據(jù)來訓練一
    發(fā)表于 07-08 17:44

    使用MATLAB進行無監(jiān)督學習

    監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。無監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關系,無需任何監(jiān)督或關于結果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1433次閱讀
    使用MATLAB進行無<b class='flag-5'>監(jiān)督學習</b>

    新品 | 橋1200V CoolSiC? MOSFET EconoDUAL? 3模塊

    新品橋1200VCoolSiCMOSFETEconoDUAL3模塊采用EconoDUAL3封裝的1200V/1.4mΩ橋模塊。芯片為SiCMOSFETM1H增強型1代、集成NTC溫
    的頭像 發(fā)表于 04-17 17:05 ?947次閱讀
    新品 | <b class='flag-5'>半</b>橋1200V CoolSiC? MOSFET EconoDUAL? <b class='flag-5'>3</b>模塊