91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于少數(shù)鏡頭命名實體識別的分解元學習

深度學習自然語言處理 ? 來源:PaperWeekly ? 作者:回亭風 ? 2022-07-05 14:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

論文標題:

Decomposed Meta-Learning for Few-Shot Named Entity Recognition

論文鏈接:

https://arxiv.org/abs/2204.05751

代碼鏈接:

https://github.com/microsoft/vert-papers/tree/master/papers/DecomposedMetaNER

Abstract

少樣本 NER 的系統(tǒng)目的在于通過很少的標注樣本來識別新的命名實體類。本文提出了一個分解的元學習方法來解決小樣本 NER,通過將原問題分解為小樣本跨度預測和小樣本實體分類兩個過程。具體來說,我們將跨度預測當作序列標注問題并且使用 MAML 算法訓練跨度預測器來找到更好的模型初始化參數(shù)并且使模型能夠快速適配新實體。對于實體分類,我們提出 MAML-ProtoNet,一個 MAML 增強的原型網(wǎng)絡,能夠找到好的嵌入空間來更好的分辨不同實體類的跨度。在多個 benchmark 上的實驗表明,我們的方法取得了比之前的方法更好的效果。

Intro

NER 目的在于定位和識別文本跨度中的預定義實體類諸如 location、organization。在標準的監(jiān)督學習 NER 中深度學習的架構取得了很大的成功。然而,在實際應用中,NER 的模型通常需要迅速適配一些新的未見過的實體類,且通常標注大量的新樣本開銷很大。因此,小樣本 NER 近年來得到了廣泛的研究。 之前關于小樣本 NER 的研究都是基于 token 級的度量學習,將每個查詢 token 和原型進行度量上的比較,然后為每個 token 分配標簽。最近的很多研究都轉為跨度級的度量學習,能夠繞過 token 對標簽的以來并且明確利用短語的表征。 然而這些方法在遇到較大領域偏差時可能沒那么有效,因為他們直接使用學習的度量而沒有對目標域進行適配。換句話說,這些方法沒有完全挖掘支持集數(shù)據(jù)的信息。現(xiàn)在的方法還存在以下限制: 1. 解碼過程需要對重疊的跨度仔細處理; 2. 非實體類型“O”通常時噪聲,因為這些詞之間幾乎沒有共同點。 此外,當針對一個不同的領域時,唯一可用的信息僅僅是很少的支持樣本,不幸的是,這些樣本在之前的方法中僅僅被應用在推理階段計算相似度的過程中。 為了解決這些局限性,本文提出了一種分解的元學習方法,將原問題分解為跨度預測和實體分類兩個過程。具體來講: 1. 對于小樣本跨度預測來說,我們將其看作序列標注問題來解決重疊跨度的問題。這個過程目的在于定位命名實體并且是與類別無關的。然后我們僅僅對被標注出的跨度進行實體分類,這樣也可以消除“O”類噪聲的影響。當訓練跨度檢測模塊時,我們采用的 MAML 算法來找到好的模型初始化參數(shù),在使用少量目標域支持集樣本更新后,能夠快速適配新實體類。在模型更新時,特定領域的跨度邊界信息能夠被模型有效的利用,使模型能夠更好的遷移到目標領域; 2. 對于實體分類,采用了 MAML-ProtoNet 來縮小源域和目標域的差距。 我們在一些 benchmark 上進行了實驗,實驗表明我們提出的框架比之前的 SOTA 模型表現(xiàn)更好,我們還進行了定性和定量的分析,不同的元學習策略對于模型表現(xiàn)的影響。

Method

本文遵循傳統(tǒng)的 N-way-K-shot 的小樣本設置,示例如下表(2-way-1-shot):

e74d80fa-fc23-11ec-ba43-dac502259ad0.png

下圖為模型的總體結構:

e7728026-fc23-11ec-ba43-dac502259ad0.png

2.1 Entity Span Detection

跨度檢測階段不需要分類具體的實體類,因此模型的參數(shù)可以在不同的領域之間共享?;诖耍覀儾捎?MAML 來促進領域不變的內部表征學習而不是針對特定領域特征的學習。這種方式訓練的元學習模型對于目標域的樣本更加敏感,因此只需要少量樣本進行微調就能取得很好的效果而不會過擬合。 2.1.1 Basic Detector 基檢測器是一個標準的序列標注任務,采用 BIOES 的標注策略,對于一個句子序列 {xi},使用一個編碼器得到其上下文表征 h,然后通過 softmax 生成概率分布。

e7a4b1b8-fc23-11ec-ba43-dac502259ad0.png

▲ fθ:編碼器

e7b0ed20-fc23-11ec-ba43-dac502259ad0.png

▲概率分布 模型的訓練誤差在交叉熵損失基礎上添加了最大值項來緩解對于損失較高的 token 學習不足的問題:

e7cdece0-fc23-11ec-ba43-dac502259ad0.png

▲交叉熵損失 推理階段采用了維特比解碼,這里我們沒有訓練轉移矩陣,簡單的添加了一些限制保證預測的標簽不違反 BIOES 的標注規(guī)則。 2.1.2 Meta-Learning Procedure 元訓練過程具體來說,首先隨機采樣一組訓練 episode:

e7f7b96c-fc23-11ec-ba43-dac502259ad0.png

使用支持集進行 inner-update 過程:

e81b8cac-fc23-11ec-ba43-dac502259ad0.png

其中 Un 代表 n 步梯度更新,損失采用上文所述的損失函數(shù)。然后使用更新后的參數(shù) Θ' 在查詢集上進行評估,將一個 batch 內的所有 episode 的損失求和,訓練目標是最小化該損失:

e835bca8-fc23-11ec-ba43-dac502259ad0.png

用上述損失來更新模型的原參數(shù) Θ,這里使用一階導數(shù)來近似計算:

e8430d90-fc23-11ec-ba43-dac502259ad0.png

MAML 數(shù)學推導參考:MAML

https://zhuanlan.zhihu.com/p/181709693

在推理階段先使用基模型中提到的交叉熵損失在支持集上微調,然后在查詢集上使用微調后的模型進行測試。

2.2 Entity Typing

實體分類模塊采用原型網(wǎng)絡作為基礎模型,使用 MAML 算法對模型進行增強,使模型得到一個更具代表性的嵌入空間來更好的區(qū)分不同的實體類。 2.2.1 Basic Model 這里使用了另一個編碼器來對輸入 token 進行編碼,然后使用跨度檢測模塊輸出的跨度 x[i,j],將跨度中所有的 token 表征取平均來代表此跨度的表征:

e862bbd6-fc23-11ec-ba43-dac502259ad0.png

e87639f4-fc23-11ec-ba43-dac502259ad0.png

遵循原型網(wǎng)絡的設置,使用支持集中屬于同一實體類的跨度的求和平均作為類原型的表示:

e88f60be-fc23-11ec-ba43-dac502259ad0.png

模型的訓練過程先采用支持集計算每個類原型的表示,然后對于查詢集中的每個跨度,通過計算其到某一類原型的距離來計算其屬于該類的概率:

e8bd2454-fc23-11ec-ba43-dac502259ad0.png

模型的訓練目標是一個交叉熵損失:

e8d8e84c-fc23-11ec-ba43-dac502259ad0.png

推理階段就是簡單的計算與哪一類原型距離最近即可:

e8f043f2-fc23-11ec-ba43-dac502259ad0.png

2.2.2 MAML Enhanced ProtoNet 這一過程的設置與跨度檢測中應用的 MAML 一致,同樣是使用 MAML 算法來找到一個更好的初始化參數(shù),詳細過程參考上文:

e8fcffca-fc23-11ec-ba43-dac502259ad0.png

e91e00bc-fc23-11ec-ba43-dac502259ad0.png

推理階段也與上文一致,這里不詳細說明了。

實驗

3.1 數(shù)據(jù)集和設置

本文采用 Few-NERD,一個專門為 few-shot NER 推出的數(shù)據(jù)集以及 cross-dataset,四種不同領域的數(shù)據(jù)集的整合。對于 Few-NERD 使用 P、R、micro-F1 作為評價指標,cross-dataset 采用 P、R、F1 作為評價指標。文中兩個編碼器采用兩個獨立的 BERT,優(yōu)化器使用 AdamW。

3.2 主實驗

e93e4f0c-fc23-11ec-ba43-dac502259ad0.png

▲ Few-NERD

e9657b2c-fc23-11ec-ba43-dac502259ad0.png

▲Cross-Dataset

3.3 消融實驗

e97dc34e-fc23-11ec-ba43-dac502259ad0.png

3.4 分析

對于跨度檢測,作者用一個全監(jiān)督的跨度檢測器進行實驗:

e99005d6-fc23-11ec-ba43-dac502259ad0.png

作者分析,未精調的模型預測的 Broadway 對于新實體類來說是一個錯誤的預測(Broadway 出現(xiàn)在了訓練數(shù)據(jù)中),然后通過對該模型采用新實體類樣本進行精調,可以看出模型能夠預測出正確的跨度,但是 Broadway 這一跨度仍然被預測了。這表明傳統(tǒng)的精調雖然可以使模型獲取一定的新類信息,但是其還是存在很大偏差。 然后作者對比了 MAML 增強的模型和未使用 MAML 模型的 F1 指標:

e99f2ae8-fc23-11ec-ba43-dac502259ad0.png

MAML 算法可以更好的利用支持集的數(shù)據(jù),找到一個更好的初始化參數(shù),使模型能夠快速適配到新域中。 然后作者分析了 MAML 如何提升原型網(wǎng)絡,首先是指標上 MAML 增強的原型網(wǎng)絡會有一定的提升:

e9c0b488-fc23-11ec-ba43-dac502259ad0.png

接著作者進行了可視化分析:

e9e0a00e-fc23-11ec-ba43-dac502259ad0.png

從上圖可以看出,MAML 增強的原型網(wǎng)絡能夠更好的區(qū)分各個類原型。

Conclusion

本文提出了一個兩階段的模型,跨度檢測和實體分類來進行小樣本 NER 任務,兩個階段的模型均使用元學習 MAML 的方法來進行增強,獲取了更好的初始化參數(shù),能夠使模型通過少量樣本快速適配到新域中。本文也算是一篇啟發(fā)性的文章,在指標上可以看出,元學習的方法對小樣本 NER 任務有著巨大的提升。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3775

    瀏覽量

    52178
  • 深度學習
    +關注

    關注

    73

    文章

    5600

    瀏覽量

    124492

原文標題:ACL2022 | 分解的元學習小樣本命名實體識別

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是變倍鏡頭

    變倍鏡頭是一種專門為精密檢測設計的工業(yè)光學元件,一般應用于機器視覺與工業(yè)自動化領域。它可以在工作距離不變的情況下,通過調節(jié)內部的光學組件來改變光學放大倍率,從而實現(xiàn)不同倍率的切換,而不用更換鏡頭
    的頭像 發(fā)表于 03-14 17:35 ?89次閱讀
    什么是變倍<b class='flag-5'>鏡頭</b>?

    影響工業(yè)鏡頭視場角的因素

    影響工業(yè)鏡頭視場角的因素工業(yè)鏡頭廣泛應用于機器視覺、監(jiān)控系統(tǒng)和精密檢測領域,其視場角(FieldofView,FOV)定義了鏡頭在固定位置下所能覆蓋的場景范圍。這一參數(shù)通常以角度或線性
    的頭像 發(fā)表于 12-17 16:55 ?1067次閱讀
    影響工業(yè)<b class='flag-5'>鏡頭</b>視場角的因素

    華秋輸出的GERBER別的軟件無法正確識別

    ,卡住了。 這個是華秋識別的,可以看到是正確的。 下面是AD,KICAD、工廠錫膏機識別的,都一樣的,統(tǒng)一少了太多東東。
    發(fā)表于 12-17 10:46

    線掃鏡頭的選型指南

    線掃鏡頭(LineScanLens)是一種專為線掃描相機設計的光學組件,主要應用于工業(yè)自動化檢測、印刷質量控制、紡織品檢驗以及醫(yī)療影像等領域。此類鏡頭通過捕捉連續(xù)移動物體的線性圖像,實現(xiàn)高精度
    的頭像 發(fā)表于 12-11 17:50 ?987次閱讀
    線掃<b class='flag-5'>鏡頭</b>的選型指南

    遠心鏡頭核心技術解析與應用

    遠心鏡頭(TelecentricLens)是一種專為精密光學成像設計的鏡頭系統(tǒng),其核心在于消除傳統(tǒng)鏡頭中常見的透視失真和放大倍率變化問題。該技術廣泛應用于工業(yè)檢測、計量測量和機器視覺等
    的頭像 發(fā)表于 12-08 17:25 ?729次閱讀
    遠心<b class='flag-5'>鏡頭</b>核心技術解析與應用

    雷科電力-REKE2180帶電電纜識別

    雷科電力-REKE2180帶電電纜識別儀,又名電纜識別儀、多功能電纜識別儀、智能電纜識別儀,是為電力電纜工程師和電纜工解決電纜識別的技術問題
    的頭像 發(fā)表于 12-04 17:28 ?1439次閱讀
    雷科電力-REKE2180帶電電纜<b class='flag-5'>識別</b>儀

    基于AIK-RA8D1的人臉識別的應用演示

    與Aizip人臉識別技術結合,實現(xiàn)高效且低功耗的人臉識別應用。人臉識別的優(yōu)勢傳統(tǒng)的密碼驗證方式存在很多缺點。首先,密碼容易泄露或被共享,可能導致未
    的頭像 發(fā)表于 12-02 14:29 ?5551次閱讀
    基于AIK-RA8D1的人臉<b class='flag-5'>識別的</b>應用演示

    電壓放大器在全導波場圖像目標識別的損傷檢測實驗的應用

    圖像目標識別的智能損傷檢測方法,通過結合超聲導波檢測技術與深度學習算法,系統(tǒng)探究了損傷引起的波場畸變特性及其識別機制。 測試設備:掃描激光多普勒測振儀、函數(shù)發(fā)生器、功率放大器ATA-2021H、壓電換能器、反光膜、計算機數(shù)據(jù)處理
    的頭像 發(fā)表于 12-02 11:37 ?323次閱讀
    電壓放大器在全導波場圖像目標<b class='flag-5'>識別的</b>損傷檢測實驗的應用

    什么是變倍鏡頭

    什么是變倍鏡頭變倍鏡頭是一種可以連續(xù)調節(jié)放大倍率或視場范圍的光學鏡頭。它通過內部光學組的相對移動,實現(xiàn)倍率/焦距的連續(xù)變化,而且需要保證在變倍過程中成像仍然清晰、畸變小。特點:適合需要多倍率觀察
    的頭像 發(fā)表于 12-01 15:31 ?653次閱讀
    什么是變倍<b class='flag-5'>鏡頭</b>

    電能質量在線監(jiān)測裝置是如何實現(xiàn)對電壓中斷事件的識別的?

    30137-2013/IEC 61000-4-30 標準的中斷事件。具體實現(xiàn)流程可拆解為以下 6 個關鍵步驟,每個環(huán)節(jié)都有明確的技術邏輯和參數(shù)要求: 一、前置基礎:明確識別的 “國標門檻”(統(tǒng)一判定標準) 裝置首先內置電壓中斷的國標定義作為識別基準,避免因判定規(guī)則模糊導
    的頭像 發(fā)表于 11-27 16:32 ?1194次閱讀
    電能質量在線監(jiān)測裝置是如何實現(xiàn)對電壓中斷事件的<b class='flag-5'>識別的</b>?

    Windows下解決OpenOCD找不到設備及串口無法識別的方法

    hbird_driver.exe驅動程序 - 連接開發(fā)板,打開設備管理器,為另一個未識別的端口手動安裝FT2232串口驅動 - 重連開發(fā)板,程序可以正常燒寫調試,串口也可以正常建立連接 詳細圖文流程
    發(fā)表于 10-20 11:25

    基于LockAI視覺識別模塊:C++人臉識別

    是實現(xiàn)人臉識別的常用方法: 深度學習方法:現(xiàn)代的人臉識別系統(tǒng)大多采用深度學習方法,并結合大規(guī)模人臉數(shù)據(jù)庫和高性能計算資源,實現(xiàn)了非常高的識別
    發(fā)表于 07-01 12:01

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    1.1 手寫數(shù)字識別簡介 手寫數(shù)字識別是一種利用計算機視覺和機器學習技術自動識別手寫數(shù)字的過程。它通過圖像預處理、特征提取和模型訓練來實現(xiàn)高效準確的數(shù)字
    發(fā)表于 06-30 16:45

    Arm產品命名體系的演變

    繼 Arm 首席執(zhí)行官 Rene Haas 宣布 Arm 推出新的產品命名體系后,本文將為你詳解新的計算平臺名稱,以及新命名體系內的新 IP 名稱標識。
    的頭像 發(fā)表于 06-19 10:38 ?1020次閱讀
    Arm產品<b class='flag-5'>命名</b>體系的演變

    順絡貼片電容規(guī)格都是怎么命名

    順絡貼片電容的規(guī)格命名通常包含一系列字符,這些字符用于標識電容的關鍵規(guī)格和屬性。雖然不同制造商的命名規(guī)則可能有所不同,但一般來說,順絡貼片電容的命名規(guī)則可能包含以下參數(shù): 1、尺寸:這
    的頭像 發(fā)表于 04-29 15:31 ?1139次閱讀
    順絡貼片電容規(guī)格都是怎么<b class='flag-5'>命名</b>的