91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣去增強(qiáng)PLM對于實(shí)體和實(shí)體間關(guān)系的理解?

深度學(xué)習(xí)自然語言處理 ? 來源:TsinghuaNLP ? 作者:秦禹嘉 ? 2021-06-23 15:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來,預(yù)訓(xùn)練語言模型(PLM)在各種下游自然語言處理任務(wù)中表現(xiàn)出卓越的性能,受益于預(yù)訓(xùn)練階段的自監(jiān)督學(xué)習(xí)目標(biāo),PLM 可以有效地捕獲文本中的語法和語義,并為下游 NLP 任務(wù)提供蘊(yùn)含豐富信息的語言表示。然而,傳統(tǒng)的預(yù)訓(xùn)練目標(biāo)并沒有對文本中的關(guān)系事實(shí)進(jìn)行建模,而這些關(guān)系事實(shí)對于文本理解至關(guān)重要。

在這篇被ACL 2021主會錄用的文章中,清華大學(xué)聯(lián)合騰訊微信模式識別中心與伊利諾伊大學(xué)厄巴納香檳分校(UIUC),提出了一種新穎的對比學(xué)習(xí)框架ERICA,幫助PLM深入了解文本中的實(shí)體及實(shí)體間關(guān)系。具體來說,作者提出了兩個輔助性預(yù)訓(xùn)練任務(wù)來幫助PLM更好地理解實(shí)體和實(shí)體間關(guān)系:(1)實(shí)體區(qū)分任務(wù),給定頭實(shí)體和關(guān)系,推斷出文本中正確的尾實(shí)體;(2)關(guān)系判別任務(wù),區(qū)分兩個關(guān)系在語義上是否接近,這在長文本情景下涉及復(fù)雜的關(guān)系推理。實(shí)驗結(jié)果表明,ERICA在不引入額外神經(jīng)網(wǎng)絡(luò)參數(shù)的前提下,僅僅對PLM進(jìn)行少量的額外訓(xùn)練,就可以提升典型PLM(例如BERT 和 RoBERTa)在多種自然語言理解任務(wù)上(包括關(guān)系抽取、實(shí)體類別區(qū)分、問題回答等)的性能。尤其是在低資源(low-resource)的設(shè)定下,性能的提升更加明顯。

一、問題背景

傳統(tǒng)的預(yù)訓(xùn)練目標(biāo)沒有對文本中的關(guān)系事實(shí)進(jìn)行顯式建模,而這些關(guān)系事實(shí)對于理解文本至關(guān)重要。為了解決這個問題,一些研究人員試圖改進(jìn) PLM 的架構(gòu)、預(yù)訓(xùn)練任務(wù)等,以更好地理解實(shí)體之間的關(guān)系。但是它們通常只對文本中的句子級別的單個關(guān)系進(jìn)行建模,不僅忽略了長文本場景下多個實(shí)體之間的復(fù)雜關(guān)系,也忽略了對實(shí)體本身的理解,例如圖1中所展現(xiàn)的,對于長文本來說,為了讓PLM更加充分理解地單個實(shí)體,我們需要考慮該實(shí)體和其他實(shí)體之間的復(fù)雜關(guān)系;而這些復(fù)雜的關(guān)系的理解通常涉及復(fù)雜的推理鏈,往往需要綜合多個句子的信息得出結(jié)論。針對這兩個痛點(diǎn),本文提出了實(shí)體區(qū)分任務(wù)和關(guān)系區(qū)分任務(wù)來增強(qiáng)PLM對于實(shí)體和實(shí)體間關(guān)系的理解。

二 、文檔級預(yù)訓(xùn)練數(shù)據(jù)收集

ERICA的訓(xùn)練依賴于大規(guī)模文檔級遠(yuǎn)程監(jiān)督數(shù)據(jù),該數(shù)據(jù)的構(gòu)造有三個階段:首先從wikipedia中爬取文本段落,然后用命名實(shí)體識別工具(例如spacy)進(jìn)行實(shí)體標(biāo)注,將所有獲得的實(shí)體和wikidata中標(biāo)注的實(shí)體對應(yīng)上,并利用遠(yuǎn)程監(jiān)督(distant supervision)信號獲得實(shí)體之間可能存在的關(guān)系,最終保留長度在128到512之間,含有多于4個實(shí)體,實(shí)體間多于4個遠(yuǎn)程監(jiān)督關(guān)系的段落。注意這些遠(yuǎn)程監(jiān)督的關(guān)系中存在大量的噪聲,而大規(guī)模的預(yù)訓(xùn)練可以一定程度上實(shí)現(xiàn)降噪。作者也開源了由100萬個文檔組成的大規(guī)模遠(yuǎn)程監(jiān)督預(yù)訓(xùn)練數(shù)據(jù)。

三 、實(shí)體與實(shí)體間關(guān)系的表示

鑒于每個實(shí)體可能在段落中出現(xiàn)多次,并且每次出現(xiàn)時對應(yīng)的描述(mention)可能也不一樣,作者在使用PLM對tokenize后的段落進(jìn)行編碼后,取每個描述的所有token均勻池化后的結(jié)果作為該描述的表示,接著對于全文中該實(shí)體所有的描述進(jìn)行第二次均勻池化,得到該實(shí)體在該文檔中的表示;對于兩個實(shí)體,它們之間的關(guān)系表示為兩個實(shí)體表示的簡單拼接。以上是最簡單的實(shí)體/實(shí)體間關(guān)系的表示方法,不需要引入額外的神經(jīng)網(wǎng)絡(luò)參數(shù)。作者在文中還探索了其它的表示方法,并驗證了所有方法相比baseline都有一致的提升。

四 、實(shí)體區(qū)分任務(wù)

實(shí)體區(qū)分任務(wù)旨在給定頭實(shí)體和關(guān)系,從當(dāng)前文檔中尋找正確的尾實(shí)體。例如在上圖中,Sinaloa和Mexico具有country的遠(yuǎn)程關(guān)系,于是作者將關(guān)系country和頭實(shí)體Sinaloa拼接在原文檔的前面作為提示(prompt),在此條件下區(qū)分正確的尾實(shí)體的任務(wù)可以在對比學(xué)習(xí)的框架下轉(zhuǎn)換成拉近頭實(shí)體和正確尾實(shí)體的實(shí)體表示的距離,推遠(yuǎn)頭實(shí)體和文檔中其它實(shí)體(負(fù)樣本)的實(shí)體表示的距離,具體的公式如下所示:

aa6771d0-d061-11eb-9e57-12bb97331649.png

五、關(guān)系區(qū)分任務(wù)

關(guān)系區(qū)分任務(wù)旨在區(qū)分兩個關(guān)系的表示在語義空間上的相近程度。由于作者采用文檔級而非句子級的遠(yuǎn)程監(jiān)督,文檔中的關(guān)系區(qū)分涉及復(fù)雜的推理鏈。具體而言,作者隨機(jī)采樣多個文檔,并從每個文檔中得到多個關(guān)系表示,這些關(guān)系可能只涉及句子級別的推理,也可能涉及跨句子的復(fù)雜推理。之后基于對比學(xué)習(xí)框架,根據(jù)遠(yuǎn)程監(jiān)督的標(biāo)簽在關(guān)系空間中對不同的關(guān)系表示進(jìn)行訓(xùn)練,如前文所述,每個關(guān)系表示均由文檔中的兩個實(shí)體表示構(gòu)成。正樣本即具有相同遠(yuǎn)程監(jiān)督標(biāo)簽的關(guān)系表示,負(fù)樣本與此相反。作者在實(shí)驗中還發(fā)現(xiàn)進(jìn)一步引入不具有遠(yuǎn)程監(jiān)督關(guān)系的實(shí)體對作為負(fù)樣本可以進(jìn)一步提升模型效果。由于進(jìn)行對比訓(xùn)練的兩個關(guān)系表示可能來自于多個文檔,也可能來自于單個文檔,因此文檔間/跨文檔的關(guān)系表示交互都得到了實(shí)現(xiàn)。巧妙的是,對于涉及復(fù)雜推理的關(guān)系,該方法不需要顯示地構(gòu)建推理鏈,而是“強(qiáng)迫”模型理解這些關(guān)系并在頂層的關(guān)系語義空間中區(qū)分這些關(guān)系。具體的公式如下所示:

aaa2d9dc-d061-11eb-9e57-12bb97331649.png

為了避免災(zāi)難性遺忘,作者將上述兩個任務(wù)同masked language modeling (MLM)任務(wù)一起訓(xùn)練,總的訓(xùn)練目標(biāo)如下所示:

aaaeafe6-d061-11eb-9e57-12bb97331649.png

六、實(shí)驗結(jié)果

ERICA的訓(xùn)練不需要引入除了PLM之外的任何參數(shù),并且對于任意模型均能夠適配,具體的,作者采用了兩個經(jīng)典的PLM:BERT和RoBERTa,并對其進(jìn)行一定時間的post-training,最后在文檔級關(guān)系抽取、實(shí)體類別區(qū)分、問題回答等任務(wù)上進(jìn)行了測試,并對比了例如CorefBERT, SpanBERT, ERNIE, MTB,CP等基線模型,驗證了ERICA框架的有效性。具體結(jié)果如下:

a) 文檔級關(guān)系抽取,模型需要區(qū)分文檔中的多個實(shí)體之間的關(guān)系,這需要PLM對實(shí)體間關(guān)系有較好的理解。

b) 實(shí)體類別區(qū)分,模型需要區(qū)分文本中的實(shí)體的具體類別,這需要PLM對實(shí)體本身有較好的理解。

c) 問題回答,作者測試了兩種常見的問題回答任務(wù):多選問答(multi-choice QA)和抽取式問答(extractive QA)。這需要PLM對實(shí)體和實(shí)體間關(guān)系有較好的理解。

七、分析

a) 消融分析(ablation study)。作者對ERICA框架中的所有組成成分進(jìn)行了細(xì)致的分析,并證明了這些組成成分對于模型整體效果的提升是缺一不可的。

b) 可視化分析。作者對經(jīng)過ERICA訓(xùn)練前后的PLM對實(shí)體和實(shí)體間關(guān)系的表示進(jìn)行了可視化,結(jié)果如下圖所示。通過ERICA的對比學(xué)習(xí)訓(xùn)練,PLM對于同類別的實(shí)體/實(shí)體關(guān)系的表示有明顯的聚類現(xiàn)象,這充分驗證了ERICA能夠顯著增強(qiáng)PLM對實(shí)體和實(shí)體間關(guān)系的理解。

c) 此外,作者分析了遠(yuǎn)程監(jiān)督關(guān)系的多樣性/預(yù)訓(xùn)練文檔數(shù)量對于模型效果的提升。實(shí)驗結(jié)果發(fā)現(xiàn),更加多樣的遠(yuǎn)程監(jiān)督關(guān)系與更大的預(yù)訓(xùn)練數(shù)據(jù)集對于性能的提升有積極的作用。

d) 除了使用均勻池化的方式來獲得實(shí)體/關(guān)系表示,作者也嘗試使用entity marker的表示方法來測試模型的性能。實(shí)驗結(jié)果證明,ERICA對各種實(shí)體/關(guān)系表示方法均適用,進(jìn)一步驗證了該架構(gòu)的通用性。

八、總結(jié)

在本文中,作者提出了ERICA框架,通過對比學(xué)習(xí)幫助PLM提高實(shí)體和實(shí)體間關(guān)系的理解。作者在多個自然語言理解任務(wù)上驗證了該框架的有效性,包括關(guān)系提取、實(shí)體類別區(qū)分和問題問答。實(shí)驗結(jié)果表明ERICA顯著優(yōu)于所有基線模型,尤其是在低資源的設(shè)定下,這意味著 ERICA 可以更好地幫助 PLM捕獲文本中的相關(guān)事實(shí)并綜合有關(guān)實(shí)體及其關(guān)系的信息。

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • PLM
    PLM
    +關(guān)注

    關(guān)注

    2

    文章

    148

    瀏覽量

    22093
  • 實(shí)體
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    7424

原文標(biāo)題:ERICA: 提升預(yù)訓(xùn)練語言模型實(shí)體與關(guān)系理解的統(tǒng)一框架

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    被美國列入實(shí)體清單!復(fù)旦微強(qiáng)勢回應(yīng)的底氣是什么?

    運(yùn)行平穩(wěn),客戶服務(wù)與交付保障有力。 ? 而這次回應(yīng),正是針對前不久美國商務(wù)部工業(yè)與安全局(BIS)發(fā)布公告,將復(fù)旦微等23家中國實(shí)體列入實(shí)體清單。而從此次的回應(yīng)可以看到,中國企業(yè)已經(jīng)越來越能挺直自己的腰桿,而這背后,是中
    的頭像 發(fā)表于 09-16 08:51 ?7935次閱讀

    安寶特產(chǎn)品丨3DE-實(shí)體模型簡化-快捷簡化和表面收縮

    CAD 實(shí)體模型如何輕量化?快捷簡化與表面收縮助力版權(quán)保護(hù)和營銷素材制作成本優(yōu)化。
    的頭像 發(fā)表于 12-01 13:28 ?276次閱讀
    安寶特產(chǎn)品丨3DE-<b class='flag-5'>實(shí)體</b>模型簡化-快捷簡化和表面收縮

    今日看點(diǎn)丨美國將16家中企列入實(shí)體清單;英偉達(dá)黃仁勛證實(shí)投資xAI

    ? 美國將16家中企列入實(shí)體清單,含多家電子元器件分銷商 10月8日,美國商務(wù)部工業(yè)與安全局(BIS)發(fā)布公告,將26家實(shí)體與3個地址加入實(shí)體清單(Entity List)。其中包括16家中
    發(fā)表于 10-09 10:22 ?1379次閱讀
    今日看點(diǎn)丨美國將16家中企列入<b class='flag-5'>實(shí)體</b>清單;英偉達(dá)黃仁勛證實(shí)投資xAI

    復(fù)旦微電子被列入實(shí)體清單(Footnote 4)后發(fā)布公開信 已構(gòu)建可持續(xù)發(fā)展格局

    在美國時間的9月12日,美國商務(wù)部工業(yè)與安全局(BIS)再次無理制裁,將我國23 家實(shí)體列入實(shí)體清單。此次的23家中國實(shí)體包括有13家半導(dǎo)體企業(yè)、3家生物技術(shù)公司及多家科研院所;包括有復(fù)旦微電子等
    的頭像 發(fā)表于 09-15 11:28 ?3103次閱讀

    千億圖書市場下的實(shí)體書店自救:UHF RFID 技術(shù)的關(guān)鍵作用

    在數(shù)字化浪潮的席卷下,傳統(tǒng)實(shí)體書店的生存境遇愈發(fā)艱難。據(jù)相關(guān)數(shù)據(jù)顯示,2024 年中國圖書零售市場碼洋規(guī)模雖高達(dá) 1129 億元,但實(shí)體書店的份額卻已萎縮至 14.0%。平臺電商以 40.9% 的占
    的頭像 發(fā)表于 08-19 09:19 ?713次閱讀

    AIoT智能體崛起:物聯(lián)網(wǎng)正塑造AI在實(shí)體世界的運(yùn)行框架

    目前一個值得關(guān)注的趨勢在悄然發(fā)生:AI不再只是一個云端工具,開始成為一個“在場”的智能體,而物聯(lián)網(wǎng)正塑造AI在實(shí)體世界的運(yùn)行框架。本文將通過以下5個部分闡述:1.范式轉(zhuǎn)變:從通用智能到場景智能2.
    的頭像 發(fā)表于 07-31 16:54 ?1090次閱讀
    AIoT智能體崛起:物聯(lián)網(wǎng)正塑造AI在<b class='flag-5'>實(shí)體</b>世界的運(yùn)行框架

    PLM - 基礎(chǔ)知識、優(yōu)勢和差異化

    工業(yè)4.0、制造業(yè)數(shù)字化和工業(yè)流程網(wǎng)絡(luò)化為PLM的運(yùn)行提供了框架。它結(jié)合了不同的系統(tǒng)和技術(shù),共同優(yōu)化了產(chǎn)品整個生命周期的信息流。 什么是PLM? 產(chǎn)品生命周期管理(Product
    發(fā)表于 07-30 14:26

    AI重構(gòu)實(shí)體生意:智能體如何重塑家居行業(yè)增長邏輯?

    重構(gòu)實(shí)體生意·2025AI智能營銷大會”現(xiàn)場,鴻雁電器總裁王米成、螢石網(wǎng)絡(luò)智能算法部總經(jīng)理程戰(zhàn)戰(zhàn)、百度家居行業(yè)高級客戶經(jīng)理韓仲秋、騰訊云行業(yè)解決方案專家張金繁、群
    的頭像 發(fā)表于 07-16 20:46 ?842次閱讀
    AI重構(gòu)<b class='flag-5'>實(shí)體</b>生意:智能體如何重塑家居行業(yè)增長邏輯?

    PDM是什么?2025制造PDM/PLM系統(tǒng)盤點(diǎn)

    合適PDM/PLM(How)五個方面,用最簡練的語言幫助讀者理解PDM。 文末附有10款主流PDM產(chǎn)品、
    的頭像 發(fā)表于 06-19 17:46 ?2085次閱讀
    PDM是什么?2025制造PDM/<b class='flag-5'>PLM</b>系統(tǒng)盤點(diǎn)

    PLM系統(tǒng)是什么?PLM系統(tǒng)的功能、制造業(yè)案例,2025國產(chǎn)PLM發(fā)展

    本文全面深入地探討了產(chǎn)品生命周期管理(PLM)系統(tǒng),涵蓋其概念、發(fā)展歷程、核心功能、優(yōu)勢、應(yīng)用范圍、實(shí)施策略以及未來趨勢,并結(jié)合實(shí)際案例進(jìn)行分析。 PLM系統(tǒng)作為現(xiàn)代制造業(yè)的關(guān)鍵信息化工具,貫穿產(chǎn)品全生命周期,實(shí)現(xiàn)數(shù)據(jù)集成與協(xié)同工作,可顯著提升產(chǎn)品開發(fā)效率與質(zhì)量,加
    的頭像 發(fā)表于 05-29 17:33 ?3399次閱讀

    如何在MQTT中發(fā)布和訂閱實(shí)體

    在MQTT中發(fā)布和訂閱實(shí)體(主題)是MQTT通信的核心操作,下面將詳細(xì)介紹其原理、步驟以及示例代碼,幫助你全面理解這一過程。 一、MQTT發(fā)布與訂閱的基本概念 發(fā)布(Publish):客戶端將
    的頭像 發(fā)表于 05-20 17:21 ?1434次閱讀

    今日看點(diǎn)丨美國將浪潮等54家中國科技企業(yè)加入實(shí)體清單;中國科學(xué)院成功研發(fā)全固態(tài) DUV 光源技術(shù)

    1. 美國將浪潮等 54 家中國科技企業(yè)加入實(shí)體清單 ? 當(dāng)?shù)貢r間周二(3月25日),美國商務(wù)部工業(yè)與安全局(BIS)在聯(lián)邦公報上發(fā)布兩份文件,將54個中國科技企業(yè)和機(jī)構(gòu)納入所謂的“實(shí)體清單”,預(yù)期
    發(fā)表于 03-26 11:15 ?1346次閱讀

    泰凌微電子見證藍(lán)牙技術(shù)聯(lián)盟中國實(shí)體成立

    藍(lán)牙技術(shù)聯(lián)盟近日在北京舉行董事會并正式成立中國實(shí)體,這一舉措在行業(yè)內(nèi)引起了廣泛關(guān)注。這標(biāo)志著藍(lán)牙技術(shù)聯(lián)盟對于中國成員和市場的戰(zhàn)略意義的重視,將為中國藍(lán)牙生態(tài)系統(tǒng)的蓬勃發(fā)展注入強(qiáng)大動力。中國作為藍(lán)牙
    的頭像 發(fā)表于 03-18 17:18 ?1234次閱讀

    藍(lán)牙技術(shù)聯(lián)盟正式成立中國實(shí)體,擴(kuò)展全球市場布局

    中國北京, 2025 年 3 月 13 日 ——負(fù)責(zé)發(fā)展藍(lán)牙技術(shù)的行業(yè)協(xié)會藍(lán)牙技術(shù)聯(lián)盟(Bluetooth SIG)今日宣布正式成立藍(lán)牙技術(shù)(北京)有限公司。中國實(shí)體的總部設(shè)在北京,并在上海和深圳
    發(fā)表于 03-13 10:53 ?492次閱讀
    藍(lán)牙技術(shù)聯(lián)盟正式成立中國<b class='flag-5'>實(shí)體</b>,擴(kuò)展全球市場布局

    一文讀懂產(chǎn)品生命周期管理系統(tǒng)(PLM)?

    在當(dāng)今快速迭代的制造業(yè)和科技領(lǐng)域,企業(yè)能否高效管理產(chǎn)品從概念到退市的全生命周期,已成為其核心競爭力的重要體現(xiàn)。產(chǎn)品生命周期管理系統(tǒng)(Product Lifecycle Management, PLM
    的頭像 發(fā)表于 03-10 17:09 ?2841次閱讀
    一文讀懂產(chǎn)品生命周期管理系統(tǒng)(<b class='flag-5'>PLM</b>)?