91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自然語(yǔ)言處理BERT中CLS的效果如何?

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:AI自然語(yǔ)言處理與知識(shí)圖譜 ? 作者:Elesdspline ? 2021-04-04 17:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要說(shuō)自然語(yǔ)言處理在18年最?yuàn)Z目閃耀的是什么事情,那當(dāng)屬 BERT 刷新各個(gè)任務(wù)的記錄了,至今已經(jīng)過(guò)去了近兩年半的時(shí)間,但其影響力未曾衰減,無(wú)論學(xué)術(shù)界還是工業(yè)界,很多的工作與部署都圍繞其展開(kāi),對(duì)很多的下游任務(wù)都有舉足輕重的作用,真的是里程碑啊。

相信大家都有過(guò)BERT、ALBERT等預(yù)訓(xùn)練語(yǔ)言模型應(yīng)用在自己任務(wù)上的實(shí)踐經(jīng)歷,可能是情感分析、分類、命名實(shí)體識(shí)別、閱讀理解、相似度計(jì)算等等,使用的方法也無(wú)非是在自己任務(wù)上 fine-tune 或者作為預(yù)訓(xùn)練Embedding,使用的預(yù)訓(xùn)練模型大多是公開(kāi)的,大佬們(財(cái)大氣粗、資源無(wú)數(shù))訓(xùn)練好的。(有錢真好)

在用預(yù)訓(xùn)練模型的時(shí)候,根據(jù)任務(wù)的不同,用到信息也不同,有的需要是詞表示,比如命名實(shí)體識(shí)別、詞性標(biāo)注等任務(wù),有的需要的是句子表示,比如分類、句子語(yǔ)意匹配等。這里我要說(shuō)的句子表示這一類的任務(wù),大家經(jīng)常會(huì)用到的 [CLS] 特征信息作為句子向量表示,CLS 作為 BERT/ALBERT序列信息中特殊的一個(gè)存在,在最開(kāi)始設(shè)計(jì)模型的時(shí)候便考慮將其作為后續(xù)文本分類的表示,然而直接使用 CLS 的效果真的會(huì)滿足我們的預(yù)期嘛?相信大家在實(shí)踐的過(guò)程中都有所體會(huì)~,另外 ALBERT 和 BERT 在下游任務(wù)應(yīng)用上面孰好孰壞,是否有一個(gè)定論?

我最近看到了一篇 Arxiv 的文章,題目是 《Evaluation of BERT and ALBERT Sentence Embedding Performance on Downstream NLP Tasks》,這篇文章在 BERT/ALBERT 提取信息作為句子信息表示應(yīng)用在下游任務(wù),對(duì)其效果進(jìn)行了評(píng)測(cè),或許會(huì)解答我們實(shí)踐中的疑惑,也或者會(huì)給我們一些預(yù)訓(xùn)練模型在下游任務(wù)應(yīng)用的啟發(fā),讓我們來(lái)看下~

評(píng)測(cè)對(duì)比

有一系列的對(duì)比實(shí)驗(yàn),來(lái)看在下游任務(wù)上面的效果~

[CLS] embeddings

CLS 通過(guò) Self-Attention 機(jī)制來(lái)獲取句子級(jí)別的信息表示,在不同的任務(wù)上 Fine-tune 之后,CLS 會(huì)捕捉特定環(huán)境下的上下文信息表示。

Pooled embeddings

將文本中的所有詞做 Avg-pooling 或者 max-pooling。

Sentence-X(SBERT/ALBERT)

BERT 在語(yǔ)義相似度任務(wù)上面也取得了很不錯(cuò)的效果,然后其內(nèi)部的結(jié)構(gòu)在計(jì)算過(guò)程中會(huì)導(dǎo)致非常耗時(shí),不適合做語(yǔ)義相似度匹配任務(wù),特別是在工業(yè)界,BERT 的耗時(shí)無(wú)法滿足上線的需要。針對(duì)這個(gè)問(wèn)題,有人提出 Sentence-BERT,采用孿生網(wǎng)絡(luò)模型框架,將不同的句子輸入到參數(shù)共享的兩個(gè)BERT模型中,獲取句子信息表示,用于語(yǔ)義相似度計(jì)算,最終相比BERT效率大大提升,滿足工業(yè)界線上需要。SBERT 從65小時(shí)降到5秒,具體詳見(jiàn)參考資料2。

99cb1f6c-88e9-11eb-8b86-12bb97331649.png

CNN-SBERT/SALBERT

在上圖中,SBERT 采用 Avg-pooling 獲取句子向量表示,本文將其替換成 CNN 網(wǎng)絡(luò)結(jié)構(gòu)獲取句子向量表示。

99fe6886-88e9-11eb-8b86-12bb97331649.png

結(jié)果分析

評(píng)測(cè)任務(wù)

STS:Semantic Textual Similarity

NLI:Natural Language Inference

評(píng)測(cè)指標(biāo)

Pearson and Spearman’s rank coefficients(皮爾遜和斯皮爾曼相關(guān)系數(shù))

評(píng)測(cè)數(shù)據(jù)

Semantic Textual Similarity benchmark(STSb)

Multi-Genre Natural Language Inference(MultiNLI)

Stanford Natural Language Inference(SNLI)

上面列出來(lái)相關(guān)的評(píng)測(cè)任務(wù)、評(píng)測(cè)指標(biāo)以及評(píng)測(cè)所用到的數(shù)據(jù),下面先給出一張結(jié)果表,然后再詳細(xì)分析~

9a3609a8-88e9-11eb-8b86-12bb97331649.png

詳細(xì)分析

微調(diào)有效:這個(gè)是符合我們認(rèn)知的,肯定是微調(diào)的效果要好。

CLS 效果:CLS 的效果要遜色很多,無(wú)論是在微調(diào)上面,還是不微調(diào)上面,CLS的效果都要遠(yuǎn)遜色于平均池化操作或者其他方法。

不同方法效果:總體上來(lái)看,CNN-BERT > SBERT > Avg pooling > CLS

BERT 與 ALBERT:從上圖中大概能夠看出,不微調(diào)的情況下,兩者的效果差不多,但是微調(diào)之后,ALBERT的效果要比BERT差很多,僅僅在STSb上微調(diào)的時(shí)候,CLS 和平均池化的方法要好于BERT。

CNN的效果

從上圖來(lái)看,最好的結(jié)果是采用了 CNN 網(wǎng)絡(luò)結(jié)構(gòu),說(shuō)明 CNN 起到了正向的作用,仔細(xì)觀察發(fā)現(xiàn),CNN 對(duì) ALBERT 的改進(jìn)要遠(yuǎn)大于對(duì) BERT 的改善提高。ALBERT 由于內(nèi)部參數(shù)共享,可能存在不穩(wěn)定性,CNN 網(wǎng)絡(luò)結(jié)構(gòu)或許可以減緩這種不穩(wěn)定性。

下圖也進(jìn)行了一些對(duì)比,在幾個(gè)不同的數(shù)據(jù)集上驗(yàn)證 CNN 的有效性,從最終的 Avg 結(jié)果來(lái)看,CNN 網(wǎng)絡(luò)結(jié)構(gòu)對(duì) ALBERT 有改善提升。

9a91a5e2-88e9-11eb-8b86-12bb97331649.png

以上是根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行的簡(jiǎn)單分析,其中有一些結(jié)論和對(duì)比可以在我們?nèi)粘5膶?shí)踐中借鑒并嘗試,說(shuō)不定會(huì)有不錯(cuò)的效果~

原文標(biāo)題:【BERT】BERT中CLS效果真的好嘛?這篇文章告訴你答案

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50095

    瀏覽量

    265310
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13987

原文標(biāo)題:【BERT】BERT中CLS效果真的好嘛?這篇文章告訴你答案

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自然語(yǔ)言處理NLP的概念和工作原理

    自然語(yǔ)言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書(shū)面形式的人類語(yǔ)言。自然語(yǔ)言處理將計(jì)算
    的頭像 發(fā)表于 01-29 14:01 ?362次閱讀
    <b class='flag-5'>自然語(yǔ)言</b><b class='flag-5'>處理</b>NLP的概念和工作原理

    Neway電機(jī)方案在實(shí)際應(yīng)用效果如何?

    Neway電機(jī)方案在實(shí)際應(yīng)用效果如何?Neway電機(jī)方案是深圳市立維創(chuàng)展科技有限公司推出的電機(jī)驅(qū)動(dòng)與控制系統(tǒng)解決方案,具有高穩(wěn)定性、高性價(jià)比、小型化等特點(diǎn),Neway電機(jī)方案在實(shí)際應(yīng)用效果
    發(fā)表于 12-03 09:23

    云知聲論文入選自然語(yǔ)言處理頂會(huì)EMNLP 2025

    近日,自然語(yǔ)言處理(NLP)領(lǐng)域國(guó)際權(quán)威會(huì)議 ——2025 年計(jì)算語(yǔ)言學(xué)與自然語(yǔ)言處理國(guó)際會(huì)議(EMNLP 2025)公布論文錄用結(jié)果,云知
    的頭像 發(fā)表于 11-10 17:30 ?803次閱讀
    云知聲論文入選<b class='flag-5'>自然語(yǔ)言</b><b class='flag-5'>處理</b>頂會(huì)EMNLP 2025

    格靈深瞳突破文本人物檢索技術(shù)難題

    格靈深瞳參與研究的GA-DMS框架,為攻破上述技術(shù)難題提供了全新解決方案。研究團(tuán)隊(duì)通過(guò)數(shù)據(jù)構(gòu)建和模型架構(gòu)的協(xié)同改進(jìn),推動(dòng)CLIP在人物表征學(xué)習(xí)的應(yīng)用,顯著提升了基于文本的人物檢索效果。該成果已入選EMNLP 2025 主會(huì)(自然語(yǔ)言
    的頭像 發(fā)表于 09-28 09:42 ?630次閱讀
    格靈深瞳突破文本人物檢索技術(shù)難題

    LCD屏幕無(wú)法正確顯示效果如何解決?

    : 4.通過(guò)修改link文件將LCD緩存數(shù)組定義到SDRAM里面去: 5.在main線程初始化和寫(xiě)一個(gè)小方塊函數(shù): 6.下載后效果不理想。 這塊驅(qū)動(dòng)是正點(diǎn)的官方例程,在裸機(jī)的時(shí)候是沒(méi)有問(wèn)題
    發(fā)表于 09-25 08:16

    HarmonyOSAI編程自然語(yǔ)言代碼生成

    安裝CodeGenie后,在下方對(duì)話框內(nèi),輸入代碼需求描述,將根據(jù)描述智能生成代碼,生成內(nèi)容可一鍵復(fù)制或一鍵插入至編輯區(qū)當(dāng)前光標(biāo)位置。 提問(wèn)示例 使用ArkTs語(yǔ)言寫(xiě)一段代碼,在頁(yè)面中間部分
    發(fā)表于 09-05 16:58

    北斗生態(tài)環(huán)境監(jiān)測(cè)站:讀懂自然的 “語(yǔ)言

    北斗生態(tài)環(huán)境監(jiān)測(cè)站:讀懂自然的 “語(yǔ)言”柏峰【BF-BDQX】當(dāng)生態(tài)監(jiān)測(cè)遇上北斗技術(shù),一場(chǎng)關(guān)于 “精準(zhǔn)守護(hù)自然” 的變革正悄然發(fā)生 ——北斗生態(tài)環(huán)境監(jiān)測(cè)站以北斗定位導(dǎo)航系統(tǒng)為核心
    的頭像 發(fā)表于 09-04 10:59 ?503次閱讀
    北斗生態(tài)環(huán)境監(jiān)測(cè)站:讀懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>語(yǔ)言</b>”

    【HZ-T536開(kāi)發(fā)板免費(fèi)體驗(yàn)】5- 無(wú)需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開(kāi)發(fā)板上搭建 MCP 服務(wù)器,自然語(yǔ)言輕松控板

    引言:為什么需要 “自然語(yǔ)言控板”? 痛點(diǎn)引入 :嵌入式開(kāi)發(fā),開(kāi)發(fā)者常需通過(guò) SSH 等工具登錄開(kāi)發(fā)板,手動(dòng)輸入復(fù)雜的 Linux 命令(如ls -l、gpio readall、ifconfig等
    發(fā)表于 08-23 13:10

    超聲波清洗設(shè)備的清洗效果如何?

    超聲波清洗設(shè)備是一種常用于清洗各種物體的技術(shù),它通過(guò)超聲波振蕩產(chǎn)生的微小氣泡在液體破裂的過(guò)程來(lái)產(chǎn)生高能量的沖擊波,這些沖擊波可以有效地去除表面和細(xì)微裂縫的污垢、油脂、污染物和雜質(zhì)。超聲波清洗設(shè)備
    的頭像 發(fā)表于 06-06 16:04 ?852次閱讀
    超聲波清洗設(shè)備的清洗<b class='flag-5'>效果如</b>何?

    人工智能浪潮下,制造企業(yè)如何借力DeepSeek實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型?

    DeepSeek,憑借其強(qiáng)大的深度學(xué)習(xí)和自然語(yǔ)言處理能力,能夠理解復(fù)雜問(wèn)題并提供精準(zhǔn)解決方案。它不僅能夠作為學(xué)習(xí)、工作、生活的助手,滿足用戶在不同場(chǎng)景下的需求,更能在制造業(yè)中發(fā)揮重要作用。通過(guò)自然語(yǔ)言交互,用戶無(wú)需學(xué)習(xí)復(fù)雜的操作
    的頭像 發(fā)表于 05-29 16:17 ?650次閱讀

    云知聲四篇論文入選自然語(yǔ)言處理頂會(huì)ACL 2025

    近日,第63屆國(guó)際計(jì)算語(yǔ)言學(xué)年會(huì)ACL 2025(Annual Meeting of the Association for Computational Linguistics,簡(jiǎn)稱ACL)論文接收
    的頭像 發(fā)表于 05-26 14:15 ?1310次閱讀
    云知聲四篇論文入選<b class='flag-5'>自然語(yǔ)言</b><b class='flag-5'>處理</b>頂會(huì)ACL 2025

    自然語(yǔ)言處理的發(fā)展歷程和應(yīng)用場(chǎng)景

    你是否曾經(jīng)對(duì)著手機(jī)說(shuō):“嘿,Siri,今天天氣怎么樣?”或者在出國(guó)旅行時(shí),打開(kāi)翻譯軟件,對(duì)著菜單說(shuō):“請(qǐng)把這道菜翻譯成英文”。
    的頭像 發(fā)表于 04-17 11:40 ?1327次閱讀

    自然語(yǔ)言提示原型在英特爾Vision大會(huì)上首次亮相

    在英特爾Vision大會(huì)上,Network Optix首次展示了自然語(yǔ)言提示原型,該方案將重新定義視頻管理,為各行各業(yè)由AI驅(qū)動(dòng)的洞察和效率提速。
    的頭像 發(fā)表于 04-09 09:30 ?963次閱讀

    ?VLM(視覺(jué)語(yǔ)言模型)?詳細(xì)解析

    視覺(jué)語(yǔ)言模型(Visual Language Model, VLM)是一種結(jié)合視覺(jué)(圖像/視頻)和語(yǔ)言(文本)處理能力的多模態(tài)人工智能模型,能夠理解并生成與視覺(jué)內(nèi)容相關(guān)的自然語(yǔ)言。以下
    的頭像 發(fā)表于 03-17 15:32 ?8828次閱讀
    ?VLM(視覺(jué)<b class='flag-5'>語(yǔ)言</b>模型)?詳細(xì)解析

    智慧路燈的照明效果如何?

    引言 在智慧城市建設(shè)的進(jìn)程,叁仟智慧路燈已逐漸成為城市道路照明的主力軍。其照明效果不僅關(guān)系到市民夜間出行的安全與便捷,更對(duì)城市的整體形象和生活品質(zhì)有著深遠(yuǎn)影響。相較于傳統(tǒng)路燈,叁仟智慧路燈借助
    的頭像 發(fā)表于 03-16 16:10 ?840次閱讀