91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于NLP基準(zhǔn)數(shù)據(jù)集的快速概覽,以及最新技術(shù)的進(jìn)展

DPVg_AI_era ? 來(lái)源:lq ? 2019-02-16 11:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文是一個(gè)自然語(yǔ)言處理資源索引,涵蓋了目前NLP領(lǐng)域常用任務(wù)的最佳實(shí)驗(yàn) 結(jié)果和數(shù)據(jù)集資源,可以作為進(jìn)一步從事NLP研究的基礎(chǔ)。讀者也可以自行在Github頁(yè)面上添加新的結(jié)果,本文中大部分為英文NLP資源,還有少數(shù)漢語(yǔ)、印地語(yǔ)和越南語(yǔ)資源。

本文實(shí)際上是一個(gè)索引,旨在記錄自然語(yǔ)言處理(NLP)領(lǐng)域的新進(jìn)展,并概述最常見(jiàn)的NLP任務(wù)及其相應(yīng)數(shù)據(jù)集的新技術(shù)。

這篇索引旨在涵蓋主要的傳統(tǒng)和核心NLP任務(wù),如語(yǔ)義依賴性解析和詞性標(biāo)注等,以及最近不斷取得新突破的任務(wù),比如閱讀理解和自然語(yǔ)言推理。本文主要目標(biāo)是為感興趣的讀者提供關(guān)于NLP基準(zhǔn)數(shù)據(jù)集的快速概覽,以及最新技術(shù)的進(jìn)展,這些數(shù)據(jù)集和新進(jìn)展可以作為進(jìn)一步NLP研究的基礎(chǔ)。

因此,本文有意將這些NLP領(lǐng)域的新研究進(jìn)展做一個(gè)簡(jiǎn)單匯總,便于研究人員集中查閱參考。

讀者也可以通過(guò)瀏覽器訪問(wèn)nlpprogress.com或nlpsota.com來(lái)閱讀本文。

簡(jiǎn)易使用指南

實(shí)驗(yàn)結(jié)果

本文首選在已發(fā)表的論文中的實(shí)驗(yàn)結(jié)果,但對(duì)少數(shù)影響力很大的預(yù)印本論文也可能入選。

數(shù)據(jù)集

本文中收錄的數(shù)據(jù)集,除了利用該數(shù)據(jù)集的論文之外,還應(yīng)經(jīng)過(guò)至少一篇已發(fā)表的其他論文的評(píng)估。

代碼

我們建議添加指向?qū)崿F(xiàn)的鏈接(如果可用)。如果代碼不存在,您可以向表中添加代碼列(見(jiàn)下文)。在Code列,建議使用官方實(shí)現(xiàn)。如果有非官方實(shí)現(xiàn),請(qǐng)使用鏈接(見(jiàn)下文)。如果沒(méi)有可用的實(shí)現(xiàn),可以將單元格留空。

向本索引中添加新結(jié)果

如果要添加新結(jié)果,只需單擊文件右上角的小編輯按鈕以執(zhí)行相應(yīng)任務(wù)(如下圖所示)。

讀者可以在Markdown中編輯文件。只需以相同的格式將一行添加到相應(yīng)的表中即可。確保表格中數(shù)據(jù)排序正確(將最佳結(jié)果位于頂部)。完成更改后,單擊頁(yè)面頂部的“預(yù)覽更改”選項(xiàng)卡,確保表格看起來(lái)還不錯(cuò)。如果一切看起來(lái)都OK,請(qǐng)轉(zhuǎn)到頁(yè)面底部確認(rèn)更改。

此處需要為建議更改添加名稱,可以選擇添加說(shuō)明文字,可以選擇“創(chuàng)建新分支并啟動(dòng)拉取請(qǐng)求”,然后單擊“提交更改”。

具體索引內(nèi)容和研究領(lǐng)域如下,絕大部分為英語(yǔ),有少量資源為漢語(yǔ)、印地語(yǔ)和越南語(yǔ)。

英語(yǔ)

自動(dòng)語(yǔ)音識(shí)別

CCG超級(jí)標(biāo)準(zhǔn)

常識(shí)

選區(qū)解析

共同決議

依賴解析

對(duì)話

域適應(yīng)

實(shí)體鏈接

語(yǔ)法糾錯(cuò)

信息提取

語(yǔ)言建模

詞匯規(guī)范化

機(jī)器翻譯

多任務(wù)學(xué)習(xí)

多模態(tài)

命名實(shí)體識(shí)別

自然語(yǔ)言推理

詞性標(biāo)注

問(wèn)答

關(guān)系預(yù)測(cè)

關(guān)系提取

語(yǔ)義文本相似度

語(yǔ)義解析

語(yǔ)義角色標(biāo)記

情緒分析

淺語(yǔ)法

簡(jiǎn)單化

狀態(tài)檢測(cè)

概要

分類學(xué)習(xí)

時(shí)間處理

文字分類

詞義消歧

中文

實(shí)體鏈接

中文詞匯分割

印地語(yǔ)

分塊

詞性標(biāo)注

機(jī)器翻譯

越南語(yǔ)

依賴解析

機(jī)器翻譯

命名實(shí)體識(shí)別

詞性標(biāo)注

分詞

最后以”中文-詞匯分割”子類目為例,簡(jiǎn)單說(shuō)明這個(gè)索引資源的呈現(xiàn)方式。

點(diǎn)擊相應(yīng)鏈接進(jìn)入,首先是中文詞匯分割這個(gè)任務(wù)的簡(jiǎn)要介紹。

下面列出了不同作者建立的基于不同搜索方式的單詞分割模型,以及相應(yīng)模型的發(fā)表時(shí)間。

接下來(lái)是評(píng)估指標(biāo),此類中為F1分?jǐn)?shù)。下面以表格形式給出每種模型在不同數(shù)據(jù)集上獲得的最佳F1分?jǐn)?shù)。每個(gè)分?jǐn)?shù)對(duì)應(yīng)的研究論文鏈接和部分Github資源地址。

可以看到,表中中文詞匯分割模型的最優(yōu)F1分?jǐn)?shù)均超過(guò)了96分,感興趣的讀者可以點(diǎn)擊查看論文或Github資源。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1238

    瀏覽量

    26222
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    630

    瀏覽量

    14684
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23308

原文標(biāo)題:盤點(diǎn)NLP最新進(jìn)展:多語(yǔ)種40+任務(wù)最優(yōu)結(jié)果任你查

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「龍芯之光 自主可控處理器設(shè)計(jì)解析」閱讀體驗(yàn)】--全書概覽與概述

    感謝論壇與出版社提供此書以及作者編著此書。下面是書籍實(shí)物,不是很厚但很通俗易懂、簡(jiǎn)明概要。 首先對(duì)全書章節(jié)進(jìn)行概覽,然后對(duì)第一章概述進(jìn)行閱讀學(xué)習(xí)。 全書分6章,在架構(gòu)、工具鏈、案例方面進(jìn)行了介紹
    發(fā)表于 01-18 12:58

    【「龍芯之光 自主可控處理器設(shè)計(jì)解析」閱讀體驗(yàn)】+本書概覽與龍芯指令基礎(chǔ)了解.docx

    本書概覽 本書主要基于麗湖霸下BX2400的開發(fā)過(guò)程 ,介紹Soc設(shè)計(jì)全過(guò)程。 內(nèi)容覆蓋LoongArch的Soc邏輯設(shè)計(jì),邏輯綜合,可測(cè)試性設(shè)計(jì),物理設(shè)計(jì)和簽核。本書不厚一百多頁(yè),更像一本
    發(fā)表于 01-15 23:07

    華為構(gòu)網(wǎng)型儲(chǔ)能技術(shù)進(jìn)展與商用實(shí)踐

    11月24日,以“加速構(gòu)網(wǎng)技術(shù)應(yīng)用實(shí)證,支撐新型電力系統(tǒng)高質(zhì)量發(fā)展”為主題的構(gòu)網(wǎng)型儲(chǔ)能應(yīng)用與發(fā)展論壇在長(zhǎng)沙舉辦。華為數(shù)字能源構(gòu)網(wǎng)型儲(chǔ)能領(lǐng)域總裁鄭越發(fā)表題為“華為構(gòu)網(wǎng)型儲(chǔ)能技術(shù)進(jìn)展與商用實(shí)踐”的主旨演講,全面分享了華為在構(gòu)網(wǎng)型儲(chǔ)能
    的頭像 發(fā)表于 12-01 10:54 ?853次閱讀

    軟硬件協(xié)同技術(shù)分享 - 任務(wù)劃分 + 自定義指令

    Level , ESL)得到催生,然而ESL設(shè)計(jì)依賴于復(fù)雜的高層次建模以及龐大的數(shù)據(jù)支持,且其工具鏈的發(fā)展仍不是十分完善。 在現(xiàn)階段的開發(fā)氛圍中,軟硬件協(xié)同開發(fā)是一種能夠縮短開發(fā)周期,并提升總體性能的高效
    發(fā)表于 10-28 08:03

    關(guān)于“實(shí)時(shí)基準(zhǔn)對(duì)比測(cè)量”與AI再探討

    qqxjyxjy清風(fēng):關(guān)于“實(shí)時(shí)基準(zhǔn)對(duì)比測(cè)量”我還想多問(wèn)一句。 AI: 已深度思考(用時(shí) 14 秒) AI: 好的,用戶之前詳細(xì)討論了用實(shí)時(shí)基準(zhǔn)對(duì)比測(cè)量來(lái)解決ADA8330增益不確定的問(wèn)題,現(xiàn)在
    的頭像 發(fā)表于 10-14 17:39 ?569次閱讀

    創(chuàng)北方亮相2025 SID顯示新技術(shù)研討會(huì)

    2025年8月23、24日,第十屆“SID顯示新技術(shù)研討會(huì)”在大連圓滿舉行,本次研討會(huì)為更好地總結(jié)2025 SID顯示周的最新技術(shù),幫助顯示行業(yè)從業(yè)者深入了解國(guó)際顯示行業(yè)的最新成果、前沿技術(shù)和產(chǎn)業(yè)現(xiàn)狀。
    的頭像 發(fā)表于 08-30 11:47 ?1503次閱讀

    AI Cube如何導(dǎo)入數(shù)據(jù)?

    我從在線平臺(tái)標(biāo)注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導(dǎo)入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    請(qǐng)問(wèn)AICube所需的目標(biāo)檢測(cè)數(shù)據(jù)標(biāo)注可以使用什么工具?

    請(qǐng)問(wèn)AICube所需的目標(biāo)檢測(cè)數(shù)據(jù)標(biāo)注可以使用什么工具? 我使用labelimg進(jìn)行標(biāo)注,標(biāo)注后的數(shù)據(jù)改好文件名后導(dǎo)入不進(jìn)去。一直卡在數(shù)據(jù)
    發(fā)表于 08-11 08:07

    案例 | OPC 數(shù)據(jù)采集與可視化集成,實(shí)現(xiàn)設(shè)備到ERP的一體化聯(lián)動(dòng)

    案例概覽在數(shù)字化制造的浪潮中,越來(lái)越多企業(yè)選擇以數(shù)據(jù)為核心優(yōu)化生產(chǎn)流程。北歐一家領(lǐng)先的塑料制造商,在新設(shè)備上線與系統(tǒng)集成過(guò)程中,借助宏CogentDataHub軟件,成功部署了OPC實(shí)時(shí)數(shù)據(jù)
    的頭像 發(fā)表于 08-08 18:15 ?562次閱讀
    宏<b class='flag-5'>集</b>案例 | OPC <b class='flag-5'>數(shù)據(jù)</b>采集與可視化集成,實(shí)現(xiàn)設(shè)備到ERP的一體化聯(lián)動(dòng)

    村田中國(guó)亮相2025開放計(jì)算創(chuàng)新技術(shù)大會(huì):以創(chuàng)新技術(shù)驅(qū)動(dòng)智能化發(fā)展

    ”的主題,重點(diǎn)展示了包括電源、電感、傳感器以及嶄新集成封裝解決方案在內(nèi)的多款產(chǎn)品。今年,村田的創(chuàng)新技術(shù)與產(chǎn)品再次獲得OCP的認(rèn)可,榮獲“開放計(jì)算最佳創(chuàng)新獎(jiǎng)”,村田將始終致力于為數(shù)據(jù)中心的綠色化發(fā)展和高效運(yùn)行提供堅(jiān)實(shí)支撐。 隨著云
    的頭像 發(fā)表于 08-07 16:09 ?846次閱讀
    村田中國(guó)亮相2025開放計(jì)算創(chuàng)<b class='flag-5'>新技術(shù)</b>大會(huì):以創(chuàng)<b class='flag-5'>新技術(shù)</b>驅(qū)動(dòng)智能化發(fā)展

    云訓(xùn)練平臺(tái)數(shù)據(jù)過(guò)大無(wú)法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺(tái)限制了圖片數(shù)量,想要本地訓(xùn)練下載數(shù)據(jù)時(shí)發(fā)現(xiàn)只會(huì)跳出網(wǎng)絡(luò)異常的錯(cuò)誤,請(qǐng)問(wèn)這有什么解決辦法?
    發(fā)表于 07-22 06:03

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】--全書概覽

    講解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架構(gòu)、訓(xùn)練框架、推理階段優(yōu)化、后訓(xùn)練優(yōu)化等關(guān)鍵技術(shù) 第四章關(guān)于DeepSeek-R1的技術(shù)剖析 第五章 從宏觀角度分析
    發(fā)表于 07-21 00:04

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    RFID讀寫器有什么用

    和身份證中。通過(guò)將個(gè)人信息存儲(chǔ)在RFID芯片中,用戶可以在出入境以及身份驗(yàn)證時(shí),實(shí)現(xiàn)快速、準(zhǔn)確的身份識(shí)別,提升安檢效率。三、RFID讀寫器的優(yōu)勢(shì)1. 高效性:RFID讀寫器能夠在短時(shí)間內(nèi)處理大量數(shù)據(jù),
    發(fā)表于 06-20 10:36

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04