91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一些NER的英文數(shù)據(jù)集推薦

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-12-26 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1MUC Data Sets

https://www-nlpir.nist.gov/related_projects/muc/

2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/

3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創(chuàng)建的,重點關注4個實體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實體) https://www.clips.uantwerpen.be/conll2003/ner/


42010 I2B2
2010 I2B2 NER任務考慮了臨床數(shù)據(jù),重點關注臨床問題、測試和治療實體類型
https://www.i2b2.org/NLP/Relations/

5DDIExtraction2013(Drug NER)
重點關注藥品、品牌、集團和藥品n(未批準或新藥)實體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html

6CHEMPROT(Similar to 5)
相比5更側重于化學和藥物實體,例如縮寫、配方、家族、標識符等
https://biocreative.bioinformatics.udel.edu/

7 microbiology NER datasets
從PubMed和生物學網(wǎng)站收集,并且主要關注細菌、棲息地和地理位置實體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)

責任編輯:xj

原文標題:一些NER的英文數(shù)據(jù)集

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26201
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23281

原文標題:一些NER的英文數(shù)據(jù)集

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    爬壁機器人磁鐵的一些常見問題

    爬壁機器人近幾年比較火,它是類能夠在垂直墻面、天花板、傾斜表面上移動和作業(yè)的特種機器人,今天我們不聊其它,只聊下關于磁吸附應用中的磁鐵,以下是小編整理的關于爬壁機器人中磁鐵的一些常見問題。
    的頭像 發(fā)表于 01-09 10:06 ?273次閱讀
    爬壁機器人磁鐵的<b class='flag-5'>一些</b>常見問題

    關于六類網(wǎng)線一些問題的解答

    今天我們就圍繞網(wǎng)友一些常見的關于六類網(wǎng)線的問題進行下匯總式解答: 問 六類網(wǎng)線可以當電源用嗎? 答 六類網(wǎng)線并不是設計用于傳輸電力的電纜,因此般不建議將其用于電源傳輸。 盡管六類網(wǎng)線的線芯可以
    的頭像 發(fā)表于 12-09 11:13 ?565次閱讀

    貼片電容精度J±5%的一些詳細知識

    貼片電容精度J±5%表示電容的實際值與標稱值之間的偏差范圍在±5%以內 ,以下是關于貼片電容精度J±5%的一些詳細知識: 、精度等級含義 J±5% :字母“J”在貼片電容的標識中通常表示標稱精度
    的頭像 發(fā)表于 11-20 14:38 ?652次閱讀
    貼片電容精度J±5%的<b class='flag-5'>一些</b>詳細知識

    蜂鳥E203的浮點指令F的一些實現(xiàn)細節(jié)

    蜂鳥E203的浮點指令F的一些實現(xiàn)細節(jié) 既然E203不是多發(fā)射,且為了節(jié)省面積,一些指令使用FPU內的同個子模塊來執(zhí)行,即FPU同時只能進行
    發(fā)表于 10-24 08:57

    Vector向量指令簡介(

    3位標識數(shù)據(jù)位寬,高兩位指示數(shù)據(jù)類型。 指令的類型由vetype的值進行標記,如果將vetype設為00000則會禁用向量寄存器。 對于vector指令來說,有一些必須要明白的名
    發(fā)表于 10-23 08:28

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練個手寫數(shù)字識別的神經(jīng)網(wǎng)絡
    發(fā)表于 10-22 07:03

    基于蜂鳥E203架構的指令K擴展

    擴展指令架構(RISC-V ISA)的K擴展。 K擴展是種可選的指令擴展,它增加了一些向量和矩陣操作的指令。這些指令可以利用硬件并行性,高效地處理大量
    發(fā)表于 10-21 09:38

    當不同的數(shù)據(jù)放在同個Flash頁面上時,請問如何在不影響其他數(shù)據(jù)的情況下更改一些單獨的數(shù)據(jù)?

    當不同的數(shù)據(jù)放在同個Flash頁面上時,如何在不影響其他數(shù)據(jù)的情況下更改一些單獨的數(shù)據(jù)?
    發(fā)表于 08-22 06:25

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)直顯示數(shù)據(jù)正在解析,為什么?

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)直顯示數(shù)據(jù)正在解析 數(shù)據(jù)有問題,把數(shù)據(jù)
    發(fā)表于 08-13 07:16

    云訓練平臺數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺限制了圖片數(shù)量,想要本地訓練下載數(shù)據(jù)時發(fā)現(xiàn)只會跳出網(wǎng)絡異常的錯誤,請問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    使用AICube導入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    Debian和Ubuntu哪個好一些?

    兼容性對比Debian和Ubuntu哪個好一些,并為您揭示如何通過RAKsmart服務器釋放Linux系統(tǒng)的最大潛能。
    的頭像 發(fā)表于 05-07 10:58 ?1151次閱讀

    樹莓派在自動化控制項目中的一些潛在應用

    自動化控制項目中的一些潛在應用。之前,我們已經(jīng)為Arduino平臺探討了相同的話題。我們確定Arduino是個出色的教育工具,但由于一些限制,它無法在工業(yè)環(huán)境中完全
    的頭像 發(fā)表于 03-25 09:45 ?625次閱讀
    樹莓派在自動化控制項目中的<b class='flag-5'>一些</b>潛在應用

    請問NanoEdge AI數(shù)據(jù)該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 03-10 08:20