1MUC Data Sets
https://www-nlpir.nist.gov/related_projects/muc/
2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/
3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創(chuàng)建的,重點關注4個實體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實體) https://www.clips.uantwerpen.be/conll2003/ner/
42010 I2B2
2010 I2B2 NER任務考慮了臨床數(shù)據(jù),重點關注臨床問題、測試和治療實體類型
https://www.i2b2.org/NLP/Relations/
5DDIExtraction2013(Drug NER)
重點關注藥品、品牌、集團和藥品n(未批準或新藥)實體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html
6CHEMPROT(Similar to 5)
相比5更側重于化學和藥物實體,例如縮寫、配方、家族、標識符等
https://biocreative.bioinformatics.udel.edu/
7 microbiology NER datasets
從PubMed和生物學網(wǎng)站收集,并且主要關注細菌、棲息地和地理位置實體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)
責任編輯:xj
原文標題:一些NER的英文數(shù)據(jù)集
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
數(shù)據(jù)集
+關注
關注
4文章
1236瀏覽量
26201 -
nlp
+關注
關注
1文章
491瀏覽量
23281
原文標題:一些NER的英文數(shù)據(jù)集
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
爬壁機器人磁鐵的一些常見問題
關于六類網(wǎng)線一些問題的解答
貼片電容精度J±5%的一些詳細知識
蜂鳥E203的浮點指令集F的一些實現(xiàn)細節(jié)
Vector向量指令集簡介(一)
在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗
基于蜂鳥E203架構的指令集K擴展
當不同的數(shù)據(jù)放在同一個Flash頁面上時,請問如何在不影響其他數(shù)據(jù)的情況下更改一些單獨的數(shù)據(jù)?
AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)集后一直顯示數(shù)據(jù)正在解析,為什么?
云訓練平臺數(shù)據(jù)集過大無法下載數(shù)據(jù)集至本地怎么解決?
使用AICube導入數(shù)據(jù)集點創(chuàng)建后提示數(shù)據(jù)集不合法怎么處理?
數(shù)據(jù)集下載失敗的原因?
Debian和Ubuntu哪個好一些?
樹莓派在自動化控制項目中的一些潛在應用
一些NER的英文數(shù)據(jù)集推薦
評論