91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI領(lǐng)域頂會EMNLP 2020落下帷幕

醫(yī)健AI掘金志 ? 來源:IoT科技評論 ? 作者:IoT科技評論 ? 2020-12-15 18:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這項工作的意義在于,幫助醫(yī)學(xué)研究工作者更好地選擇醫(yī)學(xué)臨床試驗,特別在新冠疫情下,更好的醫(yī)學(xué)臨床試驗或許就意味著能更快地找到有效的治療方案。 日前,AI領(lǐng)域頂會EMNLP 2020落下帷幕。

今年全球僅有754篇論文被接受,接收率為24%,阿里巴巴憑借28篇論文成為入選論文數(shù)最多的中國科技公司。

據(jù)雷鋒網(wǎng)《醫(yī)健AI掘金志》了解,阿里相關(guān)研究成果覆蓋情感分析、文本生成及醫(yī)療NLP等領(lǐng)域。

在今年疫情的大環(huán)境下,醫(yī)療領(lǐng)域的研究與成果產(chǎn)出也不斷提速。

在名為《Predicting Clinical Trial Results by Implicit Evidence Integration》的論文中,達(dá)摩院研究團(tuán)隊設(shè)計了針對醫(yī)學(xué)臨床試驗的進(jìn)一步預(yù)訓(xùn)練任務(wù),并提出全新的模型,幫助醫(yī)學(xué)研究工作者更好地選擇醫(yī)學(xué)臨床試驗,以更快地找到有效的治療方案。

研究團(tuán)隊在COVID-evidence數(shù)據(jù)集上完成了試驗,并證明了模型的有效性。

為此,該論文作者、達(dá)摩院算法專家譚傳奇進(jìn)行了解讀。

自18年谷歌BERT橫空出世以來,預(yù)訓(xùn)練語言模型一躍成為自然語言處理領(lǐng)域的研究熱點,“Pre-training + Fine-tune”也成為NLP任務(wù)的新范式,將自然語言處理由原來的手工調(diào)參、依靠機(jī)器學(xué)習(xí)專家的階段,進(jìn)入到可以大規(guī)模、可復(fù)制的大工業(yè)施展的階段。

這篇論文在BioBERT(在醫(yī)學(xué)數(shù)據(jù)上訓(xùn)練的BERT模型)的基礎(chǔ)上,設(shè)計了針對醫(yī)學(xué)臨床試驗的進(jìn)一步預(yù)訓(xùn)練任務(wù)(Post-Pre-training),最終在真實醫(yī)學(xué)臨床試驗數(shù)據(jù)上微調(diào)(Fine-tune)后,取得了超過10個百分點的結(jié)果提升。

而這項工作的意義在于,幫助醫(yī)學(xué)研究工作者更好地選擇醫(yī)學(xué)臨床試驗,特別在COVID-19疫情下,更好的醫(yī)學(xué)臨床試驗或許就意味著能更快地找到有效的治療方案。

劍指臨床試驗的設(shè)計難題

在循證醫(yī)學(xué)的時代,任何的治療都要有相應(yīng)的臨床證據(jù)支持。證據(jù)往往來自于高質(zhì)量的臨床試驗。然而,實施臨床試驗耗時耗力,需要大量資源支持。

并且,設(shè)計有缺陷或者難以成功的臨床試驗占用了寶貴的病人資源,可能會使亟待實施的臨床試驗因招募不到足夠的患者而被迫終止。

新冠肺炎疫情中的瑞德西韋臨床試驗就是一個例子:

因其他設(shè)計有缺陷或者難以成功的臨床試驗占用了不少病人資源,該試驗沒有招募到足夠的病人資源,而沒有得到統(tǒng)計學(xué)上顯著的結(jié)果。

所以,研究者需要在設(shè)計階段就去預(yù)測臨床試驗的結(jié)果,并優(yōu)先進(jìn)行成功概率較高的臨床試驗。

提出新的臨床試驗需要過往臨床證據(jù)的支持,比如WHO為新冠肺炎推薦優(yōu)先檢測氯喹/羥氯喹,瑞德西韋,干擾素和洛匹那韋/利托那韋四種藥物優(yōu)先進(jìn)行臨床試驗。

推薦的理由就是,這些藥物在過往的實驗室或人體試驗中對相關(guān)冠狀病毒有效。然而,人類綜合過往臨床證據(jù)的能力有限。

譚傳奇引用了一個數(shù)據(jù):一項研究發(fā)現(xiàn)大概86.2%的臨床試驗最終會失敗,WHO專家推薦的某些新冠肺炎治療方法,如氯喹/羥氯喹,也沒有得到好的結(jié)果。

臨床試驗設(shè)計難題的核心是臨床試驗的結(jié)果無法準(zhǔn)確預(yù)測。

所以,如果能準(zhǔn)確地預(yù)測臨床試驗的結(jié)果,就可以有針對性地進(jìn)行成功概率的臨床試驗,從而大大提高臨床試驗實施的效率。

因此,譚傳奇團(tuán)隊表示,在本工作中,我們的貢獻(xiàn)就在于:

第一、創(chuàng)新地從NLP的角度重新定義了臨床試驗結(jié)果預(yù)測任務(wù);

第二、提出了一種基于大規(guī)模隱式臨床證據(jù)預(yù)訓(xùn)練的模型EBM-Net(Evidence-Based Medicine Network)用以解決該任務(wù),EBM-Net在各種指標(biāo)上遠(yuǎn)超醫(yī)學(xué)大規(guī)模語言模型BioBERT,如在標(biāo)準(zhǔn)數(shù)據(jù)集上有10.7%的相對F1提升,并且在新冠肺炎相關(guān)的臨床試驗上也被證明有效。

6dfc957e-34d3-11eb-a64d-12bb97331649.png

在上面這張圖中,參考醫(yī)學(xué)臨床試驗在填報提案時需要的基本信息,輸入是自然文本的形式的:

臨床試驗背景B,如“最新研究發(fā)現(xiàn)瑞德西韋在體外對新冠肺炎病毒有效……”;

要研究的人群P,如“重癥新冠肺炎病人”;

治療方法I,如“靜脈注射瑞德西韋”;

對照方法C,如“與瑞德西韋相匹配的安慰劑”;

測量指標(biāo)O,如“死亡率”

輸出是其結(jié)果R,即在研究人群P中,治療組I和對照組C的測量結(jié)果O的比較關(guān)系,有升高、降低和不變?nèi)N。

EBM-Net

717acc3e-34d3-11eb-a64d-12bb97331649.png

為了解決上述臨床試驗結(jié)果預(yù)測任務(wù),達(dá)摩院的團(tuán)隊提出了針對循證醫(yī)學(xué)的EBM-Net模型,其結(jié)構(gòu)如圖2所示,具體分為三步進(jìn)行:

首先,用啟發(fā)式方法收集隱式證據(jù);

然后,用隱式證據(jù)預(yù)訓(xùn)練比較語言模型;

最后,用預(yù)訓(xùn)練的模型進(jìn)行臨床試驗結(jié)果預(yù)測。

收集隱式證據(jù)

臨床證據(jù)常常以一種比較的形式表達(dá),如“瑞德西韋比對照組有更好的治療新冠肺炎的療效”,而找到這些證據(jù)就可以為我們提供訓(xùn)練文本。

研究團(tuán)隊發(fā)現(xiàn),PubMed和PubMed Central是一個提供生物醫(yī)學(xué)方面的論文搜尋以及摘要,文獻(xiàn)資源中就包含需要的證據(jù)文本(注:醫(yī)學(xué)領(lǐng)域最好的大規(guī)模語言模型BioBERT的訓(xùn)練數(shù)據(jù)即來自PubMed)。

這篇論文提出用關(guān)鍵詞匹配的方法,收集PubMed和PubMed Central中所有含有比較語義的句子:

為尋找表達(dá)升高和降低的語義,匹配含有“than”的句子,再進(jìn)一步匹配形容詞或副詞的比較級,如“higher”,“smaller”等,同時含有“than”和一個或更多比較級的句子被收集;為尋找表達(dá)相似的語義,匹配含有“no difference between”和“similar to”模式的句子。

這些句子被稱為隱式證據(jù),因為它們往往隱式地含有臨床證據(jù)所需要的PICO組分。他們還收集這些句子對應(yīng)的文章摘要里的背景和方法的部分,作為隱式證據(jù)的背景B。

這種方法可以從PubMed和PubMed Central中提取出1180萬條隱式證據(jù),其中240萬條表達(dá)結(jié)果降低,350萬條表達(dá)結(jié)果相似,590萬條表達(dá)結(jié)果升高。

預(yù)訓(xùn)練比較語言模型

將收集到的隱式證據(jù)中提示結(jié)果語義的詞去除,就構(gòu)造了一個類似語言模型訓(xùn)練的問題,通過給定上下文信息,預(yù)測去除的比較詞。

論文中改進(jìn)語言模型,提出用比較語言模型預(yù)訓(xùn)練一個Transformer編碼器模型,即EBM-Net,以獲取預(yù)測臨床試驗結(jié)果的能力。具體地,兩組樣本被用于預(yù)訓(xùn)練:

1、用正序的隱式證據(jù)預(yù)測其結(jié)果;

2、用反序的隱式證據(jù)預(yù)測相反的結(jié)果。

加入反序的例子有利于模型學(xué)到治療組和對照組之間的比較,而不是語言模型里的共現(xiàn)關(guān)系。

臨床試驗結(jié)果預(yù)測

在微調(diào)和測試時,團(tuán)隊將一個新臨床試驗要研究的PICO要素拼接成E,將E和其研究背景B輸入到上述預(yù)訓(xùn)練好的EBM-Net模型中,輸出其預(yù)測的比較結(jié)果,從而預(yù)測臨床試驗的結(jié)果。

標(biāo)準(zhǔn)數(shù)據(jù)集的試驗結(jié)果

EBM-Net在臨床試驗結(jié)果預(yù)測任務(wù)的標(biāo)準(zhǔn)數(shù)據(jù)集Evidence Integration試驗結(jié)果如圖3所示:

71e5b760-34d3-11eb-a64d-12bb97331649.png

從結(jié)果中可以看出:

1、EBM-Net相比其他方法,包括隨機(jī)預(yù)測、詞袋+邏輯回歸、利用MeSH知識圖譜、信息檢索+閱讀理解模型以及目前生物醫(yī)學(xué)NLP領(lǐng)域的SOTA模型BioBERT,都有很大的提高:BioBERT作為最強(qiáng)的基線模型,也比EBM-Net低了10.7%的相對macro-F1和9.6%的準(zhǔn)確率;

2、EBM-Net相比其他方法在對抗攻擊下更魯棒:用|Δ||Δ|,即在對抗數(shù)據(jù)集上的accuracy的相對減少的值來衡量模型的魯棒性,|Δ||Δ|越大表示模型越易受攻擊。

BioBERT的|Δ||Δ|幾乎是EBM-Net的兩倍(5.1%比2.7%),說明EBM-Net遠(yuǎn)比BioBERT魯棒;

EBM-Net用于新冠肺炎相關(guān)臨床試驗

達(dá)摩院團(tuán)隊還基于COVID-evidence數(shù)據(jù)庫提取了截止5月12日前完成的22篇臨床試驗的結(jié)果,以本工作定義的臨床試驗結(jié)果預(yù)測的格式構(gòu)建了一個小型數(shù)據(jù)集。

達(dá)摩院團(tuán)隊提出的EBM-Net模型在該數(shù)據(jù)集上進(jìn)行留一法驗證得到的macro-F1和accuracy都遠(yuǎn)高于BioBERT,分別是45.5%比36.1%和59.1%比50.0%,再一次驗證了EBM-Net的有效性。

總結(jié)

為了優(yōu)化臨床試驗的設(shè)計過程,本文從NLP的角度定義了臨床試驗結(jié)果預(yù)測任務(wù),并且提出了一種基于大規(guī)模隱式證據(jù)預(yù)訓(xùn)練的EBM-Net模型來解決這個任務(wù)。

EBM-Net在標(biāo)準(zhǔn)數(shù)據(jù)集和新冠肺炎相關(guān)臨床試驗上都有較好的表現(xiàn),大幅超過生物醫(yī)學(xué)NLP的SOTA模型BioBERT。

未來,臨床試驗可以在EBM-Net等相關(guān)模型的協(xié)助下進(jìn)行設(shè)計:

當(dāng)我們固定了想要研究的疾病人群(P)和觀察指標(biāo)(O)后,可以固定以現(xiàn)有的標(biāo)準(zhǔn)治療為對照(C),遍歷每種可能的新型治療方式(I)以及其相關(guān)的背景介紹(B),用模型預(yù)測其成功的概率,優(yōu)先選取所有可能的治療方式中成功概率高的做臨床試驗。

當(dāng)然,模型在技術(shù)上還需要進(jìn)一步地提高才能更好地輔助臨床試驗設(shè)計。

后續(xù),我們可以把團(tuán)隊構(gòu)建的大規(guī)模醫(yī)學(xué)知識圖譜集成在模型中,使其擁有更準(zhǔn)確和魯棒的預(yù)測能力。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39806

    瀏覽量

    301479
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11322
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26202

原文標(biāo)題:劍指臨床試驗的設(shè)計難題!達(dá)摩院提出新模型EBM-Net,比最強(qiáng)基線模型準(zhǔn)確率高9.6%

文章出處:【微信號:IoT_talk,微信公眾號:醫(yī)健AI掘金志】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    后摩智能4篇論文入選人工智能ICLR 2026

    繼斬獲NeurIPS、ICCV、AAAI、ACMMM四大認(rèn)可后,后摩智能再傳捷報——4篇論文成功入選國際頂級人工智能會議ICLR 2026(International Conference
    的頭像 發(fā)表于 02-09 14:18 ?702次閱讀

    理想汽車12篇論文入選全球五大AI

    2025年三季度以來,理想汽車基座模型團(tuán)隊在國際頂級AI學(xué)術(shù)會議上取得重大突破,共有12篇高質(zhì)量研究論文入選AAAI、NeurIPS、EMNLP、ACM MM、ICCV五大。
    的頭像 發(fā)表于 11-21 14:44 ?762次閱讀
    理想汽車12篇論文入選全球五大<b class='flag-5'>AI</b><b class='flag-5'>頂</b><b class='flag-5'>會</b>

    云知聲論文入選自然語言處理EMNLP 2025

    近日,自然語言處理(NLP)領(lǐng)域國際權(quán)威會議 ——2025 年計算語言學(xué)與自然語言處理國際會議(EMNLP 2025)公布論文錄用結(jié)果,云知聲提交的《面向門診病歷生成的高質(zhì)量醫(yī)患對話合成技術(shù)
    的頭像 發(fā)表于 11-10 17:30 ?810次閱讀
    云知聲論文入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會</b><b class='flag-5'>EMNLP</b> 2025

    安霸亮相CPSE 2025安博

    為期四天的 “全球安防第一展”——CPSE 2025 安博順利落下帷幕。安霸以“AI 驅(qū)動,智影領(lǐng)航”為主題,攜幾大核心技術(shù)矩陣亮相安博
    的頭像 發(fā)表于 11-04 16:07 ?397次閱讀

    移柯通信亮相第二十屆安博

    2025年10月31日,備受矚目的第二十屆安博圓滿落下帷幕。作為通信技術(shù)領(lǐng)域的創(chuàng)新力量,移柯通信在展會上精彩亮相,以"鏈接為基,AI為核"
    的頭像 發(fā)表于 11-04 14:21 ?649次閱讀

    北斗智聯(lián)亮相2025中國汽車工程學(xué)會年會暨展覽

    10月24日,第三十二屆中國汽車工程學(xué)會年會暨展覽(SAECCE 2025)在重慶科學(xué)會堂圓滿落下帷幕。會議期間,北斗智聯(lián)科技有限公司(簡稱“北斗智聯(lián)”)戰(zhàn)略發(fā)展中心總經(jīng)理劉蕊磊、副總經(jīng)理黃勝
    的頭像 發(fā)表于 10-28 17:04 ?697次閱讀

    沐曦聯(lián)合香港科技大學(xué)登上AI

    近日,沐曦PDE-AI Solution團(tuán)隊與香港科技大學(xué)合作,在兩大人工智能頂級會議NeurIPS2025與EMNLP 2025上發(fā)表重要研究成果,涵蓋大語言模型(LLM)的多樣化解碼與高效訓(xùn)練優(yōu)化方向,展現(xiàn)了中國企業(yè)在AI
    的頭像 發(fā)表于 10-14 09:46 ?1487次閱讀

    升譜光電亮相2025中國光博

    9月12日,為期3日的第26屆中國國際光電博覽(CIOE中國光博)完美落下帷幕。
    的頭像 發(fā)表于 09-16 11:16 ?923次閱讀
    升譜光電亮相2025中國光博<b class='flag-5'>會</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    生物化學(xué)計算機(jī),它通過離子、分子間的相互作用來進(jìn)行復(fù)雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據(jù)研究,估算出大腦的功率是20W,在進(jìn)行智力活動時,其功率增大到25~50W。在大腦進(jìn)化
    發(fā)表于 09-06 19:12

    輕量化AI+AR顯示設(shè)備的新變局拉開帷幕

    在智能穿戴設(shè)備行業(yè)的激烈競爭中,每一次產(chǎn)品的推出與戰(zhàn)略的調(diào)整都如同投入湖面的巨石,激起層層漣漪。蘋果公司,這位科技領(lǐng)域的巨頭,其一舉一動都備受全球矚目。近期,蘋果公司在AI+AR顯示設(shè)備領(lǐng)域的發(fā)展態(tài)勢發(fā)生了微妙的變化,一場關(guān)于輕
    的頭像 發(fā)表于 08-19 11:19 ?1124次閱讀

    小鵬汽車在全球AI會展示下一代自動駕駛模型

    此前,北京時間6月11-14日,計算機(jī)視覺CVPR 2025在美國田納西州納什維爾舉行,小鵬汽車受邀參與自動駕駛研討CVPR WAD(Workshop on Autonomous
    的頭像 發(fā)表于 06-23 09:13 ?1161次閱讀

    湖北移動攜手華為打造AI WAN SPN智慧教育專網(wǎng)

    2025年全國高考正式落下帷幕,湖北移動聯(lián)合華為等合作伙伴依托AI WAN SPN(Slicing Packet Network,切片分組網(wǎng))打造智慧教育專網(wǎng),以“云網(wǎng)智能一體化”為特征的SPN教育專網(wǎng),為湖北高考提供
    的頭像 發(fā)表于 06-14 11:02 ?1124次閱讀

    酷芯微電子亮相2025深圳國際無人機(jī)展覽

    近日,2025國際低空經(jīng)濟(jì)與無人系統(tǒng)博覽暨第十屆深圳國際無人機(jī)展覽圓滿落下帷幕。作為無人機(jī)領(lǐng)域的年度盛會,本次展會匯聚產(chǎn)業(yè)鏈上下游,聚焦
    的頭像 發(fā)表于 05-30 16:00 ?1173次閱讀

    后摩智能四篇論文入選三大國際

    2025 年上半年,繼年初被 AAAI、ICLR、DAC 三大國際會收錄 5 篇論文后,后摩智能近期又有 4 篇論文入選CVPR、ICML、ACL三大國際,面向大模型的編碼、量化、壓縮與微調(diào)等技術(shù)難題提出創(chuàng)新性解決方案,為
    的頭像 發(fā)表于 05-29 15:37 ?1338次閱讀

    華太電子亮相第十三屆儲能國際峰會暨展覽

    此前,2025年4月12日,第十三屆儲能國際峰會暨展覽(ESIE 2025)在北京落下帷幕。作為儲能技術(shù)創(chuàng)新的重要參與者,蘇州華太電子技術(shù)股份有限公司攜重磅系統(tǒng)級產(chǎn)品亮相A3館A339展位,以“芯片-模組-系統(tǒng)”三級驗證體系全
    的頭像 發(fā)表于 04-14 17:13 ?1521次閱讀