91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NLP最難“考卷”成績出爐:追一科技超越Facebook躍居第二

科訊視點 ? 2020-01-16 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自然語言處理領域權威數據集SuperGLUE最新榜單排名更新。Google預訓練模型T5保持第一,中國AI創(chuàng)業(yè)公司追一科技AI Lab團隊超越Facebook AI,躍居榜單第二。值得注意的是,相比谷歌T5等超大規(guī)模研究型模型,追一此次登榜的RoBERTa-mtl-adv模型在商業(yè)化能力也非常強勁,相關技術已經落地到追一科技的AI數字員工產品線上,持續(xù)賦能銀行、保險、證券、零售、地產、能源,教育,互聯網等多個行業(yè)。

圖片1.jpg

追一科技躍居SuperGLUE測試榜第二

SuperGLUE(Super General Language Understanding Evaluation)是當下NLP領域難度最大,權威性最高,含金量最足的測評標準之一,由紐約大學、華盛頓大學以及谷歌旗下的DeepMind聯合Facebook作為主要發(fā)起人推出,最大程度涵蓋了現實生活中可能遇到的不同類型的NLP任務,旨在更真實地反映當前最前沿的NLP技術可以達到的認知智能水平。

追一科技在為企業(yè)提供智能交互服務的過程中,技術和應用互相驅動,將實際商業(yè)化應用中總結出的多任務學習、對抗訓練、知識蒸餾等技術手段和經驗融入到參賽模型中,并在SuperGLUE測評數據集上拿到第二的成績。

除去作為參照的人類水平,目前排名榜單第一的是Google的T5模型。從學術研究看,T5模型達到了目前“實驗室智能”的最好水平,但如果考慮商用,T5需要耗費大量的算力,且模型自身體積過于龐大,目前還不能落地到實際業(yè)務場景中,缺少實際的商業(yè)應用價值。

而追一科技通過多任務學習、對抗訓練以及知識蒸餾的方式,使得RoBERTa-mtl-adv模型大小合理,效果僅次于Google的T5。同時,相關技術也落地到了追一科技AI數字員工的產品線上。就SuperGLUE排名而言,可以說追一科技的RoBERTa-mtl-adv模型在目前全球具有實際落地能力的NLP模型中效果最好,排名最高。

“學霸”模型的商業(yè)化能力

SuperGLUE測試項目并非是“花拳繡腿”,而是實實在在考驗模型通用能力的“鐵人三項”;參加SuperGLUE也并非只是為了刷新評分,更重要的是檢驗當前技術能否很好地落地到實際應用場景中去。

SuperGLUE覆蓋了問答、推斷、語義理解、常識判斷等自然語言理解維度,是人機智能交互過程中的核心環(huán)節(jié),在具體的業(yè)務場景中都有很重要的應用價值。追一科技此次參賽模型的相關NLP技術已經被成熟運用于到自主研發(fā)的全套AI數字員工產品線上,廣泛服務于銀行、保險、泛互聯網、地產、政企等多個行業(yè)的標桿客戶。例如,在追一科技的智能在線機器人Bot中就融入了多輪問答技術、語義檢索、機器閱讀理解技術等NLP技術,能準確識別用戶意圖,滿足用戶需求。

口說無憑,接下來就結合SuperGLUE中的任務與Bot的具體案例,一探虛實。

單/多輪問答技術是指機器人和用戶之間一問一答,實現多輪對話的過程。例如下面這個智能在線機器人Bot服務餐飲行業(yè)的場景:

智能在線機器人Bot不僅可以從對話中準確識別出地點,人數等信息,還能進一步追問用戶未給出的“用餐時間”的信息,滿足客戶的需求。而傳統(tǒng)的客服機器人并不會對未給出的潛在信息做出反應。

機器閱讀理解技術在于機器人去“用力”理解文檔中內容的意思,從而根據用戶需求輸出相應的結果。例如在金融保險領域會涉及到大量保險業(yè)務文檔的修訂、新增等情況。在面對客戶時,即使是富有經驗的客戶經理,往往也很難迅速結合所有新增的文檔內容進行有效回答。這時,定制了閱讀理解技術的智能在線機器人Bot就又可以發(fā)揮作用了——可以實時幫助業(yè)務人員,針對相關問題從新文檔中提取出答案,解決問題,降低出錯的概率。

自然語言推斷任務中“文本蘊含”是常出現的形式,在實際用語中非常的普遍,參考下面這個銀行領域的例子:

因為白金信用卡屬于信用卡,因此“我的白金信用卡需要掛失”蘊含在“我的信用卡需要掛失”中,因此,智能在線機器人Bot 在回答用戶時只需準確指引用戶如何掛失信用卡即可。

指代消解在人的交流過程中非常常見,在表達中適當地使用指代會讓表達更加簡練卻不影響本意的闡述。如下面這個出行領域的例子:

智能在線機器人Bot理解了客戶問句里的“上次”其實指代的是“上次中途取消訂單”,所以立馬給出了正確回復。

然而,最難為機器人的是常識推斷,對語言的理解離不開對常識的掌握。舉這么一個例子:

圖片5.jpg

機器人需要具備“影子是由太陽升起照射留下的”這樣的常識性推斷,才能正確的選擇答案。對于人來說,這些常識很簡單,但是對于機器來說,大量的這種常識知識都潛藏在我們意識的深處,AI系統(tǒng)的研究者幾乎不可能把所有這樣的常識都總結出來,并灌入到系統(tǒng)中,所以機器人在該數據集的表現往往不盡如人意。

落地到現實場景中,比如我們可以對智能在線機器人Bot說“我銀行卡弄丟了”,Bot就會詢問你是否需要掛失。因為它具備了“弄丟銀行卡需要掛失”這樣的業(yè)務常識。

可以看到,真實的交互場景中模型需要對語言的不同維度都具有理解能力才能完全正常流暢的對話。而上述的幾個例子中的問題形式都很好地包含在了SuperGLUE的不同數據集中,因此,此次追一科技在SuperGLUE測評指標上獲得的成績,不僅是對其RoBERTa-mtl-adv模型在理解自然語言技術上的一個肯定,還驗證了“技術驅動應用,應用導向技術”策略的可行性,更加堅定了追一科技繼續(xù)深耕技術,持續(xù)用AI賦能百業(yè)的信念。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31084

    瀏覽量

    222317
  • 智能機器人
    +關注

    關注

    17

    文章

    920

    瀏覽量

    85812
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中國中車2025年新能源客車銷量位居行業(yè)第二

    近日,中國客車信息網2025年新能源客車銷量排行榜正式出爐,中國中車位居行業(yè)第二!
    的頭像 發(fā)表于 01-15 16:31 ?831次閱讀

    冰零榮獲DEKRA德凱ISO 26262 ASIL-D認證

    近日,冰零智能科技(常州)有限公司(簡稱:冰零)順利通過ISO 26262:2018汽車功能安全標準ASIL-D等級認證,并獲得由DEKRA德凱頒發(fā)的功能安全流程認證證書。冰零
    的頭像 發(fā)表于 11-14 12:44 ?1729次閱讀

    四維圖新旗下六分榮獲安永復旦最具潛力企業(yè)獎

    9月26日,以“無限可能·智能具身拓未來”為主題的“安永復旦最具潛力企業(yè)”2025評選活動在上海揭榜。四維圖新成員企業(yè)六分以高質量、可持續(xù)增長的出色表現,摘得“最具潛力企業(yè)獎”榮譽。六分
    的頭像 發(fā)表于 09-29 17:04 ?1054次閱讀

    曾被小米投資、特斯拉起訴,清華博士的傳感器初創(chuàng)企業(yè)冰零再獲融資

    近日,冰零智能科技(常州)有限公司(下文簡稱“冰零”)宣布完成A輪融資,融資金額暫未披露,本輪投資方為國元創(chuàng)新投。 此次融資將進步推動冰零
    的頭像 發(fā)表于 09-25 19:25 ?2101次閱讀
    曾被小米投資、特斯拉起訴,清華博士的傳感器初創(chuàng)企業(yè)冰零<b class='flag-5'>科</b><b class='flag-5'>技</b>再獲融資

    全球半導體變天!中國反超韓國位居全球第二

    近日,韓國科學技術評估與規(guī)劃研究院前瞻技術中心(KISTEP)發(fā)布的《全球半導體技術競爭力評估報告》引發(fā)行業(yè)廣泛關注。報告顯示,中國半導體技術已超越韓國,躍居全球第二,僅次于美國,這
    的頭像 發(fā)表于 09-01 17:30 ?1886次閱讀

    【作品合集】微五CF5010RBT60開發(fā)板測評

    :jf_69121293【微五CF5010RBT60開發(fā)板試用體驗】硬件IIC點亮OLED小屏幕 第二期合集: 創(chuàng)龍科技TLT113/TL3562-MiniEVM開發(fā)板測評作品合集 第三期合集: 嘉楠
    發(fā)表于 09-01 14:48

    【微五CF5010RBT60開發(fā)板試用體驗】硬件IIC點亮OLED小屏幕

    微五 CF5010RBT60 測評:硬件 IIC 驅動 OLED 的流暢體驗 作為款基于高性能 RISC-V 內核 (CF5010RBT60, 160MHz) 的開發(fā)板,微五
    發(fā)表于 08-08 11:01

    【微五CF5010RBT60開發(fā)板試用體驗】串口輸出測試

    立研發(fā)只會受制于人?。。?這期來講解串口通信,微五CF5010RBT60開發(fā)板上有個調試串口,按照原理圖接線可知,是連接的PC10口,因為使用的是TTL電平,所以只需要連接串口工具上的TX皆可,
    發(fā)表于 07-22 16:52

    【微五CF5010RBT60開發(fā)板試用體驗】創(chuàng)建開發(fā)環(huán)境點燈操作

    很高興收到了微五CF5010RBT60開發(fā)板,拿到板子有端時間了,之前移植卡在開發(fā)環(huán)境上無法有效的建立和JTAG的通信上,導致沒有寫測評帖子,今天搞定了這個問題,現在就可以開始寫測評帖子了
    發(fā)表于 07-22 16:16

    【微五CF5010RBT60開發(fā)板試用體驗】開箱評測與環(huán)境搭建

    、開箱評測(1)產品介紹 微五CF5010RBT60,采用最新代RISC-V高效率的精簡指令架構,寬溫域32位通用MCU芯片,內部集成
    發(fā)表于 07-01 16:17

    【微五CF5010RBT60開發(fā)板試用體驗】開箱曬圖

    引出了JTAG調試接口。雙排排針引出了所有IO。 BOOT0 與BOOT1 分別引出,在板子背面直接印刷上了啟動配置說明非常便于使用。 微五(ChinaFive)成立于2019年,是家半導體
    發(fā)表于 06-25 11:06

    中微公司亮相2025金融與產業(yè)創(chuàng)新大會

    近日,由上海市普陀區(qū)人民政府、中國證券報等機構聯合主辦的“2025金融與產業(yè)創(chuàng)新大會”在上海普陀區(qū)隆重舉行。中微半導體設備(上海)股份有限公司(以下簡稱“中微公司”,股票代碼:688012
    的頭像 發(fā)表于 06-17 11:32 ?1099次閱讀

    六分攜手瑞聲科技推動高精定位產業(yè)跨越式發(fā)展

    近日,四維圖新成員企業(yè)六分與瑞聲科技全面戰(zhàn)略合作簽約儀式在武漢舉行。六分CEO李陽、瑞聲科技半導體及傳感器事業(yè)部總經理吳志江分別代表雙方簽約。簽約儀式后,六分
    的頭像 發(fā)表于 05-27 17:08 ?930次閱讀

    瑞聲科技與六分達成全面戰(zhàn)略合作

    近日,瑞聲科技集團半導體及傳感器事業(yè)部(以下簡稱瑞聲科技)總經理吳志江先生與北京六分有限公司(以下簡稱六分)首席執(zhí)行官李陽先生在武漢瑞聲科技生產制造中心
    的頭像 發(fā)表于 05-26 17:26 ?1185次閱讀

    Nullmax邀您相約2025中國汽車智能化創(chuàng)新峰會

    2025年4月26日,2025中國汽車智能化創(chuàng)新峰會將在第二十一屆上海國際汽車工業(yè)展覽會(簡稱2025上海車展)同期舉行。中國汽車智能化創(chuàng)新峰會是智一科聚焦汽車智能化打造的產業(yè)峰會IP,已成功舉辦三屆,最近兩屆均是在上海車展同
    的頭像 發(fā)表于 04-25 15:42 ?765次閱讀