91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,科技公司谷歌和微軟相繼在一份權(quán)威自然語言理解榜單中超越人類的表現(xiàn),微軟宣稱這“標(biāo)志著邁向通用人工智能的重要里程碑?!?/p>

自然語言理解(Natural Language Understanding,簡稱NLU)任務(wù)在人工智能領(lǐng)域歷史悠久,被譽(yù)為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實(shí)現(xiàn)高質(zhì)量的自然語言理解有相當(dāng)?shù)碾y度。

為了衡量人工智能模型的自然語言理解能力,紐約大學(xué)、華盛頓大學(xué)、Facebook和DeepMind在2019年合作提出一個(gè)名為SuperGLUE的人工智能基準(zhǔn)測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務(wù)難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準(zhǔn)線(human baseline)。這是人工智能首次在SuperGLUE中表現(xiàn)超越人類。

盡管在SuperGLUE測試上取得令人滿意的結(jié)果,但微軟坦言,DeBERTa模型還沒有達(dá)到人類智能的自然語言理解水平。人類非常善于利用從不同任務(wù)中學(xué)到的知識來解決新的任務(wù),這是AI模型需要學(xué)習(xí)的地方。

排名第一的微軟模型DeBERTa共有15億個(gè)參數(shù)。在SuperGLUE測試中,單個(gè)DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(xiàn)(89.8分);模型整體得分(90.3分)也超過人類基準(zhǔn)線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準(zhǔn)線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個(gè)孩子對疾病產(chǎn)生了免疫力”,問“這是由什么導(dǎo)致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個(gè)簡單的因果推理任務(wù),人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰(zhàn)。為了得出正確答案,模型需要理解已知條件和選項(xiàng)之間的因果關(guān)系。

2021年1月6日,微軟在博客發(fā)文詳細(xì)介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個(gè)基于Transformer架構(gòu)的神經(jīng)語言模型,采用自監(jiān)督學(xué)習(xí)方法對大量原始文本語料庫進(jìn)行預(yù)訓(xùn)練。DeBERTa的目標(biāo)是學(xué)習(xí)通用的語言表達(dá)形式,適用于各種自然語言理解任務(wù)。DeBERTa主要用到三種新技術(shù),分別是分離注意力機(jī)制、增強(qiáng)的掩碼解碼器和用于微調(diào)的虛擬對抗訓(xùn)練方法。

排名第二的T5+Meena技術(shù)來自谷歌。谷歌團(tuán)隊(duì)尚未詳細(xì)解釋其模型在SuperGLUE創(chuàng)紀(jì)錄的原因。但微軟在博客文章中評價(jià)稱,谷歌的T5模型由110億個(gè)參數(shù)組成,相比之下,15億參數(shù)的DeBERTa在訓(xùn)練和維護(hù)上更加節(jié)能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準(zhǔn)備向公眾公開15億參數(shù)的DeBERTa模型及其源代碼。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6741

    瀏覽量

    107864
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265427
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13989
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型 ai coding 比較

    第三方裁判更客觀 樣本量說明:當(dāng)前樣本量30題,統(tǒng)計(jì)意義有限,建議后續(xù)擴(kuò)大到100+題 數(shù)據(jù)污染風(fēng)險(xiǎn):評估經(jīng)典題目被模型訓(xùn)練集見過的可能性 6. 環(huán)境一致性維度 所有模型完全相同的環(huán)境下測試
    發(fā)表于 02-19 13:43

    嵌入式軟件單元測試AI自動(dòng)化與人工檢查的協(xié)同機(jī)制研究:基于專業(yè)工具的實(shí)證分析

    提升效率與覆蓋率方面的優(yōu)勢。通過實(shí)證案例與工業(yè)實(shí)踐數(shù)據(jù),論證即使AI高度介入的測試流程,人工檢查在測試用例設(shè)計(jì)、異常語義判斷、邊界條件推
    發(fā)表于 12-31 11:22

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    ?電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)泰凌微近日表示,公司與谷歌智能家居、音頻等多個(gè)領(lǐng)域開展具體項(xiàng)目合作。其與谷歌已從單一的遙控器芯片供應(yīng),發(fā)展為涵蓋音頻、智能家居、端側(cè)AI等多領(lǐng)域的深度
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實(shí)現(xiàn)任何創(chuàng)意。Gemini 3 Pro 基于最先進(jìn)的推理技術(shù),與之前的版本相比,它在所有主要的 AI 基準(zhǔn)測試中都取得了無與倫比的結(jié)果,尤其是在編程方
    的頭像 發(fā)表于 11-24 11:10 ?1225次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新Gemini 3 <b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    微軟最新AI技術(shù)數(shù)據(jù)中心即將啟用

    微軟美國威斯康星州 Mount Pleasant 建設(shè)的最新AI技術(shù)數(shù)據(jù)中心即將投入使用,預(yù)計(jì) 2026 年初正式啟用。第二座同規(guī)模中心也規(guī)劃
    的頭像 發(fā)表于 11-05 16:37 ?926次閱讀

    谷歌AlphaEarth和維智時(shí)空AI模型的核心差異

    谷歌AlphaEarth和維智時(shí)空AI模型技術(shù)理念上存在諸多共性,但兩者目標(biāo)尺度、數(shù)據(jù)來源、技術(shù)實(shí)現(xiàn)和應(yīng)用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?886次閱讀

    谷歌AlphaEarth和維智時(shí)空AI模型的技術(shù)路徑

    谷歌AlphaEarth和維智時(shí)空AI模型應(yīng)用場景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?913次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實(shí)世界的知識整合。 3、測試時(shí)計(jì)算 測試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來提升泛化性能。 4、具身智能與滲透式
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    流體芯片 ⑤AI計(jì)算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個(gè)跨學(xué)科、全面性覆蓋的知識庫和科學(xué)基礎(chǔ)模型 ②需要解決信息不準(zhǔn)確和認(rèn)知偏差問題
    發(fā)表于 09-17 11:45

    谷歌AI模型點(diǎn)亮開發(fā)無限可能

    2025 年的 Google 谷歌開發(fā)者大會(huì)上,AI 不是一門“技術(shù)”,更是一股徹底改變開發(fā)范式的“力量”,助力開發(fā)者們海外市場更上一層樓。A
    的頭像 發(fā)表于 08-29 09:29 ?1141次閱讀

    K230,如何使用AI Demo的object_detect_yolov8n,YOLOV8多目標(biāo)檢測模型?

    K230的AI開發(fā)教程文檔,可以看到有源碼的AI Demo,其中包括yolov8n模型,
    發(fā)表于 08-07 06:48

    微軟推出多項(xiàng)革新性AI工具

    今年Microsoft Build大會(huì)上,微軟推出了多項(xiàng)革新性Al工具:智能Microsoft 365 Copilot副駕駛Tuning支持企業(yè)通過低代碼方式,結(jié)合自有數(shù)據(jù)與業(yè)務(wù)邏輯定制高精度AI
    的頭像 發(fā)表于 05-26 09:47 ?1159次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    PIX GP模型的整合,并且針對模型進(jìn)行全鏈路微秒級分析,以確保最佳的端到端性能表現(xiàn)。雙方的整個(gè)合作流程,開發(fā)效率提升了30%。 天璣AI
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3730次閱讀