91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌語義文本最新進展 開源兩個新模型

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-23 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自然語言理解研究的快速發(fā)展,特別是在學習語義文本表示方面的發(fā)展可以促進一些新穎的產(chǎn)品,如自動寫作和“TalktoBooks”搜索等。本文介紹了谷歌在語義文本表示方面的最新進展,以及開源的兩個新模型。

基于神經(jīng)網(wǎng)絡的自然語言理解研究的快速發(fā)展,它還可以幫助提高數(shù)據(jù)量有限的各種自然語言任務的性能,比如基于僅有的幾百個標簽樣例來構(gòu)建強大的文本。

下面,我們將討論兩篇關(guān)于Google語義表示最新進展的論文,以及在TensorFlow Hub上可以下載使用的兩個新模型,我們希望開發(fā)者能夠使用這些模型來構(gòu)建新的、令人興奮的應用程序。

語義文本相似度

在“從對話中學習語義文本相似性(Learning Semantic Textual Similarity from Conversations)”這篇論文中,我們引入了一種新的方法來學習語義文本相似性的句子表示?;诘南敕ㄊ牵喝绻渥佑邢嗨频姆磻植?,那么它們在語義上是相似的。例如,“你多大了?”和“你的年齡是多少?”這兩個問題都是關(guān)于年齡的問題,可以用類似的回答作為響應,比如“我20歲”。相比之下,“你好嗎?”和“你多大了?”"包含幾乎相同的單詞,它們有非常不同的含義并會對應不同的響應。

在這項工作中,我們的目標是通過一種響應式的分類任務來學習語義相似性,具體方法如下:給定一個對話輸入,我們希望從一組隨機選擇的響應中對正確的響應進行分類。但是,最終的目標是學習一種能夠返回表示各種自然語言關(guān)系編碼的模型,包括相似性和關(guān)聯(lián)性。通過添加另一個預測任務(在本例中是SNLI entailment數(shù)據(jù)集),并通過共享編碼層強制執(zhí)行,我們在相似度量方面獲得了更好的性能,相似度的衡量指標有很多,例如用于句子相似性基準性度量的STSBenchmark和用于衡量一個問題/問題相似任務的CQA task B指標。這是因為邏輯推理與簡單的等價性有很大的不同,并且為學習復雜的語義表示提供了更多的借鑒意義。

通用句子編碼器

在“通用句子編碼器(Universal Sentence Encoder)”中,我們引入了一個模型,它對上面描述的多任務訓練進行了擴展,并增加了更多的任務,并使用一個類似于skip-thought的模型來訓練它們,它可以在給定的文本范圍內(nèi)來預測句子。

然而,最初的skip-thought模型,是一種只使用編碼器的體系結(jié)構(gòu),而非在最初的skip-thought模型中使用編碼-解碼體系結(jié)構(gòu)來驅(qū)動預測任務的模型。通過這種方式可以大大減少訓練時間,同時保留各種傳遞任務的性能,包括情感和語義相似的關(guān)系。其目的是提供一個單一的編碼器,它可以支持盡可能廣泛的應用程序,包括解釋檢測、關(guān)聯(lián)、集群和自定義文本分類。

正如我們的論文中所描述的,通用句子編碼器模型的一個版本使用了一個深度平均網(wǎng)絡(DAN)編碼器,而第二個版本使用了更復雜的自我參與的網(wǎng)絡架構(gòu):變壓器(Transformer)。

基于更復雜的體系結(jié)構(gòu)的模型比簡單的DAN模型在各種情緒和相似的處理任務上表現(xiàn)得更好,而對于短句來說它只是反應的稍微慢一些。然而,隨著句子長度的增加,使用Transformer的模型的計算時間會顯著增加,而DAN模型的計算時間則保持不變。

新模型

除了上面描述的通用句子編碼器模型之外,我們還在TensorFlow Hub上共享兩個新模型:通用句子編碼器-large版(Universal Sentence Encoder - Large)和通用句子編碼器-Lite版(Universal Sentence Encoder - Lite)。這些都是預先訓練的張量模型,它的返回值是可變長度文本輸入的語義編碼。這些編碼可用于語義相似度測量、相似性關(guān)系檢測、分類或自然語言文本的聚類。

在我們的第二篇論文中描述了這個Large模型。它針對需要高精度語義表示的場景,以及以速度和大小為代價的最佳模型性能。

Lite模型是通過一個句子的詞匯表而不是單詞來訓練的,這樣就可以減少詞匯的大小,這是模型大小的主要貢獻者。它針對的是內(nèi)存和CPU等資源有限的場景,比如基于設備或基于瀏覽器實現(xiàn)。

我們很高興能與社區(qū)分享這項研究,以及這些模型。我們認為,我們在這里展示的只是一個開始,還有一些重要的研究問題需要解決,比如將技術(shù)擴展到更多的語言之上(上面討論的模型目前支持英語)。我們還希望進一步開發(fā)這種技術(shù),使它能夠理解段落甚至文檔級別的文本。在完成這些任務的過程中,有可能制造出真正“通用”的編碼器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3974

    瀏覽量

    142921
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4244

    瀏覽量

    46282

原文標題:谷歌語義文本最新進展+兩個開源新模型

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA全新開放物理AI模型和框架加速人形機器人開發(fā)

    本文是洞悉 Omniverse 系列文章?!岸聪?Omniverse”重點介紹開發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進展從根本上變革他們的工作流程。
    的頭像 發(fā)表于 02-06 15:36 ?604次閱讀

    國芯科技DPNPU新IP產(chǎn)品最新進展,單核支持0.5~4.8TOPS靈活算力配置

    國芯科技DPNPU新IP產(chǎn)品 最新進展,單核支持0.5~4.8TOPS 靈活算力配置 ? 電子發(fā)燒友網(wǎng)綜合報道 國芯科技發(fā)布公告稱,其自主研發(fā)的神經(jīng)網(wǎng)絡處理器DPNPU(Dataflow
    的頭像 發(fā)表于 01-09 09:19 ?5309次閱讀
    國芯科技DPNPU新IP產(chǎn)品<b class='flag-5'>最新進展</b>,單核支持0.5~4.8TOPS靈活算力配置

    從協(xié)議到實踐——EtherNet/IP與NetStaX的最新進展

    從協(xié)議到實踐——EtherNet/IP與NetStaX的最新進展
    的頭像 發(fā)表于 12-19 15:26 ?1565次閱讀
    從協(xié)議到實踐——EtherNet/IP與NetStaX的<b class='flag-5'>最新進展</b>

    開源鴻蒙生態(tài)設備南向分論壇成功舉辦

    11月28日,開源鴻蒙生態(tài)設備南向分論壇在深圳舉辦,聚焦開源鴻蒙設備端發(fā)展與生態(tài)共建的最新進展。論壇邀請來自開源鴻蒙社區(qū)的多位核心技術(shù)負責人,共同探討
    的頭像 發(fā)表于 12-04 16:57 ?1004次閱讀

    以開發(fā)者為核心驅(qū)動開源項目邁向成熟

    11月21-22日,以“一切為了開發(fā)者——AI共智·開源共享”為主題的2025開放原子開源開發(fā)者大會在北京成功舉辦。大會聚焦人工智能、基礎(chǔ)軟件等重點方向,來自產(chǎn)業(yè)界、高校、科研機構(gòu)和開源社區(qū)的開發(fā)者齊聚一堂,系統(tǒng)展示我國
    的頭像 發(fā)表于 12-04 10:09 ?717次閱讀

    芯科科技分享在物聯(lián)網(wǎng)領(lǐng)域的最新進展

    Labs(芯科科技)亞太區(qū)業(yè)務副總裁王祿銘、中國大陸區(qū)總經(jīng)理周巍及臺灣區(qū)總經(jīng)理寶陸格就公司技術(shù)路線、產(chǎn)品策略及市場趨勢回答了媒體提問。三位高管圍繞安全認證、無線連接、邊緣計算等議題,介紹了公司在物聯(lián)網(wǎng)領(lǐng)域的最新進展
    的頭像 發(fā)表于 11-13 10:48 ?1741次閱讀

    DisplayPort汽車擴展標準新進展,顯示系統(tǒng)靈活性和效率大幅提升

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年10月27日,VESA(視頻電子標準協(xié)會)在深圳益田威斯汀酒店舉辦新聞發(fā)布會,詳細介紹了DisplayPort汽車擴展標準(DP AE)的最新進展,同時分享了
    的頭像 發(fā)表于 11-08 10:43 ?1.1w次閱讀
    DisplayPort汽車擴展標準<b class='flag-5'>新進展</b>,顯示系統(tǒng)靈活性和效率大幅提升

    上海光機所在激光驅(qū)動離子加速方面取得新進展

    圖1 實驗原理示意圖 近期,中國科學院上海光學精密機械研究所超強激光科學與技術(shù)全國重點實驗室賓建輝研究員團隊在激光驅(qū)動離子加速方面取得新進展。相關(guān)研究成果分別以“Enhanced proton
    的頭像 發(fā)表于 08-06 09:36 ?660次閱讀
    上海光機所在激光驅(qū)動離子加速方面取得<b class='flag-5'>新進展</b>

    使用NVIDIA Cosmos模型提高未來智能汽車安全性

    本文是洞悉 Omniverse 系列文章?!岸聪?Omniverse” 重點介紹開發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進展深入改變他們的工作流。
    的頭像 發(fā)表于 07-14 11:46 ?1218次閱讀

    東風汽車轉(zhuǎn)型突破取得新進展

    上半年,東風汽車堅定高質(zhì)量發(fā)展步伐,整體銷量逐月回升,經(jīng)營質(zhì)量持續(xù)改善,自主品牌和新能源滲透率和收益性進一步提升,半年累計終端銷售汽車111.6萬輛,轉(zhuǎn)型突破取得新進展。
    的頭像 發(fā)表于 07-10 15:29 ?948次閱讀

    開源鴻蒙硬件生態(tài)分論壇圓滿舉辦

    近日,開源鴻蒙開發(fā)者大會2025(OHDC.2025)硬件生態(tài)分論壇在深圳圓滿舉辦。本次論壇主題為“開源鴻蒙硬件新生態(tài)”,特邀行業(yè)技術(shù)領(lǐng)袖、專家、開發(fā)者和生態(tài)伙伴,從芯片平臺、硬件開發(fā)板、硬件產(chǎn)品等方面,共同探討開源鴻蒙硬件生態(tài)
    的頭像 發(fā)表于 06-05 15:35 ?1086次閱讀

    英特爾持續(xù)推進核心制程和先進封裝技術(shù)創(chuàng)新,分享最新進展

    近日,在2025英特爾代工大會上,英特爾展示了多代核心制程和先進封裝技術(shù)的最新進展,這些突破不僅體現(xiàn)了英特爾在技術(shù)開發(fā)領(lǐng)域的持續(xù)創(chuàng)新,也面向客戶需求提供了更高效、更靈活的解決方案。 在制程技術(shù)方面
    的頭像 發(fā)表于 05-09 11:42 ?902次閱讀
    英特爾持續(xù)推進核心制程和先進封裝技術(shù)創(chuàng)新,分享<b class='flag-5'>最新進展</b>

    百度在AI領(lǐng)域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進展。
    的頭像 發(fā)表于 04-30 10:14 ?1383次閱讀

    谷歌Gemini API最新進展

    體驗的 Live API 的最新進展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1738次閱讀

    華為公布AI基礎(chǔ)設施架構(gòu)突破性新進展

    近日,華為公司常務董事、華為云計算CEO張平安在華為云生態(tài)大會2025上公布了AI基礎(chǔ)設施架構(gòu)突破性新進展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?2006次閱讀