91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用算法開(kāi)發(fā)了一種新的自然語(yǔ)言生成解碼方式

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:夕小瑤的賣萌屋 ? 作者:Yimin_飯煲 ? 2022-08-02 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

相信大多數(shù)學(xué)習(xí)過(guò)人工智能課程的讀者,當(dāng)聽(tīng)到算法的時(shí)候,都會(huì)有一種既熟悉又陌生的感覺(jué)。說(shuō)算法熟悉,是因?yàn)橐宦?tīng)到這個(gè)算法,就想起那本厚厚的《人工智能——一種現(xiàn)代的方法》,想起這個(gè)算法似乎是人工智能課程考試的重點(diǎn);說(shuō)算法陌生,是因?yàn)榇蠹椰F(xiàn)在在從事人工智能相關(guān)的研究和開(kāi)發(fā)工作時(shí),似乎又很少用到這個(gè)算法,大部分時(shí)間都花在了研究數(shù)據(jù)處理和處理實(shí)驗(yàn)設(shè)置上面。而在NAACL2022上,一群來(lái)自AI2的自然語(yǔ)言處理研究者們利用算法開(kāi)發(fā)了一種新的自然語(yǔ)言生成解碼方式,還被授予了NAACL2022 Best New Method paper??雌饋?lái)已經(jīng)過(guò)時(shí)的A*算法,居然能在深度學(xué)習(xí)時(shí)代有如此的妙用,看完這篇論文,筆者情不自禁地打開(kāi)了《人工智能——一種現(xiàn)代的方法》,想看看還有什么經(jīng)典算法可以深挖一下!

論文標(biāo)題:
NEUROLOGIC A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

論文鏈接:
https://arxiv.org/pdf/2112.08726.pdf

問(wèn)題背景

自然語(yǔ)言生成任務(wù)一般指給定一個(gè)輸入序列,生成一個(gè)輸出序列。目的是解出使得目標(biāo)函數(shù)最大化的序列,其中, , 而衡量對(duì)約束條件的滿足。傳統(tǒng)的Beam Search不考慮全局的最優(yōu),而是最優(yōu)化當(dāng)前步驟添加的Token.

為了達(dá)到全局最優(yōu)的效果,需要滿足如下的優(yōu)化目標(biāo)

主要方法

前向啟發(fā)算法

直接優(yōu)化全局最優(yōu)目標(biāo)面臨著搜索空間過(guò)大的問(wèn)題。而A算法可以被用來(lái)解決這個(gè)搜索問(wèn)題。A算法是一個(gè)最優(yōu)優(yōu)先的搜索算法,可以解決這樣形式的搜索問(wèn)題:

其中是迄今為止的分?jǐn)?shù),是對(duì)于未來(lái)分?jǐn)?shù)的啟發(fā)式估計(jì)。因此我們將優(yōu)化目標(biāo)修改為如下形式

同時(shí),需要限制前向搜索的長(zhǎng)度為,避免模型無(wú)限制地向前搜索

在前向生成的過(guò)程中有幾種不同的方法。方法只生成一個(gè)序列,從開(kāi)始,每次選擇概率最大的Token。方法采用插值的思想,混合方法和隨機(jī)選擇一個(gè)Token的概率分布。方法從開(kāi)始進(jìn)行步的Beam Search,選擇前個(gè)概率最大的序列, 而方法則是直接從按照概率進(jìn)行采樣。

無(wú)限制生成

在無(wú)限制生成的場(chǎng)景下,使用的優(yōu)化函數(shù)為

其中控制的是對(duì)未來(lái)估計(jì)的重視程度,類似于加權(quán)算法

受限制生成

在受限制生成任務(wù)上,作者們基于之前的工作NeuroLogic進(jìn)行改進(jìn)。首先我們簡(jiǎn)要介紹一下NeuroLogic方法。首先,將對(duì)生成文本的限制表示為合取范式。其中每一個(gè)表示一個(gè)限制條件,。NeuroLogic的優(yōu)化目標(biāo)可以寫為

其中遠(yuǎn)大于0,用來(lái)懲罰不滿足的約束。在每一步搜索時(shí),NeuroLogic利用如下的打分函數(shù)進(jìn)行計(jì)算

其中是約束條件的前綴,這個(gè)優(yōu)化函數(shù)的目標(biāo)是獎(jiǎng)勵(lì)那些滿足約束條件的樣本。接下來(lái),作者們加入了前向啟發(fā)函數(shù)

這樣的前向啟發(fā)函數(shù)有兩個(gè)好處,如果是滿足多Token約束的一個(gè)Token,前向啟發(fā)函數(shù)包含了全部約束的分?jǐn)?shù),如果不是約束的一部分,如果被選中,這一前向策略能考慮到未來(lái)約束的分?jǐn)?shù)。

實(shí)驗(yàn)結(jié)果

無(wú)限制生成

0b4c6ef6-118e-11ed-ba43-dac502259ad0.png

作者們?cè)诠适律扇蝿?wù)上開(kāi)展了實(shí)驗(yàn),可以發(fā)現(xiàn)提出的方法不論是在流暢性,豐富性還是人工評(píng)估上都有著很好的表現(xiàn)。

受限制生成

在受限制生成方面,作者們?cè)诔WR(shí)生成,機(jī)器翻譯,表格到文本生成,問(wèn)題生成等任務(wù)上開(kāi)展了實(shí)驗(yàn)。在這里展示常識(shí)生成方面的結(jié)果。這一任務(wù)的主要內(nèi)容是給定一系列概念,利用全部概念生成一個(gè)合理的句子.

0b65b0be-118e-11ed-ba43-dac502259ad0.png

可以發(fā)現(xiàn),作者們提出的方法在多個(gè)指標(biāo)上都明顯超越了基線模型,取得了很好的效果。

0b779a5e-118e-11ed-ba43-dac502259ad0.png

從文章中給出的例子來(lái)看,作者們提出的方法確實(shí)有著更好的生成效果。

結(jié)語(yǔ)

本文的方法實(shí)現(xiàn)并不復(fù)雜,所用到的原理和思想也是非常經(jīng)典的人工智能算法,但卻取得了非常不錯(cuò)的性能,一舉摘得了NAACL2022的最佳方法論文??磥?lái),好的研究并不是追逐熱點(diǎn),調(diào)參魔改結(jié)構(gòu)的增量式創(chuàng)新,而是打好數(shù)學(xué)基礎(chǔ),深入地思考研究問(wèn)題,廣泛接觸各個(gè)領(lǐng)域的算法,才能在發(fā)現(xiàn)領(lǐng)域的關(guān)鍵待解決問(wèn)題時(shí)取得成果~

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4786

    瀏覽量

    98271
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50174

    瀏覽量

    266093
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5600

    瀏覽量

    124495

原文標(biāo)題:NAACL最佳方法論文 | 課本上的A*搜索算法可以提升文本生成效果!

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自然語(yǔ)言處理NLP的概念和工作原理

    自然語(yǔ)言處理 (NLP) 是人工智能 (AI) 的個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書(shū)面形式的人類語(yǔ)言。自然語(yǔ)言處理將計(jì)算語(yǔ)言學(xué)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 01-29 14:01 ?483次閱讀
    <b class='flag-5'>自然語(yǔ)言</b>處理NLP的概念和工作原理

    8常用的CRC算法分享

    CRC 計(jì)算單元可按所選擇的算法和參數(shù)配置來(lái)生成數(shù)據(jù)流的 CRC 碼。有些應(yīng)用中,可利用 CRC 技術(shù)來(lái)驗(yàn)證數(shù)據(jù)的傳輸和存儲(chǔ)的完整性。 8 常用的 CRC
    發(fā)表于 11-13 07:25

    云知聲論文入選自然語(yǔ)言處理頂會(huì)EMNLP 2025

    近日,自然語(yǔ)言處理(NLP)領(lǐng)域國(guó)際權(quán)威會(huì)議 ——2025 年計(jì)算語(yǔ)言學(xué)與自然語(yǔ)言處理國(guó)際會(huì)議(EMNLP 2025)公布論文錄用結(jié)果,云知聲提交的《面向門診病歷生成的高質(zhì)量醫(yī)患對(duì)話合
    的頭像 發(fā)表于 11-10 17:30 ?851次閱讀
    云知聲論文入選<b class='flag-5'>自然語(yǔ)言</b>處理頂會(huì)EMNLP 2025

    不只有AI協(xié)作編程(Vibe Coding):生成式系統(tǒng)級(jí)芯片(GenSoC)將如何把生成式設(shè)計(jì)推向硬件層面

    但是否能將這種生成式的、目標(biāo)驅(qū)動(dòng)的方法從軟件層向下延伸呢?這理念是否可以直接應(yīng)用于硬件本身呢?通過(guò)GenSoC,開(kāi)發(fā)者可用自然語(yǔ)言或高級(jí)模型描述系統(tǒng)行為,XMOS的工具鏈將自動(dòng)
    的頭像 發(fā)表于 11-07 14:04 ?585次閱讀

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    源代碼編譯為 HDL 的過(guò)程共分為兩步: (1)C to HASM (2)HASM to HDL 第步 C to HASM 是將 C 語(yǔ)言描述的算法編譯為
    發(fā)表于 10-30 07:02

    HarmonyOSAI編程自然語(yǔ)言代碼生成

    安裝CodeGenie后,在下方對(duì)話框內(nèi),輸入代碼需求描述,將根據(jù)描述智能生成代碼,生成內(nèi)容可鍵復(fù)制或鍵插入至編輯區(qū)當(dāng)前光標(biāo)位置。 提問(wèn)示例 使用ArkTs
    發(fā)表于 09-05 16:58

    HarmonyOSAI編程頁(yè)面生成

    支持通過(guò)自然語(yǔ)言對(duì)話,生成應(yīng)用/元服務(wù)可用的頁(yè)面代碼,生成結(jié)果支持實(shí)時(shí)預(yù)覽,幫助開(kāi)發(fā)者快速完成頁(yè)面搭建。 點(diǎn)擊頁(yè)面右側(cè)菜單欄CodeGenie圖標(biāo),完成登錄后在輸入框輸入\"/\&qu
    發(fā)表于 08-29 15:50

    【HZ-T536開(kāi)發(fā)板免費(fèi)體驗(yàn)】5- 無(wú)需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開(kāi)發(fā)板上搭建 MCP 服務(wù)器,自然語(yǔ)言輕松控板

    ifconfig、gpio write 1 1)。 工作流程 : MCP客戶端發(fā)送自然語(yǔ)言指令到 HZ-T536 的 MCP 服務(wù)器; MCP 服務(wù)器利用DeepSeek的大語(yǔ)言模型能力,生成
    發(fā)表于 08-23 13:10

    HarmonyOSAI編程編輯區(qū)代碼生成

    CodeGenie提供Inline Edit能力,支持在編輯窗口中通過(guò)自然語(yǔ)言進(jìn)行問(wèn)答,基于上下文智能生成代碼片段,提升代碼可讀性。 當(dāng)前有以下兩方式喚醒Inline Edit對(duì)話框
    發(fā)表于 08-20 15:24

    HarmonyOS AI輔助編程工具(CodeGenie)頁(yè)面生成

    支持通過(guò)自然語(yǔ)言對(duì)話,生成應(yīng)用/元服務(wù)可用的頁(yè)面代碼,生成結(jié)果支持實(shí)時(shí)預(yù)覽,幫助開(kāi)發(fā)者快速完成頁(yè)面搭建。該功能從DevEco Studio 6.0.0 Beta1版本開(kāi)始支持。 點(diǎn)擊頁(yè)
    發(fā)表于 08-13 10:38

    高德與阿里云起,開(kāi)啟智慧出行新范式

    ,加速智能化場(chǎng)景落地。 技術(shù)融合:大模型賦能地圖交互升級(jí) 基于阿里云通義千問(wèn)系列大模型領(lǐng)先的自然語(yǔ)言處理與多模態(tài)交互能力,MCP Server實(shí)現(xiàn)從文本指令到可視化地圖的精準(zhǔn)轉(zhuǎn)化。用戶可通過(guò)自然語(yǔ)言生成個(gè)性化出行方案(如智能路徑
    的頭像 發(fā)表于 07-18 10:29 ?611次閱讀

    RDK × 腿臂機(jī)器人:這只 “機(jī)械汪” 竟會(huì)說(shuō)人話、走花路!

    ,基于RDKX3平臺(tái)進(jìn)行AI大模型算法開(kāi)發(fā),提出了一種融合AI大模型的創(chuàng)新性解決方案,提升腿臂機(jī)器人的綜合性能。-項(xiàng)目首先強(qiáng)化了機(jī)器人的多模態(tài)感知能力,利用雷達(dá)、攝像
    的頭像 發(fā)表于 07-01 20:27 ?1330次閱讀
    RDK × 腿臂機(jī)器人:這只 “機(jī)械汪” 竟會(huì)說(shuō)人話、走花路!

    小白學(xué)大模型:從零實(shí)現(xiàn) LLM語(yǔ)言模型

    在當(dāng)今人工智能領(lǐng)域,大型語(yǔ)言模型(LLM)的開(kāi)發(fā)已經(jīng)成為個(gè)熱門話題。這些模型通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語(yǔ)言文本,完成各種復(fù)雜的任
    的頭像 發(fā)表于 04-30 18:34 ?1381次閱讀
    小白學(xué)大模型:從零實(shí)現(xiàn) LLM<b class='flag-5'>語(yǔ)言</b>模型

    自然語(yǔ)言提示原型在英特爾Vision大會(huì)上首次亮相

    在英特爾Vision大會(huì)上,Network Optix首次展示了自然語(yǔ)言提示原型,該方案將重新定義視頻管理,為各行各業(yè)由AI驅(qū)動(dòng)的洞察和效率提速。
    的頭像 發(fā)表于 04-09 09:30 ?1018次閱讀

    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開(kāi)發(fā)教程

    小智AI聊天機(jī)器人是個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開(kāi)發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實(shí)現(xiàn)人
    的頭像 發(fā)表于 03-29 15:33 ?1.3w次閱讀
    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)<b class='flag-5'>開(kāi)發(fā)</b>教程