91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Zero-shot-CoT是multi-task的方法

深度學(xué)習(xí)自然語言處理 ? 來源:NLP日志 ? 作者:NLP日志 ? 2022-06-15 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 簡介

Prompt learning中的prompt如同一種心理暗示,可以驅(qū)使語言模型按照特定的方向去預(yù)測。就像一種解題技巧,只要加入了它,就能更準(zhǔn)確的解決問題。在之前prompt系列的文章中,我們介紹過各種形式的prompt,也強調(diào)過一個合適的prompt對于下游任務(wù)的效果影響重大,為此如何尋找一個合適的prompt的顯得尤為重要。

今天介紹一個最近剛被發(fā)現(xiàn)的“寶藏prompt”,Let’s think step by step,通過使用特定的prompt“Let’s think step by step”和相應(yīng)的兩階段prompt技巧,提高了大規(guī)模語言模型在的推理能力,在多個推理相關(guān)的zero-shot任務(wù)取得驚人的提升,遠(yuǎn)超之前的zero-shot方法。

2背景

大規(guī)模預(yù)訓(xùn)練語言模型借助于針對特定任務(wù)設(shè)計的prompt(無論是few shot還是zero shot),在單步驟的system-1任務(wù)上有著出色表現(xiàn),但是對于那些緩慢和需要多步推理的system-2任務(wù)表現(xiàn)不佳。(system-1跟system-2是心理學(xué)家定義的一些推理任務(wù),可以理解為system-1是那些一步就可以推出答案的任務(wù),,而system-2則是那些需要通過多步推理才能解決的任務(wù))。

為了解決大規(guī)模語言模型在system-2任務(wù)中表現(xiàn)不佳的問題,CoT(Chain of thought prompting)被提出來,它將原本的few shot的樣例,調(diào)整為逐步推理的答案,從而讓語言模型去學(xué)習(xí)few shot樣例的逐步推理過程,從而控制模型推理能力的方向,在復(fù)雜的system-2任務(wù)中獲得明顯提升。細(xì)節(jié)可以見下圖中的樣例,其中左上角就是原本的few shot prompt,而右上角就是將few shot樣例調(diào)整為逐步推理樣例的CoT(為了跟后面的Zero-shot-CoT區(qū)分而稱為Few-shot- CoT),可以看出Few-shot-CoT是將few shot樣例里的推理過程展開了,讓語言模型能更好的學(xué)習(xí)其中的細(xì)節(jié)。

c009e2c2-ebed-11ec-ba43-dac502259ad0.png

圖1:Few-shot, Few-shot-CoT, Zero-shot, Zero-shot-CoT示例

3 Zero-shot-CoT

跟前面提及的Few-shot Cot不同,Zero-shot-CoT不需要經(jīng)過調(diào)整的逐步推理的few shot樣例,也不同大多數(shù)prompt,它不依賴于特定的任務(wù),可以利用當(dāng)前問題逐步的推理過程推導(dǎo)得到一個簡單的prompt模版,從而控制語言模型預(yù)測的方向。Zero-shot Cot的核心是利用“Let’s think step by step”去抽取當(dāng)前問題的逐步推理過程。雖然Zero-shot-CoT的概念很簡單,它的巧妙之處在于整個過程使用了兩次prompt,具體過程如下,同時可以查看下圖樣例加深理解。

a)推論抽取

首先將問題X通過一個簡單的模版”Q:[X].A:[Z]”調(diào)整為一個prompt,其中[X]是一個輸入槽位,通過問題X來填充,而[Z]是一個觸發(fā)器槽位,用一個人工構(gòu)建的觸發(fā)器句子來填充,使得語言模型可以從中抽取回答問題X所需的逐步推理過程,論文中用的觸發(fā)器句子是“Let’s think step by step.”。然后將構(gòu)造好的模版輸入到語言模型,從而生成后續(xù)的句子Z(可以使用任何解碼策略,論文為了簡便使用了貪婪解碼策略)。

b)答案抽取

將第一步構(gòu)造好的模版Q:[X].A:[Z],生成的句子Z,和一個新的觸發(fā)器句子[A]拼接到一起輸入到同一個語言模型,利用語言模型生成的結(jié)果進行解析得到最終的答案。這一步的觸發(fā)器句子[A]跟第一步的觸發(fā)器句子不同,它依賴于具體的答案形式,例如圖中樣例用的觸發(fā)器句子是“Therefore, the answer (arabic numerals) is”

c02c2ab2-ebed-11ec-ba43-dac502259ad0.png

圖2: Zero-shot-Cot全過程

Zero-shot-CoT跟Few-shot-CoT的區(qū)別在于,對于每個任務(wù),F(xiàn)ew-shot-CoT需要謹(jǐn)慎的人工工程將few shot樣例轉(zhuǎn)化為特定的答案格式,就是其中的逐步推理過程,而Zero-shot-CoT則不需要這些工程,只需要調(diào)用兩次語言模型即可實現(xiàn)。Zero-shot-CoT跟Zero-shot的區(qū)別在于,Zero-shot-Cot多了生成多步推論的過程,最終輸入語言模型的文本會更加豐富,語言模型能按照逐步推論的方向進行預(yù)測,從而更好的控制語言模型的輸出。

4 實驗結(jié)果

論文在算術(shù)推理跟常識推理相關(guān)的任務(wù)做了實驗,有以下一些實驗結(jié)論。

a)Zero-shot-CoT在需要多步推理的算術(shù)推理任務(wù),符號推理任務(wù),其他邏輯推理任務(wù)上大幅超越zero-shot,在不需要多步推理的算數(shù)推理任務(wù)上(SingleEq和AddSub)上跟zero-shot水平相當(dāng)。在常識推理任務(wù)上,Zero-shot-Cot表現(xiàn)沒有提升。

c05b4054-ebed-11ec-ba43-dac502259ad0.png

圖3: Zero-shot-CoT跟Zero-shot在多個任務(wù)上的表現(xiàn)

b)在算術(shù)推理任務(wù)中,雖然Zero-shot-CoT不及Few-shot-CoT,但明顯優(yōu)于標(biāo)準(zhǔn)的Few-shot,即便是帶8個樣例的Fes-shot方法。

c06f2268-ebed-11ec-ba43-dac502259ad0.png

圖4: 在多步算法推理任務(wù)上多種方法的效果對比

c)對于常識推理問題,Zero-shot-CoT通常能生成靈活合理的推論,即便最終預(yù)測是錯誤的(下圖左邊樣例)。同時當(dāng)模型發(fā)現(xiàn)很難將答案選項縮小時,Zero-shot-CoT經(jīng)常輸出多個答案選項(下圖右邊樣例)。

c0b67492-ebed-11ec-ba43-dac502259ad0.png

圖5: Zero-shot-CoT在常識推理任務(wù)的若干bad case

5討論

a)語言模型規(guī)模跟zero-shot推理是否相關(guān)?

大規(guī)模語言模型能帶來更合理的推理。對于不需要多步推理的任務(wù),zero-shot表現(xiàn)隨著語言模型規(guī)模的增長可能不增長或者增長非常緩慢,但是對于需要多步推理的任務(wù),隨著語言模型規(guī)模的增長,zero-shot的效果飛速增長。

c0cd946a-ebed-11ec-ba43-dac502259ad0.png

圖6:模型規(guī)模的影響

b)Prompt的選擇是否影響Zero-shot-CoT

如果文本被撰寫成有利于深度推理的樣子,模型效果也會得到提升。不同的prompt會驅(qū)使模型表示出迥然不同的推理能力,具體的差異取決了實際句子。在論文實驗中,其中一個prompt”Let’s think step by step”取得最優(yōu)的效果。

c114572e-ebed-11ec-ba43-dac502259ad0.png

圖7:不同prompt對于Zero-shot-CoT的影響

c)大規(guī)模語言模型的推理能力

部分研究表明預(yù)訓(xùn)練模型通常不擅長推理任務(wù),但是通過讓它進行逐步推理可以極大程度的提升它的推理性能,而不是通過微調(diào)。論文的實驗也佐證了大規(guī)模語言模型是一個合適的zero-shot推理器。

d)Multi-task prompting

大多數(shù)prompt都是針對特定任務(wù)而設(shè)計的,但是Zero-shot-CoT是支持多任務(wù)的,具有更強的泛化能力,能應(yīng)用到更多不同的任務(wù)中去。Zero-shot-CoT可以為作為一種參考,不僅加速應(yīng)用大規(guī)模語言模型進行邏輯推理的研究,也加速發(fā)現(xiàn)其他大規(guī)模語言模型的廣泛感知能力的研究。

6總結(jié)

個人覺得,相比其他prompt相關(guān)的文章,Zero-shot-CoT通過兩階段的prompt過程設(shè)計,擺脫了prompt工程的限制,也不受限于具體的任務(wù),更好的控制模型的預(yù)測方向。雖然思想跟Few-shot-CoT很像,但是擺脫了其中的精心設(shè)計的將few shot樣例轉(zhuǎn)化為合適的prompt的過程。這一點還是很有價值的。

但是,看完這個文章還是有不少的疑問。文章提及Zero-shot-CoT是multi-task的方法,但是只在推理相關(guān)的任務(wù)上進行實驗,Let’s think step by step”在非推理的任務(wù)上也會是最優(yōu)選擇嗎?在其他任務(wù)上,Zero-shot-CoT能取得多少增益?對于其他語言而言,找到自身最佳的“Let’s think step by step”只能把所有可能的prompt都測試一遍嗎?有其他自動化的手段嗎?有沒有跨語言的“Let’s think step by step”?

參考文獻

1.(2022,) Large Language Models are Zero-Shot Reasoners

https://arxiv.org/pdf/2205.11916.pdf

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    31

    文章

    5931

    瀏覽量

    90224
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11310

原文標(biāo)題:提示學(xué)習(xí) | Let’s think step by step

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MULTI-BEAM Plus電源連接器有何特點?-赫聯(lián)電子

      TE品牌推出的MULTI-BEAM Plus電源連接器滿足了市場對更高功率和更高性能的需求,其最高每功率電流觸點的最高電流為每觸點140 A,四個相鄰電源觸點的每觸點100A。更高的功率和信號
    發(fā)表于 12-29 20:25

    Amphenol Multi-Trak?:下一代高速互連解決方案

    Amphenol Multi-Trak?:下一代高速互連解決方案 在高速互連技術(shù)不斷發(fā)展的今天,Amphenol推出的Multi - Trak?產(chǎn)品無疑是一顆耀眼的新星。它為電子工程師們在設(shè)計高速
    的頭像 發(fā)表于 12-11 15:30 ?407次閱讀

    新思科技以AI驅(qū)動EDA加速Multi-Die創(chuàng)新

    Multi-Die設(shè)計將多個異構(gòu)或同構(gòu)裸片無縫集成在同一封裝中,大幅提升了芯片的性能和能效,因而在高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)分析、先進圖形處理和其他要求嚴(yán)苛的應(yīng)用領(lǐng)域中至關(guān)重要。
    的頭像 發(fā)表于 11-07 10:17 ?710次閱讀

    AI智能大模型,你身邊的最好用的辦公提效小能手

    幾十億到數(shù)萬億; 任務(wù)廣:一次訓(xùn)練可以支持多個任務(wù),具備通用能力; 適應(yīng)快:只需少量樣例,就能遷移到新任務(wù)中(Few-shot、Zero-shot)。 訊維AI智能大模型訓(xùn)練流程包含以下幾個步驟: 1.收集數(shù)據(jù):包括書籍、百科、代碼、新聞等,數(shù)據(jù)量達到 TB 級別。
    的頭像 發(fā)表于 09-30 10:59 ?329次閱讀

    【作品合集】玄鐵BPI-CanMV-K230D-Zero開發(fā)板測評

    開發(fā)板體驗】+閃存讀寫程序的分析 【BPI-CanMV-K230D-Zero開發(fā)板體驗】+TFT屏顯示驅(qū)動及信息顯示 【BPI-CanMV-K230D-Zero開發(fā)板體驗】+車牌識別處理與應(yīng)用方法
    發(fā)表于 09-18 10:13

    特瑞仕DC/DC轉(zhuǎn)換器的HiSAT-COT高速瞬態(tài)響應(yīng)技術(shù)

    “HiSAT-COT※(High-Speed Architecture for Transit with Constant On-Time 恒定導(dǎo)通時間高速瞬態(tài)結(jié)構(gòu))”備受矚目。
    的頭像 發(fā)表于 09-05 09:26 ?801次閱讀
    特瑞仕DC/DC轉(zhuǎn)換器的HiSAT-<b class='flag-5'>COT</b>高速瞬態(tài)響應(yīng)技術(shù)

    Task任務(wù):LuatOS實現(xiàn)“任務(wù)級并發(fā)”的核心引擎

    Task任務(wù)通過其強大的并發(fā)處理能力,使LuatOS能夠在單線程環(huán)境中模擬多線程執(zhí)行,通過協(xié)程的掛起與恢復(fù)機制,實現(xiàn)任務(wù)級的并行操作,顯著提升系統(tǒng)效能。 sys核心庫是LuatOS運行框架庫,也是
    的頭像 發(fā)表于 08-28 13:49 ?508次閱讀
    <b class='flag-5'>Task</b>任務(wù):LuatOS實現(xiàn)“任務(wù)級并發(fā)”的核心引擎

    揭秘LuatOS Task:多任務(wù)管理的“智能中樞”

    Task任務(wù)作為LuatOS的核心組成部分,通過智能化的任務(wù)管理機制,實現(xiàn)任務(wù)的創(chuàng)建、調(diào)度與協(xié)同運行,讓復(fù)雜應(yīng)用得以高效并行處理,滿足實時場景下的嚴(yán)苛需求。 sys核心庫是LuatOS運行框架庫
    的頭像 發(fā)表于 08-28 13:48 ?635次閱讀
    揭秘LuatOS <b class='flag-5'>Task</b>:多任務(wù)管理的“智能中樞”

    水晶光電COT Vietnam新工廠開業(yè)投產(chǎn)

    盛夏的越南,晴空萬里,驕陽似火。8月2日上午,COT Vietnam新工廠開業(yè)暨投產(chǎn)儀式在興安省升龍二號工業(yè)園區(qū)一期廠房內(nèi)隆重舉行,現(xiàn)場洋溢著熱鬧喜慶的氛圍。
    的頭像 發(fā)表于 08-12 09:15 ?1346次閱讀

    開源Made with KiCad(134):Icepi Zero - 基于Lattice ECP5的便攜FPGA開發(fā)板

    “? Icepi Zero 是一款 Raspberry Pi Zero 尺寸的便攜式 FPGA 開發(fā)板,基于 Lattice ECP5。 ” ? Made with KiCad 系列將支持新的展示
    的頭像 發(fā)表于 07-14 11:21 ?3695次閱讀
    開源Made with KiCad(134):Icepi <b class='flag-5'>Zero</b> - 基于Lattice ECP5的便攜FPGA開發(fā)板

    樹莓派 Zero 2 W 是開啟智能家居生活的理想之選!

    想嘗試智能家居自動化,又不想花費太多?樹莓派Zero2W或許正是你開啟智能家居之旅所需的理想設(shè)備。小板子大潛力想打造一個智能家居?這想法超棒!一旦掌握了技巧,自動化控制燈光、插座、傳感器等設(shè)備,既有
    的頭像 發(fā)表于 06-24 16:24 ?861次閱讀
    樹莓派 <b class='flag-5'>Zero</b> 2 W 是開啟智能家居生活的理想之選!

    【開源分享】:開源小巧的FPGA開發(fā)板——Icepi Zero

    核心芯片設(shè)計一款滿足工業(yè)和音視頻等領(lǐng)域的FPGA開發(fā)板,配套數(shù)十套原始開發(fā)案例、開源所有原理圖及PCB文件。 Icepi Zero - 便攜式 FPGA 開發(fā)板。 什么是 Icepi Zero
    發(fā)表于 06-09 14:01

    用 樹莓派 Zero 打造的智能漫游車!

    使用PXFMini和樹莓派Zero打造您自己的自主漫游車。本項目所用組件硬件組件ErleRoboticsPXFmini×1樹莓派Zero×1樹莓派2ModelB×1樹莓派3ModelB×1軟件應(yīng)用與在線服務(wù)APM飛行
    的頭像 發(fā)表于 05-13 16:39 ?1106次閱讀
    用 樹莓派 <b class='flag-5'>Zero</b> 打造的智能漫游車!

    kw45卡在Host_Task的原因?

    KW45 以從機模式運行,安卓手機APP反復(fù)斷開連接,偶爾會卡住kw45,這不是在連接和斷開連接時發(fā)生的,而是在連接成功后的幾秒鐘或幾十秒。 調(diào)試分析發(fā)現(xiàn),kw45 卡在 Host_Task,o任務(wù)無法運行。 以下是任務(wù)運行的屏幕截圖。重復(fù)運行屏幕截圖是Host_Task
    發(fā)表于 04-10 06:22

    京東方助力雷神ZERO 18 Pro系列AI游戲筆記本發(fā)布

    近日,雷神科技在中國烏鎮(zhèn)舉辦新品發(fā)布會,攜手BOE(京東方)重磅發(fā)布年度旗艦AI游戲筆記本——雷神ZERO 18 Pro系列。
    的頭像 發(fā)表于 04-03 10:59 ?1192次閱讀