91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程10.8之波束搜索

PyTorch教程10.8之波束搜索

2023-06-05 | pdf | 0.20 MB | 次下載 | 免費(fèi)

資料介紹

10.7 節(jié)中,我們介紹了編碼器-解碼器架構(gòu),以及端到端訓(xùn)練它們的標(biāo)準(zhǔn)技術(shù)。然而,當(dāng)談到測(cè)試時(shí)間預(yù)測(cè)時(shí),我們只提到了 貪心策略,我們?cè)诿總€(gè)時(shí)間步選擇下一個(gè)預(yù)測(cè)概率最高的標(biāo)記,直到在某個(gè)時(shí)間步,我們發(fā)現(xiàn)我們已經(jīng)預(yù)測(cè)了特殊的序列結(jié)尾“”標(biāo)記。在本節(jié)中,我們將從形式化這種貪婪搜索策略開始,并確定從業(yè)者往往會(huì)遇到的一些問題。隨后,我們將該策略與兩種替代方案進(jìn)行比較:窮舉搜索(說明性但不實(shí)用)和 波束搜索(實(shí)踐中的標(biāo)準(zhǔn)方法)。

讓我們從設(shè)置我們的數(shù)學(xué)符號(hào)開始,借用第 10.7 節(jié)中的約定。隨時(shí)步t′,解碼器輸出表示詞匯表中每個(gè)標(biāo)記出現(xiàn)在序列中的概率的預(yù)測(cè)(可能的值 yt′+1, 以先前的標(biāo)記為條件 y1,…,yt′和上下文變量c,由編碼器產(chǎn)生以表示輸入序列。為了量化計(jì)算成本,表示為Y輸出詞匯表(包括特殊的序列結(jié)束標(biāo)記“”)。我們還將輸出序列的最大標(biāo)記數(shù)指定為 T′. 我們的目標(biāo)是搜索所有的理想輸出 O(|Y|T′)可能的輸出序列。請(qǐng)注意,這稍微高估了不同輸出的數(shù)量,因?yàn)樵凇啊睒?biāo)記出現(xiàn)之后沒有后續(xù)標(biāo)記。然而,出于我們的目的,這個(gè)數(shù)字大致反映了搜索空間的大小。

10.8.1。貪心搜索

考慮第 10.7 節(jié)中的簡(jiǎn)單貪婪搜索策略 。在這里,隨時(shí)步t′,我們只需從中選擇條件概率最高的標(biāo)記 Y, IE,

(10.8.1)yt′=argmaxy∈YP(y∣y1,…,yt′?1,c).

一旦我們的模型輸出“”(或者我們達(dá)到最大長(zhǎng)度 T′) 輸出序列完成。

這個(gè)策略看似合理,其實(shí)還不錯(cuò)!考慮到它在計(jì)算上的要求是多么的低,你很難獲得更多的收益。然而,如果我們暫時(shí)擱置效率,搜索最有可能的序列似乎更合理,而不是(貪婪選擇的)最有可能的標(biāo)記序列。事實(shí)證明,這兩個(gè)對(duì)象可能完全不同。最可能的序列是最大化表達(dá)式的序列 ∏t′=1T′P(yt′∣y1,…,yt′?1,c). 在我們的機(jī)器翻譯示例中,如果解碼器真正恢復(fù)了潛在生成過程的概率,那么這將為我們提供最有可能的翻譯。不幸的是,不能保證貪心搜索會(huì)給我們這個(gè)序列。

讓我們用一個(gè)例子來說明它。假設(shè)輸出字典中有四個(gè)標(biāo)記“A”、“B”、“C”和“”。圖10.8.1中,每個(gè)時(shí)間步下的四個(gè)數(shù)字分別代表在該時(shí)間步生成“A”、“B”、“C”、“”的條件概率。

https://file.elecfans.com/web2/M00/A9/C9/poYBAGR9N4-AaGx4AAET1yiKAhk378.svg

圖 10.8.1在每個(gè)時(shí)間步,貪婪搜索選擇條件概率最高的標(biāo)記。

在每個(gè)時(shí)間步,貪心搜索選擇條件概率最高的標(biāo)記。因此,將預(yù)測(cè)輸出序列“A”、“B”、“C”和“”(圖 10.8.1)。這個(gè)輸出序列的條件概率是 0.5×0.4×0.4×0.6=0.048.

接下來,讓我們看一下圖 10.8.2中的另一個(gè)例子。與圖 10.8.1不同,在時(shí)間步 2 中,我們選擇圖 10.8.2中的標(biāo)記“C” ,它具有第二高的條件概率。

https://file.elecfans.com/web2/M00/AA/43/pYYBAGR9N5GACDvWAAEKuTR1cgg914.svg

圖 10.8.2每個(gè)時(shí)間步下的四個(gè)數(shù)字代表在該時(shí)間步生成“A”、“B”、“C”和“”的條件概率。在時(shí)間步 2,選擇具有第二高條件概率的標(biāo)記“C”。

由于時(shí)間步3所基于的時(shí)間步1和2的輸出子序列已經(jīng)從圖10.8.1中的“A”和“B”變?yōu)?/font>圖10.8.2 中的“A”和“C” 圖 10.8.2中每個(gè)標(biāo)記在時(shí)間步長(zhǎng) 3 的條件概率也發(fā)生了變化 。假設(shè)我們?cè)跁r(shí)間步 3 選擇標(biāo)記“B”。現(xiàn)在時(shí)間步 4 以前三個(gè)時(shí)間步“A”、“C”和“B”的輸出子序列為條件,這與“A”不同、“B”、“C”在圖 10.8.1中。因此,圖 10.8.2中第 4 步生成每個(gè) token 的條件概率 也與 圖 10.8.1不同. 因此, 圖 10.8.2中輸出序列“A”、“C”、“B”和“”的條件概率為 0.5×0.3×0.6×0.6=0.054,大于圖 10.8.1中的貪心搜索。在本例中,貪心搜索得到的輸出序列“A”、“B”、“C”、“”并不是最優(yōu)序列。

10.8.2。窮舉搜索

如果目標(biāo)是獲得最可能的序列,我們可以考慮使用 窮舉搜索:窮舉所有可能的輸出序列及其條件概率,然后輸出得分最高的預(yù)測(cè)概率。

雖然這肯定會(huì)給我們想要的東西,但它的計(jì)算成本卻高得令人望而卻步 O(|Y|T′),序列長(zhǎng)度呈指數(shù)增長(zhǎng),詞匯量很大。例如,當(dāng)|Y|=10000T′=10,我們需要評(píng)估1000010=1040序列。與實(shí)際應(yīng)用程序相比,這些數(shù)字很小,但已經(jīng)超出了任何可預(yù)見的計(jì)算機(jī)的能力。另一方面,貪心搜索的計(jì)算成本是


預(yù)測(cè) 搜索 pytorch
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
  2. 3.40 MB  |  1次下載  |  免費(fèi)
  3. 2冷柜-電氣控制系統(tǒng)講解
  4. 13.68 MB   |  1次下載  |  10 積分
  5. 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
  6. 2.33 MB  |  次下載  |  免費(fèi)
  7. 4MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
  8. 2.62 MB  |  次下載  |  免費(fèi)
  9. 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
  10. 0.60 MB   |  次下載  |  3 積分
  11. 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
  12. 0.89 MB   |  次下載  |  3 積分
  13. 7收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
  14. 2.50 MB   |  次下載  |  免費(fèi)
  15. 8MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
  16. 0.60 MB   |  次下載  |  免費(fèi)

本月

  1. 1愛華AIWA HS-J202維修手冊(cè)
  2. 3.34 MB   |  37次下載  |  免費(fèi)
  3. 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
  4. 1.63 MB   |  23次下載  |  免費(fèi)
  5. 3NB-IoT芯片廠商的資料說明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書
  8. 838.47 KB  |  5次下載  |  免費(fèi)
  9. 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  10. 0.04 MB   |  4次下載  |  1 積分
  11. 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
  12. 0.08 MB   |  2次下載  |  1 積分
  13. 7100W準(zhǔn)諧振反激式恒流電源電路圖資料
  14. 0.09 MB   |  2次下載  |  1 積分
  15. 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊(cè)
  16. 1.81 MB   |  1次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分