亚洲欧美日韩91,黄片视频观看免费

據(jù)了解，1997年，兩位科學(xué)家Sepp Hochreiter和Jürgen Schmidhuber共同創(chuàng)建了長短期記憶（LSTM）神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，用于改善循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）的長期記憶功能。

近期，Hochreiter在arXiv平臺(tái)發(fā)表論文，推出了一款新型的XLSTM（擴(kuò)展LSTM）架構(gòu)，有效克服了傳統(tǒng)LSTM互聯(lián)網(wǎng)結(jié)構(gòu)“僅能按時(shí)間順序處理信息”的局限性，有望挑戰(zhàn)當(dāng)前熱門的Transformer架構(gòu)。

該論文指出，Hochreiter在新的XLSTM架構(gòu)中運(yùn)用了指數(shù)型門控循環(huán)網(wǎng)絡(luò)，并引入了“sLSTM”和“mLSTM”兩種記憶規(guī)則，使神經(jīng)網(wǎng)絡(luò)能夠更高效地利用RAM，實(shí)現(xiàn)類似于Transformer的并行化處理。

研究團(tuán)隊(duì)通過對(duì)基于XLSTM和Transformer架構(gòu)的兩款模型進(jìn)行150億個(gè)Token的訓(xùn)練和測試，結(jié)果顯示，XLSTM表現(xiàn)更為出色，特別是在“語言能力”方面表現(xiàn)尤為突出。因此，研究人員預(yù)測，未來XLSTM有可能與Transformer展開競爭。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4838

瀏覽量
107897
RAM

RAM

+關(guān)注

關(guān)注
8

文章
1399

瀏覽量
120681
架構(gòu)

架構(gòu)

+關(guān)注

關(guān)注
1

文章
533

瀏覽量
26600

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

基于xLSTM和Transformer的模型評(píng)估：xLSTM在“語言能力”的表現(xiàn)

評(píng)論