91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)網(wǎng)絡中詞向量是怎么表示的?

深度學習自然語言處理 ? 來源:語雀 ? 作者:云不見 ? 2021-02-05 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上一篇我們講到了在神經(jīng)網(wǎng)絡出現(xiàn)以前的詞向量表示方法:基于同義詞詞典的方法和基于計數(shù)統(tǒng)計的方法。想要回顧的可以看這里小白跟學系列之手把手搭建NLP經(jīng)典模型-2(含代碼)

這一篇我們要真正開始講在神經(jīng)網(wǎng)絡中,詞向量是怎么表示的,以及它又有什么優(yōu)缺點呢?

067b7aa0-603e-11eb-8b86-12bb97331649.jpg

目錄

基于統(tǒng)計存在的問題

什么是推理?

神經(jīng)網(wǎng)絡中輸入的單詞怎么處理?

簡單的word2vec

CBOW模型的推理

CBOW模型的學習

學習數(shù)據(jù)的準備

CBOW模型的實現(xiàn)

從概率角度看CBOW

總結


基于計數(shù)統(tǒng)計存在的問題

在海量數(shù)據(jù)的今天,基于計數(shù)統(tǒng)計的方法難以處理大規(guī)模的語料庫,因為統(tǒng)計需要一次性統(tǒng)計整個語料庫!實在是有點難頂。而SVD降維的復雜度又太大,于是將推出——基于推理的方法,也就是基于神經(jīng)網(wǎng)絡的方法。

0a142d2e-603e-11eb-8b86-12bb97331649.png

神經(jīng)網(wǎng)絡一次只需要處理一個mini-batch的數(shù)據(jù)進行學習,并且反復更新網(wǎng)絡權重,使神經(jīng)網(wǎng)絡能夠正確預測結果。

0d83a958-603e-11eb-8b86-12bb97331649.png

基于推理的方法以預測為目標,同時獲得了作為副產(chǎn)品的單詞分布式表示。也就是說,模型學習的最終目的是能夠預測正確的結果,而在學習的過程中,我們意外的獲得了單詞的分布式表示。

如果看不懂也沒有關系,這里只是擺出了最終的結論,接著往下看。


什么是推理?

當給出周圍的單詞(上下文)時,預測"?"處會出現(xiàn)什么單詞。

0df3a398-603e-11eb-8b86-12bb97331649.png

也就是說,基于推理的方法和基于計數(shù)的方法一樣,也是基于分布式假設的,即“單詞含義由其周圍的單詞構成”。


輸入單詞的處理方法

將輸入文本寫為one-hot向量

和之前的方法一樣,不管什么模型都無法直接輸入文本本身,模型只“看得懂”數(shù)字,因此我們需要先將單詞轉化為固定長度的向量。對此,一種方式是將單詞轉換為 one-hot向量。在 one-hot 表示中,只有一個元素是 1,其他元素都是 0。還是以“You say goodbye and I say hello.”這一語料作為例子,表示成one-hot向量即如下所示:

0e596d86-603e-11eb-8b86-12bb97331649.png

像這樣,將單詞轉化為固定長度的向量,神經(jīng)網(wǎng)絡的輸入層的神經(jīng)元個數(shù)也就可以固定下來(圖 3-5)。

0ebd1e58-603e-11eb-8b86-12bb97331649.png

能用向量表示單詞啦,這樣我們就可以把它們丟進神經(jīng)網(wǎng)絡進行處理了。比如,對于one-hot表示的某個單詞,

使用全連接層的神經(jīng)網(wǎng)絡如圖 3-6 所示。

0f314df0-603e-11eb-8b86-12bb97331649.png

但是我們需要關注權重W的大小,因此我們將神經(jīng)網(wǎng)絡畫成如下的形式:

0ffa072c-603e-11eb-8b86-12bb97331649.png

全連接層變換可以寫成如下的 Python代碼。

import numpy as np c = np.array([[1, 0, 0, 0, 0, 0, 0]]) # 輸入youW = np.random.randn(7, 3) # 權重初始值為7行3列的矩陣隨機數(shù),且具有標準正態(tài)分布h = np.dot(c, W) # 中間隱藏層節(jié)點print(h)# [[-0.70012195 0.25204755 -0.79774592]]

這里需要注意的是因為輸入 c 是 one-hot 表示,單詞 ID 對應的元素是 1,其他地方都是 0。因此,上述代碼中的 c × W 的矩陣乘積相當于“提取”權重的對應行向量。

10760b92-603e-11eb-8b86-12bb97331649.png

這里,僅為了提取權重的行向量而進行矩陣乘積計算好像不是很有效率。關于這一點,我們會在后續(xù)進行改進。而且乘積也可以用MatMul層(專門做矩陣乘積的層)來實現(xiàn)。

學習了基于推理的方法,并用代碼實現(xiàn)了神經(jīng)網(wǎng)絡中單詞的處理方法,至此準備工作就完成了,現(xiàn)在是時候實現(xiàn)word2vec了。

在基于推理(神經(jīng)網(wǎng)絡)的方法中,最著名的就是Word2Vec。接下來我們將詳細的探討word2vec的結構和如何用代碼把這個結構搭建起來。


簡單的word2vec

word2vec有兩種模型:

CBOW模型

Skip-gram模型

兩種模型的區(qū)別如下:

10dcb8ec-603e-11eb-8b86-12bb97331649.png

CBOW 模型是從上下文的多個單詞預測中間的單詞(目標詞),而 skip-gram 模型則從中間的單詞(目標詞)預測上下文的多個單詞。

本節(jié)我們將主要討論CBOW模型。

114bf3ce-603e-11eb-8b86-12bb97331649.png

CBOW模型的推理

CBOW 模型是根據(jù)上下文預測目標詞的神經(jīng)網(wǎng)絡(“目標詞”是指中間的單詞,它周圍的單詞是“上下文”)。通過訓練這個 CBOW 模型,使其能盡可能地進行正確的預測目標詞,我們就可以獲得中間產(chǎn)物——單詞的分布式表示。

提前劇透一下,這個學習好的、能正確預測結果的權重就是我們想要的單詞分布式表示。

13ca4038-603e-11eb-8b86-12bb97331649.png

中間層的神經(jīng)元數(shù)量比輸入層少這一點很重要。中間層需要將預測單詞所需的信息壓縮保存,從而產(chǎn)生密集的向量表示。這時,中間層被寫入了我們?nèi)祟悷o法解讀的代碼,相當于 “編碼” 工作。而從中間層的信息獲得期望結果的過程則稱為 “解碼” 。這一過程將被編碼的信息復原為我們可以理解的形式。

我們從層的角度來看看這個CBOW模型:

1450e2be-603e-11eb-8b86-12bb97331649.png

如圖 3-11 所示,CBOW 模型一開始有兩個 MatMul 層,這兩個層的輸出被加在一起。然后,對這個相加后得到的值乘以 0.5 求平均,可以得到中間層的神經(jīng)元。最后,將另一個 MatMul 層應用于中間層的神經(jīng)元,輸出得分。

MatMul 層的正向傳播,在內(nèi)部會計算矩陣乘積。

接下來用代碼實現(xiàn) CBOW 模型的推理(即求得分的過程) ,具體實現(xiàn)如下所示( ch03/cbow_predict.py ) 。

import syssys.path.append('..')import numpy as npfrom common.layers import MatMul # 樣本的上下文數(shù)據(jù)c0 = np.array([[1, 0, 0, 0, 0, 0, 0]]) # youc1 = np.array([[0, 0, 1, 0, 0, 0, 0]]) # goodbye # 權重的初始值W_in = np.random.randn(7, 3)W_out = np.random.randn(3, 7) # 生成層in_layer0 = MatMul(W_in)in_layer1 = MatMul(W_in)out_layer = MatMul(W_out) # 正向傳播h0 = in_layer0.forward(c0)h1 = in_layer1.forward(c1)h = 0.5 * (h0 + h1)s = out_layer.forward(h)print(s) # [[ 0.30916255 0.45060817 -0.77308656 0.22054131 0.15037278# -0.93659277 -0.59612048]]

輸出側的MatMul層共享權重W_in。

以上是沒有使用激活函數(shù)的簡單網(wǎng)絡結構,接下來看看CBOW模型的學習(也就是添加激活函數(shù)后得到概率)。

CBOW模型的學習

推理完了得到得分,加上激活函數(shù)就得到結果的概率,這個概率就表示哪個單詞會出現(xiàn)在給定的上下文(周圍單詞)中間。

1520cf4c-603e-11eb-8b86-12bb97331649.png

說白了,CBOW模型的學習就是調(diào)整權重參數(shù),以使預測結果更加準確。評估預測是否準確的一大指標就是預測的結果和正確的結果之間進行對比,用什么指標去比對呢?用交叉熵誤差量化對比模型預測的概率和正確結果之間的差距(也就是loss值),并且反饋給前面的權重參數(shù)W并進行參數(shù)W的調(diào)整,從而不斷的減小與正確結果之間的距離,這就是模型訓練、學習的過程。

從層的角度表示如下:

1635f27c-603e-11eb-8b86-12bb97331649.png

CBOW模型的學習,只需在 CBOW 模型的推理上加上Softmax 層和 Cross Entropy Error 層,就可以得到損失。這就是 CBOW模型的正向傳播。

那么學習好的模型最終獲得的權重參數(shù)是什么樣的呢?

word2vec 中使用的網(wǎng)絡有兩個權重,分別是輸入側的權重(Win)和輸出側的權重(Wout) 。一般而言,輸入側的權重 Win 的每一行對應于各個單詞的分布式表示?;蛘咻敵鰝鹊拿恳涣幸餐瑯訉鱾€單詞的分布式表示。

16cbd1a2-603e-11eb-8b86-12bb97331649.png

那么,我們最終應該使用哪個權重作為單詞的分布式表示呢?這里有三個選項。

A. 只使用輸入側的權重

B. 只使用輸出側的權重

C. 同時使用兩個權重

就 word2vec(特別是 skip-gram 模型)而言,最受歡迎的是方案 A。在這里我們也使用Win作為詞向量。而在與 word2vec 相似的 GloVe[27]詞向量表示方法中,使用C方案將兩個權重相加,也獲得了良好的結果。

模型搭建好了,我們還要對輸入數(shù)據(jù)進行預處理。

學習數(shù)據(jù)的準備

我們上面有說過,模型沒法直接"認識"文本,而只認識數(shù)字,所以我們首先需要將輸入數(shù)據(jù)轉化為one-hot向量表示。這里仍以“You say goodbye and I say hello.”為例。

17d5ee48-603e-11eb-8b86-12bb97331649.png

代碼實現(xiàn)數(shù)據(jù)預處理如下:

import syssys.path.append('..')from common.util import preprocess, create_contexts_target,convert_one_hot text = 'You say goodbye and I say hello.' corpus, word_to_id, id_to_word = preprocess(text) contexts, target = create_contexts_target(corpus, window_size=1) vocab_size = len(word_to_id)target = convert_one_hot(target, vocab_size)contexts = convert_one_hot(contexts, vocab_size)

convert_one_hot() 函數(shù)實現(xiàn)了將單詞 ID 轉化為 one-hot 表示,內(nèi)容很簡單,代碼在 common/util.py 中。

至此,學習數(shù)據(jù)的準備就完成了,下面我們來討論最重要的 CBOW 模型的實現(xiàn)。

CBOW模型的實現(xiàn)

190a20a4-603e-11eb-8b86-12bb97331649.png

根據(jù)CBOW模型的網(wǎng)絡結構圖,將該神經(jīng)網(wǎng)絡實現(xiàn)為 SimpleCBOW 類(下一節(jié)將對其進行改進為 CBOW 類) 。首先,讓我們看一下 SimpleCBOW 類的初始化方法( ch03/simple_cbow.py ) 。

模型的初始化代碼

import syssys.path.append('..')import numpy as npfrom common.layers import MatMul, SoftmaxWithLoss class SimpleCBOW: def __init__(self, vocab_size, hidden_size): # 詞匯數(shù):vocab_size ;中間層神經(jīng)元個數(shù):hidden_size V, H = vocab_size, hidden_size # 初始化權重,用一些小的隨機值初始化 W_in = 0.01 * np.random.randn(V, H).astype('f') W_out = 0.01 * np.random.randn(H, V).astype('f') # 生成層 self.in_layer0 = MatMul(W_in) self.in_layer1 = MatMul(W_in) self.out_layer = MatMul(W_out) self.loss_layer = SoftmaxWithLoss() # 將所有的權重和梯度整理到列表中 layers = [self.in_layer0, self.in_layer1, self.out_layer] self.params, self.grads = [], [] for layer in layers: self.params += layer.params self.grads += layer.grads # 將單詞的分布式表示設置為成員變量 self.word_vecs = W_in

指定 NumPy 數(shù)組的數(shù)據(jù)類型為 astype('f'),初始化將使用 32 位的浮點數(shù)。

實現(xiàn)神經(jīng)網(wǎng)絡的正向傳播 forward() 函數(shù)代碼。該函數(shù)接收參數(shù) contexts 和 target,并返回損失(loss)。

def forward(self, contexts, target): # 接收參數(shù) contexts 和 target,并返回損失(loss) h0 = self.in_layer0.forward(contexts[:, 0]) h1 = self.in_layer1.forward(contexts[:, 1]) h = (h0 + h1) * 0.5 score = self.out_layer.forward(h) loss = self.loss_layer.forward(score, target) return loss

這里,假定參數(shù) contexts 是一個三維 NumPy 數(shù)組,即圖3-18 的例子中 (6,2,7) 的形狀,其中第 0 維是 mini-batch 的數(shù)量,第 1 維是上下文的窗口大小,第 2 維表示 one-hot 向量。此外, target 是 (6,7)這樣的二維形狀。

實現(xiàn)反向傳播 backward()

19c39aac-603e-11eb-8b86-12bb97331649.png

反向傳播代碼如下:

def backward(self, dout=1): ds = self.loss_layer.backward(dout) da = self.out_layer.backward(ds) da *= 0.5 self.in_layer1.backward(da) self.in_layer0.backward(da) return None

“×”的反向傳播將正向傳播時的輸入值“交換”后乘以梯度?!?”的反向傳播則將梯度“原樣”傳播。

此處正向、反向傳播已實現(xiàn),通過先調(diào)用 forward() 函 數(shù), 再調(diào)用 backward() 函數(shù),grads 列表中的梯度被更新。

模型學習的實現(xiàn)

CBOW 模型的學習和一般的神經(jīng)網(wǎng)絡的學習完全相同。

首先,給神經(jīng)網(wǎng)絡準備好學習數(shù)據(jù)。

然后,求梯度,并逐步更新權重參數(shù)。

這里,我們使用神經(jīng)網(wǎng)絡中的 Trainer 類來執(zhí)行學習過程,學習的源代碼如下所示( ch03/train.py ) 。

模型學習的實現(xiàn)代碼:

import syssys.path.append('..')from common.trainer import Trainerfrom common.optimizer import Adamfrom simple_cbow import SimpleCBOWfrom common.util import preprocess, create_contexts_target,convert_one_hot window_size = 1hidden_size = 5batch_size = 3max_epoch = 1000 text = 'You say goodbye and I say hello.'corpus, word_to_id, id_to_word = preprocess(text) vocab_size = len(word_to_id)contexts, target = create_contexts_target(corpus, window_size)target = convert_one_hot(target, vocab_size)contexts = convert_one_hot(contexts, vocab_size) model = SimpleCBOW(vocab_size, hidden_size)optimizer = Adam()trainer = Trainer(model, optimizer)trainer.fit(contexts, target, max_epoch, batch_size)trainer.plot()

之后,我們都會使用Train類進行網(wǎng)絡的學習。使用 Trainer類, 可以理清容易變復雜的學習代碼。

結果如圖所示:

1aa57de6-603e-11eb-8b86-12bb97331649.png

通過不斷的學習,損失的確在減??!我們再來看看學習結束后的權重W。我們?nèi)〕鰟倓偙4娴妮斎雮鹊臋嘀亍?/p>

word_vecs = model.word_vecs for word_id, word in id_to_word.items(): print(word, word_vecs[word_id])

word_vecs 的各行保存了對應的單詞 ID 的分布式表示。結果如下所示:

you [-0.9031807 -1.0374491 -1.4682057 -1.3216232 0.93127245]say [ 1.2172916 1.2620505 -0.07845993 0.07709391 -1.2389531 ]goodbye [-1.0834033 -0.8826921 -0.33428606 -0.5720131 1.0488235 ]and [ 1.0244362 1.0160093 -1.6284224 -1.6400533 -1.0564581]i [-1.0642933 -0.9162385 -0.31357735 -0.5730831 1.041875 ]hello [-0.9018145 -1.035476 -1.4629668 -1.3058501 0.9280102]. [ 1.0985303 1.1642815 1.4365371 1.3974973 -1.0714306]

我們終于將單詞表示為了密集向量!這就是單詞的分布式表示。

不過,由于這里使用的語料庫因為太小了所以并沒有給出很好的結果。如果換成更大的語料庫,相信會獲得更好的結果。但是,如果語料庫太大,在處理速度方面又會出現(xiàn)新的問題,因為當前這個 CBOW 模型的實現(xiàn)在處理效率方面存在幾個問題。下一節(jié)我們將改進這個簡單的 CBOW 模型,實現(xiàn)一個“真正的”、更快的CBOW 模型。

從概率角度看CBOW

我們從概率角度再來看一下CBOW模型。首先說明幾個概率的表示方法。

由概率統(tǒng)計所學,我們知道:

P(A):表示A發(fā)生的概率;

P(A,B):表示A,B同時發(fā)生的概率;(聯(lián)合概率)

P(A|B):B發(fā)生時A發(fā)生的概率。(后驗概率)

已知CBOW模型的原理是已知上下文而預測目標詞。

1bb2e21e-603e-11eb-8b86-12bb97331649.png

我們用數(shù)學式來表示當給定上下文 wt?1和 wt+1時目標詞為 wt 的概率。即使用后驗概率,有式 (3.1):

1c19c6a0-603e-11eb-8b86-12bb97331649.png

式 (3.1) 表示“在 wt?1和 wt+1發(fā)生后,wt發(fā)生的概率” 。也就是說,CBOW 模型可以建模為式 (3.1)。

而且使用式 (3.1)可以簡潔地表示CBOW 模型的損失函數(shù)。

將原交叉熵誤差函數(shù)式以概率的形式來表示就是:

1c861bca-603e-11eb-8b86-12bb97331649.png

CBOW 模型的損失函數(shù)只是對式 (3.1) 的概率取 log,并加上負號,這也稱為負對數(shù)似然(negative log likelihood) 。式 (3.2) 是一筆樣本數(shù)據(jù)的損失函數(shù)。如果將其擴展到整個語料庫,則損失函數(shù)可以寫為:

1cc6b22a-603e-11eb-8b86-12bb97331649.png

CBOW 模型學習的任務就是讓式 (3.3) 表示的損失函數(shù)盡可能地小。學習好的權重參數(shù)就是我們想要的單詞的分布式表示。這里,我們只考慮了窗口大小為 1 的情況,不過其他的窗口大小(或者窗口大小為 m 的一般情況) 也很容易用數(shù)學式表示。

理解了 CBOW 模型的實現(xiàn),在實現(xiàn) skip-gram 模型時也就不存在什么難點了。這里就不再介紹 skip-gram 模型的實現(xiàn)。詳細代碼可以參考 ch03/simple_skip_gram.py 。


總結

到目前為止,我們已經(jīng)了解了基于計數(shù)的方法和基于神經(jīng)網(wǎng)絡的方法(特別是 word2vec) ?;谟嫈?shù)的方法通過對整個語料庫的統(tǒng)計數(shù)據(jù)進行一次學習來獲得單詞的分布式表示,而基于推理的方法則通過反復觀察語料庫的一部分數(shù)據(jù)進行學習(mini-batch 學習) 。

如果需要向詞匯表添加新詞匯并更新詞向量。

基于計數(shù)的方法:需要從頭開始計算,重新生成共現(xiàn)矩陣、進行SVD降維等操作。

而基于神經(jīng)網(wǎng)絡的方法:允許參數(shù)的增量學習??梢詫⒅皩W習好的權重參數(shù)作為初始值繼續(xù)學習更新權重參數(shù)。

但是現(xiàn)階段的CBOW模型在學習效率上還存在一些問題。下一節(jié)我們將改進這個CBOW模型,使其更加高效的學習詞向量表示。

原文標題:師妹問我:如何在7分鐘內(nèi)徹底搞懂word2vec?

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107799
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136958
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23281

原文標題:師妹問我:如何在7分鐘內(nèi)徹底搞懂word2vec?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    內(nèi)置USB聲卡AI神經(jīng)網(wǎng)絡算法降噪消回音模組A-59U#AI神經(jīng)網(wǎng)絡#回聲消除#智能降噪

    神經(jīng)網(wǎng)絡
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 17:09:37

    神經(jīng)網(wǎng)絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經(jīng)網(wǎng)絡的實現(xiàn)。什么是神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡的核心思想是模仿生物神經(jīng)系統(tǒng)的結構,特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?335次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的初步認識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡是個啥?

    在自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網(wǎng)格。
    的頭像 發(fā)表于 11-19 18:15 ?2078次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經(jīng)網(wǎng)絡</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經(jīng)網(wǎng)絡內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡的性能并最??大限度地減少其內(nèi)存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數(shù)字識別的神經(jīng)網(wǎng)絡
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡部署相關操作

    在完成神經(jīng)網(wǎng)絡量化后,需要將神經(jīng)網(wǎng)絡部署到硬件加速器上。首先需要將所有權重數(shù)據(jù)以及輸入數(shù)據(jù)導入到存儲器內(nèi)。 在仿真環(huán)境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(LNN):時間連續(xù)性與動態(tài)適應性的神經(jīng)網(wǎng)絡

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡架構,其設計理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的神經(jīng)結構,盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1226次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    神經(jīng)網(wǎng)絡的并行計算與加速技術

    隨著人工智能技術的飛速發(fā)展,神經(jīng)網(wǎng)絡在眾多領域展現(xiàn)出了巨大的潛力和廣泛的應用前景。然而,神經(jīng)網(wǎng)絡模型的復雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1130次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的并行計算與加速技術

    基于神經(jīng)網(wǎng)絡的數(shù)字預失真模型解決方案

    在基于神經(jīng)網(wǎng)絡的數(shù)字預失真(DPD)模型中,使用不同的激活函數(shù)對整個系統(tǒng)性能和能效有何影響?
    的頭像 發(fā)表于 08-29 14:01 ?3473次閱讀

    無刷電機小波神經(jīng)網(wǎng)絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經(jīng)網(wǎng)絡來實現(xiàn)轉角預測,并采用改進遺傳算法來訓練網(wǎng)絡結構與參數(shù),借助
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡專家系統(tǒng)在電機故障診斷中的應用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進行自學習、自適應的問題,本文提出了基于種經(jīng)網(wǎng)絡專家系統(tǒng)的并步電機故障診斷方法。本文將小波神經(jīng)網(wǎng)絡和專家系統(tǒng)相結合,充分發(fā)揮了二者故障診斷的優(yōu)點,很大程度上降低了對電機
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡RAS在異步電機轉速估計中的仿真研究

    眾多方法中,由于其結構簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡的特點,使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡已經(jīng)通過python或者MATLAB訓練好的神經(jīng)網(wǎng)絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1218次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的步驟解析

    NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡渲染技術的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡渲染技術的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經(jīng)網(wǎng)絡著色技術,讓開
    的頭像 發(fā)表于 04-07 11:33 ?1187次閱讀