91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

deepwalk算法核心的步驟

智能生物識別說 ? 來源:快商通AI ? 作者:快商通AI ? 2021-10-14 09:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在數(shù)據(jù)量越來越大的今天,word2vec是通過字詞的共現(xiàn)關(guān)系來學(xué)習(xí)字詞的向量表示,Graph Embeding的思想類似于word2vec,通過圖中節(jié)點(diǎn)與節(jié)點(diǎn)的共現(xiàn)關(guān)系來學(xué)習(xí)節(jié)點(diǎn)的向量表示,構(gòu)成文本序列從而計(jì)算相互關(guān)聯(lián)出現(xiàn)的詞的概率,從而計(jì)算詞向量表示文本。那么在圖模型中的關(guān)鍵的問題就是如何來描述節(jié)點(diǎn)與節(jié)點(diǎn)的共現(xiàn)關(guān)系,于是方法是利用DeepWalk來采樣這樣的文本序列,通過隨機(jī)游走(RandomWalk)的方式在圖中進(jìn)行節(jié)點(diǎn)采樣,從而就能夠輸入序列計(jì)算圖的向量表示。所以deepwalk算法核心的步驟就是兩步:

RandomWalk

Skip-Gram

RandomWalk是一種可重復(fù)訪問已訪問節(jié)點(diǎn)的深度優(yōu)先遍歷算法。給定當(dāng)前訪問起始節(jié)點(diǎn),從其鄰居中隨機(jī)采樣節(jié)點(diǎn)作為下一個(gè)訪問節(jié)點(diǎn),重復(fù)此過程,直到訪問序列長度滿足預(yù)設(shè)條件。

spacer.gif算法過程就是輸入一個(gè)圖,輸出節(jié)點(diǎn)表示的矩陣,簡單對步驟進(jìn)行解析:

初始化:從 $\mathcal{U}^{|V| \times d}$ 樣本空間中采樣,embedding的大小為 $d$

構(gòu)建一棵二叉樹Hierarchical Softmax

開始做 $\gamma$ 步的隨機(jī)游走,這里的 $\gamma$ 是初始化好的超參數(shù)

打亂采樣得到的節(jié)點(diǎn)

這個(gè)循環(huán)是開始以每個(gè)節(jié)點(diǎn)為根節(jié)點(diǎn)開始做長度為 $t$ 的隨機(jī)游走,這里的 $t$ 為初始化的超參數(shù)。然后按窗口 $w$ 進(jìn)行SkipGram學(xué)習(xí)文本序列

SkipGram

一般提到word2vec有兩種主要的算法,Cbow和Skip-Gram,都是在統(tǒng)計(jì)語言模型的基礎(chǔ)上計(jì)算一個(gè)詞在文本中出現(xiàn)的概率用來作為這個(gè)詞的表示向量,于是優(yōu)化目標(biāo)就是最大化$Pr(w_n|w_0,w_1,...,w_{n-1})$ 。 $w$ 表示的就是詞。

SkipGram就是用當(dāng)前詞來預(yù)測上下文。丟掉了詞序并且不考慮與當(dāng)前詞的距離。優(yōu)化目標(biāo)是最大化同一個(gè)句子中同時(shí)出現(xiàn)的詞的共現(xiàn)概率:

預(yù)測給到的詞從整個(gè)詞表vocabulary中選擇,因此在輸出的時(shí)候會計(jì)算softmax進(jìn)行選擇,維度為 $|V|$ ,計(jì)算的維度會非常大,因此采用Hierarchical Softmax來構(gòu)建二叉樹進(jìn)行選擇,每個(gè)詞就只需要計(jì)算 $log_2^{|V|}$ 次。

Node2Vec

node2vec依然采用的是隨機(jī)游走的方式獲取頂點(diǎn)的臨近頂點(diǎn)序列,但不同的是node2vec采用的是一種有偏的隨機(jī)游走。給定當(dāng)前頂點(diǎn) $v$,訪問下一個(gè)頂點(diǎn)的概率是:

$\pi{vx}$ 是頂點(diǎn) $v$ 到頂點(diǎn) $x$ 之間的轉(zhuǎn)移概率, $Z$ 是歸一化參數(shù)。 node2vec引入兩個(gè)超參數(shù) $p$ 和 $q$ 來控制隨機(jī)游走的策略,假設(shè)當(dāng)前隨機(jī)游走經(jīng)過邊 $(v, x) $ 到達(dá)頂點(diǎn) $t$ ,設(shè) $\pi{vx}=\alpha{pq}(t, x)\cdot w{vx}$ , $w_{vx}$ 是頂點(diǎn) $v$ 和 $x$ 之間的邊權(quán)。

$d{tx}$ 為頂點(diǎn) $t$ 和頂點(diǎn) $x$ 之間的最短路徑距離。參數(shù)$p$和參數(shù)$q$的意義:控制重復(fù)訪問剛剛訪問過的頂點(diǎn)的概率。$p$作用于$d{tx}=0$,表達(dá)的意義就是頂點(diǎn)$x$就是訪問當(dāng)前頂點(diǎn)$v$之前剛剛訪問過的頂點(diǎn)。如果$p$較高,則訪問剛剛訪問過的頂點(diǎn)的概率會變低,反之變高。$q$控制著游走是向外還是向內(nèi),如果$q>1$,隨機(jī)游走傾向于訪問和節(jié)點(diǎn)$t$相接近的頂點(diǎn)(類似于$BFS$)。如果$q<1$,則傾向于訪問遠(yuǎn)離$t$的頂點(diǎn)(類似于$DFS$)。

Graph Convolutional Network

Graph Embedding的意義就在于能夠利用圖結(jié)構(gòu)處理非結(jié)構(gòu)化數(shù)據(jù),因此在cv和nlp領(lǐng)域能夠更進(jìn)一步結(jié)合先驗(yàn)知識進(jìn)行特征學(xué)習(xí),因此是深度學(xué)習(xí)領(lǐng)域的重要發(fā)展方向。定義圖$G=(V,E)$,$V$為節(jié)點(diǎn)的集合,$E$為邊的集合,對于每個(gè)節(jié)點(diǎn)$i$, 均有其特征$x_i$,特征矩陣可以用$X_{N*D}$來表示,其中$N$表示節(jié)點(diǎn)數(shù),$D$表示每個(gè)節(jié)點(diǎn)的特征編碼尺寸,在nlp應(yīng)用中就是embedding_size。對于圖的理解有一個(gè)經(jīng)典的思想:

圖中的每個(gè)結(jié)點(diǎn)無時(shí)無刻不因?yàn)猷従雍透h(yuǎn)的點(diǎn)的影響而在改變著自己的狀態(tài)直到最終的平衡,關(guān)系越親近的鄰居影響越大。

實(shí)際上從鄰居節(jié)點(diǎn)獲取信息的思想在很多領(lǐng)域都有應(yīng)用,例如:word2vec和pagerank。很多參考的理解描述了更加細(xì)節(jié)的數(shù)學(xué)原理:從傅立葉變換到拉普拉斯算子到拉普拉斯矩陣。很難理解。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98072
  • 節(jié)點(diǎn)
    +關(guān)注

    關(guān)注

    0

    文章

    229

    瀏覽量

    25571
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、特征值分解、向量空間等。應(yīng)用場
    發(fā)表于 02-27 10:53

    集成電路版圖設(shè)計(jì)的核心組成與關(guān)鍵步驟

    在集成電路設(shè)計(jì)中,版圖(Layout)是芯片設(shè)計(jì)的核心環(huán)節(jié)之一,指芯片電路的物理實(shí)現(xiàn)圖。它描述了電路中所有元器件(如晶體管、電阻、電容等)及其連接方式在硅片上的具體布局。版圖是將電路設(shè)計(jì)轉(zhuǎn)化為實(shí)際可制造物理形態(tài)的關(guān)鍵步驟,類似于建筑設(shè)計(jì)中平面圖到實(shí)際結(jié)構(gòu)的轉(zhuǎn)化。
    的頭像 發(fā)表于 12-26 15:12 ?727次閱讀
    集成電路版圖設(shè)計(jì)的<b class='flag-5'>核心</b>組成與關(guān)鍵<b class='flag-5'>步驟</b>

    合科泰MOSFET選型的四個(gè)核心步驟

    面對數(shù)據(jù)手冊中繁雜的參數(shù),如何快速鎖定適合應(yīng)用的 MOSFET?遵循以下四個(gè)核心步驟,您能系統(tǒng)化地完成選型,避免因關(guān)鍵參數(shù)遺漏導(dǎo)致的設(shè)計(jì)風(fēng)險(xiǎn)。
    的頭像 發(fā)表于 12-19 10:33 ?734次閱讀

    芯片制造的步驟

    ? ? ? ? 簡單地說,芯片的制造過程可以大致分為沙子原料(石英)、硅錠、晶圓、光刻(平版印刷)、蝕刻、離子注入、金屬沉積、金屬層、互連、晶圓測試與切割、核心封裝、等級測試、包裝上市等諸多步驟
    的頭像 發(fā)表于 11-14 11:14 ?521次閱讀

    如何使用恢復(fù)算法來實(shí)現(xiàn)開平方運(yùn)算

    本文主要描述如何使用恢復(fù)算法來實(shí)現(xiàn)開平方運(yùn)算。 簡介 開平方的恢復(fù)算法其實(shí)與除法的恢復(fù)算法十分相似。首先我們假設(shè)X為輸入的操作數(shù)(它應(yīng)該為正數(shù)),而他的平方根可以表示為Qn=0.q1q2q3
    發(fā)表于 10-24 13:33

    確定諧波檢測設(shè)備核心誤差要求的步驟有哪些?

    ≤±0.3%、基波誤差≤±0.1%)。以下是具體步驟,含每步的目標(biāo)、操作與輸出: 步驟 1:拆解場景核心需求 —— 明確 “誤差要求服務(wù)的目標(biāo)” 目標(biāo) :厘清場景的核心訴求,避免無依據(jù)
    的頭像 發(fā)表于 10-13 17:23 ?561次閱讀

    數(shù)據(jù)濾波算法的具體實(shí)現(xiàn)步驟是怎樣的?

    ? 數(shù)據(jù)濾波算法在電能質(zhì)量在線監(jiān)測裝置中的具體實(shí)現(xiàn),需圍繞 “ 數(shù)據(jù)采集→預(yù)處理→算法執(zhí)行→參數(shù)適配→效果驗(yàn)證→結(jié)果輸出 ” 的全流程展開,核心是結(jié)合裝置硬件特性(采樣率、ADC 精度)和干擾類型
    的頭像 發(fā)表于 10-10 16:45 ?824次閱讀

    AI的核心操控:從算法到硬件的協(xié)同進(jìn)化

    ? ? ? ?人工智能(AI)的核心操控涉及算法、算力和數(shù)據(jù)三大要素的深度融合,其技術(shù)本質(zhì)是通過硬件與軟件的協(xié)同優(yōu)化實(shí)現(xiàn)對復(fù)雜任務(wù)的自主決策與執(zhí)行。這一過程依賴多層技術(shù)棧的精密配合,從底層的芯片架構(gòu)
    的頭像 發(fā)表于 09-08 17:51 ?989次閱讀

    液態(tài)金屬電阻率測試儀的核心算法與信號處理技術(shù)

    液態(tài)金屬電阻率測試儀之所以能在科研與工業(yè)領(lǐng)域精準(zhǔn)捕捉液態(tài)金屬的電學(xué)特性,背后離不開核心算法與信號處理技術(shù)的協(xié)同支撐。這兩大技術(shù)如同測試儀的“智慧大腦” 與 “敏銳感官”,前者負(fù)責(zé)將原始測量數(shù)據(jù)轉(zhuǎn)化
    的頭像 發(fā)表于 09-01 09:21 ?613次閱讀
    液態(tài)金屬電阻率測試儀的<b class='flag-5'>核心算法</b>與信號處理技術(shù)

    SDIO SD卡電路設(shè)計(jì)速成攻略:核心步驟+調(diào)試技巧 !

    針對時(shí)間緊迫的開發(fā)者,本攻略直擊SDIO外接SD卡電路設(shè)計(jì)的核心步驟,并補(bǔ)充實(shí)用調(diào)試技巧,幫助你在最短時(shí)間完成從理論到可用的電路實(shí)現(xiàn)。 今天一起來聊聊 SDIO外接SD卡: SDIO (Secure
    的頭像 發(fā)表于 08-15 14:32 ?712次閱讀
    SDIO SD卡電路設(shè)計(jì)速成攻略:<b class='flag-5'>核心</b><b class='flag-5'>步驟</b>+調(diào)試技巧 !

    PPEC電源DIY套件:圖形化算法編程,解鎖電力電子底層算法實(shí)踐

    電源。這種方式不僅降低了開發(fā)門檻,還保留了對底層算法的控制能力,具有很強(qiáng)的實(shí)踐性和教育意義。 升級版開關(guān)電源DIY 套件核心組件含: PPEC 最小系統(tǒng)板(PPEC32F334RBT7 芯片
    發(fā)表于 08-14 11:30

    三坐標(biāo)測量機(jī)路徑規(guī)劃與補(bǔ)償技術(shù):核心算法解析

    三坐標(biāo)測量的微米級精度背后,是精密的路徑規(guī)劃算法與實(shí)時(shí)補(bǔ)償技術(shù)在保駕護(hù)航。三坐標(biāo)測量機(jī)的智能避撞算法保障了測量的安全與高效;溫度補(bǔ)償技術(shù)消除了環(huán)境的無形干擾;點(diǎn)云智能處理則讓海量數(shù)據(jù)蛻變?yōu)榫珳?zhǔn)的工程
    的頭像 發(fā)表于 08-01 14:15 ?1603次閱讀
    三坐標(biāo)測量機(jī)路徑規(guī)劃與補(bǔ)償技術(shù):<b class='flag-5'>核心算法</b>解析

    無鉛焊接工藝有哪些步驟

    無鉛焊接工藝的核心步驟如下,每個(gè)步驟均包含關(guān)鍵控制要點(diǎn)以確保焊接質(zhì)量:
    的頭像 發(fā)表于 08-01 09:13 ?908次閱讀

    openstack搭建詳細(xì)步驟

    openstack搭建詳細(xì)步驟
    的頭像 發(fā)表于 05-07 14:05 ?2027次閱讀

    封裝基板設(shè)計(jì)的詳細(xì)步驟

    封裝基板設(shè)計(jì)是集成電路封裝工程中的核心步驟之一,涉及將芯片與外部電路連接的基板(substrate)設(shè)計(jì)工作?;逶O(shè)計(jì)不僅決定了芯片與外部電路之間的電氣連接,還影響著封裝的可靠性、性能、成本及生產(chǎn)可行性。
    的頭像 發(fā)表于 03-12 17:30 ?2167次閱讀