91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文讓你了解知識(shí)圖譜多跳問(wèn)答

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:MIRA Lab ? 作者: 蔡健宇 ? 2021-04-19 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、簡(jiǎn)介

1. 什么是問(wèn)答

問(wèn)答 (Question Answering) 是自然語(yǔ)言處理 (Natural Language Processing) 的一個(gè)重要研究領(lǐng)域。在該領(lǐng)域中,研究者們旨在構(gòu)建出這樣一種系統(tǒng):它可以針對(duì)人類(lèi)以「自然語(yǔ)言形式」提出的問(wèn)題自動(dòng)地給出答案。

問(wèn)答這一領(lǐng)域的研究成果已經(jīng)早已普及我們每個(gè)人的生活。例如,當(dāng)你清晨起床詢問(wèn)你的智能語(yǔ)音助手 “今天天氣怎么樣”時(shí),你會(huì)得到類(lèi)似這樣的回答:“今天是晴天,溫度 15-22 攝氏度”。

與傳統(tǒng)的信息檢索以及數(shù)據(jù)庫(kù)檢索不同的是,問(wèn)答這一領(lǐng)域旨在研究那些以「自然語(yǔ)言形式」給出的問(wèn)題,而非結(jié)構(gòu)化的查詢語(yǔ)言,這更符合日常生活中的應(yīng)用場(chǎng)景。但自然語(yǔ)言的模糊性也為問(wèn)題的準(zhǔn)確理解帶來(lái)了很大困難。

同時(shí),問(wèn)答的數(shù)據(jù)源可能是多種多樣的。在不同的場(chǎng)景下,結(jié)構(gòu)化的知識(shí)圖譜以及無(wú)結(jié)構(gòu)的文本均有可能是潛在的數(shù)據(jù)源。因此,針對(duì)不同的數(shù)據(jù)源研究相應(yīng)的推理算法也是當(dāng)前問(wèn)答領(lǐng)域的熱門(mén)方向之一。

因此,總結(jié)一下,構(gòu)建一個(gè)高質(zhì)量問(wèn)答系統(tǒng)的關(guān)鍵點(diǎn)在于:

準(zhǔn)確的問(wèn)題理解技術(shù)

針對(duì)不同的數(shù)據(jù)源設(shè)計(jì)合適的推理算法

本文將重點(diǎn)針對(duì)以「知識(shí)圖譜」為主要數(shù)據(jù)源的問(wèn)答場(chǎng)景(知識(shí)圖譜問(wèn)答)進(jìn)行介紹。首先,我們回顧一下知識(shí)圖譜的相關(guān)概念與定義。

2. 什么是知識(shí)圖譜 ?

知識(shí)圖譜 (Knowledge Graph) 是一種以「多關(guān)系有向圖」形式存儲(chǔ)人類(lèi)「知識(shí)」的數(shù)據(jù)結(jié)構(gòu)。知識(shí)圖譜中的每個(gè)節(jié)點(diǎn)表示一個(gè)實(shí)體,兩個(gè)節(jié)點(diǎn)之間的有向邊表示它們之間的關(guān)系。例如,《姚明》 是一個(gè)實(shí)體,《上?!?也是一個(gè)實(shí)體,它們之間的關(guān)系是 《出生于》。這樣的一個(gè)三元組 《姚明,出生于,上?!?表示一個(gè)事實(shí) (Fact)。

同樣作為問(wèn)答的數(shù)據(jù)源,與無(wú)結(jié)構(gòu)的文本數(shù)據(jù)相比,結(jié)構(gòu)化的知識(shí)圖譜以一種更加清晰、準(zhǔn)確的方式表示人類(lèi)知識(shí),從而為高質(zhì)量的問(wèn)答系統(tǒng)的構(gòu)建帶來(lái)了前所未有的發(fā)展機(jī)遇。

3. 什么是知識(shí)圖譜問(wèn)答?

知識(shí)圖譜問(wèn)答 (Question Answering over Knowledge Graphs),顧名思義,指的是使用知識(shí)圖譜作為主要數(shù)據(jù)源的問(wèn)答場(chǎng)景。對(duì)于給定的問(wèn)題,我們基于知識(shí)圖譜進(jìn)行推理從而得到答案。這一技術(shù)已經(jīng)被業(yè)界廣泛地使用于相關(guān)智能搜索與推薦業(yè)務(wù)中,其中最著名的當(dāng)屬谷歌的搜索引擎業(yè)務(wù)。

例如,對(duì)于這樣一個(gè)比較簡(jiǎn)單的問(wèn)題 “姚明的出生地是哪里?”,谷歌通過(guò)知識(shí)圖譜中 《姚明,出生于,上?!?這個(gè)三元組得到答案是 《上?!?這一實(shí)體。

圖 1:谷歌搜索引擎基于知識(shí)圖譜對(duì)于簡(jiǎn)單問(wèn)題的回答

對(duì)于更加復(fù)雜的一些問(wèn)題,如 “成龍的父親的出生地是哪里?”,谷歌依然可以通過(guò)知識(shí)圖譜中的多個(gè)三元組 《成龍,父親,房道龍 (Charles Chan)》,《房道龍,出生地,和縣》 得到答案是實(shí)體 《和縣》。

6b2322ac-9fb6-11eb-8b86-12bb97331649.png

圖 2:谷歌搜索引擎基于知識(shí)圖譜對(duì)于復(fù)雜問(wèn)題的回答

接下來(lái),為了更好地介紹知識(shí)圖譜問(wèn)答領(lǐng)域的發(fā)展,我們需要先明確幾個(gè)基本概念:

「主題實(shí)體」:主題實(shí)體指的是出現(xiàn)在問(wèn)題中的實(shí)體。例如,對(duì)于問(wèn)題 “姚明的出生地是哪里?”,我們通過(guò) “姚明” 這一字符串判斷主題實(shí)體是 《姚明》 ,它也是后續(xù)推理流程中的推理起點(diǎn)。理論上一個(gè)問(wèn)題中的主題實(shí)體不限個(gè)數(shù),但在后面介紹的知識(shí)圖譜多跳問(wèn)答領(lǐng)域中,一般假設(shè)一個(gè)問(wèn)題中只存在一個(gè)主題實(shí)體。

「答案實(shí)體」:理論上問(wèn)題的答案未必是一個(gè)實(shí)體,例如 ”中國(guó)在北京奧運(yùn)會(huì)獲得的金牌有多少枚?“ 的答案是一個(gè)數(shù)字。但在后面介紹的知識(shí)圖譜多跳問(wèn)答領(lǐng)域中,一般假設(shè)問(wèn)題的答案是知識(shí)圖譜中的一個(gè)實(shí)體,即答案實(shí)體。

二、知識(shí)圖譜問(wèn)答的發(fā)展簡(jiǎn)史

接下來(lái),本文將從兩個(gè)維度簡(jiǎn)要介紹知識(shí)圖譜問(wèn)答的發(fā)展歷史。

一方面,按照所研究的問(wèn)題 (Question) 的難易程度,知識(shí)圖譜問(wèn)答領(lǐng)域的發(fā)展可分為兩個(gè)階段:早期的 「Simple QA」 以及當(dāng)前主流的 「Complex QA」。

另一方面,按照建模方式的不同,知識(shí)圖譜問(wèn)答領(lǐng)域的工作可分為兩個(gè)流派:「語(yǔ)義解析」 (Semantic Parsing) 與 「信息檢索」 (Information Retrieval)。

1. 問(wèn)題難度:Simple QA & Complex QA

(1)。 Simple QA在知識(shí)圖譜問(wèn)答領(lǐng)域發(fā)展的早期,研究者們主要針對(duì) Simple QA 這種較為簡(jiǎn)單的場(chǎng)景開(kāi)展研究 [1, 2, 3]。Simple QA 研究的是那些「可以使用單個(gè)三元組推理出答案」的問(wèn)題,這些問(wèn)題也被稱為 Simple Questions 。

例如,對(duì)于 “姚明的出生地是哪里?” 這一問(wèn)題,我們可以通過(guò)知識(shí)圖譜中的單個(gè)三元組 《姚明,出生于,上海》 得到答案是 《上海》 這個(gè)實(shí)體。

(2)。 Complex QA經(jīng)過(guò)一段時(shí)間的研究,Simple QA 場(chǎng)景中已經(jīng)發(fā)展出了許多成熟且實(shí)用的方法。因此,研究者們轉(zhuǎn)而研究更為復(fù)雜的問(wèn)題 (Complex Questions)。這些問(wèn)題更契合實(shí)際應(yīng)用中的復(fù)雜場(chǎng)景,而這一研究方向也被稱為 Complex QA [4, 5]。

簡(jiǎn)單地說(shuō),Complex Questions 是 Simple Questions 的補(bǔ)集,即「無(wú)法使用單個(gè)三元組」回答的問(wèn)題。在實(shí)際的研究中,研究者們主要關(guān)注以下類(lèi)型的問(wèn)題:

「帶約束的問(wèn)題」:例如:”誰(shuí)是第一屆溫網(wǎng)男單冠軍?“。該問(wèn)題中的 “第一屆” 表示一種對(duì)答案實(shí)體的約束。

「多跳問(wèn)題」:例如:”成龍主演電影的導(dǎo)演是哪些人?“。該問(wèn)題需要使用多個(gè)三元組所形成的多跳推理路徑才能夠回答。例如:通過(guò)這些三元組 《成龍,主演,新警察故事》, 《新警察故事,導(dǎo)演,陳木勝》,我們推理出 《陳木勝》 是一個(gè)正確答案。

本文之后將主要結(jié)合多跳問(wèn)題這一研究場(chǎng)景(知識(shí)圖譜多跳問(wèn)答)進(jìn)行詳細(xì)介紹。

2. 建模方式:Semantic Parsing & Information Retrieval

(1)。 Semantic Parsing語(yǔ)義解析 (Semantic Parsing) 類(lèi)方法旨在將問(wèn)題解析為可執(zhí)行的圖數(shù)據(jù)庫(kù)「查詢語(yǔ)句」 (如 SPARQL),然后通過(guò)執(zhí)行該語(yǔ)句找到答案。

對(duì)于 Simple Questions,語(yǔ)義解析類(lèi)方法旨在將問(wèn)題解析為一個(gè)頭實(shí)體 與一個(gè)關(guān)系 ,即 (h, r, ?) 的形式。例如,對(duì)于 “姚明的出生地是哪里?” 這一問(wèn)題,可以解析出頭實(shí)體 《姚明》 與關(guān)系 《出生地》,并得到偽查詢語(yǔ)句 《姚明,出生地,?》。隨后通過(guò)執(zhí)行該查詢語(yǔ)句得到答案 《上?!贰?/p>

對(duì)于 Complex Questions,語(yǔ)義解析類(lèi)方法將它們解析為一種 查詢圖 (Query Graph) [4]。例如,對(duì)于 ”成龍第一部主演的電影的導(dǎo)演是誰(shuí)?“ 這一復(fù)雜問(wèn)題,我們可以將其解析為以下查詢圖。

6b33a460-9fb6-11eb-8b86-12bb97331649.png

圖 3:語(yǔ)義解析類(lèi)方法示意圖

當(dāng)我們執(zhí)行這張查詢圖所表示的查詢語(yǔ)句時(shí),我們首先找到成龍主演的所有電影 ,再通過(guò) argmin 這一約束從中篩選出上映時(shí)間最早的電影。對(duì)于這部篩選出來(lái)的電影,我們進(jìn)一步查詢出它的導(dǎo)演是 ,并作為答案返回。

(2)。 Information Retrieval信息檢索 (Information Retrieval) 類(lèi)方法 [5] 旨在從問(wèn)題與候選答案中提取出它們的特征,并基于這些特征設(shè)計(jì)相應(yīng)的打分函數(shù)以衡量 ”問(wèn)題-候選答案“ 的語(yǔ)義相關(guān)性,最終得分最高的候選答案被作為預(yù)測(cè)答案輸出。下圖給出了信息檢索類(lèi)模型的處理流程。

6b473ea8-9fb6-11eb-8b86-12bb97331649.png

圖 4:信息檢索類(lèi)方法示意圖

三、知識(shí)圖譜多跳問(wèn)答

本節(jié)將結(jié)合一些重點(diǎn)工作對(duì) 「知識(shí)圖譜多跳問(wèn)答」 這一方向進(jìn)行介紹。從問(wèn)題的難易程度這一視角來(lái)看,多跳問(wèn)答屬于 Complex QA 這一領(lǐng)域;從模型的流派這一視角來(lái)看,多跳問(wèn)答這一方向中的模型的主流是信息檢索這一流派,因此我們接下來(lái)也將重點(diǎn)結(jié)合這一流派進(jìn)行介紹。

通俗來(lái)說(shuō),多跳問(wèn)題 (Multi-hop Questions) 指的是那些需要知識(shí)圖譜 「多跳推理」 才能回答的問(wèn)題。例如,若要回答 ”成龍主演電影的導(dǎo)演是哪些人?“ 這一問(wèn)題,則需要多個(gè)三元組所形成的多跳推理路徑 《成龍,主演,新警察故事》, 《新警察故事,導(dǎo)演,陳木勝》 才能夠回答。

這種類(lèi)型的問(wèn)題在實(shí)際應(yīng)用中十分普遍,但想要構(gòu)建出一個(gè)高準(zhǔn)確率的知識(shí)圖譜多跳問(wèn)答系統(tǒng)卻并非易事。下圖展示了一個(gè)谷歌搜索中的 Bad Case。

我們嘗試在谷歌搜索中輸入以下問(wèn)題 ”姚明的妻子的父親的出生地是哪里?“。對(duì)于該問(wèn)題,正確的推理路徑為 妻子父親出生地。但是,谷歌卻錯(cuò)誤地將問(wèn)題解析成了以下推理路徑 父親妻子出生地。由于姚明的母親(父親的妻子)是方鳳娣 (Fang Fengdi),谷歌將她的出生地作為答案返回。由此可見(jiàn),知識(shí)圖譜多跳問(wèn)答是一個(gè)極具挑戰(zhàn)性的任務(wù)。

6b5ac982-9fb6-11eb-8b86-12bb97331649.png

圖 5:谷歌搜索引擎對(duì)于復(fù)雜問(wèn)題的錯(cuò)誤回答案例

接下來(lái),我們將結(jié)合近年的幾個(gè)重要工作對(duì)知識(shí)圖譜多跳問(wèn)答這一領(lǐng)域的發(fā)展進(jìn)行介紹。在開(kāi)篇的簡(jiǎn)介中,我們提到高質(zhì)量問(wèn)答系統(tǒng)的構(gòu)建包含兩個(gè)關(guān)鍵點(diǎn):?jiǎn)栴}理解與推理算法。知識(shí)圖譜多跳問(wèn)答也不例外。接下來(lái)要介紹的幾篇工作也正是圍繞這兩個(gè)關(guān)鍵點(diǎn)展開(kāi)。

(1)。 VRN:端到端的問(wèn)題理解

知識(shí)圖譜問(wèn)答中,問(wèn)題理解的首要目標(biāo)就是識(shí)別問(wèn)題中的主題實(shí)體 (Topic Entity)。在之前的例子中,如 “姚明的出生地是哪里?”,我們通過(guò) “姚明” 這一字符串判斷主題實(shí)體是 《姚明》 ,它也是后續(xù)推理流程中的推理起點(diǎn)。

之前的一些工作 [6] 通過(guò)文本匹配的方式來(lái)識(shí)別主題實(shí)體,但在實(shí)際應(yīng)用場(chǎng)景中這種方式易受噪聲(自然語(yǔ)言的模糊性和錯(cuò)別字)影響。在這些情況下,如果我們將知識(shí)圖譜問(wèn)答分為主題實(shí)體識(shí)別與知識(shí)推理這兩個(gè)獨(dú)立的階段,那么在主題實(shí)體識(shí)別這一階段產(chǎn)生的錯(cuò)誤往往會(huì)傳遞到知識(shí)推理這一階段,從而對(duì)最終預(yù)測(cè)結(jié)果產(chǎn)生嚴(yán)重的影響。

為了解決這一問(wèn)題,VRN [5] 提出了一個(gè)端到端 (end-to-end) 的框架。它將主題實(shí)體識(shí)別與知識(shí)推理這兩個(gè)模塊以端到端的方式融合起來(lái),從而訓(xùn)練過(guò)程中的 loss 會(huì)直接反饋到主題實(shí)體識(shí)別模塊,有助于更準(zhǔn)確地在噪聲環(huán)境中識(shí)別出正確的主題實(shí)體。

為了實(shí)現(xiàn) ”端到端“ 這一目標(biāo),VRN 進(jìn)行了以下概率建模。對(duì)于給定的問(wèn)題 ,它的正確答案是實(shí)體 的概率表示為 。問(wèn)題 中的主題實(shí)體是實(shí)體 的概率表示為 。給定主題實(shí)體是 的情況下,問(wèn)題 的答案是 的概率表示為。從而得到,

其中 表示的是實(shí)體識(shí)別這一流程, 表示的是知識(shí)推理這一流程。本質(zhì)上,VRN 是將主題實(shí)體 建模為隱變量,然后以全概率公式的形式表示 。

接下來(lái)介紹的三個(gè)工作主要圍繞推理算法進(jìn)行研究。更具體地,這些工作主要針對(duì)知識(shí)圖譜「鏈接缺失」 (incomplete) 這一真實(shí)場(chǎng)景下的推理算法進(jìn)行研究。

(2)。 GraftNet: 基于多源數(shù)據(jù)的問(wèn)答

真實(shí)應(yīng)用場(chǎng)景下的知識(shí)圖譜往往是存在鏈接缺失問(wèn)題的,即一部分正確的三元組(事實(shí))沒(méi)有被包含進(jìn)知識(shí)圖譜中。而這些缺失的三元組可能對(duì)于準(zhǔn)確地回答給定的問(wèn)題至關(guān)重要。

為了解決這一問(wèn)題,GraftNet [7] 采取了以下措施:

使用無(wú)結(jié)構(gòu)的文本數(shù)據(jù)作為結(jié)構(gòu)化的知識(shí)圖譜數(shù)據(jù)的補(bǔ)充;

提出了一個(gè)圖神經(jīng)網(wǎng)絡(luò)模型 (GNN),它可以在文本與知識(shí)圖譜組成的混合類(lèi)型數(shù)據(jù)上進(jìn)行推理并得到答案。

對(duì)于無(wú)結(jié)構(gòu)的文本數(shù)據(jù),GraftNet 將每個(gè)文檔 (document) 看做一個(gè)節(jié)點(diǎn),并融入知識(shí)圖譜結(jié)構(gòu)中:如果該文檔中包含某個(gè)實(shí)體 ,那么就在這個(gè)文檔與實(shí)體 之間建立連接。下圖展示了一個(gè)直觀的例子。

6b6b2174-9fb6-11eb-8b86-12bb97331649.png

圖 6:GraftNet 多源數(shù)據(jù)融合示意圖 [7]

基于這種由知識(shí)圖譜與文檔數(shù)據(jù)組成的圖結(jié)構(gòu),GraftNet 設(shè)計(jì)了一個(gè) GNN 用于推理,大致流程如下:

對(duì)給定的問(wèn)題 (假定主題實(shí)體 已知),使用 Personalized PageRank (PPR) 算法提取出以 為中心的子圖。最終的候選答案實(shí)體便被限定在該子圖中,這個(gè)子圖中實(shí)體的集合也就是候選答案集合。

使用多層 GNN 迭代更新實(shí)體、文檔的表示,使得圖中的每個(gè)節(jié)點(diǎn)可以感知到多跳鄰居的信息。最終基于更新后的實(shí)體表示計(jì)算每個(gè)候選實(shí)體的得分。詳細(xì)內(nèi)容請(qǐng)見(jiàn)原文 [7]。

至于為什么要裁剪出子圖,這是由于實(shí)際應(yīng)用中知識(shí)圖譜的實(shí)體數(shù)量過(guò)于龐大,如果將實(shí)體全集作為候選答案實(shí)體集,則會(huì)大大增加從中尋找正確答案的難度。因此,提前對(duì)實(shí)體進(jìn)行篩選,只保留一小部分與問(wèn)題相關(guān)的實(shí)體作為候選答案是一個(gè)明智的選擇。

(3)。 PullNet: 動(dòng)態(tài)子圖拓展

雖然 GraftNet 取得了不錯(cuò)的效果,但該方法依然存在著一些問(wèn)題。例如,GraftNet 為了減小候選答案實(shí)體集合的大小,使用 PPR 算法提取出以主題實(shí)體為中心的子圖。但這些子圖往往過(guò)大,而且有時(shí)并沒(méi)有將正確答案囊括進(jìn)來(lái) [8]。

為了解決這一問(wèn)題,PullNet [8] 提出了一種動(dòng)態(tài)的子圖拓展方法。具體地,該算法將子圖初始化為主題實(shí)體 ,隨后迭代地將與問(wèn)題相關(guān)程度高的鄰居實(shí)體拓展進(jìn)子圖,并同時(shí)使用 GNN 更新子圖中節(jié)點(diǎn)的表示。

圖7展示了 PullNet 相比 GraftNet 在子圖提取上的優(yōu)勢(shì),其中x-軸表示提取出的子圖大小(子圖中的實(shí)體數(shù)量),y-軸表示正確答案實(shí)體的召回率,即正確答案被包含在子圖中的百分比,PageRank-Nibble 表示 GraftNet 所使用的子圖提取方法。以左圖 MetaQA (3-hop) 數(shù)據(jù)集為例,GraftNet 如果想要達(dá)到 0.9 左右的召回率,則需要將子圖中的實(shí)體數(shù)量增大至 500 左右,而 PullNet 只需要?jiǎng)討B(tài)地拓展出實(shí)體數(shù)量大小為 65 左右的子圖,便可以輕松達(dá)到 0.983 的召回率。

6b7d920a-9fb6-11eb-8b86-12bb97331649.png

圖 7:正確答案實(shí)體召回率 (y-軸) 與子圖大小 (x-軸)關(guān)系示意圖 [8]

(4)。 EmbedKGQA: 基于鏈接預(yù)測(cè)思路的問(wèn)答方法

與 GraftNet 以及 PullNet 使用 GNN 進(jìn)行推理思路不同的是,EmbedKGQA [9] 借鑒了知識(shí)圖譜鏈接預(yù)測(cè) (Link Prediction) 的思路以實(shí)現(xiàn)在鏈接缺失的知識(shí)圖譜上的推理。

知識(shí)圖譜鏈接預(yù)測(cè)指的是給定一個(gè)三元組中的頭實(shí)體(或尾實(shí)體)與關(guān)系,對(duì)尾實(shí)體(或頭實(shí)體)進(jìn)行預(yù)測(cè)的任務(wù),即 (h, r, ?) 或 (?, r, t)。給定一個(gè)問(wèn)題 ,EmbedKGQA [9] 將該問(wèn)題中的主題實(shí)體 看做頭實(shí)體,將問(wèn)題 看做一個(gè)關(guān)系,要預(yù)測(cè)的尾實(shí)體則是該問(wèn)題的答案。也就是說(shuō),EmbedKGQA 將多跳問(wèn)答建模成 。

這樣的思路雖然簡(jiǎn)單,但也行之有效??偟膩?lái)說(shuō),在知識(shí)圖譜鏈接缺失的場(chǎng)景下,GraftNet 與 PullNet 從數(shù)據(jù)的角度出發(fā),采取了使用文本數(shù)據(jù) ”補(bǔ)全“ 知識(shí)圖譜的思路,同時(shí)針對(duì)這種混合類(lèi)型數(shù)據(jù)設(shè)計(jì)專(zhuān)門(mén)的推理算法。EmbedKGQA 則是從模型的角度出發(fā),直接借鑒了鏈接預(yù)測(cè)這種比較成熟的建模思路。

四、總結(jié)

構(gòu)建高質(zhì)量問(wèn)答系統(tǒng)的關(guān)鍵在于「準(zhǔn)確的問(wèn)題理解」與「針對(duì)相應(yīng)的數(shù)據(jù)源設(shè)計(jì)合適的推理算法」。從問(wèn)題理解的角度,知識(shí)圖多跳問(wèn)答近期工作主要關(guān)注于如何準(zhǔn)確地識(shí)別問(wèn)題中的實(shí)體。從推理算法的角度,近期的工作主要關(guān)注:1) 如何降低候選實(shí)體集合大小,同時(shí)減小對(duì)正確答案召回率的影響;2): 如何在鏈接缺失的知識(shí)圖譜上進(jìn)行推理。

Reference

[1] Berant, Jonathan et al. “Semantic Parsing on Freebase from Question-Answer Pairs.” EMNLP (2013)。

[2] Yih, Wen-tau et al. “Semantic Parsing for Single-Relation Question Answering.” ACL (2014)。

[3] Bordes, Antoine et al. “Large-scale Simple Question Answering with Memory Networks.” ArXiv abs/1506.02075 (2015)

[4] Yih, Wen-tau et al. “Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base.” ACL (2015)。

[5] Zhang, Yuyu et al. “Variational Reasoning for Question Answering with Knowledge Graph.” AAAI (2018)。

[6] Miller, Alexander H. et al. “Key-Value Memory Networks for Directly Reading Documents.” EMNLP (2016)。

[7] Sun, Haitian et al. “Open Domain Question Answering Using Early Fusion of Knowledge Bases and Text.” EMNLP (2018)。

[8] Sun, Haitian et al. “PullNet: Open Domain Question Answering with Iterative Retrieval on Knowledge Bases and Text.” EMNLP (2019)。

[9] Saxena, Apoorv et al. “Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings.” ACL (2020)。

作者簡(jiǎn)介:蔡健宇,2019年畢業(yè)于東南大學(xué),獲得工學(xué)學(xué)士學(xué)位?,F(xiàn)于中國(guó)科學(xué)技術(shù)大學(xué)電子工程與信息科學(xué)系的 MIRA Lab 實(shí)驗(yàn)室攻讀研究生,師從王杰教授。研究興趣包括知識(shí)表示與知識(shí)推理。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111557
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    14011
  • 知識(shí)圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8321

原文標(biāo)題:一文帶你入門(mén)知識(shí)圖譜多跳問(wèn)答

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    潤(rùn)和軟件入選大模型體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國(guó)信息通信研究院聯(lián)合編制的《大模型體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國(guó)內(nèi)大模型體機(jī)產(chǎn)業(yè)鏈上下游70余家代表性企業(yè),全面呈現(xiàn)我國(guó)大模型
    的頭像 發(fā)表于 12-10 17:56 ?1560次閱讀
    潤(rùn)和軟件入選大模型<b class='flag-5'>一</b>體機(jī)產(chǎn)業(yè)<b class='flag-5'>圖譜</b>

    網(wǎng)絡(luò)接口:數(shù)字世界的“門(mén)鈴”,了解多少?

    ,還能為選擇適合的網(wǎng)絡(luò)解決方案奠定基礎(chǔ)。在萬(wàn)物互聯(lián)的時(shí)代,這些基礎(chǔ)知識(shí)顯得愈發(fā)重要。 希望這篇簡(jiǎn)單的介紹能幫助大家對(duì)網(wǎng)絡(luò)接口有基本的了解。我始終相信,了解技術(shù)細(xì)節(jié)能讓客戶做出更明智的選擇。如果
    發(fā)表于 11-26 18:53

    HarmonyOSAI編程智能問(wèn)答

    CodeGenie基于生成式搜索能力,通過(guò)查詢生成、內(nèi)容優(yōu)選服務(wù)高效理解用戶意圖,問(wèn)答交互式地獲取編碼相關(guān)知識(shí)。 對(duì)話示例 在對(duì)話區(qū)域輸入需要查詢的問(wèn)題,開(kāi)始問(wèn)答。示例如下: ArkTS如何實(shí)現(xiàn)
    發(fā)表于 09-03 16:17

    HarmonyOS AI輔助編程工具(CodeGenie)智能問(wèn)答

    CodeGenie基于生成式搜索能力,在對(duì)話區(qū)域下拉框中選擇所需要的智能體,通過(guò)查詢生成、內(nèi)容優(yōu)選服務(wù)高效理解用戶意圖,問(wèn)答交互式地獲取編碼相關(guān)知識(shí)。 CodeGenie現(xiàn)接入小藝
    發(fā)表于 08-15 11:07

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】書(shū)籍介紹+第章讀后心得

    整合(源融合、概念關(guān)聯(lián)、知識(shí)圖譜構(gòu)建 )與邏輯推理(因果、數(shù)學(xué)、邏輯分析 ),支撐知識(shí)處理與推導(dǎo) 輔助決策 :通過(guò)方案規(guī)劃(任務(wù)分解、流程優(yōu)化、風(fēng)險(xiǎn)評(píng)估 )、建議生成(專(zhuān)業(yè)、個(gè)性化建議 )、數(shù)據(jù)
    發(fā)表于 07-17 11:59

    家電電路識(shí)圖自學(xué)手冊(cè)

    家電電路識(shí)圖自學(xué)手冊(cè)
    發(fā)表于 07-11 15:49 ?16次下載

    了解電壓諧波

    我們經(jīng)常會(huì)聽(tīng)到諧波,到底什么是諧波,怎么定義的?為什么要關(guān)注諧波?什么時(shí)候關(guān)注諧波?諧波如何計(jì)算或標(biāo)準(zhǔn)規(guī)定的諧波的算法是怎樣的?GB關(guān)于電壓諧波又是如何評(píng)估的?帶著諸多的問(wèn)題,我們一起來(lái)了解。
    的頭像 發(fā)表于 06-28 17:23 ?4830次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>了解</b>電壓諧波

    有獎(jiǎng)問(wèn)答 | Aigtek安泰電子“功“力無(wú)限知識(shí)竟賽!起答題抽好禮!

    親愛(ài)的電子工程師們~歡迎參加Aigtek“功“力無(wú)限知識(shí)競(jìng)賽!參與互動(dòng)答題就有機(jī)會(huì)贏得精美獎(jiǎng)品!作為專(zhuān)用于放大信號(hào)+驅(qū)動(dòng)測(cè)試領(lǐng)域的測(cè)試儀器,是否了解關(guān)于它基本知識(shí)?關(guān)于它的使用注意事
    的頭像 發(fā)表于 06-26 18:46 ?649次閱讀
    有獎(jiǎng)<b class='flag-5'>問(wèn)答</b> | Aigtek安泰電子“功“力無(wú)限<b class='flag-5'>知識(shí)</b>竟賽!<b class='flag-5'>一</b>起答題抽好禮!

    關(guān)于SFP連接器必須了解的那些知識(shí)

    關(guān)于SFP連接器必須了解的那些知識(shí) 、SFP光籠子的作用及材料組成 1.光籠子的概念與作用 ① 光籠子是什么? SFP Cage(Small Form-factor Pluggab
    的頭像 發(fā)表于 06-17 09:42 ?1122次閱讀
    關(guān)于SFP連接器<b class='flag-5'>你</b>必須<b class='flag-5'>了解</b>的那些<b class='flag-5'>知識(shí)</b>

    這么內(nèi)網(wǎng)穿透工具怎么選?不再糾結(jié)的終極指南!

    穿透工具就是的救星! 但問(wèn)題來(lái)了—— 市面上這么工具,Ngrok、FRP、ZeroNews……到底該選哪個(gè)? 別急,這篇文章將帶你全面了解各種內(nèi)網(wǎng)穿透方案的優(yōu)缺點(diǎn),幫你找到最適合自己的那
    的頭像 發(fā)表于 05-13 16:06 ?1281次閱讀
    這么<b class='flag-5'>多</b>內(nèi)網(wǎng)穿透工具怎么選?<b class='flag-5'>一</b>篇<b class='flag-5'>讓</b><b class='flag-5'>你</b>不再糾結(jié)的終極指南!

    輕輕松松學(xué)電工(識(shí)圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實(shí)際需要,主要介紹了常用電工電路識(shí)圖的基礎(chǔ)知識(shí)、方法及技巧,內(nèi)容包括常用電氣符號(hào)、電工識(shí)圖基本方法,以及識(shí)讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動(dòng)系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長(zhǎng)效續(xù)航,語(yǔ)音暢聊,情景對(duì)話,知識(shí)科普,色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級(jí)交互體驗(yàn) ① AI情感對(duì)話:不止問(wèn)答,更能陪你聊心事、講笑話,像朋友樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換種聲音陪伴
    發(fā)表于 04-24 16:11

    典型電路原理、電路識(shí)圖從入門(mén)到精通等資料

    1、電路識(shí)圖從入門(mén)到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?2.5w次閱讀
    典型電路原理、電路<b class='flag-5'>識(shí)圖</b>從入門(mén)到精通等資料

    每周推薦!電子工程師必學(xué)!典型電路原理、電路識(shí)圖從入門(mén)到精通等資料

    1、 電路識(shí)圖從入門(mén)到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的
    發(fā)表于 04-11 15:17

    電路識(shí)圖從入門(mén)到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過(guò)“入門(mén)篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,以及典型小家電、電動(dòng)車(chē)、洗衣機(jī)、
    發(fā)表于 04-10 16:22