91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知識圖譜——技術(shù)與行業(yè)應(yīng)用

恬靜簡樸1 ? 來源:恬靜簡樸1 ? 作者:恬靜簡樸1 ? 2022-10-14 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從一開始的Google搜索,到現(xiàn)在的聊天機器人、大數(shù)據(jù)風(fēng)控、證券投資、智能醫(yī)療、自適應(yīng)教育、推薦系統(tǒng),無一不跟知識圖譜相關(guān)。

隨著移動互聯(lián)網(wǎng)的發(fā)展,萬物互聯(lián)成為了可能,這種互聯(lián)所產(chǎn)生的數(shù)據(jù)也在爆發(fā)式地增長,而且這些數(shù)據(jù)恰好可以作為分析關(guān)系的有效原料。如果說以往的智能分析專注在每一個個體上,在移動互聯(lián)網(wǎng)時代則除了個體,這種個體之間的關(guān)系也必然成為我們需要深入分析的很重要一部分。 在一項任務(wù)中,只要有關(guān)系分析的需求,知識圖譜就“有可能”派的上用場。

知識圖譜的表示

知識圖譜應(yīng)用的前提是已經(jīng)構(gòu)建好了知識圖譜,也可以把它認(rèn)為是一個知識庫。這也是為什么它可以用來回答一些搜索相關(guān)問題的原因,比如在Google搜索引擎里輸入“Who is the wife of Bill Gates?”,我們直接可以得到答案-“Melinda Gates”。這是因為我們在系統(tǒng)層面上已經(jīng)創(chuàng)建好了一個包含“Bill Gates”和“Melinda Gates”的實體以及他倆之間關(guān)系的知識庫。所以,當(dāng)我們執(zhí)行搜索的時候,就可以通過關(guān)鍵詞提?。?Bill Gates", "Melinda Gates", "wife")以及知識庫上的匹配可以直接獲得最終的答案。這種搜索方式跟傳統(tǒng)的搜索引擎是不一樣的,一個傳統(tǒng)的搜索引擎它返回的是網(wǎng)頁、而不是最終的答案,所以就多了一層用戶自己篩選并過濾信息的過程。

poYBAGNIzBKAaTkxAAIlyThzrBw436.png

在現(xiàn)實世界中,實體和關(guān)系也會擁有各自的屬性,比如人可以有“姓名”和“年齡”。當(dāng)一個知識圖譜擁有屬性時,我們可以用屬性圖(Property Graph)來表示。下面的圖表示一個簡單的屬性圖。李明和李飛是父子關(guān)系,并且李明擁有一個138開頭的電話號,這個電話號開通時間是2018年,其中2018年就可以作為關(guān)系的屬性。類似的,李明本人也帶有一些屬性值比如年齡為25歲、職位是總經(jīng)理等。

pYYBAGNIzBSAQNLKAAIACxc8tZc445.png

這種屬性圖的表達(dá)很貼近現(xiàn)實生活中的場景,也可以很好地描述業(yè)務(wù)中所包含的邏輯。除了屬性圖,知識圖譜也可以用RDF來表示,它是由很多的三元組(Triples)來組成。RDF在設(shè)計上的主要特點是易于發(fā)布和分享數(shù)據(jù),但不支持實體或關(guān)系擁有屬性,如果非要加上屬性,則在設(shè)計上需要做一些修改。目前來看,RDF主要還是用于學(xué)術(shù)的場景,在工業(yè)界我們更多的還是采用圖數(shù)據(jù)庫(比如用來存儲屬性圖)的方式。感興趣的讀者可以參考RDF的相關(guān)文獻(xiàn),在文本里不多做解釋。

知識抽取

知識圖譜的構(gòu)建是后續(xù)應(yīng)用的基礎(chǔ),而且構(gòu)建的前提是需要把數(shù)據(jù)從不同的數(shù)據(jù)源中抽取出來。對于垂直領(lǐng)域的知識圖譜來說,它們的數(shù)據(jù)源主要來自兩種渠道:一種是業(yè)務(wù)本身的數(shù)據(jù),這部分?jǐn)?shù)據(jù)通常包含在公司內(nèi)的數(shù)據(jù)庫表并以結(jié)構(gòu)化的方式存儲;另一種是網(wǎng)絡(luò)上公開、抓取的數(shù)據(jù),這些數(shù)據(jù)通常是以網(wǎng)頁的形式存在所以是非結(jié)構(gòu)化的數(shù)據(jù)。

前者一般只需要簡單預(yù)處理即可以作為后續(xù)AI系統(tǒng)的輸入,但后者一般需要借助于自然語言處理等技術(shù)來提取出結(jié)構(gòu)化信息。比如在上面的搜索例子里,Bill Gates和Malinda Gate的關(guān)系就可以從非結(jié)構(gòu)化數(shù)據(jù)中提煉出來,比如維基百科等數(shù)據(jù)源。

pYYBAGNIzBWAD60gAAG3JGg5ERU878.png

信息抽取的難點在于處理非結(jié)構(gòu)化數(shù)據(jù)。在下面的圖中,我們給出了一個實例。左邊是一段非結(jié)構(gòu)化的英文文本,右邊是從這些文本中抽取出來的實體和關(guān)系。在構(gòu)建類似的圖譜過程當(dāng)中,主要涉及以下幾個方面的自然語言處理技術(shù):

a. 實體命名識別(Name Entity Recognition)

b. 關(guān)系抽?。≧elation Extraction)

c. 實體統(tǒng)一(Entity Resolution)

d. 指代消解(Coreference Resolution)

知識圖譜的存儲

知識圖譜主要有兩種存儲方式:一種是基于RDF的存儲;另一種是基于圖數(shù)據(jù)庫的存儲。它們之間的區(qū)別如下圖所示。RDF一個重要的設(shè)計原則是數(shù)據(jù)的易發(fā)布以及共享,圖數(shù)據(jù)庫則把重點放在了高效的圖查詢和搜索上。其次,RDF以三元組的方式來存儲數(shù)據(jù)而且不包含屬性信息,但圖數(shù)據(jù)庫一般以屬性圖為基本的表示形式,所以實體和關(guān)系可以包含屬性,這就意味著更容易表達(dá)現(xiàn)實的業(yè)務(wù)場景。

poYBAGNIzBaAKwfhAAGWlMzuoKY396.png

根據(jù)最新的統(tǒng)計(2018年上半年),圖數(shù)據(jù)庫仍然是增長最快的存儲系統(tǒng)。相反,關(guān)系型數(shù)據(jù)庫的增長基本保持在一個穩(wěn)定的水平。同時,我們也列出了常用的圖數(shù)據(jù)庫系統(tǒng)以及他們最新使用情況的排名。 其中Neo4j系統(tǒng)目前仍是使用率最高的圖數(shù)據(jù)庫,它擁有活躍的社區(qū),而且系統(tǒng)本身的查詢效率高,但唯一的不足就是不支持準(zhǔn)分布式。相反,OrientDB和JanusGraph(原Titan)支持分布式,但這些系統(tǒng)相對較新,社區(qū)不如Neo4j活躍,這也就意味著使用過程當(dāng)中不可避免地會遇到一些刺手的問題。如果選擇使用RDF的存儲系統(tǒng),Jena或許一個比較不錯的選擇。

pYYBAGNIzBeAHp_sAAH9wf4RM1k801.png

知識圖譜在其他行業(yè)中的應(yīng)用

除了金融領(lǐng)域,知識圖譜的應(yīng)用可以涉及到很多其他的行業(yè),包括醫(yī)療、教育、證券投資、推薦等等。其實,只要有關(guān)系存在,則有知識圖譜可發(fā)揮價值的地方。 在這里簡單舉幾個垂直行業(yè)中的應(yīng)用。

比如對于教育行業(yè),我們經(jīng)常談?wù)搨€性化教育、因材施教的理念。其核心在于理解學(xué)生當(dāng)前的知識體系,而且這種知識體系依賴于我們所獲取到的數(shù)據(jù)比如交互數(shù)據(jù)、評測數(shù)據(jù)、互動數(shù)據(jù)等等。為了分析學(xué)習(xí)路徑以及知識結(jié)構(gòu),我們則需要針對于一個領(lǐng)域的概念知識圖譜,簡單來講就是概念拓?fù)浣Y(jié)構(gòu)。在下面的圖中,我們給出了一個非常簡單的概念圖譜:比如為了學(xué)習(xí)邏輯回歸則需要先理解線性回歸;為了學(xué)習(xí)CNN,得對神經(jīng)網(wǎng)絡(luò)有所理解等等。所有對學(xué)生的評測、互動分析都離不開概念圖譜這個底層的數(shù)據(jù)。

poYBAGNIzBiAHYW3AAFlnZCiH4o564.png

在證券領(lǐng)域,我們經(jīng)常會關(guān)心比如“一個事件發(fā)生了,對哪些公司產(chǎn)生什么樣的影響?” 比如有一個負(fù)面消息是關(guān)于公司1的高管,而且我們知道公司1和公司2有種很密切的合作關(guān)系,公司2有個主營產(chǎn)品是由公司3提供的原料基礎(chǔ)上做出來的。

poYBAGNIzBmAcRIMAAJehHxE9cs206.png

其實有了這樣的一個知識圖譜,我們很容易回答哪些公司有可能會被這次的負(fù)面事件所影響。當(dāng)然,僅僅是“有可能”,具體會不會有強相關(guān)性必須由數(shù)據(jù)來驗證。所以在這里,知識圖譜的好處就是把我們所需要關(guān)注的范圍很快給我們?nèi)Χ?。接下來的問題會更復(fù)雜一些,比如既然我們知道公司3有可能被這次事件所影響,那具體影響程度有多大? 對于這個問題,光靠知識圖譜是很難回答的,必須要有一個影響模型、以及需要一些歷史數(shù)據(jù)才能在知識圖譜中做進(jìn)一步推理以及計算。

實踐上的幾點建議

首先,知識圖譜是一個比較新的工具,它的主要作用還是在于分析關(guān)系,尤其是深度的關(guān)系。所以在業(yè)務(wù)上,首先要確保它的必要性,其實很多問題可以用非知識圖譜的方式來解決。

知識圖譜領(lǐng)域一個最重要的話題是知識的推理。 而且知識的推理是走向強人工智能的必經(jīng)之路。但很遺憾的,目前很多語義網(wǎng)絡(luò)的角度討論的推理技術(shù)(比如基于深度學(xué)習(xí),概率統(tǒng)計)很難在實際的垂直應(yīng)用中落地。其實目前最有效的方式還是基于一些規(guī)則的方法論,除非我們有非常龐大的數(shù)據(jù)集。

最后,還是要強調(diào)一點,知識圖譜工程本身還是業(yè)務(wù)為重心,以數(shù)據(jù)為中心。不要低估業(yè)務(wù)和數(shù)據(jù)的重要性。

總之知識圖譜是一個既充滿挑戰(zhàn)而且非常有趣的領(lǐng)域。只要有正確的應(yīng)用場景,對于知識圖譜所能發(fā)揮的價值還是可以期待的。我相信在未來不到2,3年時間里,知識圖譜技術(shù)會普及到各個領(lǐng)域當(dāng)中。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4020

    瀏覽量

    68365
  • 知識圖譜
    +關(guān)注

    關(guān)注

    2

    文章

    132

    瀏覽量

    8316
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    實力認(rèn)證!行云創(chuàng)新入圍《AI 中國生態(tài)圖譜 2025》大模型開放平臺板塊

    了中國 AI 產(chǎn)業(yè)全鏈路生態(tài)布局,是洞察國內(nèi) AI 技術(shù)發(fā)展與產(chǎn)業(yè)落地的核心行業(yè)風(fēng)向標(biāo)。行云創(chuàng)新憑借在 AI 領(lǐng)域深厚的技術(shù)積淀、全棧產(chǎn)品能力及豐富的行業(yè)落地經(jīng)驗,成功 入圍
    的頭像 發(fā)表于 03-04 14:25 ?109次閱讀
    實力認(rèn)證!行云創(chuàng)新入圍《AI 中國生態(tài)<b class='flag-5'>圖譜</b> 2025》大模型開放平臺板塊

    潤和軟件入選大模型一體機產(chǎn)業(yè)圖譜

    格局與創(chuàng)新力量。在本次圖譜中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)以AI全棧技術(shù)能力與豐富的行業(yè)落地實踐入選圖譜,成為國產(chǎn)智能計算領(lǐng)域的重要力量。 潤和軟件入選《大模型一體
    的頭像 發(fā)表于 12-10 17:56 ?1512次閱讀
    潤和軟件入選大模型一體機產(chǎn)業(yè)<b class='flag-5'>圖譜</b>

    華為聯(lián)合發(fā)布宜興“天機鏡”大模型知識圖譜

    近日,由宜興市大數(shù)據(jù)發(fā)展有限公司與華為聯(lián)合主辦的“共聚AI泛生態(tài) 智啟產(chǎn)業(yè)新未來——城市大安全AI產(chǎn)業(yè)發(fā)展峰會暨華為中國行2025江蘇站”,在江蘇宜興舉行。
    的頭像 發(fā)表于 11-14 16:40 ?1560次閱讀

    中軟國際入選中國信通院AI Agent智能體產(chǎn)業(yè)圖譜1.0

    近日,中國信息通信研究院(以下簡稱“中國信通院”)《AI Agent智能體產(chǎn)業(yè)圖譜1.0》正式發(fā)布。該圖譜是國內(nèi)系統(tǒng)性梳理智能體產(chǎn)業(yè)生態(tài)的重要成果,聚焦“基礎(chǔ)底座、智能體平臺、場景智能體與行業(yè)智能體
    的頭像 發(fā)表于 07-14 14:55 ?1640次閱讀

    家電電路識圖自學(xué)手冊

    家電電路識圖自學(xué)手冊
    發(fā)表于 07-11 15:49 ?14次下載

    造物數(shù)科亮相華為開發(fā)者大會2025 | 技術(shù)創(chuàng)新與數(shù)字服務(wù),加速電子電路產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型

    6月20-22日,作為電子電路產(chǎn)業(yè)互聯(lián)網(wǎng)創(chuàng)新引領(lǐng)者,造物數(shù)科受邀出席東莞松山湖舉辦的華為開發(fā)者大會2025(HDC.2025),全面解析電子電路產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型解決方案,并聯(lián)合啟動工業(yè)知識圖譜聯(lián)盟。3
    的頭像 發(fā)表于 06-23 18:00 ?1184次閱讀
    造物數(shù)科亮相華為開發(fā)者大會2025 | <b class='flag-5'>技術(shù)</b>創(chuàng)新與數(shù)字服務(wù),加速電子電路產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型

    波峰焊技術(shù)入門:原理、應(yīng)用與行業(yè)標(biāo)準(zhǔn)

    等問題。波峰焊技術(shù)的廣泛應(yīng)用波峰焊技術(shù)在電子制造行業(yè)具有廣泛的應(yīng)用,如計算機、通訊、消費類電子、汽車電子等領(lǐng)域。在手機制造中,主板上的部分元器件采用波峰焊連接,確保信號傳輸穩(wěn)定;汽車電子中的發(fā)動機控制
    發(fā)表于 05-29 16:11

    B10 BMS技術(shù)知識初探(上、下)

    課程名稱: BMS技術(shù)知識初探課程目標(biāo): 可充電電池已是人們生活中不可缺少的組成部分,基于電池技術(shù)為基礎(chǔ)的電動汽車、儲能行業(yè),更是新能源發(fā)展的重要標(biāo)志。而BMS技術(shù)是電池安全的重要保障
    發(fā)表于 05-02 11:04

    輕輕松松學(xué)電工(識圖篇)

    內(nèi)容介紹 結(jié)合廣大電工人員的實際需要,主要介紹了常用電工電路識圖的基礎(chǔ)知識、方法及技巧,內(nèi)容包括常用電氣符號、電工識圖基本方法,以及識讀供配電系統(tǒng)圖、建筑電氣圖、電力拖動系統(tǒng)電氣圖、PLC梯形圖
    發(fā)表于 04-30 17:18

    東軟集團入選中國央國企數(shù)字化平臺廠商圖譜

    2025年4月,國際數(shù)據(jù)公司(IDC)發(fā)布《中國央國企數(shù)字化平臺廠商圖譜及領(lǐng)導(dǎo)者實踐》(Doc#CHC52296525,2025年3月)報告,深度剖析央國企數(shù)字化轉(zhuǎn)型趨勢、市場競爭格局,梳理行業(yè)
    的頭像 發(fā)表于 04-18 16:15 ?847次閱讀

    圖表細(xì)說電子元器件(建議下載)

    知識。以電子元器件為軸心,詳細(xì)講述電路識圖方法和修理技術(shù),使電子技術(shù)初學(xué)者輕松步入電子天地。 純分享貼,有需要可以直接下載附件獲取文檔! (如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持
    發(fā)表于 04-17 17:10

    典型電路原理、電路識圖從入門到精通等資料

    1、電路識圖從入門到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的
    的頭像 發(fā)表于 04-15 15:53 ?2.4w次閱讀
    典型電路原理、電路<b class='flag-5'>識圖</b>從入門到精通等資料

    每周推薦!電子工程師必學(xué)!典型電路原理、電路識圖從入門到精通等資料

    1、 電路識圖從入門到精通高清電子資料 由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的
    發(fā)表于 04-11 15:17

    電路識圖從入門到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識、典型單元電路的識圖方法,以及典型小家電、電動車、洗衣機、
    發(fā)表于 04-10 16:22

    SMT技術(shù)的核心優(yōu)勢與行業(yè)影響

    。這種技術(shù)不僅提高了電子產(chǎn)品的性能和可靠性,還顯著降低了生產(chǎn)成本,推動了電子制造行業(yè)的自動化和高效化發(fā)展。 SMT技術(shù)的主要特點包括其極高的組裝密度。貼片元件的體積和重量通常只有傳統(tǒng)插裝元件的1/10
    發(fā)表于 03-25 20:27