91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用Flood多維索引技術(shù)實現(xiàn)優(yōu)化數(shù)據(jù)存儲布局

牽手一起夢 ? 來源:學(xué)術(shù)頭條 ? 作者:佚名 ? 2020-09-22 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在多維索引表格(multi-dimensional table)上進(jìn)行掃描和篩選是現(xiàn)代分析型數(shù)據(jù)庫引擎的關(guān)鍵技術(shù)。為了對這些操作進(jìn)行優(yōu)化,數(shù)據(jù)庫常建立起聚類的索引結(jié)構(gòu)(indexes),如R-Trees,Z-ordering等,然而這些索引結(jié)構(gòu)在不同的數(shù)據(jù)集以及查詢集合(query workload)下很難進(jìn)行統(tǒng)一優(yōu)化。在本篇論文中,提出了名為Flood的多維學(xué)習(xí)索引結(jié)構(gòu)。通過同時優(yōu)化索引結(jié)構(gòu)以及存儲布局,這種結(jié)構(gòu)自動地調(diào)整自身以適應(yīng)具體數(shù)據(jù)集和查詢集合。該工作用來為端到端學(xué)習(xí)型數(shù)據(jù)庫系統(tǒng)構(gòu)建索引模塊。

論文背景

在多維索引表格上進(jìn)行掃描和篩選是現(xiàn)代分析型數(shù)據(jù)庫引擎的關(guān)鍵技術(shù)之一。如果數(shù)據(jù)完全根據(jù)其中某一個屬性(attribute)進(jìn)行組織,即不會涉及到多個屬性同時被訪問的情況,那么通過建立平衡樹或者進(jìn)行簡單二分搜索的方法已經(jīng)足夠。然而,如果數(shù)據(jù)需要通過不同屬性進(jìn)行篩選,那么通過建立多層索引的方法是不足以解決問題的。多層索引所帶來的存儲代價是的這項技術(shù)只能被應(yīng)用在很小的范圍內(nèi)。另一種解決方案是建立起多維索引(multi-dimensional indexes)對數(shù)據(jù)進(jìn)行組織管理。如Redshift以及Spark-SQL使用Z-ordering技術(shù)來對數(shù)據(jù)進(jìn)行布局,一些空間數(shù)據(jù)庫則嘗試使用R-tree來進(jìn)行索引。然而,現(xiàn)有的多維索引技術(shù)有著顯著的缺點。首先,這些技術(shù)都非常難以根據(jù)實際的數(shù)據(jù)集進(jìn)行優(yōu)化。其次,沒有一項方案可以作為所有問題的統(tǒng)一解決方法。不同的數(shù)據(jù)集以及查詢集合將會決定使用不同的多維索引技術(shù)。

為了解決上述缺點,本文提出了名為Flood的基于內(nèi)存的學(xué)習(xí)多維索引。該索引方案的重點在于自動地同時優(yōu)化數(shù)據(jù)存儲布局以及索引的結(jié)構(gòu),以此來獲得優(yōu)于其他所有多維索引的索引速度。Flood框架有以下兩個重點idea:

1. 使用一個下采樣的查詢集合,即一小部分查詢樣例構(gòu)成的查詢集合樣本,以此來學(xué)習(xí)不同維度屬性在查詢過程中的使用頻率?;谠撔畔?,F(xiàn)lood框架自動地調(diào)節(jié)數(shù)據(jù)存儲布局,以此優(yōu)化索引性能。

2. 使用一個累計分布函數(shù)CDF(Calculative Distribution Function)模型來將多維上可能的傾斜數(shù)據(jù)映射到一個均勻空間中。這個平滑(Flatten)過程使得每一個存儲的存儲單元儲存的數(shù)據(jù)量基本一致。以此更快地進(jìn)行索引。

Flood框架的主要貢獻(xiàn)有三:

1. 提出了第一個學(xué)習(xí)型多維索引,F(xiàn)lood框架。Flood從一個篩選斷言集合,即一個下采樣的查詢集合中學(xué)習(xí)查詢集合的分布函數(shù),以此調(diào)節(jié)數(shù)據(jù)存儲布局。

2. 使用三個真實數(shù)據(jù)集評估了多個不同的多維索引結(jié)構(gòu),實驗顯示Flood框架大大優(yōu)于其他的多維索引結(jié)構(gòu)。

3. 實驗顯示出Flood框架在不同的Filter Predicates上都實現(xiàn)了搜索加速,其索引結(jié)構(gòu)的建立速度與其他多維索引的建立速度相當(dāng)。

論文模型

如何利用Flood多維索引技術(shù)實現(xiàn)優(yōu)化數(shù)據(jù)存儲布局

多維索引查詢的難點在于同時對Y和Z兩個屬性進(jìn)行篩選,對其中某一個維度進(jìn)行排序的二分搜索無法順利完成該任務(wù)。

數(shù)據(jù)布局

如果把整個多維空間看作一個歐幾里得空間的話,不同于單維數(shù)據(jù),多維數(shù)據(jù)不可以基于一個維度,或者屬性進(jìn)行排序,這導(dǎo)致很多單維上可以使用的索引方法在多維索引上并不適用。但是如果將整個空間分成一個個小的格子,在單獨一個格子內(nèi)使用統(tǒng)一維度進(jìn)行排序,則在訪問該格子內(nèi)的數(shù)據(jù)中就可以通過使用單維索引技術(shù)加速索引。

模型基本操作

1. 映射查找存儲塊(Projection):通過查詢中的篩選條件得到需要遍歷的數(shù)據(jù)網(wǎng)格,并且將索引范圍約束在這些網(wǎng)格當(dāng)中。

2. 凝練查找范圍(Refinement):對按照某一維度進(jìn)行排序的網(wǎng)格數(shù)據(jù)進(jìn)行進(jìn)一步篩選,根據(jù)查找篩選條件對排序維度的限制進(jìn)一步縮小檢索的范圍。

3. 進(jìn)行搜索。

網(wǎng)格優(yōu)化

網(wǎng)格分割需要決定每一個維度所應(yīng)該分割的子空間個數(shù)。Flood框架可以通過學(xué)習(xí)選擇合適的網(wǎng)格個數(shù)以及決定哪一個維度作為排序維度,即在網(wǎng)格內(nèi)對數(shù)據(jù)進(jìn)行排序的維度。

數(shù)據(jù)學(xué)習(xí)優(yōu)化索引結(jié)構(gòu)

1. 數(shù)據(jù)平滑化

根據(jù)CDF模型,對空間進(jìn)行不均勻的劃分,達(dá)到每一個網(wǎng)格的數(shù)據(jù)點數(shù)量基本一致。實驗顯示當(dāng)數(shù)據(jù)量方差較小時,索引的速度有所加快。

2. 快速查找范圍凝練(使用機(jī)器學(xué)習(xí)方法)

在凝練搜索范圍的過程中,通過使用學(xué)習(xí)索引模型,RMI(Recursive Model Index),這一個多層線性回歸模型的索引結(jié)構(gòu),加速范圍索引的速度。論文中稱之為piecewise linear model。

實驗

本文在Sales,OSM,Perform三個真實數(shù)據(jù)上進(jìn)行了試驗。

同時,還驗證了數(shù)據(jù)扁平化等優(yōu)化方法在提升索引速度上的有效性。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3209

    瀏覽量

    76358
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4019

    瀏覽量

    68339
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    368

    瀏覽量

    23452
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    全志科技V系列多維影像處理技術(shù)指南

    全志V系列影像技術(shù)通過對產(chǎn)品應(yīng)用中的功耗管理、畫質(zhì)要求與AI處理等多維度挑戰(zhàn)的深入洞察,形成了覆蓋多場景的芯片平臺與高度優(yōu)化的算法配套體系,將復(fù)雜的系統(tǒng)級能力整合為簡潔、穩(wěn)定、可落地的解決方案,助力合作伙伴聚焦于產(chǎn)品創(chuàng)新與差異化
    的頭像 發(fā)表于 12-17 10:41 ?780次閱讀
    全志科技V系列<b class='flag-5'>多維</b>影像處理<b class='flag-5'>技術(shù)</b>指南

    內(nèi)存與數(shù)據(jù)處理優(yōu)化藝術(shù)

    ,避免了數(shù)組索引的額外計算。 選擇合適的數(shù)據(jù)類型同樣重要。如果一個變量只需要表示0或1,使用最小所需的數(shù)據(jù)類型就比使用較大的類型更好,因為它占用內(nèi)存更少,可能提高緩存利用率。 對于浮點
    發(fā)表于 11-14 07:46

    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)波形存儲時長可以通過哪些方式進(jìn)行優(yōu)化?

    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)波形存儲時長優(yōu)化需結(jié)合硬件升級、數(shù)據(jù)壓縮、存儲策略調(diào)整及架構(gòu)創(chuàng)新等多維技術(shù)
    的頭像 發(fā)表于 11-05 14:45 ?259次閱讀

    華納云香港服務(wù)器數(shù)據(jù)索引優(yōu)化策略

    在香港服務(wù)器環(huán)境中,數(shù)據(jù)索引優(yōu)化是提升整體性能的關(guān)鍵因素。隨著企業(yè)數(shù)據(jù)量的不斷增長,高效的索引管理能顯著提高查詢速度并降低服務(wù)器負(fù)載。本文
    的頭像 發(fā)表于 10-16 17:06 ?518次閱讀

    多種類幾何尺寸集成智能儀器定制 一站式解決產(chǎn)線多維度測量需求

    :多臺儀器占用空間,產(chǎn)線布局擁擠;人工轉(zhuǎn)運(yùn)工件、切換儀器,效率低;各儀器數(shù)據(jù)獨立存儲,難追溯、難分析;人工讀數(shù)易出錯,測量精度受人為影響大。 集成智能儀器解決方案:1臺設(shè)備集成多種幾何尺寸測量功能(如
    發(fā)表于 10-09 13:50

    淘寶/天貓:利用銷售數(shù)據(jù)API生成區(qū)域熱力圖,優(yōu)化倉儲布局

    ? ?在電商運(yùn)營中,倉儲布局直接影響物流效率和客戶滿意度。淘寶/天貓作為領(lǐng)先平臺,通過銷售數(shù)據(jù)API獲取區(qū)域銷售信息,生成熱力圖來可視化需求分布,從而科學(xué)優(yōu)化倉儲策略。本文將逐步解析這一流程,幫助
    的頭像 發(fā)表于 09-18 14:20 ?677次閱讀
    淘寶/天貓:<b class='flag-5'>利用</b>銷售<b class='flag-5'>數(shù)據(jù)</b>API生成區(qū)域熱力圖,<b class='flag-5'>優(yōu)化</b>倉儲<b class='flag-5'>布局</b>

    如何利用技術(shù)實現(xiàn)裝置數(shù)據(jù)驗證的全生命周期管理?

    裝置數(shù)據(jù)驗證的全生命周期管理,需覆蓋 需求規(guī)劃、數(shù)據(jù)采集、自動化驗證、存儲歸檔、應(yīng)用迭代、退役審計 6 大核心階段。利用技術(shù)
    的頭像 發(fā)表于 09-05 15:23 ?746次閱讀
    如何<b class='flag-5'>利用</b><b class='flag-5'>技術(shù)</b><b class='flag-5'>實現(xiàn)</b>裝置<b class='flag-5'>數(shù)據(jù)</b>驗證的全生命周期管理?

    HarmonyOS NEXT應(yīng)用元服務(wù)布局優(yōu)化利用布局邊界減少布局計算

    、SDK 4.0.10.9條件下測試得到,不同設(shè)備類型數(shù)據(jù)可能存在差異,測試數(shù)據(jù)旨在體現(xiàn)性能優(yōu)化趨勢,僅供參考。 由上數(shù)據(jù)可以發(fā)現(xiàn): ?首次繪制時,三種情況
    發(fā)表于 06-26 11:13

    HarmonyOS NEXT應(yīng)用元服務(wù)布局優(yōu)化精簡節(jié)點數(shù)

    中出現(xiàn)該規(guī)則相關(guān)問題,可參考本章節(jié)提供的優(yōu)化建議進(jìn)行調(diào)整。 布局階段是采用遞歸遍歷所有節(jié)點的方式進(jìn)行組件位置和大小的計算, 如果嵌套層級過深,將帶來了更多的中間節(jié)點,在布局測算階段下,額外的節(jié)點數(shù)將導(dǎo)致
    發(fā)表于 06-26 10:21

    HarmonyOS NEXT應(yīng)用元服務(wù)布局優(yōu)化精簡節(jié)點數(shù)

    中出現(xiàn)該規(guī)則相關(guān)問題,可參考本章節(jié)提供的優(yōu)化建議進(jìn)行調(diào)整。 布局階段是采用遞歸遍歷所有節(jié)點的方式進(jìn)行組件位置和大小的計算, 如果嵌套層級過深,將帶來了更多的中間節(jié)點,在布局測算階段下,額外的節(jié)點數(shù)將導(dǎo)致
    發(fā)表于 06-26 10:21

    HarmonyOS NEXT應(yīng)用元服務(wù)布局優(yōu)化ArkUI框架執(zhí)行流程

    應(yīng)用組件樹。當(dāng)用戶執(zhí)行交互(滑動,點擊等行為)時會觸發(fā)界面修改,界面的修改本質(zhì)上是通過觸發(fā)這棵組件樹的重新渲染,來實現(xiàn)應(yīng)用界面更新的過程。 應(yīng)用界面更新的過程主要分為兩個過程: 數(shù)據(jù)處理過程和UI
    發(fā)表于 06-23 09:41

    鴻蒙5開發(fā)寶藏案例分享---優(yōu)化應(yīng)用時延問題

    就不用加班改bug了?** 趕緊整理出來分享給大家,附詳細(xì)代碼解析!** ?** 案例1:布局層級優(yōu)化(Flex vs 相對布局)** 問題 :留言箱列表加載1024條數(shù)據(jù)時卡頓(10
    發(fā)表于 06-13 10:08

    鴻蒙Next實現(xiàn)瀑布流布局

    設(shè)計思路 鴻蒙 Next 的瀑布流布局可以通過自定義組件結(jié)合 Column、Row 等容器組件實現(xiàn)。其核心思路是將數(shù)據(jù)分成若干列,每列獨立滾動展示,且根據(jù)數(shù)據(jù)項高度動態(tài)調(diào)整
    發(fā)表于 06-10 14:17

    #### KEPServerEX 數(shù)據(jù)存儲插件\\-2

    觸發(fā)存儲。 觸發(fā)條件類型具體如下: 二、存儲數(shù)據(jù)的時候有沒有一個值可以代表某一類設(shè)備/數(shù)據(jù),方便后期數(shù)據(jù)
    發(fā)表于 04-09 16:09

    MRAM存儲替代閃存,F(xiàn)PGA升級新技術(shù)

    優(yōu)化的架構(gòu)設(shè)計和成熟的制程技術(shù),具備內(nèi)置的硬擦除器、錯誤檢測和校正機(jī)制,為用戶提供了可靠的開發(fā)環(huán)境。用戶可利用最新的Radiant工具,直接實現(xiàn)MRAM的編程接口,支持多種
    發(fā)表于 03-08 00:10 ?1960次閱讀