91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析? 華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

IT科技蘇辭 ? 來(lái)源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析?

華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

當(dāng)下,信息社會(huì)正在從互聯(lián)網(wǎng)時(shí)代走向物聯(lián)網(wǎng)時(shí)代,信息交互變得更加龐雜、高效和智能。對(duì)于互聯(lián)網(wǎng)公司和IOT企業(yè)來(lái)說(shuō),既是機(jī)遇,也是挑戰(zhàn)。因?yàn)椋髽I(yè)不可避免的要面對(duì)數(shù)據(jù)量劇增帶來(lái)的一系列問(wèn)題:如何高效存儲(chǔ)和擴(kuò)容,如何在對(duì)原有業(yè)務(wù)改動(dòng)最小的情況下做到智能化和實(shí)時(shí)分析。

針對(duì)挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶(hù)提供了強(qiáng)擴(kuò)展、高存儲(chǔ)、高效導(dǎo)入/導(dǎo)出和實(shí)時(shí)分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶(hù)的高度認(rèn)可和支持。本文將以其中一個(gè)客戶(hù)業(yè)務(wù)的痛點(diǎn)問(wèn)題舉例,聊聊高效存儲(chǔ)和實(shí)時(shí)分析的3個(gè)秘訣。

海量存儲(chǔ),PB級(jí)無(wú)感擴(kuò)展

該用戶(hù)在線下本地化部署使用數(shù)據(jù)庫(kù)或者使用其他的存儲(chǔ)為云盤(pán)的數(shù)據(jù)庫(kù)時(shí),常常需要在容量達(dá)到閾值時(shí),提前規(guī)劃和申購(gòu)存儲(chǔ)資源,可能還需要連帶擴(kuò)容不必要的計(jì)算資源。而使用GaussDB (for Cassandra)之后,便再無(wú)此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨(dú)擴(kuò)展存儲(chǔ),高效擴(kuò)容,業(yè)務(wù)無(wú)感,最高可擴(kuò)展到PB級(jí)。

此外,客戶(hù)為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)再寫(xiě)入一份到HDFS中,供MapReduce和Spark分析,同時(shí)需要維護(hù)兩套資源,維護(hù)和資源成本成為了痛點(diǎn)。而客戶(hù)使用GaussDB (for Cassandra)之后,可以?xún)H采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫(kù)存儲(chǔ)和對(duì)接大數(shù)據(jù)分析的功能,同時(shí)GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶(hù)更加專(zhuān)注功能開(kāi)發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實(shí)時(shí)分析

客戶(hù)的一個(gè)使用場(chǎng)景需要將爬蟲(chóng)或用戶(hù)輸入的數(shù)據(jù),進(jìn)行在線分析和實(shí)時(shí)推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達(dá)到了50億條,但增量數(shù)據(jù)不足5億,分析對(duì)象主要是每日新增數(shù)據(jù)。在這個(gè)場(chǎng)景中,GaussDB (for Cassandra)為客戶(hù)提供了streaming服務(wù)+實(shí)時(shí)分析解決方案,在損失小部分讀寫(xiě)性能的前提下,客戶(hù)端無(wú)需改造即可做到數(shù)據(jù)讀寫(xiě)和實(shí)時(shí)分析并行,解決方案如下圖,該解決方案主要有以下幾個(gè)階段:

1.客戶(hù)業(yè)務(wù)用過(guò)開(kāi)源驅(qū)動(dòng)寫(xiě)入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對(duì)外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶(hù)構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫(xiě)入到指定的Kafka隊(duì)列

4.Kafka隊(duì)列將streaming數(shù)據(jù)寫(xiě)入到Spark或者Flink中

5.客戶(hù)在Spark中可對(duì)增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶(hù)的另一個(gè)業(yè)務(wù)需要周期性對(duì)全量數(shù)據(jù)進(jìn)行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時(shí)處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進(jìn)行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開(kāi)源的10+倍,同時(shí)做到對(duì)業(yè)務(wù)讀寫(xiě)基本無(wú)影響。如下為互聯(lián)網(wǎng)客戶(hù)每周定期導(dǎo)出數(shù)據(jù)分析用戶(hù)畫(huà)像的解決方案,該方案有以下幾個(gè)階段:

1.客戶(hù)根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶(hù)在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時(shí)任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過(guò)這3個(gè)秘訣,華為云GaussDB (for Cassandra)完美解決了難擴(kuò)展、高成本、變更不及時(shí)等問(wèn)題,實(shí)現(xiàn)了海量數(shù)據(jù)的高效存儲(chǔ)和實(shí)時(shí)分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2832

    瀏覽量

    19249
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    恒訊科技解析:如何安裝MySQL并創(chuàng)建數(shù)據(jù)庫(kù)

    管理系統(tǒng)(RDBMS),使用結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)高效地組織和管理數(shù)據(jù)。它是全球最受歡迎的開(kāi)源數(shù)據(jù)庫(kù)系統(tǒng)之一,廣泛應(yīng)用于網(wǎng)頁(yè)開(kāi)發(fā)、電子商務(wù)和商業(yè)應(yīng)用。 常見(jiàn)用例? MySQL 是多種應(yīng)用的可靠選擇,包括: 網(wǎng)絡(luò)應(yīng)用:管理用戶(hù)認(rèn)
    的頭像 發(fā)表于 01-14 14:25 ?176次閱讀

    華納香港服務(wù)器數(shù)據(jù)庫(kù)索引優(yōu)化策略

    )實(shí)施有效的索引優(yōu)化策略。無(wú)論您是IT管理員還是開(kāi)發(fā)人員,了解這些技巧都能幫助您優(yōu)化數(shù)據(jù)庫(kù)效率,確保業(yè)務(wù)高效運(yùn)轉(zhuǎn)。下面,華納(hncloud)將通過(guò)結(jié)構(gòu)化分析,一步步解析香港服務(wù)器
    的頭像 發(fā)表于 10-16 17:06 ?518次閱讀

    華納為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD存儲(chǔ)

    游戲數(shù)據(jù)庫(kù)對(duì)速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開(kāi)發(fā)者越來(lái)越依賴(lài)NVMe SSD存儲(chǔ)來(lái)提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD
    的頭像 發(fā)表于 09-30 16:03 ?1067次閱讀

    mysql數(shù)據(jù)恢復(fù)—mysql數(shù)據(jù)庫(kù)表被truncate的數(shù)據(jù)恢復(fù)案例

    ECS網(wǎng)站服務(wù)器,linux操作系統(tǒng),部署了mysql數(shù)據(jù)庫(kù)。工作人員在執(zhí)行數(shù)據(jù)庫(kù)版本更新測(cè)試時(shí),錯(cuò)誤地將本應(yīng)在測(cè)試庫(kù)執(zhí)行的sql腳本在生產(chǎn)庫(kù)
    的頭像 發(fā)表于 09-11 09:28 ?872次閱讀
    mysql<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—mysql<b class='flag-5'>數(shù)據(jù)庫(kù)</b>表被truncate的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫(kù)故障的數(shù)據(jù)恢復(fù)案例

    備份,僅有一些斷斷續(xù)續(xù)的歸檔日志。 Oracle數(shù)據(jù)庫(kù)恢復(fù)流程: 1、檢測(cè)數(shù)據(jù)庫(kù)故障情況; 2、嘗試掛起并修復(fù)數(shù)據(jù)庫(kù); 3、解析數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 07-24 11:12 ?637次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫(kù)</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    三款主流國(guó)產(chǎn)數(shù)據(jù)庫(kù)的技術(shù)特點(diǎn)

    隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展和數(shù)據(jù)安全要求的提升,國(guó)產(chǎn)數(shù)據(jù)庫(kù)正迎來(lái)前所未有的發(fā)展機(jī)遇。在信創(chuàng)浪潮推動(dòng)下,達(dá)夢(mèng)數(shù)據(jù)庫(kù)、TiDB、華為高斯數(shù)據(jù)庫(kù)等國(guó)產(chǎn)
    的頭像 發(fā)表于 07-14 11:08 ?1147次閱讀

    milvus向量數(shù)據(jù)庫(kù)的主要特性和應(yīng)用場(chǎng)景

    Milvus 是一個(gè)開(kāi)源的向量數(shù)據(jù)庫(kù),專(zhuān)門(mén)為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計(jì)。它適用于需要高效存儲(chǔ)
    的頭像 發(fā)表于 07-04 11:36 ?1071次閱讀
    milvus向量<b class='flag-5'>數(shù)據(jù)庫(kù)</b>的主要特性和應(yīng)用場(chǎng)景

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫(kù)。 MongoDB數(shù)據(jù)庫(kù)故障: 工作人員在MongoDB服務(wù)仍
    的頭像 發(fā)表于 07-01 11:13 ?638次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫(kù)</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫(kù)故障: SQL Server數(shù)據(jù)庫(kù)被加密,無(wú)法使用。 數(shù)據(jù)庫(kù)MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?672次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫(kù)</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    SQLSERVER數(shù)據(jù)庫(kù)是什么

    SQL Server 是由微軟公司開(kāi)發(fā)的一款 關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) ,用于存儲(chǔ)、管理和檢索結(jié)構(gòu)化數(shù)據(jù)。它是企業(yè)級(jí)應(yīng)用中廣泛使用的數(shù)據(jù)庫(kù)解決方案之一,尤其適用于Window
    的頭像 發(fā)表于 05-26 09:19 ?1169次閱讀

    MySQL數(shù)據(jù)庫(kù)是什么

    MySQL數(shù)據(jù)庫(kù)是一種 開(kāi)源的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開(kāi)發(fā),后被Oracle公司收購(gòu)。它通過(guò)結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)進(jìn)行數(shù)據(jù)存儲(chǔ)、管理和操作,廣
    的頭像 發(fā)表于 05-23 09:18 ?1206次閱讀

    HarmonyOS5服務(wù)技術(shù)分享--數(shù)據(jù)庫(kù)使用指南

    ??: 敏感數(shù)據(jù)啟用字段級(jí)加密(如用戶(hù)手機(jī)號(hào))。 ? ??總結(jié)?? 華為數(shù)據(jù)庫(kù)(CloudDB)讓HarmonyOS應(yīng)用的數(shù)據(jù)管理變得輕
    發(fā)表于 05-22 18:29

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)—虛擬機(jī)上hbase和hive數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 16臺(tái)某品牌R730xd服務(wù)器節(jié)點(diǎn),每臺(tái)服務(wù)器節(jié)點(diǎn)上有數(shù)臺(tái)虛擬機(jī)。 虛擬機(jī)上部署Hbase和Hive數(shù)據(jù)庫(kù)。 分布式存儲(chǔ)故障:
    的頭像 發(fā)表于 04-17 11:05 ?718次閱讀

    #### KEPServerEX 數(shù)據(jù)存儲(chǔ)插件\\-2

    觸發(fā)存儲(chǔ)。 觸發(fā)條件類(lèi)型具體如下: 二、存儲(chǔ)數(shù)據(jù)的時(shí)候有沒(méi)有一個(gè)值可以代表某一類(lèi)設(shè)備/數(shù)據(jù),方便后期數(shù)據(jù)
    發(fā)表于 04-09 16:09

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫(kù)文件拷貝后服務(wù)無(wú)法啟動(dòng)的數(shù)據(jù)恢復(fù)

    MongoDB數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)Windows Server操作系統(tǒng)虛擬機(jī)上部署MongoDB數(shù)據(jù)庫(kù)。 MongoDB數(shù)據(jù)庫(kù)故障: 管理員在未關(guān)閉MongoDB服務(wù)的
    的頭像 發(fā)表于 04-09 11:34 ?864次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫(kù)</b>文件拷貝后服務(wù)無(wú)法啟動(dòng)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)