91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hadoop大數(shù)據(jù)存算分離方案:計(jì)算層無縫對接存儲系統(tǒng)

杉巖老李 ? 來源:杉巖老李 ? 作者:杉巖老李 ? 2022-12-26 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Hadoop的誕生改變了企業(yè)對數(shù)據(jù)的存儲、處理和分析的過程,加速了大數(shù)據(jù)的發(fā)展。隨著大數(shù)據(jù)系統(tǒng)建設(shè)的深入,企業(yè)的數(shù)據(jù)基礎(chǔ)設(shè)施易出現(xiàn)計(jì)算資源浪費(fèi)、存儲性能低、管理成本過高等挑戰(zhàn)。相比存算一體架構(gòu),存算分離架構(gòu)具有性能與成本最優(yōu)、兼具靈活性等特點(diǎn),因此受到企業(yè)IT部門的青睞,并紛紛開始對Hadoop架構(gòu)進(jìn)行改造。

為滿足大數(shù)據(jù)不同場景需求,杉巖數(shù)據(jù)此前研發(fā)推出了兼容HDFS接口能力的高性能數(shù)據(jù)湖文件網(wǎng)關(guān),為使湖倉一體方案更加完善,杉巖數(shù)據(jù)全新升級了面向AI訓(xùn)練、機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等場景的高性能文件存儲——杉巖云原生文件存儲(以下簡稱杉巖CNFS),為客戶實(shí)現(xiàn)All in One的存儲能力。

存算分離實(shí)現(xiàn)方案:客戶端模式

杉巖CNFS支持客戶端模式,提供HCFS(Hadoop Compatible File System,Hadoop兼容文件協(xié)議)接口實(shí)現(xiàn),對HDFS接口協(xié)議完全兼容,可以保證應(yīng)用層就像使用原生HDFS存儲一樣使用杉巖CNFS。

實(shí)際場景中,通過在計(jì)算平臺部署安裝專用的客戶端與簡單的配置,即可實(shí)現(xiàn)Hadoop平臺的組件與分離部署的存儲交互。針對業(yè)界使用比較廣泛的CDH平臺(Hadoop商業(yè)發(fā)行版之一),杉巖CNFS也開發(fā)了配套的Parcel資源包,利用CDH自身的管理便捷地配置使用杉巖CNFS提供的存儲空間。

poYBAGOpQvyAFw8dAADHIWN3r4A300.png

圖1 杉巖湖倉一體方案存算分離實(shí)現(xiàn)(客戶端模式)

但是像所有HCFS接口實(shí)現(xiàn)一樣,侵入式的部署方式使計(jì)算組件有了額外的依賴需要管理,當(dāng)涉及計(jì)算組件自身的升級、替換等場景時,就要考慮杉巖CNFS客戶端軟件包和配置的同步,增加了運(yùn)維工作。因此這種對接方式一定程度限制了計(jì)算組件自身的靈活性。

在實(shí)際應(yīng)用中,用戶如果有相對較為頻繁的升級更替計(jì)算組件的場景,往往不能接受侵入式的部署對接方式。

實(shí)現(xiàn)無縫對接!杉巖數(shù)據(jù)推出HDFS網(wǎng)關(guān)服務(wù)端組件

針對這一需求,杉巖數(shù)據(jù)研發(fā)推出了HDFS網(wǎng)關(guān)服務(wù)端組件,進(jìn)一步簡化對接部署過程。HDFS網(wǎng)關(guān)實(shí)現(xiàn)了原生HDFS協(xié)議,可收發(fā)原生HDFS協(xié)議的請求,計(jì)算節(jié)點(diǎn)通過Hadoop環(huán)境自帶的原生HDFS-Client即可訪問存儲系統(tǒng),無需額外安裝專用客戶端。

pYYBAGOpQv2AYB7vAADpGMFzRyA309.png

圖2 杉巖湖倉一體方案存算分離實(shí)現(xiàn)(服務(wù)端模式)

方案優(yōu)勢

原生HDFS協(xié)議,兼容性良好:HDFS網(wǎng)關(guān)支持幾乎所有的HDFS數(shù)據(jù)面接口,可對接市場上常見的大數(shù)據(jù)平臺。

無縫對接,簡化對接部署過程:通過原生HDFS協(xié)議直接訪問存儲系統(tǒng),無需在計(jì)算層安裝專用客戶端。計(jì)算組件升級、替換時,無需考慮客戶端配置,減少運(yùn)維工作量。

高數(shù)據(jù)吞吐能力,無單點(diǎn)故障:通過杉巖云原生文件存儲對HDFS網(wǎng)關(guān)的數(shù)據(jù)處理卸載能力,大大降低了HDFS網(wǎng)關(guān)的數(shù)據(jù)處理開銷,提升了整體的數(shù)據(jù)吞吐能力,并結(jié)合LVS實(shí)現(xiàn)了對HDFS網(wǎng)關(guān)的去中心化、水平擴(kuò)展。

性能測試

LVS只處理HDFS NameNode的元數(shù)據(jù)相關(guān)RPC,實(shí)際占大部分網(wǎng)絡(luò)帶寬的數(shù)據(jù)讀寫是DataNode角色的block讀寫流量,不通過LVS,而由HDFS Gateway通過NameNode RPC返回自身節(jié)點(diǎn)的IP,HDFS-Client直接和各HDFS Gateway通訊。所以LVS不會成為大數(shù)據(jù)讀寫的瓶頸,如下圖所示:

poYBAGOpQv6AMqtSAAHFAXqwdk4046.png

圖3 通過LVS訪問HDFS網(wǎng)關(guān)的交互

以下是在3節(jié)點(diǎn)存儲加3節(jié)點(diǎn)Hadoop集群環(huán)境,通過TestDFSIO讀寫9個30G文件的對比測試結(jié)果,可見HDFS網(wǎng)關(guān)對存儲系統(tǒng)帶寬影響較小。但HDFS網(wǎng)關(guān)的增加會使IO路徑長度多一跳,對存儲網(wǎng)絡(luò)帶寬需求增加,規(guī)劃存儲網(wǎng)絡(luò)時應(yīng)考慮這一點(diǎn)。

pYYBAGOpQv6AUMm3AACIb_-ZSnM729.png

圖4 存算分離場景杉巖CNFS直通和通過HDFS網(wǎng)關(guān)帶寬測試

值得一提的是,有些計(jì)算層組件可能針對HDFS做特別的優(yōu)化,例如Hbase就實(shí)現(xiàn)了自己的異步HDFS-Client,此情況下使用HDFS網(wǎng)關(guān)可以繼續(xù)使用計(jì)算側(cè)的特別優(yōu)化,能獲得更好的性能。

總結(jié)

隨著5GIoT的快速發(fā)展,數(shù)據(jù)激增,企業(yè)級大數(shù)據(jù)平臺建設(shè)逐漸深入,基于存算分離架構(gòu),計(jì)算承接豐富的應(yīng)用接入需求,存儲提供成熟穩(wěn)定的底座支撐業(yè)務(wù)發(fā)展和生態(tài)對接是大勢所趨。

上述內(nèi)容體現(xiàn)了杉巖云原生文件存儲在Hadoop大數(shù)據(jù)存算分離場景中的優(yōu)勢,杉巖數(shù)據(jù)推出HDFS網(wǎng)關(guān)服務(wù)端組件,通過原生HDFS協(xié)議直接訪問存儲系統(tǒng),簡化了對接部署過程,為用戶提供了更多的選擇,使基于杉巖大數(shù)據(jù)智能存儲為基座的湖倉一體方案更加完善。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    433

    瀏覽量

    41891
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    16936
  • HDFS
    +關(guān)注

    關(guān)注

    1

    文章

    32

    瀏覽量

    10113
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9062

    瀏覽量

    143735
  • 存算分離
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    161
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    ADAS 數(shù)據(jù)安全 晶存儲筑牢防線

    256GB eMMC以工業(yè)級可靠性與高耐用性,為ADAS系統(tǒng)提供大容量數(shù)據(jù)存儲解決方案,保障行車數(shù)據(jù)
    的頭像 發(fā)表于 02-25 09:55 ?1238次閱讀
    ADAS <b class='flag-5'>數(shù)據(jù)</b>安全 晶<b class='flag-5'>存</b><b class='flag-5'>存儲</b>筑牢防線

    國產(chǎn)高性能ONFI IP解決方案全解析

    )時代,數(shù)據(jù)存儲的吞吐量瓶頸日益凸顯,高性能的ONFI IP能夠確保大規(guī)模數(shù)據(jù)的高效存取,是SSD及先進(jìn)存儲系統(tǒng)的核心技術(shù)基石。2. 奎芯科技 ONFI IP 的核心技術(shù)規(guī)格奎芯科技提
    發(fā)表于 01-13 16:15

    mSSD存儲介質(zhì)生態(tài)創(chuàng)新,探索AI終端存儲新路徑

    的產(chǎn)業(yè)鏈伙伴,共探AI時代存儲介質(zhì)生態(tài)創(chuàng)新。AI發(fā)展驅(qū)動終端計(jì)算架構(gòu)革新,力持續(xù)突破的同時,存儲系統(tǒng)的同步進(jìn)化也至關(guān)重要,其技術(shù)創(chuàng)新與全鏈條生態(tài)協(xié)同的重要性日益凸
    的頭像 發(fā)表于 12-15 21:32 ?599次閱讀
    mSSD<b class='flag-5'>存儲</b>介質(zhì)生態(tài)創(chuàng)新,探索AI終端<b class='flag-5'>存儲</b>新路徑

    曙光存儲推出面向金融的可信AI存儲

    近日,曙光存儲推出面向金融的可信AI存儲,助力金融行業(yè)高效、安全、穩(wěn)定地使用關(guān)鍵業(yè)務(wù)敏感數(shù)據(jù)。該方案基于全球領(lǐng)先的集中式全閃存儲FlashN
    的頭像 發(fā)表于 10-23 09:24 ?641次閱讀

    曙光存儲支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲系統(tǒng)

    近日,曙光存儲支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲系統(tǒng),為AI研發(fā)、科學(xué)計(jì)算和信息化平臺等提供力支持。性能實(shí)測顯示,該
    的頭像 發(fā)表于 08-25 11:48 ?1238次閱讀

    NAS存儲系統(tǒng)斷電風(fēng)險大?UPS電源守護(hù)數(shù)據(jù)安全刻不容緩

    在數(shù)字化時代,企業(yè)數(shù)據(jù)已成為最寶貴的資產(chǎn)。NAS存儲系統(tǒng)作為企業(yè)數(shù)據(jù)存儲的核心設(shè)備,一旦遭遇意外斷電,輕則導(dǎo)致數(shù)據(jù)丟失,重則造成設(shè)備損壞,給
    的頭像 發(fā)表于 08-25 10:13 ?1040次閱讀
    NAS<b class='flag-5'>存儲系統(tǒng)</b>斷電風(fēng)險大?UPS電源守護(hù)<b class='flag-5'>數(shù)據(jù)</b>安全刻不容緩

    一文看懂“一體”

    今天這篇文章,我們來聊一個最近幾年很火的概念——一體。為什么會提出“一體”?一體,英
    的頭像 發(fā)表于 08-18 12:15 ?1428次閱讀
    一文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b>一體”

    Ceph分布式存儲系統(tǒng)解析

    在當(dāng)今數(shù)據(jù)爆炸的時代,企業(yè)對存儲系統(tǒng)的需求日益增長,傳統(tǒng)的集中式存儲已經(jīng)無法滿足大規(guī)模數(shù)據(jù)處理的要求。分布式存儲系統(tǒng)應(yīng)運(yùn)而生,而Ceph作為
    的頭像 發(fā)表于 07-14 11:15 ?994次閱讀

    緩解高性能一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計(jì)

    在高性能計(jì)算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計(jì)算密度、能效和精度優(yōu)勢成為主流
    的頭像 發(fā)表于 07-11 15:11 ?1313次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b>一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計(jì)

    平衡”有多重要?

    。而決定這種配合效率的關(guān)鍵指標(biāo),正是我們今天要聊的“比”。什么是比?比=
    的頭像 發(fā)表于 07-11 14:06 ?746次閱讀
    “<b class='flag-5'>算</b><b class='flag-5'>存</b>平衡”有多重要?

    力積存儲港股IPO,蓄力研發(fā)AI方案

    電子發(fā)燒友網(wǎng)綜合報(bào)道,5月28日,浙江力積存儲科技股份有限公司(以下簡稱"力積存儲")向港交所提交上市申請書,獨(dú)家保薦人為中信證券(香港)有限公司。 ? 力積存儲是中國領(lǐng)先的內(nèi)存芯片設(shè)計(jì)公司及AI
    的頭像 發(fā)表于 06-06 00:57 ?8097次閱讀
    力積<b class='flag-5'>存儲</b>港股IPO,蓄力研發(fā)AI<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>方案</b>

    第二屆知科技杯華東高校內(nèi)計(jì)算創(chuàng)新應(yīng)用大賽正式啟動

    在數(shù)字化浪潮席卷各行業(yè)的當(dāng)下,數(shù)據(jù)量呈爆炸式增長,力需求也水漲船高。內(nèi)計(jì)算架構(gòu)作為創(chuàng)新解決方案,備受產(chǎn)學(xué)研各界關(guān)注。為推動
    的頭像 發(fā)表于 05-06 17:51 ?888次閱讀

    兆芯+圖云創(chuàng)智—可信分布式存儲系統(tǒng)解決方案

    圖云創(chuàng)智分布式存儲系統(tǒng)采用全分布式設(shè)計(jì)與先進(jìn)的存儲虛擬化技術(shù)相結(jié)合,由多個獨(dú)立的兆芯 x86 服務(wù)器作為存儲節(jié)點(diǎn),聯(lián)合道熵存儲軟件和思贊博微可信計(jì)算
    的頭像 發(fā)表于 04-23 10:29 ?931次閱讀
    兆芯+圖云創(chuàng)智—可信分布式<b class='flag-5'>存儲系統(tǒng)</b>解決<b class='flag-5'>方案</b>

    27MHz HCSL 差分晶體振蕩器在數(shù)據(jù)中心網(wǎng)絡(luò)存儲系統(tǒng)中的應(yīng)用方案

    提升系統(tǒng)時鐘一致性與數(shù)據(jù)可靠性,是存儲系統(tǒng)中不可或缺的時鐘核心元件之一。借助FCom富士晶振領(lǐng)先的設(shè)計(jì)與制造能力,該產(chǎn)品可為客戶提供長壽命、高一致性、高性能的時鐘解決方案,助力
    發(fā)表于 04-14 21:19

    力接棒力,慧榮科技以主控技術(shù)突破AI存儲極限

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)在AI的高速增長下,尤其是以DeepSeek為代表的AI大模型推動存儲需求激增,力增長倒逼力升級。而存儲是AI生態(tài)的基礎(chǔ),
    的頭像 發(fā)表于 03-19 01:29 ?2809次閱讀
    <b class='flag-5'>存</b>力接棒<b class='flag-5'>算</b>力,慧榮科技以主控技術(shù)突破AI<b class='flag-5'>存儲</b>極限