海量數(shù)據(jù)的爆炸式增長,使存儲技術(shù)近五年的發(fā)展速度遠(yuǎn)超過去n年的發(fā)展歷程。C端用戶一個(gè)明顯的感覺就是:U盤存儲容量從過去物以稀為貴的幾十M迅速發(fā)展到今天幾十G、甚至TB級,家用電腦硬盤容量更是TB級標(biāo)配。
那么,企業(yè)級又迎來了怎樣的變化?IDC數(shù)據(jù)顯示,到2020年,企業(yè)數(shù)據(jù)總體將達(dá)到44ZB,其中80%的數(shù)據(jù)將會是非結(jié)構(gòu)化數(shù)據(jù)(圖片、視頻、歸檔以及企業(yè)級備份等各種數(shù)據(jù))。顯然,海量數(shù)據(jù)的產(chǎn)生正在促使企業(yè)級存儲從需求到產(chǎn)品形態(tài)都發(fā)生了改變。
“相對于NAS、SAN這種傳統(tǒng)企業(yè)級存儲解決方案,對象存儲確實(shí)處于一個(gè)藍(lán)海市場,它的競爭不那么激烈,而需求的潛力卻非常巨大。”一位企業(yè)級存儲市場人士表示。存儲作為企業(yè)數(shù)據(jù)留存的核心介質(zhì),數(shù)據(jù)的爆發(fā)式增長首當(dāng)其沖會給存儲帶來巨大的挑戰(zhàn)。說到對象存儲,對大多數(shù)傳統(tǒng)企業(yè)IT管理者而言依舊是個(gè)新名詞。
它專為解決非結(jié)構(gòu)化數(shù)據(jù)而來
眾所周知,當(dāng)前傳統(tǒng)企業(yè)在存儲方面慣常采用三類方式:一是DAS直連存儲,類似小柜子一樣,通過一根不長的線接到客戶端,這類存儲容量很有限,使用場景也非常少;二是NAS(網(wǎng)絡(luò)接入存儲),它是以NFS協(xié)議,將存儲暴露給客戶端掛載使用;三是SAN(存儲區(qū)域網(wǎng)絡(luò)),它暴露的是塊存儲,將所謂的硬盤暴露給客戶端。
“所有傳統(tǒng)企業(yè)存儲都有一個(gè)共同的特征——就是只能垂直擴(kuò)展。比如一個(gè)EMC的存儲柜容量不夠,只能另買一個(gè)存儲柜,它在管理、成本以及容量和性能方面都存在一定的問題。這里的成本分為三部分,一是采購成本,存儲柜很貴;二是人力成本,需要專業(yè)的存儲工程師管理存儲柜;三是管理成本,如果企業(yè)又買了一個(gè)存儲柜,這兩個(gè)柜子之間是孤立的。對企業(yè)而言,數(shù)據(jù)怎么分布在這兩個(gè)存儲柜,如果這兩個(gè)柜子容量用滿之后,再加一個(gè)新柜子怎么辦?這都會帶來管理上的成本。從性能方面看,首先只能垂直擴(kuò)展,性能只能局限于這個(gè)柜子之上。從NAS文件存儲的角度來講,它的性能問題會體現(xiàn)得更為明顯。比如企業(yè)現(xiàn)在有海量文件要存儲,它的劣勢就會表現(xiàn)出來,因?yàn)榇鎯Φ奈募蕉?,NAS文件存儲的性能會越差。為了解決這個(gè)問題,整個(gè)企業(yè)級存儲市場正在從‘垂直擴(kuò)展’向‘水平擴(kuò)展’發(fā)展。”
整個(gè)企業(yè)級存儲市場的這種潛在的需求變化自然推動了存儲產(chǎn)品出現(xiàn)了新的變化。“業(yè)界關(guān)于新一代企業(yè)級存儲出現(xiàn)了很多名詞,比如軟件定義存儲、分布式存儲、水平擴(kuò)展式存儲等,它們所表達(dá)的意思其實(shí)是一樣的,就是在相對比較廉價(jià)的X86服務(wù)器之上通過軟件進(jìn)行管理?!?/p>
傳統(tǒng)IT架構(gòu)漸成“過去式” 非結(jié)構(gòu)化數(shù)據(jù)倒逼存儲變革
今天,許多企業(yè)已經(jīng)意識到,結(jié)構(gòu)化數(shù)據(jù)僅僅是企業(yè)所擁有數(shù)據(jù)的一小部分。與業(yè)務(wù)信息系統(tǒng)中大量用于交易記錄、流程控制和統(tǒng)計(jì)分析的結(jié)構(gòu)化數(shù)據(jù)相比,非結(jié)構(gòu)化數(shù)據(jù)具有某種特定和持續(xù)的價(jià)值,這種價(jià)值在共享、檢索、分析等使用過程中得以產(chǎn)生和放大,并最終對企業(yè)業(yè)務(wù)和戰(zhàn)略產(chǎn)生影響。
多年來,杉巖數(shù)據(jù)通過對金融、教育、醫(yī)療、制造等行業(yè)的百余家知名客戶的IT信息化研究發(fā)現(xiàn),非結(jié)構(gòu)化數(shù)據(jù)的容量、文件的數(shù)量已經(jīng)大大超越了傳統(tǒng)NAS存儲的處理能力,企業(yè)級存儲從需求到產(chǎn)品形態(tài)的“自我變革”也變得更加急迫。
同時(shí),IDC數(shù)據(jù)顯示,到2020年,企業(yè)數(shù)據(jù)總體將達(dá)到44ZB,其中80%的數(shù)據(jù)將會是非結(jié)構(gòu)化數(shù)據(jù)(圖片、視頻、歸檔以及企業(yè)級備份等數(shù)據(jù)),對象存儲市場規(guī)模將達(dá)198億美元,這也從側(cè)面印證了杉巖對于對象存儲未來發(fā)展的趨勢判斷。
在杉巖看來,軟件定義存儲將給金融、教育、醫(yī)療等傳統(tǒng)行業(yè)的IT架構(gòu)帶來革命性改進(jìn),特別是對文件數(shù)量過多、非結(jié)構(gòu)化數(shù)據(jù)歸集檢索調(diào)取效率低、傳統(tǒng)架構(gòu)無法按需彈性配置存儲空間等問題將發(fā)生徹底改變。在服務(wù)深圳某三甲醫(yī)院的過程中,杉巖發(fā)現(xiàn)電子病歷、臨床影像文件(如CT 、X光、彩超、高精動態(tài)影像等)、非核心系統(tǒng)的數(shù)據(jù)歸集、查詢和調(diào)閱等問題成為傳統(tǒng)架構(gòu)面臨的最大挑戰(zhàn)。
比如,在進(jìn)行影像數(shù)據(jù)調(diào)閱時(shí),數(shù)據(jù)歸檔離線后,沒有任何元數(shù)據(jù)的管理描述,憑文件系統(tǒng)的目錄結(jié)構(gòu)進(jìn)行數(shù)據(jù)查找,非常費(fèi)時(shí)費(fèi)力。當(dāng)病歷文件數(shù)量到達(dá)百萬級近千萬以后,存儲性能會出現(xiàn)大幅下降;而醫(yī)院服務(wù)器上的數(shù)據(jù)仍然是孤島狀態(tài),服務(wù)器之間的存儲資源和數(shù)據(jù)并沒有實(shí)現(xiàn)共享。
當(dāng)然,這些問題不止出現(xiàn)在醫(yī)療行業(yè),在教育行業(yè)傳統(tǒng)存儲架構(gòu)遭遇的問題也十分突出。杉巖在為某高校搭建對象存儲架構(gòu)時(shí)發(fā)現(xiàn),大學(xué)各職能機(jī)構(gòu)以及二級學(xué)院之間信息系統(tǒng)相對割裂,因此在系統(tǒng)安全性和可維護(hù)性方面十分困難。
而建筑學(xué)院、傳媒學(xué)院、電影學(xué)院、服裝學(xué)院等專業(yè)性學(xué)院會產(chǎn)生大量的非結(jié)構(gòu)化數(shù)據(jù)作業(yè),如CAD制圖、影視作品、圖片設(shè)計(jì)、服裝樣片等等,這些數(shù)據(jù)對存儲空間的擴(kuò)展性和存儲安全性提出了更高的要求,既要能夠滿足在教學(xué)、科研等場景下數(shù)據(jù)存放的要求,同時(shí)還要滿足作業(yè)提交、班級數(shù)據(jù)共享、科研數(shù)據(jù)分析調(diào)取等多元化需求。
此外,在銀行、證券行業(yè)的日常業(yè)務(wù)中,客戶證件、遠(yuǎn)程開戶錄像、合同掃描件、客服中心語音、企業(yè)相關(guān)電子文檔資料等是最常見的非結(jié)構(gòu)化數(shù)據(jù)。這些文件平均大小從KB到MB甚至GB級別不等,近兩年文件量呈現(xiàn)高速增長狀態(tài)。從存儲容量上看,這些小文件甚至占據(jù)了金融機(jī)構(gòu)數(shù)據(jù)總?cè)萘康?0%以上。
根據(jù)監(jiān)管部門要求,銀行、證券、保險(xiǎn)等金融機(jī)構(gòu)需實(shí)施專區(qū)“雙錄”,即對自有理財(cái)產(chǎn)品及代銷產(chǎn)品的銷售過程同步錄音錄像,“雙錄”規(guī)定的實(shí)施會帶來海量非結(jié)構(gòu)化數(shù)據(jù)。以上這些問題都讓僵化的傳統(tǒng)IT架構(gòu)有一種深深的無力感。
隨著傳統(tǒng)IT架構(gòu)的弊端日漸凸顯,以杉巖為代表的一批創(chuàng)新型存儲廠商開始重新定義企業(yè)級存儲的標(biāo)準(zhǔn)。從2014年創(chuàng)立伊始,杉巖便早早瞄準(zhǔn)對象存儲市場并持續(xù)深耕。經(jīng)過四年的快速發(fā)展,杉巖目前在全國范圍內(nèi)擁有近百家合作伙伴,業(yè)務(wù)范圍覆蓋政府、金融、運(yùn)營商、教育、醫(yī)療、電力和制造等十余個(gè)行業(yè),用戶數(shù)據(jù)量部署總和超過100PB。
其研發(fā)的杉巖海量對象存儲(SandStone MOS)已成為海量非結(jié)構(gòu)化數(shù)據(jù)存儲的主流解決方案,其在廣發(fā)證券檔案中心、武漢大學(xué)智慧校園云存儲平臺的成功應(yīng)用得到了行業(yè)用戶的廣泛好評。
對于海量數(shù)據(jù)的存儲問題,杉巖海量對象存儲(SandStone MOS)解決方案采用去中心化分布式架構(gòu),同時(shí)利用軟件定義的方式實(shí)現(xiàn)了單一名字空間條件下數(shù)百PB級規(guī)模的容量擴(kuò)展,業(yè)務(wù)可以隨時(shí)隨地訪問而不受數(shù)據(jù)存儲位置的限制。
在提升海量小文件訪問性能方面,SandStone MOS利用哈希計(jì)算實(shí)現(xiàn)了數(shù)億級文件的高效訪問。針對文件檢索困難,SandStone MOS支持標(biāo)簽功能,文件存儲時(shí)會自動設(shè)置標(biāo)簽,從而更好地與業(yè)務(wù)結(jié)合,滿足高效檢索。
比如,在銀行業(yè)務(wù)場景下,當(dāng)業(yè)務(wù)人員想要提取相關(guān)視頻音頻文件時(shí),可以根據(jù)文件標(biāo)簽進(jìn)行檢索調(diào)閱。此外,SandStone MOS在易用性與可維護(hù)性方面也超越了同級別產(chǎn)品,其采用“x86通用服務(wù)器+存儲軟件”的分布式解耦架構(gòu),將底層存儲空間與上層業(yè)務(wù)邏輯空間進(jìn)行分離,軟硬件的升級不會影響到整個(gè)系統(tǒng)的正常運(yùn)行。
即使系統(tǒng)有再多應(yīng)用更新,也不會影響存儲空間的使用。值得一提的是,SandStone MOS首創(chuàng)的分布式存儲數(shù)據(jù)盤漫游功能,可以幫助企業(yè)用戶漸進(jìn)式的進(jìn)行老舊硬件設(shè)備更換,不影響業(yè)務(wù)的正常運(yùn)行。
在對象存儲領(lǐng)域的專注與持續(xù)創(chuàng)新,換來的是行業(yè)的高度認(rèn)可。去年8月,杉巖數(shù)據(jù)成為首家通過Intel中國云計(jì)算創(chuàng)新中心測試并發(fā)布報(bào)告的軟件定義存儲廠商。與此同時(shí),杉巖數(shù)據(jù)作為國家信息化標(biāo)準(zhǔn)委員會云計(jì)算標(biāo)準(zhǔn)工作組成員單位及中國開源云聯(lián)盟理事單位,先后參與了分布式存儲國家標(biāo)準(zhǔn)的制定工作及Ceph行業(yè)白皮書的編寫工作。
如今,對象存儲正煥發(fā)出更大的生命力,一場存儲革命也已開啟。以杉巖數(shù)據(jù)為代表的創(chuàng)新型存儲廠商,正通過不斷深耕對象存儲領(lǐng)域,幫助企業(yè)構(gòu)建更加智慧的IT基礎(chǔ)設(shè)施,推動傳統(tǒng)存儲朝著更高效、更集約、更易用的方向全面演進(jìn)。
? ? ? ? fqj
電子發(fā)燒友App














































評論