91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超算和智能網(wǎng)卡

SSDFans ? 來源:ssdfans ? 作者:ssdfans ? 2021-01-07 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AWS re:Invent2019顯示AWS市場占用率達到45%,相比2018年營收增長29%。使用專用芯片構(gòu)建用于加速特定場景的戰(zhàn)略更加清晰,除去IntelAMD的X86和Nvidia GPU,還有通過其Annapurna Labs部門推出的基于Arm的Graviton的定制芯片,并承諾基于Graviton2(7納米)的新型EC2實例的性能是第一代Graviton的7倍。

早在摩爾定律失效之前,一個逐漸達成的共識就是通用處理器的算力應(yīng)該專注于復(fù)雜的商業(yè)邏輯,而簡單重復(fù)的工作則由專用芯片完成更加合適。

超算和智能網(wǎng)卡

早在20年以前,基于異構(gòu)計算的智能網(wǎng)卡就已經(jīng)應(yīng)用于超算(HPC)領(lǐng)域。從1993年開始TOP500就以每年兩次的頻率,基于Linpack benchmark負載模型來統(tǒng)計地球上運行最快的超級計算集群。

2003年,弗吉尼亞理工學(xué)院暨州立大學(xué)創(chuàng)建一個InfiniBand集群,在當時的TOP500排名第三;

2009年,世界500強超級算機中,152個使用InfiniBand,并提供38.7%的算力;

015a7700-44a1-11eb-8b86-12bb97331649.png

2020年11月,根據(jù)最新的第56版,155個使用 InfiniBand,并提供40%的算力,排名前10的超算集群有8個由 InfiniBand 構(gòu)建,更是占據(jù)了前5的4席位置。

01865f8c-44a1-11eb-8b86-12bb97331649.png

在構(gòu)建高速網(wǎng)路時,爭論主要是把網(wǎng)絡(luò)功能OnloadCPU上,還是把這些功能Offload到專用硬件:

常用Onloading,TCP/IP技術(shù)在數(shù)據(jù)包從網(wǎng)卡到應(yīng)用程序的過程中,要經(jīng)過OS,數(shù)據(jù)在主存、CPU緩存和網(wǎng)卡緩存之間來回復(fù)制,給服務(wù)器的CPU和主存造成負擔,也加劇網(wǎng)絡(luò)延遲。

Offloading 基于RDMA實現(xiàn)遠程內(nèi)存直接訪問,將數(shù)據(jù)從本地快速移動到遠程主機應(yīng)用程序的用戶空間,通過Zero-copy和Kernel bypass來實現(xiàn)高性能的遠程直接數(shù)據(jù)存取的目標。

下圖可以直觀的看到兩者在訪問路徑的區(qū)別:

01cad8ba-44a1-11eb-8b86-12bb97331649.png

當然,Offloading 需要將RDMA協(xié)議固化于硬件上,所以依賴于網(wǎng)卡的算力是否可以滿足運行RDMA協(xié)議的開銷,這實際上就是專用芯片和網(wǎng)卡的結(jié)合。用更性感的說法是

SmartNICs are an example of DPU (Data Processing Unit) technology

AWS和Nitro

云計算催生超大規(guī)模數(shù)據(jù)中心,也同時放大通用算力的不足和異構(gòu)計算的優(yōu)勢。就好比研發(fā)團隊規(guī)模變大的同時必然走向?qū)I(yè)化。AWS EC2早期由純軟(也意味著需要消耗CPU)的Xen對CPU、存儲和網(wǎng)絡(luò)完成虛擬化?;谶@種實現(xiàn)方式,一個EC2實例的虛擬化管理開銷高達30%。

01ddf5d0-44a1-11eb-8b86-12bb97331649.png

30%相當可觀,最重要的是并沒有為客戶提供直接價值。按照 Werner Vogels(AWS CTO )的說法

想為客戶顯著提高性能、安全性和敏捷性,我們必須將大部分管理程序功能遷移到專用硬件上。

2012年,AWS開始構(gòu)建Nitro系統(tǒng),也正是這,登納德縮放定律(嚴格說是預(yù)測)幾乎消失:

01ed1704-44a1-11eb-8b86-12bb97331649.png

2013年, Nitro 應(yīng)用于C3實例,其網(wǎng)絡(luò)進程卸載到硬件中;

2014年,推出了C4實例類型,將EBS存儲卸載到硬件中,并開始和Annapurna Labs合作;

2015年,收購 Annapurna Labs;

2017年,C5實例卸載控制平面和剩余的I/O,實現(xiàn)完整的Nitro系統(tǒng);

此時,Nitro系統(tǒng)已經(jīng)包含三個主要部分:Nitro卡、Nitro安全芯片和Nitro管理程序。主要卸載和加速IO,虛擬私有云(VPC)、彈性塊存儲(EBS)和實例存儲,從而讓用戶可以使用100%的通用算力。

0212159a-44a1-11eb-8b86-12bb97331649.png

對客戶而言,意味更好的性能和價格,下圖可以看到基于Nitro的C5和I3.metal的延時明顯降低:

026704c4-44a1-11eb-8b86-12bb97331649.png

計算型存儲和數(shù)據(jù)庫

從AWS的營收看,網(wǎng)絡(luò)、存儲、計算和軟件是收入的四駕馬車,數(shù)據(jù)庫毫無疑問是存儲領(lǐng)域的關(guān)鍵場景。隨著云計算帶來基礎(chǔ)環(huán)境的改變,也直接加速云原生技術(shù)的發(fā)展和成熟,程序員不會再寫出單體(Monolithic)應(yīng)用,也再也不會在應(yīng)用中只使用一種數(shù)據(jù)庫。還是借用Werner Vogels的話

A one size fits all database doesn't fit anyone.

從AWS提供的數(shù)據(jù)庫服務(wù)也應(yīng)證了一點(國內(nèi)的云計算巨頭也類似)。

028e23b0-44a1-11eb-8b86-12bb97331649.png

不同的數(shù)據(jù)庫針對不同的場景,比如Airbnb使用 Aurora 替代 MySQL,Snapchat 使用DynamoDB 承載起最大的寫負載,麥當勞將ElastiCache應(yīng)用于低延時高吞吐的工作負載,旅游網(wǎng)站expedia.com使用ElasticSearch實時優(yōu)化產(chǎn)品價格。當然,對于存儲介質(zhì),更快速和更大容量的需求普遍存在。從下面數(shù)據(jù)庫的工程實踐看,壓縮是實現(xiàn)這一目標的共識:

DB-Engines DBMS數(shù)據(jù)壓縮特性

DBMS 是否支持數(shù)據(jù)壓縮
Oracle
MySQL
Microsoft SQL Server
PostgreSQL
MongoDB
IBMDb2
Elasticsearch
Redis
SQLite
Cassandra

壓縮率依賴于數(shù)據(jù)本身,1948年由美國數(shù)學(xué)家克勞德·香農(nóng)(Claude Shannon)在經(jīng)典論文《通信的數(shù)學(xué)理論》中首先提出信息熵,理想情況下,不管是什么樣內(nèi)容的數(shù)據(jù),只要具有同樣的概率分布,就會得到同樣的壓縮率。

在實現(xiàn)時,常常要在壓縮吞吐,解壓吞吐,和犧牲壓縮率之間做取舍,這也是產(chǎn)生諸多壓縮算法的原因。下圖是基于Silesia compression corpus不同壓縮算法之間的差異。

Compressor Name Ratio Compression Decompress
zstd 1.4.5 -1 2.884 500MB/S 1660MB/S
zlib 1.2.11 -1 2.743 90MB/S 400MB/S
brotli 1.0.7 -0 2.703 400MB/S 450MB/S
zstd 1.4.5--fast=1 2.434 570MB/S 2200MB/S
zstd 1.4.5--fast=3 2.312 640MB/S 2300MB/S
quicklz 1.5.0 -1 2.238 560MB/S 710MB/S
zstd 1.4.5 --fast=5 2.178 700MB/S 2420MB/S
lzo1x 2.10 -1 2.106 690MB/S 820MB/S
lz4 1.9.2 2.101 740MB/S 4530MB/S
lzf 3.6 -1 2.077 410MB/S 860MB/S
snappy 1.1.8 2.073 560MB/S 1790MB/S

從一個常見的場景出發(fā),應(yīng)用多次寫入壓縮率各不相同的數(shù)據(jù),邏輯寫入量為36KB,如下圖所示:

02f8401a-44a1-11eb-8b86-12bb97331649.png

按照前面所示的壓縮率,最理想的情況是壓縮后占用15.2KB。

030847da-44a1-11eb-8b86-12bb97331649.png

但現(xiàn)有的空間管理實踐會占用更多的物理空間,首先寫入時需要按照文件系統(tǒng)頁對齊寫入(假設(shè)4KB),占用物理空間為48KB,數(shù)據(jù)存儲分布如下圖所示:

032a3aca-44a1-11eb-8b86-12bb97331649.png

0389a67c-44a1-11eb-8b86-12bb97331649.png

但因為壓縮后數(shù)據(jù)依然需要按照文件系統(tǒng)頁大?。?KB)對齊,數(shù)據(jù)存儲分布如下圖所示:

03bf5164-44a1-11eb-8b86-12bb97331649.png

所以實際占用的物理空間是36KB離預(yù)期的壓縮率相去甚遠。

0507d0a0-44a1-11eb-8b86-12bb97331649.png

為進一步提升壓縮效率,通常會進一步壓實(compaction)空間,壓實后數(shù)據(jù)存儲分布如下:

054af740-44a1-11eb-8b86-12bb97331649.png

這時占用的物理空間是16KB,才接近15.2KB。

可見在工程實踐時,要想在應(yīng)用場景中獲得可觀的壓縮收益,僅關(guān)注數(shù)據(jù)結(jié)構(gòu)和壓縮算法是不夠的,還要考慮壓實(Compaction)效率,如果還要兼顧算力消耗、IO延時和代碼復(fù)雜度等指標,工程難度將指數(shù)級提升。

針對這個場景,支持透明壓縮的計算型存儲 CSD2000,將壓縮解壓縮算法offload到盤內(nèi)FPGA,使計算更靠近數(shù)據(jù)存儲的地方(“in-situ computing”),進一步縮短數(shù)據(jù)路徑,從而提升數(shù)據(jù)處理的效率。

對比“軟”壓縮(基于CPU)和硬壓縮(基于FPGA)兩者的收益并不復(fù)雜,下面以MySQL為例,將MySQL頁壓縮,MySQL表壓縮和CSD2000透明壓縮三者進行對比,采用TPC-C和TPC-E數(shù)據(jù)集和負載模型,以壓縮率和數(shù)據(jù)庫性能(TPS和時延)為指標衡量壓縮效率。

先看壓縮率,計算型存儲 CSD2000 提供更高的壓縮率,幾乎是MySQL自帶壓縮的2倍以上,如下所示:

0576e2f6-44a1-11eb-8b86-12bb97331649.png

再看性能,使用sysbench測試1/4/16/64/256/512并發(fā)下性能表現(xiàn),可以觀察到(如下圖所示):

≥ 64并發(fā)時,CSD2000 QPS/TPS平均提高~5倍,最高提高~12倍,99%平均時延降低68%以上;

<64并發(fā)時,CSD2000 QPS/TPS普遍高于普通NVMe SSD 20%~50%,99%平均時延降低8%~45%;

說明:為了便于對比,以普通NVMe SSD指標為基線做歸一化。

059a9a2a-44a1-11eb-8b86-12bb97331649.png

05d2dc5a-44a1-11eb-8b86-12bb97331649.png

Mark Callaghan (Facebook Distinguished Engineer)曾經(jīng)吐槽在數(shù)據(jù)庫中實現(xiàn)透明頁壓縮并應(yīng)用在生產(chǎn)環(huán)境,工程實現(xiàn)過于復(fù)雜,難怪Jens Axboe(Linux內(nèi)核代碼主要貢獻者之一,F(xiàn)IO和IO_URING的作者)建議他把這些工作丟給計算型存儲公司 ScaleFlux。而從計算型存儲帶來的壓縮及性能(詳見:可計算存儲:數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推)收益來看已經(jīng)超額完成任務(wù)。

計算型存儲和文件系統(tǒng)

壓縮同時減少數(shù)據(jù)寫入量(Nand Written)和寫放大(Write Amplification),但實際的情況會更復(fù)雜一些,大多數(shù)情況下數(shù)據(jù)庫運行在文件系統(tǒng)之上。

064c4054-44a1-11eb-8b86-12bb97331649.png

以日志型文件系統(tǒng)ext4為例,設(shè)計以下測試驗證日志寫入量與數(shù)據(jù)庫數(shù)據(jù)寫入量的比例及透明壓縮對于減少寫入量的收益:

選用 MySQL 和 MariaDB;

200GB數(shù)據(jù)集;

3種負載模型:Insert/Update-Index/Update-Non-Index;

兩種數(shù)據(jù)訪問方式:熱點集中(Non-uniform Key Distribution) 和全隨機(Uniform Key Distribution);

最終測試結(jié)果如下:

因為文件系統(tǒng)的 WAL(Write Ahead Log)機制,加上日志的稀疏結(jié)構(gòu),日志寫入量占整體寫入量20%~90%,可見文件系統(tǒng)日志寫入量可能大于上層應(yīng)用(數(shù)據(jù)庫)的數(shù)據(jù)寫入量;

透明壓縮對于減少數(shù)據(jù)庫數(shù)據(jù)量的寫入效果明顯,對于減少日志系統(tǒng)寫入量的效果更加顯著,全部測試場景減少日志寫入量約4~5倍;

說明:以普通NVMe SSD指標為基線做歸一化,直方圖面積越小,數(shù)據(jù)寫入量越少。

0686f1ae-44a1-11eb-8b86-12bb97331649.png

06a80e5c-44a1-11eb-8b86-12bb97331649.png

人類的智慧注定都要在山頂相遇

亞馬遜經(jīng)常談?wù)搯蜗颍╫ne-way)和雙向(two-way)門決策。雙向門決策容易逆轉(zhuǎn),例如A/B test,這類決策可以快速采取行動,即使失敗,成本也不高。單向門決策大多數(shù)時候不可撤銷,必須”大膽假設(shè),小心求證“。Nitro 顯而易見是一個單向(one-way)門決策,即便是2012年開始,AWS也花了足足7年時間才完整落地。

在異構(gòu)計算領(lǐng)域,頭部云計算廠已經(jīng)達成共識,相關(guān)產(chǎn)品也加速推出,包括支持計算下推的阿里云PolarDB(詳見:可計算存儲:數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推),以及AWS re:Invent2020再次提到的基于 AUQA(Advanced Query Accelerator) 節(jié)點加速的 Redshift。

風(fēng)物長宜放眼量,人類的智慧注定都要在山頂相遇。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54010

    瀏覽量

    465983
  • 智能網(wǎng)卡
    +關(guān)注

    關(guān)注

    1

    文章

    53

    瀏覽量

    12749
  • 異構(gòu)計算
    +關(guān)注

    關(guān)注

    2

    文章

    112

    瀏覽量

    17182

原文標題:計算型存儲: 異構(gòu)計算的下一個關(guān)鍵應(yīng)用

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    中科曙光3套scaleX萬卡集群落地國家互聯(lián)網(wǎng)鄭州核心節(jié)點

    2月5日,由中科曙光提供的3套萬卡集群系統(tǒng)在國家互聯(lián)網(wǎng)鄭州核心節(jié)點同時上線試運行,成為全國首個實現(xiàn)3萬卡部署、且實際投入運營的最大國產(chǎn)AI力池,全面覆蓋萬億參數(shù)模型訓(xùn)練、高通量
    的頭像 發(fā)表于 02-09 10:32 ?463次閱讀

    中科曙光scaleX萬卡集群重塑超大規(guī)模力基礎(chǔ)設(shè)施

    在“人工智能+”行動深入推進的當下,力基礎(chǔ)設(shè)施已成為國家戰(zhàn)略競爭力的核心,而超大規(guī)模集群的運維管控難題卻日益凸顯。中科曙光scaleX萬卡集群打造的智能管理體系,正以“能管住-管得
    的頭像 發(fā)表于 01-30 15:43 ?714次閱讀

    機器視覺網(wǎng)卡與普通網(wǎng)卡的5點關(guān)鍵不同

    隨著人工智能和工業(yè)自動化的蓬勃發(fā)展,機器視覺技術(shù)扮演著越來越重要的角色。機器視覺系統(tǒng)依賴于高質(zhì)量的圖像數(shù)據(jù)進行分析和決策,而高性能的網(wǎng)絡(luò)傳輸是確保這些數(shù)據(jù)可靠、快速到達處理單元的關(guān)鍵。雖然機器視覺系
    的頭像 發(fā)表于 01-15 16:38 ?225次閱讀
    機器視覺<b class='flag-5'>網(wǎng)卡</b>與普通<b class='flag-5'>網(wǎng)卡</b>的5點關(guān)鍵不同

    聯(lián)想桌面AI工作站ThinkStation PGX開售

    10月15日,聯(lián)想桌面AI工作站ThinkStation PGX正式在京東平臺及聯(lián)想官方網(wǎng)站開售,首批購買用戶預(yù)計10月底可收到貨。PGX以“小體積、大力、低功耗”為核心定位,為開發(fā)者們提供
    的頭像 發(fā)表于 10-22 10:37 ?927次閱讀

    華為發(fā)布全球最強節(jié)點和集群

    在華為全聯(lián)接大會2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強節(jié)點和集群,并表示將發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到前所未有的戰(zhàn)略高度。在計算領(lǐng)域,鯤鵬昇騰堅持全面開源開放,攜手伙伴和開發(fā)者共建繁榮的鯤鵬、昇騰產(chǎn)業(yè)生態(tài),引領(lǐng)
    的頭像 發(fā)表于 10-10 17:29 ?2237次閱讀

    昆侖芯科技參與發(fā)布節(jié)點智應(yīng)用“北京方案”

    9月26日,2025人工智能計算大會(AICC 2025)在京舉行,昆侖芯作為國產(chǎn) AI 芯片領(lǐng)域的代表,與30多家企業(yè)與機構(gòu)攜手,在北京市科委中關(guān)村管委會、北京市發(fā)展改革委的共同見證下,發(fā)布了《基于節(jié)點創(chuàng)新聯(lián)合體,打造行業(yè)智能
    的頭像 發(fā)表于 09-29 17:06 ?1257次閱讀

    節(jié)點+集群”:華為撞出來的力之路

    節(jié)點+集群”,成為徹底解決AI力困局的契機
    的頭像 發(fā)表于 09-24 10:55 ?1179次閱讀
    “<b class='flag-5'>超</b>節(jié)點+集群”:華為撞出來的<b class='flag-5'>算</b>力之路

    中國智能力規(guī)模增長將40%

    表示預(yù)計在2025年,中國智能力規(guī)模增長將超過40%。 據(jù)中國信息通信研究院副院長 魏亮表示:目前,中國力平臺實現(xiàn)了100多個力服務(wù)商入駐,完成1000余家行業(yè)用戶注冊,接入主流
    的頭像 發(fā)表于 08-25 19:28 ?927次閱讀

    睿海光電領(lǐng)航AI光模塊:快交付與全場景兼容賦能智時代——以創(chuàng)新實力助力全球客戶構(gòu)建高效力底座

    深圳、北京、香港三大運營中心,提供本地化技術(shù)服務(wù)網(wǎng)絡(luò)。公司首創(chuàng)“三年質(zhì)保、終身維修”政策,累計服務(wù)全球1560余家客戶,涵蓋頭部云廠商、電信運營商及中心。2025年初,睿海光電更推出AI智能診斷
    發(fā)表于 08-13 19:03

    能發(fā)布節(jié)點服務(wù)器,128顆BM1690芯片組成

    電子發(fā)燒友網(wǎng)綜合報道 在2025世界人工智能大會上,能最新發(fā)布了一款節(jié)點服務(wù)器,可提供多達8T顯存空間以及巨大的FP8力,形成一臺強大“智
    的頭像 發(fā)表于 08-03 07:33 ?7774次閱讀
    <b class='flag-5'>算</b>能發(fā)布<b class='flag-5'>超</b>節(jié)點服務(wù)器,128顆BM1690芯片組成

    中科曙光智融合方案助力國產(chǎn)力中心建設(shè)

    近期,位于魯中南地區(qū)的某大型力中心正式啟動建設(shè),標志著國產(chǎn)力技術(shù)在該區(qū)域數(shù)字經(jīng)濟中的重要突破。該中心采用中科曙光“智融合”方案,實現(xiàn)力利用率提升40%目標,為區(qū)域數(shù)字經(jīng)濟發(fā)展注
    的頭像 發(fā)表于 07-31 17:13 ?1597次閱讀

    軟通智完成億級A輪融資,加速AI力產(chǎn)業(yè)布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智科技(廣東)集團有限公司(以下簡稱"軟通智")完成億級A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達資本等多家知名
    的頭像 發(fā)表于 06-18 15:37 ?570次閱讀

    智能力服務(wù)器應(yīng)用領(lǐng)域

    智能力服務(wù)器應(yīng)用領(lǐng)域 一、?金融行業(yè)? 智能風(fēng)控與投顧?:通過力集群支撐AI模型訓(xùn)練,實現(xiàn)風(fēng)險預(yù)警、智能投顧等場景規(guī)?;瘧?yīng)用,例如工商銀
    的頭像 發(fā)表于 04-21 09:09 ?1552次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>算</b>力服務(wù)器應(yīng)用領(lǐng)域

    智能力最具潛力的行業(yè)領(lǐng)域

    智能力最具潛力的行業(yè)領(lǐng)域 一、金融行業(yè) 智能風(fēng)控與精準服務(wù)?:大型銀行通過力集群(6.27萬臺服務(wù)器)支撐AI模型訓(xùn)練,實現(xiàn)風(fēng)險預(yù)警、智能
    的頭像 發(fā)表于 04-11 08:20 ?1392次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>算</b>力最具潛力的行業(yè)領(lǐng)域

    阿里最新消息:國家互聯(lián)網(wǎng)平臺、廣州力中心、多所高校接入通義千問大模型

    ? 國家互聯(lián)網(wǎng)平臺 接入阿里通義千問大模型 ? 3月10日,國家互聯(lián)網(wǎng)平臺接入阿里巴巴通義千問大模型,對外提供千問QwQ-32B A-PI 服務(wù),用戶可免費獲得100萬toke
    的頭像 發(fā)表于 03-14 11:54 ?1443次閱讀