91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型系統(tǒng)可以自動“學習”如何在數千臺服務器上調度數據處理操作

倩倩 ? 來源:綠色消費網 ? 2020-04-26 14:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

麻省理工學院的研究人員開發(fā)的新型系統(tǒng)可以自動“學習”如何在數千臺服務器上調度數據處理操作,而這通常是由不精確的人工設計算法完成的任務。這樣做可以幫助當今耗電的數據中心更加高效地運行。

數據中心可以包含數以萬計的服務器,這些服務器不斷運行來自開發(fā)人員和用戶的數據處理任務。群集調度算法可實時跨服務器分配傳入任務,以有效利用所有可用的計算資源并快速完成工作。

但是,傳統(tǒng)上,人們會根據一些基本準則(“策略”)和各種折衷來微調那些調度算法。例如,他們可以對算法進行編碼,以快速完成某些作業(yè),或者在作業(yè)之間平均分配資源。但是工作負載(意味著組合任務的組)各種各樣。因此,人類幾乎不可能針對特定的工作負載優(yōu)化其調度算法,因此,他們常常無法發(fā)揮其真正的效率潛力。

麻省理工學院的研究人員將所有手動編碼轉移到了機器上。在SIGCOMM上發(fā)表的一篇論文中,他們描述了一種利用“強化學習”(RL)(一種反復試驗的機器學習技術)來針對特定服務器群集中特定工作負載量身定制調度決策的系統(tǒng)。

為此,他們建立了新穎的RL技術,可以對復雜的工作量進行訓練。在培訓中,系統(tǒng)嘗試了多種可能的方式來跨服務器分配傳入的工作負載,最終在利用計算資源和快速處理速度方面找到了最佳折衷方案。除了“減少工作完成時間”這樣的簡單指令,不需要人工干預。

與最佳的手寫調度算法相比,研究人員的系統(tǒng)完成工作的速度提高了大約20%到30%,而在交通繁忙時則完成速度提高了一倍。但是,大多數情況下,系統(tǒng)會學習如何有效壓縮工作負載而幾乎沒有浪費。結果表明,該系統(tǒng)可以使數據中心使用更少的資源,以更高的速度處理相同的工作負載。

電氣工程和計算機科學系的博士生Hongzi Mao說:“如果您有使用機器進行反復試驗的方法,他們可以嘗試以不同的方式安排作業(yè),并自動找出哪種策略比其他方法更好。” (EECS)?!斑@可以自動提高系統(tǒng)性能。利用率的任何微小提高,即使提高1%,都可以節(jié)省數百萬美元,并為數據中心節(jié)省大量能源。”

EECS教授和計算機科學與人工智能實驗室(CSAIL)的研究員穆罕默德·阿里扎德(Mohammad Alizadeh)補充說:“制定調度決策沒有萬能的選擇?!?“在現有系統(tǒng)中,這些是您必須預先決定的硬編碼參數。相反,我們的系統(tǒng)將根據數據中心和工作負載學習調整其調度策略特征?!?/p>

通常,數據處理作業(yè)進入數據中心,以“節(jié)點”和“邊緣”的圖形表示。每個節(jié)點代表一些需要完成的計算任務,其中節(jié)點越大,所需的計算能力越強。連接節(jié)點的邊緣將連接的任務鏈接在一起。調度算法根據各種策略將節(jié)點分配給服務器。

但是傳統(tǒng)的RL系統(tǒng)并不習慣于處理這樣的動態(tài)圖。這些系統(tǒng)使用軟件“代理”進行決策并接收反饋信號作為獎勵。從本質上講,它會嘗試在給定的上下文中學習任何理想行為,從而最大化其對任何給定動作的回報。例如,它們可以幫助機器人學習如何執(zhí)行與通過與環(huán)境交互來拾取物體等任務,但這涉及通過更容易設置的像素網格處理視頻或圖像。

為了構建他們的基于RL的調度程序Decima,研究人員必須開發(fā)一種模型,該模型可以處理圖形結構的作業(yè),并可以擴展到大量作業(yè)和服務器。他們系統(tǒng)的“代理”是一種調度算法,該算法利用了圖神經網絡,通常用于處理圖結構數據。為了提出適合計劃的圖神經網絡,他們實現了一個自定義組件,該組件聚集了跨圖路徑的信息-例如快速估計完成圖的給定部分需要多少計算。這對于作業(yè)調度很重要,因為“子”(下)節(jié)點要等到其“父”(上)節(jié)點完成后才能開始執(zhí)行,因此,預測圖表中沿不同路徑的未來工作對于制定良好的調度決策至關重要。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4786

    瀏覽量

    98256
  • 服務器
    +關注

    關注

    14

    文章

    10303

    瀏覽量

    91600
  • 數據中心
    +關注

    關注

    18

    文章

    5685

    瀏覽量

    75134
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    服務器數據恢復】斷電致UFS2文件系統(tǒng)損壞的虛擬機數據恢復案例

    本次需要進行數據恢復的設備為一臺服務器,該服務器通過FreeNAS提供iSCSI塊存儲服務,并借助另外兩臺服務器構建虛擬化
    的頭像 發(fā)表于 03-10 17:36 ?570次閱讀
    【<b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復】斷電致UFS2文件<b class='flag-5'>系統(tǒng)</b>損壞的虛擬機<b class='flag-5'>數據</b>恢復案例

    NTP自動校時服務器的典型應用

    在現代信息技術飛速發(fā)展的今天,時間同步的精確性已成為許多行業(yè)和系統(tǒng)的核心需求。無論是金融交易、電力調度,還是云計算、物聯(lián)網,時間同步的準確性直接影響到系統(tǒng)的穩(wěn)定性和數據的可靠性。NTP
    的頭像 發(fā)表于 01-27 16:12 ?3902次閱讀
    NTP<b class='flag-5'>自動</b>校時<b class='flag-5'>服務器</b>的典型應用

    服務器數據恢復】服務器“泡水”硬盤掉線,數據竟這樣恢復

    北亞企安數據恢復中心的服務器數據恢復工程師和硬件工程師到現場處理故障。服務器數據恢復工程師到達現
    的頭像 發(fā)表于 01-22 17:38 ?1072次閱讀
    【<b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復】<b class='flag-5'>服務器</b>“泡水”硬盤掉線,<b class='flag-5'>數據</b>竟這樣恢復

    服務器數據恢復—意外斷電!Linux服務器數據恢復大揭秘

    某品牌服務器+存儲,安裝的linux操作系統(tǒng)。 機房意外斷電導致服務器操作系統(tǒng)無法正常啟動,服務器管理員故障
    的頭像 發(fā)表于 11-18 11:20 ?586次閱讀

    服務器數據恢復—硬盤離線致raid5陣列崩潰,數據恢復大揭秘

    公司的一臺服務器中有一組數塊硬盤組建的raid5陣列。 服務器中有一塊硬盤由于未知原因離線,服務器崩潰,存儲重要數據的D分區(qū)無法識別。 服務器
    的頭像 發(fā)表于 11-04 15:32 ?324次閱讀

    服務器數據恢復—重裝系統(tǒng)炸鍋!reiserfs數據恢復揭秘

    臺服務器上有一組由4塊SAS硬盤組建的RAID5陣列,采用的reiserfs文件系統(tǒng)。 原始數據組織結構:幾十MB的boot分區(qū)+數百GB的LVM卷+2GB的swap分區(qū)。LVM卷中劃分了一個reiserfs文件
    的頭像 發(fā)表于 10-30 16:26 ?545次閱讀

    服務器數據恢復—RAIDZ多塊硬盤離線導致服務器崩潰的數據恢復案例

    服務器數據恢復環(huán)境&故障: 一臺服務器有32塊硬盤,采用Windows操作系統(tǒng)。 服務器在正常運行的時候突然變得不可用。沒有異常斷電、進
    的頭像 發(fā)表于 09-18 12:29 ?958次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復—RAIDZ多塊硬盤離線導致<b class='flag-5'>服務器</b>崩潰的<b class='flag-5'>數據</b>恢復案例

    服務器數據恢復—服務器上的卷被誤刪數據如何恢復?

    工作人員不慎將一臺服務器上的卷誤刪除,服務器上有一組raid5陣列。需要恢復誤刪除的數據。
    的頭像 發(fā)表于 08-14 11:33 ?1030次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復—<b class='flag-5'>服務器</b>上的卷被誤刪<b class='flag-5'>數據</b>如何恢復?

    利用Ansible自動化部署Linux服務器

    作為一名在運維一線摸爬滾打多年的工程師,我見過太多因為手工配置導致的生產事故。今天,我將毫無保留地分享我在大規(guī)模Linux服務器自動化管理中積累的實戰(zhàn)經驗,讓你也能輕松駕馭數百臺服務器的配置管理。
    的頭像 發(fā)表于 08-06 17:59 ?1370次閱讀

    服務器數據恢復—硬盤離線導致raid上層的卷無法掛載的數據恢復案例

    服務器數據恢復環(huán)境&故障: 某公司一臺服務器上有一組由24塊FC硬盤組建的raid。 服務器出現故障,無法正常工作。 經過初步檢測,管理員發(fā)現導致
    的頭像 發(fā)表于 07-29 13:00 ?651次閱讀

    服務器數據恢復—重裝系統(tǒng)導致XFS文件系統(tǒng)分區(qū)丟失的數據恢復案例

    服務器數據恢復環(huán)境&故障: 一臺服務器上通過磁盤柜+RAID卡組建的riad5磁盤陣列,服務器上層安裝Linux操作系統(tǒng),搭建XFS文件
    的頭像 發(fā)表于 06-12 11:20 ?845次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復—重裝<b class='flag-5'>系統(tǒng)</b>導致XFS文件<b class='flag-5'>系統(tǒng)</b>分區(qū)丟失的<b class='flag-5'>數據</b>恢復案例

    服務器數據恢復—ocfs2文件系統(tǒng)被格式化為Ext4文件系統(tǒng)數據恢復案例

    服務器存儲數據恢復環(huán)境&故障: 人為誤操作將Ext4文件系統(tǒng)誤裝入一臺服務器存儲上的Ocfs2文件系統(tǒng)
    的頭像 發(fā)表于 06-10 12:03 ?776次閱讀
    <b class='flag-5'>服務器</b><b class='flag-5'>數據</b>恢復—ocfs2文件<b class='flag-5'>系統(tǒng)</b>被格式化為Ext4文件<b class='flag-5'>系統(tǒng)</b>的<b class='flag-5'>數據</b>恢復案例

    無人職守自動安裝部署操作系統(tǒng)指南

    當組織有服務器需要部署linux系統(tǒng)時,需要通過網絡方式安裝并結合自動應答文件,實現無人職守自動安裝部署操作系統(tǒng)。這種方式需要我們至少配置一
    的頭像 發(fā)表于 05-22 13:38 ?1059次閱讀
    無人職守<b class='flag-5'>自動</b>安裝部署<b class='flag-5'>操作系統(tǒng)</b>指南

    服務器數據恢復—Linux系統(tǒng)服務器崩潰的數據恢復案例

    服務器數據恢復環(huán)境: linux操作系統(tǒng)服務器中有一組由4塊SAS接口硬盤組建的raid5陣列。 服務器故障:
    的頭像 發(fā)表于 05-20 15:46 ?911次閱讀

    服務器數據恢復—服務器部分數據目錄項被破壞的數據恢復案例

    安裝linux系統(tǒng)服務器意外斷電。管理員重啟服務器后進行檢測,發(fā)現服務器上部分文件丟失。管理員沒有進行任何
    的頭像 發(fā)表于 05-08 15:16 ?546次閱讀