91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當機器學習遇上SSD,會擦出怎樣的火花呢?

VIBT_dputech ? 來源:大普微 ? 2020-09-07 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來人工智能和大數(shù)據(jù)的迅速發(fā)展正在深刻改變著這個世界和我們的生活方式。人工智能的核心是機器學習(Machine Learning) 算法,自 2006 年以來,在機器學習領(lǐng)域,以深度學習(Deep Lerning) 為代表的機器學習算法取得了突破性的進展,在2017年AlphaGo大戰(zhàn)圍棋冠軍李世石后這一技術(shù)加速走向市場、落地應(yīng)用。而SSD作為大數(shù)據(jù)的一種存儲介質(zhì),正在取代HDD成為主流的存儲設(shè)備。那么當機器學習遇上SSD,會擦出怎樣的火花呢?

一、什么是機器學習?

·機器學習是讓計算機具有學習的能力,無需進行明確編程?!?亞瑟·薩繆爾,1959

·計算機程序利用經(jīng)驗 E 學習任務(wù) T,性能是 P,如果針對任務(wù) T 的性能 P 隨著經(jīng)驗 E 不斷增長,則稱為機器學習?!?湯姆·米切爾,1997

機器學習是一類算法的總稱,這些算法從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測或者分類,更具體的說,機器學習可以看作是尋找一個函數(shù),輸入是樣本數(shù)據(jù),輸出是期望的結(jié)果,只是這個函數(shù)過于復(fù)雜,以至于不太方便形式化表達。需要注意的是,機器學習的目標是使學到的函數(shù)很好地適用于“新樣本”,而不僅僅是在訓練樣本上表現(xiàn)很好。學到的函數(shù)適用于新樣本的能力,稱為泛化(Generalization)能力。

二、機器學習步驟

通常學習一個好的函數(shù),分為以下三步:

1、選擇一個合適的模型,這通常需要依據(jù)實際問題而定,針對不同的問題和任務(wù)需要選取恰當?shù)哪P停P途褪且唤M函數(shù)的集合。

2、判斷一個函數(shù)的好壞,這需要確定一個衡量標準,也就是我們通常說的損失函數(shù)(Loss Function),損失函數(shù)的確定也需要依據(jù)具體問題而定,如回歸問題一般采用歐式距離,分類問題一般采用交叉熵代價函數(shù)。

3、找出“最好”的函數(shù),如何從眾多函數(shù)中最快的找出“最好”的那一個,這一步是最大的難點,做到又快又準往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。

學習得到“最好”的函數(shù)后,需要在新樣本上進行測試,只有在新樣本上表現(xiàn)很好,才算是一個“好”的函數(shù)。

三、機器學習的類型

機器學習主要有三種基本類型:監(jiān)督學習、非監(jiān)督學習和強化學習。

1監(jiān)督學習

監(jiān)督學習是使用已知正確答案的示例來訓練模型。已知數(shù)據(jù)和其一一對應(yīng)的標簽,訓練一個智能算法,將輸入數(shù)據(jù)映射到標簽的過程,它的常見應(yīng)用場景如分類問題和回歸問題。常見的算法有K近鄰算法、線性回歸、邏輯回歸、支持向量機(SVM)、決策樹和隨機森林、神經(jīng)網(wǎng)絡(luò)。

分類

在分類中,機器被訓練成將一個組劃分為特定的類。分類的一個簡單例子是電子郵件帳戶上的垃圾郵件過濾器。過濾器分析你以前標記為垃圾郵件的電子郵件,并將它們與新郵件進行比較。如果它們匹配一定的百分比,這些新郵件將被標記為垃圾郵件并發(fā)送到適當?shù)奈募A。那些比較不相似的電子郵件被歸類為正常郵件并發(fā)送到你的郵箱。

也許你會問這個分類算法對于SSD有什么用呢?SSD中的一個典型的分類問題是IO模式識別,判斷IO是純讀、純寫或者混合讀寫的,這是一個三分類的問題;判斷IO是順序的還是隨機的,這是一個二分類的問題??梢愿鶕?jù)實際情況選擇相應(yīng)的相應(yīng)的機器學習分類算法識別出不同的IO模式,然后針對不同的模式FTL就可采取不同策略,進而提升SSD的性能。

回歸

回歸問題通常是用來預(yù)測一個值,它的預(yù)測結(jié)果是連續(xù)的,如預(yù)測房價、未來的天氣情況等,例如一個產(chǎn)品的實際價格為500元,通過回歸分析預(yù)測值為499元,我們認為這是一個比較好的回歸分析。

回歸算法在SSD中能用在什么地方呢?回歸算法在SSD的一個應(yīng)用是IO強度預(yù)測,在一定模式下IO強度在時序上是有一定規(guī)律的,可以根據(jù)前一段時間的IO強度預(yù)測下一段時間的IO強度,Smart-IO技術(shù)采用長短期記憶人工神經(jīng)網(wǎng)絡(luò)LSTM對IO強度進行預(yù)測。提前預(yù)測出IO強度后就可優(yōu)化FTL策略、合理分配GC占用資源、合理調(diào)度、提高數(shù)據(jù)命中率等,進而提升SSD性能。

2非監(jiān)督學習

在無監(jiān)督學習中,數(shù)據(jù)是無標簽的。學習模型是為了推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。無監(jiān)督學習主要分為聚類和降維。

聚類用于根據(jù)屬性和行為對象進行分組。這與分類不同,因為這些組不是你提供的。聚類的一個例子是將一個組劃分成不同的子組(例如,基于年齡和婚姻狀況),然后應(yīng)用到有針對性的營銷方案中。大多數(shù)大數(shù)據(jù)可視化使用降維來識別趨勢和規(guī)則。主要算法: K-means、層次聚類分析(HCA)、DBSCAN。

高維數(shù)據(jù)中很容易出現(xiàn)樣本稀疏、距離計算困難等問題,即“維度災(zāi)難”,為了緩解維度災(zāi)難,常用的就是降維。降維的主要方法有主成分分析(PCA)、線性判別分析(LDA)、局部線性嵌入(LLE)。如圖所示,通過PCA的方法可以把一個三位的數(shù)據(jù)降維成一個二維數(shù)據(jù)。

無監(jiān)督學習由于沒有標簽,相比監(jiān)督學習來說相當于少了一些輸入信息,實際應(yīng)用中相對監(jiān)督學習學習會困難一些,那么在SSD是否就無用武之地了呢?非也非也。Smart-IO數(shù)據(jù)分組技術(shù)用K-means算法對IO進行冷熱數(shù)據(jù)分組,然后把不同組的數(shù)據(jù)寫到不同的block或者die上,那么就可以減小,可減小WA,延長SSD使用壽命。

3強化學習

強化學習算法的思路非常簡單,以游戲為例,如果在游戲中采取某種策略可以取得較高的得分,那么就進一步「強化」這種策略,以期繼續(xù)取得較好的結(jié)果。這種策略與日常生活中的各種「績效獎勵」非常類似。我們平時也常常用這樣的策略來提高自己的游戲水平。AlphaGo下圍棋也是這個原理,只告訴機器圍棋的基本規(guī)則,但是不告訴它人類摸索了上千年才總結(jié)出來的定式等圍棋戰(zhàn)術(shù),讓機器完全依靠自學,打敗人類。

強化學習感覺和SSD很難沾上邊,不過熟悉SSD(固態(tài)硬盤)的人都知道,垃圾回收(GC,Garbage Collection)是SSD固件設(shè)計中的重要一環(huán),也是影響SSD主控性能的重要因素。一般的GC機制都是只根據(jù)當前硬盤空閑空間狀態(tài)來做GC的:當有空閑空間的時,不啟動GC;反之,當沒有空閑空間的情況下,執(zhí)行GC任務(wù)。這種策略的缺點是如果在用戶操作的時候進行GC會造成SSD性能明顯下降,可以在主控空閑時提前進行GC,但是GC過于頻繁會造成WA寫放大過大,所以需要一個平衡,需要一種算法來自動確定何時GC,強化學習正好可以排上用場,給定一定的衡量標準,然后讓機器通過強化學習的方法訓練來自動學習GC的時機,得到更優(yōu)的GC的策略。

四、DapuStor機器學習技術(shù)

DapuStor已基于SSD開發(fā)出Smart-IO Data Grouping和Smart-IO Intensities Prediction等先進技術(shù),把機器學習的先進算法用到了SSD中,提升了SSD的產(chǎn)品性能。同時自研的帶有計算和智能的數(shù)據(jù)存儲處理器芯片(簡稱DPU),可以在芯片層面實現(xiàn)更多的智能功能和硬件加速,實現(xiàn)存算一體,滿足高端存儲和邊緣計算市場的需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3109

    瀏覽量

    122222
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50095

    瀏覽量

    265307
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136934

原文標題:當機器學習遇上SSD

文章出處:【微信號:dputech,微信公眾號:DapuStor】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2026 BIWIN Mini SSD生態(tài)應(yīng)用研討圓滿落幕

    2026年1月26日,由佰維存儲攜手英特爾共同舉辦的“源起深圳,共創(chuàng)商機——Mini SSD生態(tài)應(yīng)用研討”在深圳英特爾大灣區(qū)科技創(chuàng)新中心圓滿落幕。本次盛會匯聚了來自算力、先進封裝、存儲主控、終端
    的頭像 發(fā)表于 02-01 11:38 ?1172次閱讀

    強化學習讓自動駕駛模型學習更快嗎?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛大模型訓練時,有的技術(shù)方案采用模仿學習,而有些采用強化學習。同樣作為大模型的訓練方式,強化學習
    的頭像 發(fā)表于 01-31 09:34 ?641次閱讀
    強化<b class='flag-5'>學習</b><b class='flag-5'>會</b>讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?187次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    機器感受觸覺:電子皮膚手套,正在重塑“觸摸”的未來?

    你是否想過——當機器能像人的皮膚一樣,精準感知指尖的輕觸、掌心的握持,甚至布料的紋理差異,世界會發(fā)生怎樣的改變? 過去,我們習慣了“人適應(yīng)機器”:在手機上滑動、向設(shè)備輸入指令,卻很少讓機器
    的頭像 發(fā)表于 12-26 10:55 ?1809次閱讀
    讓<b class='flag-5'>機器</b>感受觸覺:電子皮膚手套,正在重塑“觸摸”的未來?

    閃迪企業(yè)級NVMe SSD獲開放計算組織OCP Inspired?認證

    SSD規(guī)范。目前,SANDISK? SN861 NVMe SSD已正式上線OCP Marketplace平臺。 隨著人工智能(AI)和機器學習應(yīng)用的快速增長,為AI工作負載優(yōu)化設(shè)計的
    的頭像 發(fā)表于 10-15 14:56 ?470次閱讀

    如何在香橙派5 Plus上移植deepin 25操作系統(tǒng)

    當開源生態(tài)遇上極客硬件,碰撞出怎樣火花?當 deepin 25 遇上香橙派 5 Plus 開發(fā)板,又會帶來什么樣的實踐體驗?
    的頭像 發(fā)表于 10-11 10:29 ?988次閱讀

    當EtherCAT高速I/O模塊遇上藍牙耳機生產(chǎn)線,擦出怎樣火花?

    藍牙耳機作為現(xiàn)代科技的熱門產(chǎn)品,其生產(chǎn)流程的高效與精準至關(guān)重要。本文將深入剖析藍牙耳機的生產(chǎn)流程,并重點介紹一套兼顧穩(wěn)定、快速與性價比的系統(tǒng)搭建方案,帶您領(lǐng)略科技生產(chǎn)背后的精細工藝與智慧選擇。藍牙耳機生產(chǎn)流程藍牙耳機的生產(chǎn)流程主要包括以下幾個關(guān)鍵階段,而組裝測試線系統(tǒng)則涵蓋了生產(chǎn)過程中的各個環(huán)節(jié),確保生產(chǎn)的高效與精準。1.生產(chǎn)流程SMT段:負責電子元件的表面
    的頭像 發(fā)表于 09-04 11:39 ?645次閱讀
    當EtherCAT高速I/O模塊<b class='flag-5'>遇上</b>藍牙耳機生產(chǎn)線,<b class='flag-5'>會</b><b class='flag-5'>擦出</b><b class='flag-5'>怎樣</b>的<b class='flag-5'>火花</b>?

    信捷視覺平臺全新升級

    當機器視覺的精準遇上AI的智能,碰撞出怎樣火花?信捷視覺平臺全新升級——XINJE VISION STUDIO 3.7 + Vision
    的頭像 發(fā)表于 07-28 15:56 ?876次閱讀
    信捷視覺平臺全新升級

    聲智科技與螞蟻集團共探聲學AI前沿技術(shù)

    當聲學AI遇上金融科技,碰撞出怎樣火花?當聲學AI模型賦能AI硬件產(chǎn)品,又將如何重塑人機交互的邊界?近日,聲智科技受邀參加螞蟻集團《AI圓桌派》內(nèi)部分享
    的頭像 發(fā)表于 07-24 10:18 ?1020次閱讀

    FPGA在機器學習中的具體應(yīng)用

    隨著機器學習和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2889次閱讀

    當機器遇上“語言障礙”:CCLINKIE轉(zhuǎn)Profinet的“破冰外掛”來啦\\!

    在汽車焊裝車間的技術(shù)角,工程師小陳的筆記本記滿了“跨協(xié)議難題”:當搭載Profinet的庫卡機器遇上CCLINKIE總線的三菱PLC,數(shù)據(jù)交互像隔著玻璃喊話——PLC發(fā)送的坐標指令要“繞地球半圈
    發(fā)表于 06-04 14:31

    明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠智睿SSD2351開發(fā)板憑借強大性能與豐富功能,為語音機器人的發(fā)展注入新動力,成為該領(lǐng)域的變革力量。 SSD
    發(fā)表于 05-28 11:36

    觸想安卓工控一體機在智慧辦公3D打印設(shè)備上的應(yīng)用特點分析

    在科技飛速發(fā)展的當下,3D打印技術(shù)作為制造業(yè)領(lǐng)域的創(chuàng)新力量,正不斷改變著產(chǎn)品的設(shè)計與制造方式。而安卓工控一體機作為工業(yè)自動化領(lǐng)域的重要設(shè)備,也在眾多行業(yè)中展現(xiàn)出強大的適用性。當這兩者相遇,又會碰撞出怎樣火花呢?
    的頭像 發(fā)表于 04-27 11:14 ?646次閱讀

    “兩”熱議“機器人和飛行汽車”,核心動力電機可能

    飛行汽車、人形機器人、自動駕駛汽車,在中國經(jīng)濟邁入高質(zhì)量發(fā)展階段后,這些高科技產(chǎn)品成為推動國內(nèi)經(jīng)濟發(fā)展的新質(zhì)生產(chǎn)力,同時也受到“兩”代表的高度關(guān)注,成為2025年“兩”期間的熱議話題。*附件
    發(fā)表于 03-31 13:35

    樹莓派遇上機器狗:科技界的“春晚明星”是怎樣煉成的?

    機器人上春晚,這次穿上了東北花棉襖!每年春晚,總有一些節(jié)目讓人眼前一亮,今年也不例外!UnitreeH1機器人化身“秧BOT”,身著東北花棉襖,扭起了“賽博秧歌”,嚇壞了萌翻了全場觀眾。這已經(jīng)不是
    的頭像 發(fā)表于 03-25 09:25 ?1163次閱讀
    樹莓派<b class='flag-5'>遇上機器</b>狗:科技界的“春晚明星”是<b class='flag-5'>怎樣</b>煉成的?