91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入研究數(shù)據(jù)分析技術(shù)

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Seth DeLand ? 2022-07-06 14:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)的海嘯為企業(yè)提供了優(yōu)化流程和提供差異化??產(chǎn)品的機(jī)會。一套新的算法??和基礎(chǔ)設(shè)施已經(jīng)出現(xiàn),允許企業(yè)使用大數(shù)據(jù)或機(jī)器學(xué)習(xí)等關(guān)鍵數(shù)據(jù)分析技術(shù)來利用這些機(jī)會。

此外,大數(shù)據(jù)或機(jī)器學(xué)習(xí)背后的這種新基礎(chǔ)設(shè)施導(dǎo)致了許多不同的技術(shù),這些技術(shù)支持構(gòu)建數(shù)據(jù)分析算法的迭代過程。正是構(gòu)建算法的迭代過程的這個開始階段可以讓企業(yè)走向成功。這個迭代過程涉及嘗試多種策略,例如尋找其他數(shù)據(jù)源以及不同的機(jī)器學(xué)習(xí)方法和特征轉(zhuǎn)換。

鑒于要嘗試的組合可能無限多,因此快速迭代至關(guān)重要。領(lǐng)域?qū)<曳浅_m合快速迭代,因為他們可以利用他們的知識和直覺來避免不太可能產(chǎn)生強(qiáng)大結(jié)果的方法。具有領(lǐng)域知識的工程師越快將他們的知識應(yīng)用到支持快速迭代的工具中,企業(yè)就能越快獲得競爭優(yōu)勢。

但在深入研究支持這項活動的技術(shù)之前,讓我們先來看看這個迭代過程的一個例子,以及在此過程中要問的一些問題。

迭代數(shù)據(jù)集

假肢公司知道,如果它知道客戶會做什么活動(站立、坐著、走路等),它可以制造更智能的假肢。因此,它提出的第一個問題是:我們可以使用哪些數(shù)據(jù)來確定這一點?

該公司的工程師知道他們的大多數(shù)客戶都有智能手機(jī),因此他們希望使用來自智能手機(jī)傳感器的數(shù)據(jù)來確定他們的活動。該公司的工程師首先記錄加速度計的數(shù)據(jù)。他們將機(jī)器學(xué)習(xí)算法直接應(yīng)用于數(shù)據(jù),但學(xué)習(xí)結(jié)果不如他們希望的那么好。迭代過程開始了,工程師接著問:我們是否有其他方法可以為機(jī)器學(xué)習(xí)準(zhǔn)備數(shù)據(jù),從而產(chǎn)生更好的結(jié)果?

該公司的工程師應(yīng)用信號處理技術(shù)從傳感器數(shù)據(jù)中提取頻率內(nèi)容,并再次嘗試機(jī)器學(xué)習(xí)技術(shù)。結(jié)果更好,但還沒有完全達(dá)到,所以他們問:我們可以使用其他數(shù)據(jù)來源來改進(jìn)我們的預(yù)測嗎?

他們決定還記錄來自智能手機(jī)的陀螺儀數(shù)據(jù),并將其與加速度計數(shù)據(jù)相結(jié)合。再次訓(xùn)練他們的機(jī)器學(xué)習(xí)模型,他們現(xiàn)在對結(jié)果感到滿意,并開始生產(chǎn)。

工程師在迭代過程中可能會問的其他問題包括:

有哪些可用數(shù)據(jù)?

還有其他數(shù)據(jù)源嗎?

可以使用哪些類型的流程從數(shù)據(jù)中提取高級信息?

該模型將在哪里運行?

某些類型的錯誤分類是否比其他類型的錯誤分類成本更高?

我們?nèi)绾尾拍芸焖龠M(jìn)行實驗來驗證想法并回答上述問題?

既然您已經(jīng)看到了迭代過程的示例和要問的問題,那么這個過程背后的技術(shù)呢?

大數(shù)據(jù)迭代

隨著越來越多的數(shù)據(jù)產(chǎn)生,系統(tǒng)需要發(fā)展以處理所有數(shù)據(jù)。在這個“大數(shù)據(jù)”領(lǐng)域,兩個大型項目重塑了格局:Hadoop 和 Spark。這兩個項目都是 Apache 軟件基金會的一部分。它們共同使存儲和分析大量數(shù)據(jù)變得更容易、更便宜。

這些技術(shù)可以極大地影響工程師的工作。對于習(xí)慣于在臺式機(jī)、網(wǎng)絡(luò)驅(qū)動器或傳統(tǒng)數(shù)據(jù)庫中處理文件中數(shù)據(jù)的工程師來說,這些新工具需要一種不同的方式來訪問數(shù)據(jù),然后才能考慮進(jìn)行分析。在許多情況下,可能會造成人為的數(shù)據(jù)孤島和低效率,例如每次執(zhí)行新分析時都需要聯(lián)系某人將數(shù)據(jù)從大數(shù)據(jù)系統(tǒng)中提取出來。

工程師在處理大數(shù)據(jù)時面臨的另一個挑戰(zhàn)是需要改變他們的計算方法。當(dāng)數(shù)據(jù)小到足以放入內(nèi)存時,標(biāo)準(zhǔn)的工作流程是加載數(shù)據(jù)并執(zhí)行計算;計算通常會很快,因為數(shù)據(jù)已經(jīng)在內(nèi)存中。但是對于大數(shù)據(jù),通常會有磁盤讀/寫,以及跨網(wǎng)絡(luò)的數(shù)據(jù)傳輸,這會減慢計算速度。

當(dāng)工程師設(shè)計一種新算法時,他們需要能夠快速迭代許多設(shè)計。結(jié)果是一個新的工作流程,包括獲取數(shù)據(jù)樣本并在本地使用它,從而實現(xiàn)快速迭代和輕松使用有用的開發(fā)工具,如調(diào)試器。一旦算法在樣本上經(jīng)過審查,它就會針對大數(shù)據(jù)系統(tǒng)中的完整數(shù)據(jù)集運行。

這些挑戰(zhàn)的解決方案是一個系統(tǒng),讓工程師可以使用熟悉的環(huán)境編寫代碼,該代碼既可以在本地數(shù)據(jù)樣本上運行,也可以在大數(shù)據(jù)系統(tǒng)中的完整數(shù)據(jù)集上運行。MATLAB 等工具與 Hadoop 等大數(shù)據(jù)系統(tǒng)建立連接。可以下載數(shù)據(jù)樣本,并在本地制作算法原型。利用延遲評估框架的新計算模型用于以性能優(yōu)化的方式在完整數(shù)據(jù)集上運行算法。對于工程和數(shù)據(jù)科學(xué)工作流程中常見的迭代分析,這種延遲評估模型是減少完成完整數(shù)據(jù)集分析所需時間的關(guān)鍵,這通??赡苁菐追昼娀驇仔r的數(shù)量級。

大數(shù)據(jù)技術(shù)一直是數(shù)據(jù)科學(xué)發(fā)展的關(guān)鍵推動力。隨著大量數(shù)據(jù)的收集,需要新的算法來對這些數(shù)據(jù)進(jìn)行推理,這導(dǎo)致了機(jī)器學(xué)習(xí)的使用熱潮。

機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)用于識別數(shù)據(jù)中的潛在趨勢和結(jié)構(gòu)。機(jī)器學(xué)習(xí)分為無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)。

在無監(jiān)督學(xué)習(xí)中,我們試圖發(fā)現(xiàn)數(shù)據(jù)中的關(guān)系,例如所有相似的數(shù)據(jù)點組。例如,我們可能想查看駕駛數(shù)據(jù),以了解人們駕駛汽車的模式是否不同。通過聚類分析,我們可能會發(fā)現(xiàn)不同的趨勢,例如城市駕駛與高速公路駕駛,或者更有趣的是,不同風(fēng)格的駕駛員(例如,激進(jìn)的司機(jī))。

在監(jiān)督學(xué)習(xí)中,我們得到輸入和輸出數(shù)據(jù),目標(biāo)是訓(xùn)練一個模型,該模型在給定新輸入的情況下可以預(yù)測新輸出。監(jiān)督學(xué)習(xí)通常用于圖像中的預(yù)測性維護(hù)、欺詐檢測和面部識別等應(yīng)用。

機(jī)器學(xué)習(xí)的每個領(lǐng)域——無監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)——都有幾十種流行的算法(還有數(shù)百種不太流行的算法)。但是,很難知道這些算法中的哪一種最適合您正在處理的特定問題。通常,最好的辦法就是嘗試一下并比較結(jié)果。這在某些環(huán)境中可能是相當(dāng)大的挑戰(zhàn),因為研究人員根據(jù)他們的問題和偏好構(gòu)建具有不同接口的算法。

成熟的機(jī)器學(xué)習(xí)工具為各種算法提供一致的界面,并且可以輕松快速地嘗試不同的方法。這對于執(zhí)行數(shù)據(jù)科學(xué)的領(lǐng)域?qū)<襾碚f至關(guān)重要,因為它使他們能夠識別機(jī)器學(xué)習(xí)比傳統(tǒng)方法提供改進(jìn)的“速贏”。這種方法還可以防止他們花費數(shù)天或數(shù)周的時間將機(jī)器學(xué)習(xí)模型調(diào)整為不適合機(jī)器學(xué)習(xí)的數(shù)據(jù)集。MATLAB 等工具通過提供訓(xùn)練和比較多個機(jī)器學(xué)習(xí)模型的點擊式應(yīng)用??程序來解決這個問題。

迭代更快

大數(shù)據(jù)和機(jī)器學(xué)習(xí)相結(jié)合,有望為長期存在的業(yè)務(wù)問題帶來新的解決方案。底層技術(shù)掌握在非常熟悉這些業(yè)務(wù)問題的領(lǐng)域?qū)<沂种校梢援a(chǎn)生顯著的成果。例如,貝克休斯的工程師使用機(jī)器學(xué)習(xí)技術(shù)來預(yù)測他們的天然氣和石油開采卡車上的泵何時會出現(xiàn)故障。他們從這些卡車上收集了近 1 TB 的數(shù)據(jù),然后使用信號處理技術(shù)來識別相關(guān)的頻率內(nèi)容。領(lǐng)域知識在這里至關(guān)重要,因為他們需要了解卡車上可能出現(xiàn)在傳感器讀數(shù)中的其他系統(tǒng),但這對預(yù)測泵故障沒有幫助。他們應(yīng)用了機(jī)器學(xué)習(xí)技術(shù),可以區(qū)分健康的泵和不健康的泵。由此產(chǎn)生的系統(tǒng)預(yù)計將減少 1000 萬美元的總成本。在整個過程中,他們對泵車系統(tǒng)的了解使他們能夠深入挖掘數(shù)據(jù)并快速迭代。

利用處理大數(shù)據(jù)和應(yīng)用機(jī)器學(xué)習(xí)的工具,貝克休斯的工程師能夠很好地解決改善業(yè)務(wù)成果的問題。憑借對這些復(fù)雜系統(tǒng)的領(lǐng)域知識,工程師們將這些工具遠(yuǎn)遠(yuǎn)超出了網(wǎng)絡(luò)和營銷應(yīng)用程序的傳統(tǒng)用途。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • matlab
    +關(guān)注

    關(guān)注

    189

    文章

    3025

    瀏覽量

    238751
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136980
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9065

    瀏覽量

    143776
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    API數(shù)據(jù)分析:淘寶流量來源分析,渠道優(yōu)化!

    ? 在電商領(lǐng)域,流量來源分析是優(yōu)化營銷策略的核心。淘寶作為中國領(lǐng)先的電商平臺,其流量數(shù)據(jù)可通過API(應(yīng)用程序接口)高效獲取和分析。本技術(shù)帖將逐步指導(dǎo)您如何利用淘寶API進(jìn)行流量來源
    的頭像 發(fā)表于 01-23 13:42 ?198次閱讀
    API<b class='flag-5'>數(shù)據(jù)分析</b>:淘寶流量來源<b class='flag-5'>分析</b>,渠道優(yōu)化!

    利用拼多多用戶API進(jìn)行粉絲數(shù)據(jù)分析,有效提升用戶粘性

    ? 在電商運營中,理解并維系核心用戶群體至關(guān)重要。拼多多開放平臺提供的用戶API,特別是與粉絲數(shù)據(jù)相關(guān)的接口,為商家深入分析粉絲行為、精準(zhǔn)運營、提升用戶粘性提供了強(qiáng)大的數(shù)據(jù)支持。本文將探討如何利用
    的頭像 發(fā)表于 12-30 10:38 ?232次閱讀
    利用拼多多用戶API進(jìn)行粉絲<b class='flag-5'>數(shù)據(jù)分析</b>,有效提升用戶粘性

    淘寶數(shù)據(jù)分析API:用戶行為洞察,精準(zhǔn)營銷決策!

    ? 在競爭激烈的電商領(lǐng)域,數(shù)據(jù)已成為驅(qū)動增長的核心引擎。淘寶作為國內(nèi)領(lǐng)先的電商平臺,其開放的數(shù)據(jù)分析API為商家提供了強(qiáng)大的工具,能夠深入挖掘用戶行為,并基于這些洞察做出更精準(zhǔn)、更有效的營銷決策
    的頭像 發(fā)表于 12-25 14:12 ?277次閱讀
    淘寶<b class='flag-5'>數(shù)據(jù)分析</b>API:用戶行為洞察,精準(zhǔn)營銷決策!

    經(jīng)營數(shù)據(jù)分析可以通過哪些方式

    在數(shù)聚股份看來,提起經(jīng)營數(shù)據(jù)分析,大家往往會聯(lián)想到一些密密麻麻的數(shù)字表格,或是高級的數(shù)據(jù)建模手法,再或是華麗的數(shù)據(jù)報表。其實,“ 分析 ”本身是每個人都具備的能力,對于業(yè)務(wù)決策者而言,
    的頭像 發(fā)表于 12-05 16:31 ?640次閱讀

    廣立微DE-G零斷檔重構(gòu)智能數(shù)據(jù)分析

    近日,數(shù)據(jù)分析領(lǐng)域被一則消息推上風(fēng)口浪尖:一家老牌軟件巨頭將撤出中國。在此背景下,其旗下以靈活著稱的數(shù)據(jù)分析軟件,在中國市場的未來將面臨極大的不確定性。
    的頭像 發(fā)表于 11-07 10:39 ?671次閱讀

    電能質(zhì)量分析軟件可以提供哪些數(shù)據(jù)分析功能?

    電能質(zhì)量分析軟件通過對電力系統(tǒng)的實時數(shù)據(jù)采集和深度算法處理,可提供覆蓋 “穩(wěn)態(tài)指標(biāo)評估、暫態(tài)事件溯源、故障預(yù)測診斷、合規(guī)性驗證” 全鏈條的數(shù)據(jù)分析功能。以下結(jié)合行業(yè)標(biāo)準(zhǔn)與前沿工具(如福祿克、華盛昌
    的頭像 發(fā)表于 10-10 17:12 ?807次閱讀

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與人工智能平臺

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運用數(shù)據(jù)分析和先進(jìn)的人工智能自動化,提供可擴(kuò)展的面向未來的解決方案。Altair數(shù)據(jù)分析和人工智能平臺包括數(shù)據(jù)準(zhǔn)備、
    的頭像 發(fā)表于 09-18 17:56 ?853次閱讀
    【產(chǎn)品介紹】Altair RapidMiner<b class='flag-5'>數(shù)據(jù)分析</b>與人工智能平臺

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?580次閱讀
    電磁兼容與電磁干擾在電磁兼容性大<b class='flag-5'>數(shù)據(jù)分析</b>中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?870次閱讀
    電磁兼容與電磁干擾在電磁兼容性大<b class='flag-5'>數(shù)據(jù)分析</b>中的智能管理系統(tǒng)

    如何有效利用高光譜成像技術(shù)提升數(shù)據(jù)分析效率

    隨著人工智能和大數(shù)據(jù)技術(shù)的快速發(fā)展,高光譜成像技術(shù)作為一種融合光譜信息與空間影像的新興技術(shù),正日益成為提升數(shù)據(jù)分析效率的重要工具。在農(nóng)業(yè)監(jiān)測
    的頭像 發(fā)表于 09-11 16:13 ?837次閱讀
    如何有效利用高光譜成像<b class='flag-5'>技術(shù)</b>提升<b class='flag-5'>數(shù)據(jù)分析</b>效率

    普迪飛 Exensio?數(shù)據(jù)分析平臺 | Test Operations解鎖半導(dǎo)體測試新紀(jì)元

    TestOperations是Exensio數(shù)據(jù)分析平臺的四個主要模塊之一。T-Ops模塊旨在幫助集成器件制造商(IDM)、無晶圓廠半導(dǎo)體公司(Fabless)和外包半導(dǎo)體(產(chǎn)品)封測廠(OSAT
    的頭像 發(fā)表于 08-19 13:53 ?1262次閱讀
    普迪飛 Exensio?<b class='flag-5'>數(shù)據(jù)分析</b>平臺 | Test Operations解鎖半導(dǎo)體測試新紀(jì)元

    如何通過數(shù)據(jù)分析識別設(shè)備故障模式?

    通過數(shù)據(jù)分析識別設(shè)備故障模式,本質(zhì)是從聲振溫等多維數(shù)據(jù)中提取故障特征,建立 “數(shù)據(jù)特征 - 故障類型” 的映射關(guān)系,核心可通過特征提取、模式匹配、趨勢分析三步實現(xiàn),精準(zhǔn)定位故障根源與發(fā)
    的頭像 發(fā)表于 08-19 11:14 ?873次閱讀
    如何通過<b class='flag-5'>數(shù)據(jù)分析</b>識別設(shè)備故障模式?

    構(gòu)建自定義電商數(shù)據(jù)分析API

    ? 在電商業(yè)務(wù)中,數(shù)據(jù)是驅(qū)動決策的核心。隨著數(shù)據(jù)量的增長,企業(yè)需要實時、靈活的分析工具來監(jiān)控銷售、用戶行為和庫存等指標(biāo)。一個自定義電商數(shù)據(jù)分析API(應(yīng)用程序接口)可以自動化
    的頭像 發(fā)表于 07-17 14:44 ?608次閱讀
    構(gòu)建自定義電商<b class='flag-5'>數(shù)據(jù)分析</b>API

    AI數(shù)據(jù)分析儀設(shè)計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?756次閱讀
    AI<b class='flag-5'>數(shù)據(jù)分析</b>儀設(shè)計原理圖:RapidIO信號接入 平板AI<b class='flag-5'>數(shù)據(jù)分析</b>儀

    如何使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化

    使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化,需結(jié)合數(shù)據(jù)捕獲、協(xié)議解碼、統(tǒng)計分析及可視化工具,將原始數(shù)據(jù)轉(zhuǎn)化為可解讀的圖表和報告。以下是詳細(xì)步驟及關(guān)鍵
    發(fā)表于 07-16 14:16