最近很多人跟我討論物聯(lián)網和大數(shù)據,但他們大都還對這兩個技術分類認識不是很清晰。在這里我結合我們的一些案例對這兩個概念做一些闡述。
物聯(lián)網是一個完整的概念,不僅包括遠端的傳感器數(shù)據采集、傳輸、存儲和展示,還包括對采集的傳感器歷史數(shù)據的分析,以及基于分析結果所產生的決策、反饋和控制動作。相對于傳統(tǒng)的人的認知方式,物聯(lián)網相當于增強了人的“五官“的識別能力,使人能夠獲取到原本很多無法直接獲取的信息。而基于物聯(lián)網的數(shù)據分析,則相當于增強了人的”大腦”的感知能力,讓人能夠擺脫傳統(tǒng)思維的局限性,實現(xiàn)更多維度、更全面的、更實時的認知和判斷能力。
通常意義上的大數(shù)據,指的都是對批量數(shù)據的計算。由于原本的存儲和計算能力有限,最近十年陸續(xù)發(fā)展出了一系列包括Hadoop、Spark在內的新技術,用以高效、實時的處理海量的數(shù)據(批量數(shù)據為主),而在此基礎上,將原來的一些處理小數(shù)據集的數(shù)據挖掘技術,同大數(shù)據結合起來,實現(xiàn)對很多業(yè)務系統(tǒng)數(shù)據(批量數(shù)據為主)的分析,比如針對不同標簽的群體的分類和畫像,并進行精準營銷。而隨著實時性的提高,最近幾年流式計算和分析也被提到了一個更高的層次,來處理時時刻刻都需要分析和處理的、帶有時間標簽的數(shù)據,如物聯(lián)網數(shù)據或日志數(shù)據。
如大家所見,這兩個看似毫無關聯(lián)的技術,是可以通過數(shù)據(一個產生數(shù)據,一個處理和分析數(shù)據)緊密的聯(lián)系在一起的。
區(qū)分IoT、IIoT和工業(yè)大數(shù)據
需追根溯源
在進一步闡述之前,我需要幫大家區(qū)分幾個概念。
首先區(qū)分傳統(tǒng)物聯(lián)網和工業(yè)物聯(lián)網傳統(tǒng)物聯(lián)網主要針對消費者以及智慧城市等,通過增加眾多分散廣泛的傳感器采集和傳輸實時數(shù)據,構建實時監(jiān)控、展示、告警和歷史數(shù)據查詢的能力;而工業(yè)物聯(lián)網,則主要指的是通過采集現(xiàn)有工業(yè)設備的控制系統(tǒng)數(shù)據(很少需要增加傳感器),在監(jiān)控告警的基礎上,通過深入的數(shù)據分析,找到提高設備可靠性、降低異常、提高生產和運營效率的途徑。
傳統(tǒng)物聯(lián)網的數(shù)據分析,和我們在互聯(lián)網上的流式數(shù)據分析,區(qū)別不大,通過單一指標的處理,產生相應的時間窗口內的平均、極值等計算量,并進行批量計算和展示。
再區(qū)分工業(yè)物聯(lián)網和工業(yè)大數(shù)據在國外很多廠商和媒體上,并沒有工業(yè)大數(shù)據這個概念,更多是將其合并在了工業(yè)物聯(lián)網(IIoT)的范疇,而國內則將二者當成兩個不同的類別,同時,還將二者連同諸如生產和供應鏈系統(tǒng)等,統(tǒng)統(tǒng)融入到工業(yè)互聯(lián)網的概念中去。所以,我們可以看到包括Gartner在內的國外分析機構,并沒有專門針對工業(yè)大數(shù)據或者工業(yè)互聯(lián)網的分類,而有很細致的IIoT的分析。
傳統(tǒng)的工業(yè)里面,并不是沒有數(shù)據處理。但是原本的數(shù)據采集、數(shù)據處理、數(shù)據分析和反饋,都是分散在不同系統(tǒng)里面,一方面無法處理海量的工業(yè)“大“數(shù)據,另一方面也無法保證實時性。我們經??匆姽I(yè)企業(yè)里面,很多數(shù)據分析人員被迫從不同的控制系統(tǒng)中手動導出一些數(shù)據文件,通過手工的方式進行交叉關聯(lián)和標注,并編寫相應的Matlab程序實現(xiàn)統(tǒng)計分析和建模,然后再提取一些現(xiàn)場數(shù)據進行驗證,條件好的企業(yè),還會請一些外部的合作伙伴將其開發(fā)成應用。這種處理和分析的效率實在是很低下,但確實是一種普遍現(xiàn)象。
工業(yè)物聯(lián)網和互聯(lián)網大數(shù)據
分析大不同
工業(yè)物聯(lián)網的數(shù)據分析(工業(yè)物聯(lián)網+工業(yè)大數(shù)據),同傳統(tǒng)的互聯(lián)網大數(shù)據分析,有很多不一樣的地方。
數(shù)據屬性不同
1、數(shù)據量巨大
工業(yè)數(shù)據的“量”,需要從幾個方面來考慮:
數(shù)據維度多傳統(tǒng)的物聯(lián)網,由于通常多是相對獨立的傳感器,而每個傳感器上的數(shù)據點往往都是個位數(shù),因此數(shù)據維度很少。
對于工業(yè)物聯(lián)網來說,復雜的生產都是多個過程相互關聯(lián)、每個過程又是多維度數(shù)據集成的過程。
這里所說的數(shù)據維度囊括了生產過程中各種設備特征、外部工況、參數(shù)、材料和工藝配方等相關因素。這種維度的數(shù)量級往往是成千上萬,在很多高端自動化生產(如半導體)的過程中,數(shù)據維度都達到了千萬級別,而其中任何一個過程的任何一個變量的變化,都有可能對最終生產的結果產生蝴蝶效應。
采樣頻率多樣化傳統(tǒng)物聯(lián)網的數(shù)據采集間隔通常都是秒級、分鐘級別,相對比較固定。
工業(yè)設備數(shù)據的采樣頻率的跨度非常大,一個設備的不同指標可以有上千倍的差別。對于設備故障診斷常用的電流、振動加速度傳感器指標,往往需要10KHz以上的采樣頻率,而一些狀態(tài)變化,往往只需要幾秒甚至幾十秒才采樣一次。
數(shù)據時間跨度大長期的數(shù)據保存,對于積累在不同狀態(tài)下的特征判決,非常有幫助。
傳統(tǒng)的物聯(lián)網對長期數(shù)據的保存需求不是很明顯,沒有太多“狀態(tài)性”(Stateless)的需求。
但是工業(yè)物聯(lián)網,對基于狀態(tài)(Stateful)的數(shù)據分析,需求非常強烈。
首先,在傳統(tǒng)的工業(yè)領域,對于設備狀態(tài)、控制門限、關鍵參數(shù)的設置,往往都是通過廠家或者運營人員的經驗值來去設置和調整,這個值是否正確,是需要經過長期的數(shù)據驗證的;
其次,工業(yè)設備的電流、功率、扭矩等指標,在不同工作模式、工況條件、故障狀態(tài)下,往往都存在明確的不一樣特征。而這些特征,如果能夠被保存下來,通過機器學習來訓練特征識別模型,將有助于實現(xiàn)精準的狀態(tài)判決、異常檢測和故障診斷。并且,通過不斷累積類似相同標簽的數(shù)據樣本,將有助于增強識別的準確性。特別是一些可靠性很高的關鍵設備,因為故障的成本很高,更需要保存異常或者故障的特征,并通過部件之間、子系統(tǒng)之間以及設備之間特征的組合分析,來進一步提高可靠性。
2、實時性強
通常大家都認為工業(yè)數(shù)據的實時性會很強,但這往往指的是工業(yè)控制的實時性,而不是工業(yè)數(shù)據分析的實時性。
傳統(tǒng)的工業(yè)數(shù)據分析,往往是通過在控制系統(tǒng)或者軟件系統(tǒng)中截取一段數(shù)據,保存成文件,通過分析人員編寫一段代碼(如Matlab)和模型,在實驗環(huán)境中進行測試和驗證,再開發(fā)相應的控制邏輯或者應用程序,通過實時接收來評估開發(fā)的模型,在運行的過程中不斷調整模型的參數(shù)。這個過程是非常痛苦的,不僅僅是因為數(shù)據的來源和分析是脫節(jié)的,更是因為在模型開發(fā)的過程中需要實時數(shù)據的驗證是沒有辦法在現(xiàn)有環(huán)境中實現(xiàn)的。
而理想的工業(yè)數(shù)據分析,就應該是一個高效實時的過程。它可以從實時的工業(yè)數(shù)據中截取有效的數(shù)據樣本,基于不同的開發(fā)語言和模型框架,開發(fā)特定的算法和模型,并基于實時采集的數(shù)據進行驗證,然后將驗證的結果同真實的實時數(shù)據流結合起來,實現(xiàn)實時的判決。只有這樣,才能形成針對具體場景的智能分析和控制。
3、數(shù)據質量差
工業(yè)數(shù)據質量差是工業(yè)數(shù)據的典型特點。
工業(yè)的專業(yè)性特點,導致大型設備往往是來自多個不同廠家的子系統(tǒng)的大集成。而主機廠往往并不了解每個子系統(tǒng)的工作原理,并沒有形成一套完整的、跨子系統(tǒng)的控制邏輯和數(shù)據整合機制,因此只能從其中挑選一些關鍵的控制信號,實現(xiàn)既定的控制邏輯,而不會去關心每一個子系統(tǒng)的工作原理,包括各種有助于實現(xiàn)可靠性、效率乃至質量分析的非控制用指標。
一方面,工業(yè)設備生產廠家雖然都聲稱能夠達到各種指標,但他們往往只能保證關鍵控制指標的完整性,而不能保證子系統(tǒng)關鍵指標的精度和可靠性;另一方面,由于沒有很好的數(shù)據整合機制,往往無法識別不同子系統(tǒng)的工作狀態(tài),而給后期針對不同工作狀態(tài)的數(shù)據分析造成巨大的障礙;第三,來自不同子系統(tǒng)的整合,往往會出現(xiàn)時間標簽不統(tǒng)一、數(shù)據量程不對、數(shù)據標簽錯誤等常見錯誤,甚至在出現(xiàn)問題的時候,主機廠都無法解釋子系統(tǒng)的指標意義;同時,由于現(xiàn)場環(huán)境的惡劣條件,往往會造成傳感器數(shù)據失效,或者長期處于不準確狀態(tài);這些數(shù)據質量問題,都給后期的數(shù)據分析造成了巨大的障礙,在分析之前需要做大量的清洗和處理工作。
數(shù)據分析方法不同
一提到大數(shù)據分析,很多人都會自然想到通過海量數(shù)據的聚類、分類、挖掘,來實現(xiàn)精準營銷、用戶畫像。
但是,這些互聯(lián)網或者業(yè)務系統(tǒng)的數(shù)據,都有一些顯著的假設條件,即數(shù)據量大、數(shù)據可以清晰的標簽化、標準化場景多、分析的準確性要求不高。通過一系列的分類、挖掘,可以找到不同樣本之間的共同特征,針對有相似屬性的不同個體的訓練結果,來推測具備相同或者相近屬性的個體的特征。
1、工業(yè)數(shù)據分析挑戰(zhàn)
但是在工業(yè)數(shù)據分析,這些假設條件基本都不存在,數(shù)據分析面臨更多的挑戰(zhàn)是:
小樣本工業(yè)的異?,F(xiàn)象往往會非常少,或者在單一設備上發(fā)生的概率非常低,這就造成無法使用常規(guī)的大數(shù)據、機器學習的方法,根據采集的異常數(shù)據特征,去訓練穩(wěn)定的故障模型;
過擬合根據大量相關因素,通過機器學習在特定數(shù)據集下所訓練出來的模型,即使經過了大量的測試數(shù)據的驗證,變現(xiàn)出很完美的擬合特征,但是在真實環(huán)境下,由于數(shù)據和工作狀態(tài)的多變性,往往也很難取得長期穩(wěn)定的判決結果,即出現(xiàn)“過擬合”的情況。
難以準確清晰的標注工業(yè)的數(shù)據,即使出現(xiàn)了一些可以提煉的特征,但是這種特征往往是跟不同的工況或者工作模式緊密相關(如振動傳感器振動幅度的高低,在設備輕載或者重載下完全不一樣),如果沒有辦法區(qū)分出異常特征的標注條件,也很難實現(xiàn)有效的數(shù)據過濾和分析;
場景碎片化工業(yè)的場景非常碎片化,很難有通用的模型,即使有一些類似電機、泵的故障模型,以及振動分析、SPC這樣的通用分析方法,在不同類型的設備上,甚至在同一類型的不同個體上,都很難保證統(tǒng)一穩(wěn)定的運行。
這些挑戰(zhàn),都會造成工業(yè)大數(shù)據分析,不可能完全采用互聯(lián)網大數(shù)據的分析方法,而是需要充分結合工作機理,實現(xiàn)復合型的建模和判決。
2、工業(yè)數(shù)據分析分類
通常意義上工業(yè)物聯(lián)網的數(shù)據分析,可以分為如下四個類別:
描述式分析(Descriptive):對采集的物聯(lián)網數(shù)據進行統(tǒng)計和展示,這部分以統(tǒng)計分析為主;診斷式分析(Diagnostic):結合工業(yè)機理,對異常產生的原因進行診斷分析,這部分需要加入很多的數(shù)據挖掘技術,包括相關性分析、序列事件分析等;預測式分析(Predictive):通過長期歷史數(shù)據的發(fā)展規(guī)律,預測趨勢的變化,這部分需要引入包括機器學習、神經網絡等技術,對趨勢進行預測;處方式分析(Prescriptive):通過多個維度的數(shù)據分析的結果,結合知識庫和機器學習,給出多種決策依據的可能,并提供智能的判決支持;在每個類別里面,又必須從兩個層次來展開分析:
機理分析:根據物理或化學的原理,對工業(yè)設備的控制、過程以及產生的響應進行基于設計原理的專業(yè)分析,這部分一定是以專業(yè)知識為依據的;數(shù)據驅動的分析:對于工業(yè)里面很多無法測量,無法解釋的現(xiàn)象,可以通過提取數(shù)據特征,從海量的數(shù)據中尋找異常點,通過機器學習的方法,彌補專業(yè)知識的不足;可以看到,工業(yè)數(shù)據分析的基礎是工業(yè)機理,也就是專業(yè)工業(yè)知識的了解,而不是數(shù)據分析的方法和能力。沒有充分的工業(yè)機理和專業(yè)知識,盲目的將一些大數(shù)據、人工智能的工具對工業(yè)數(shù)據進行分析,一定會適得其反。
應用場景融入工業(yè)三大層
起巨大作用
我們都知道,互聯(lián)網大數(shù)據的應用場景包括基于用戶畫像的精準營銷、海量結構化的決策支持等。那工業(yè)物聯(lián)網的數(shù)據分析,可以應用到哪些場景中呢?
我們認為,工業(yè)物聯(lián)網的大數(shù)據分析,從工業(yè)的三個層次,都可以發(fā)揮出巨大的作用。
設備層工業(yè)企業(yè)可以通過讀取智能工業(yè)產品的傳感器或者控制系統(tǒng)的各種實時參數(shù),構建可視化的遠程監(jiān)控,并給予采集的歷史數(shù)據,構建層次化的部件、子系統(tǒng)乃至整個設備的健康指標體系,并使用人工智能實現(xiàn)趨勢預測;基于預測的結果,對維修策略以及備品備件的管理策略進行優(yōu)化,降低和避免客戶因為非計劃停機帶來的損失;
例如,寄云科技為某石油機械制造公司提供了鉆井設備的預測性維修和故障輔助診斷系統(tǒng),不僅能夠實時采集鉆機不同關鍵子系統(tǒng),如發(fā)電機、泥漿泵、絞車、頂驅的各種關鍵指標數(shù)據,更能夠根據歷史數(shù)據的發(fā)展趨勢,對關鍵部件的性能進行評估,并根據部件性能預測的結果,調整和優(yōu)化維修的策略;同時,還能夠根據鉆機的實時狀態(tài)的分析,對鉆井的效率進行評估和優(yōu)化,能夠有效的提高鉆井的投入產出比。
過程層工業(yè)企業(yè)可以將生產階段的各種要素,如原材料、設備、工藝配方和工序要求,通過數(shù)字化的手段集成在一個緊密協(xié)作的生產過程中,并根據既定的規(guī)則,自動的完成在不同條件組合下的操作,實現(xiàn)自動化的生產過程;同時記錄生產過程中的各類數(shù)據,為后續(xù)的分析和優(yōu)化提供依據。
通過采集生產線上的各種生產設備的實時運行數(shù)據,實現(xiàn)全部生產過程的可視化監(jiān)控,并且通過經驗或者機器學習建立關鍵設備參數(shù)、檢驗指標的監(jiān)控策略,對出現(xiàn)違背策略的異常情況進行及時處理和調整,實現(xiàn)穩(wěn)定并不斷優(yōu)化的生產過程。
例如,寄云科技為某電子玻璃產線構建的在線質量監(jiān)控體系,充分采集了冷端和熱端的設備產生的數(shù)據,并通過機器學習獲得流程生產過程中關鍵指標的最佳規(guī)格,設定相應的SPC監(jiān)控告警策略,并通過相關性分析,在幾萬個數(shù)據采集點中實現(xiàn)對特定的質量異?,F(xiàn)象的診斷分析。
經營層工業(yè)企業(yè)可以通過將過程層產生的各種OT數(shù)據,同業(yè)務系統(tǒng)產生或者填報的各類IT數(shù)據相結合,構建統(tǒng)一的數(shù)據標準,并在其基礎上,通過一定的計算和分析,就能夠產生準確的經營層面的分析,對企業(yè)的安全生產、經營效率、決策支持都提供支撐,并逐步延展至企業(yè)外部環(huán)境,提供開放的數(shù)據生態(tài),進而形成更強的競爭力。
例如,寄云科技為某省級能源集團提供了安全生產智慧管控的解決方案,從數(shù)十個不同類型的實時數(shù)據庫提取生產的實時數(shù)據,結合從第三方業(yè)務系統(tǒng)抽取的業(yè)務數(shù)據,構建多維度的統(tǒng)一數(shù)據標準,并基于IT和OT融合的數(shù)據標準,開發(fā)包括生產運行監(jiān)控、安全管理、環(huán)保管理、質量管理、能源管理、經營分析等在內的一系列的工業(yè)應用。
說到這里,很多人不禁會問,原本不是也有很多的數(shù)據分析,包括BI和大屏展示還有很多的分析報表,為什么還要增加基于工業(yè)物聯(lián)網的數(shù)據分析呢?
我們都知道,現(xiàn)階段工業(yè)的數(shù)據分析,包括上述的展示和報表,都是基于業(yè)務系統(tǒng)的,很多都是填報的數(shù)據,或者基于填報數(shù)據產生的計算。而控制系統(tǒng)的數(shù)據和相應的分析結果,是游離在現(xiàn)有的數(shù)據分析系統(tǒng)之外的。但是,真實反映企業(yè)設備、生產和經營情況的,如果沒有來自控制系統(tǒng)的數(shù)據和相應的分析,是嚴重失真的。同時,很多OT的分析,如果沒有來自IT系統(tǒng)的關聯(lián),也是無法得到精準的結果的(比如將維保記錄和生產數(shù)據結合起來實現(xiàn)質量分析)。
工業(yè)IT/OT數(shù)據融合平臺架構示意圖
一個高效運行的工業(yè)企業(yè),按照我們的理解,是必須將OT和IT的數(shù)據整合到一個大的平臺上,并制定嚴格的數(shù)據標準(資產、過程、流程、組織的標準),通過不同的專業(yè)數(shù)據分析,持續(xù)開發(fā)不同的新形態(tài)的應用(如上圖所示),才能滿足企業(yè)全方位、精準、高效運營的需求。(下一篇我將針對工業(yè)企業(yè)的IT和OT的融合架構進行探討,提前預告一下)
企業(yè)選對工業(yè)物聯(lián)網平臺
將決勝未來
總結一下,物聯(lián)網,無論是通用的物聯(lián)網還是工業(yè)物聯(lián)網,如果沒有結合專業(yè)的精細化的數(shù)據分析,是支撐不了企業(yè)未來的發(fā)展戰(zhàn)略的。選擇合適的工業(yè)物聯(lián)網平臺,將極大的加快企業(yè)的數(shù)字化進程,朝著智能化的道路快速推進。
寄云科技是國內工業(yè)物聯(lián)網的領導者,提供了針對PLC、DCS、CNC等不同設備以及業(yè)務系統(tǒng)的數(shù)據采集、數(shù)據清洗和預處理、海量數(shù)據存儲和查詢的能力,能夠有效的實現(xiàn)OT數(shù)據和IT數(shù)據的高效融合,并提供統(tǒng)一的數(shù)據標準和數(shù)據服務。同時,支持用戶根據工業(yè)機理自助式選擇數(shù)據、快速構建各類工業(yè)模型,為用戶提供各種可視化開發(fā)工具,快速對實時和業(yè)務系統(tǒng)的數(shù)據進行分析和展示,并提供一系列應用框架,支持用戶通過配置以及零代碼或者低代碼的方式,構建設備的預測性維修、生產線的可視化和質量優(yōu)化,以及企業(yè)的經營分析等應用,幫助企業(yè)構建以數(shù)據為中心的轉型戰(zhàn)略,消除不同系統(tǒng)之間的隔閡,快速、靈活、高效的洞察生產、運營過程中的各類問題,構建持續(xù)的競爭力。
-
物聯(lián)網
+關注
關注
2945文章
47819瀏覽量
414857 -
大數(shù)據
+關注
關注
64文章
9063瀏覽量
143743
原文標題:寫篇文章深度解析一下物聯(lián)網和大數(shù)據分析的淵源和應用
文章出處:【微信號:Iotchannel,微信公眾號:聯(lián)動原素】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
物聯(lián)網和大數(shù)據案例闡述
評論