91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

成功構建生產(chǎn)型機器學習的12個要素

Dbwd_Imgtec ? 來源:機器之心 ? 作者:機器之心 ? 2020-12-29 16:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習社區(qū),越來越多的人開始討論研究的可復現(xiàn)性,但這些討論大部分局限于學術環(huán)境。如何確保生產(chǎn)環(huán)境的ML可復現(xiàn)?近日,機器學習開發(fā)服務提供商 maiot.io 的 CTO Benedikt Koller 發(fā)布一篇博客文章,介紹了他基于自身經(jīng)驗總結的開發(fā)可復現(xiàn)生產(chǎn)級機器學習所要注意的 12 個要素。

過去二十年來,我們對軟件開發(fā)的理解有了大幅提升。其中一大部分原因是 DevOps 概念的出現(xiàn)及其在軟件開發(fā)行業(yè)的廣泛應用。

領先的軟件公司都遵循著同樣的模式:首先是在軟件開發(fā)過程中快速迭代,然后進行持續(xù)集成、持續(xù)交付、持續(xù)部署。每個特性都要經(jīng)過測試,看其提供價值的能力如何,而且軟件始終要處于就緒的狀態(tài),并且通過自動化方法進行部署。

機器學習這個領域雖不同于傳統(tǒng)的軟件開發(fā),但我們也能從軟件開發(fā)行業(yè)汲取很多實用的經(jīng)驗教訓。過去幾年里,我們一直在開發(fā)生產(chǎn)型機器學習項目。我們的目標并不只是概念驗證,而是與軟件開發(fā)一樣的可復現(xiàn)能力(reproducibility)。因此,我們構建了一套流程協(xié)調(diào)器、強大的自動化能力并建立了一套用于實現(xiàn)該目標的工作流程。

為什么不直接使用 Jupyter Notebook?從頭開始構建一組包含所有處理步驟的筆記需要多長時間?為團隊納入新成員的難易程度如何?你現(xiàn)在可以復現(xiàn)兩個月前的結果嗎?能以多快的速度復現(xiàn)?你能將今天的結果和歷史結果進行對比嗎?你能在訓練過程中關注到數(shù)據(jù)的出處嗎?如果你的模型過時了又會發(fā)生什么?

我們遇到過所有這些問題?,F(xiàn)在,我們將這些經(jīng)驗進行了歸納總結,得到了成功構建生產(chǎn)型機器學習的 12 個要素(類似于軟件開發(fā)中的十二要素應用/12 factor app)。

1. 版本控制

對軟件工程師來說,版本控制基本上是理所當然需要做的,但是這一方法論還尚未被數(shù)據(jù)科學家廣泛接受。讓我引述一下 Gitlab 上一些人的說法:

版本控制可促進整個軟件開發(fā)團隊之間的協(xié)調(diào)、共享和協(xié)作。版本控制軟件讓團隊可以在分布式和異步環(huán)境中工作、管理代碼和文件的修改和版本以及解決合并沖突和相關異常。

簡單來說,版本控制能讓你安全地管理軟件開發(fā)中會變化的部分。

機器學習其實是一種特殊的軟件開發(fā),有著自己特定的要求。首先,機器學習中會變化的部分不止一種,而是兩種:代碼和數(shù)據(jù)。其次,模型訓練的方式是(快速)迭代,并且代碼中的差異會很大(比如拆分、預處理、模型)。

只要數(shù)據(jù)發(fā)生更改,就需要保存一個版本,這樣才能保證能復現(xiàn)結果以及重復執(zhí)行實驗和訓練模型。簡單粗暴的版本控制(硬拷貝)具有很大的改進空間,不過尤其是在團隊共享的情況下,能夠保持不變的版本控制是至關重要的。

代碼的版本控制還要更加重要。除了上面引述的內(nèi)容,預處理代碼不僅在訓練階段很重要,而且在服務階段也很重要,需要與模型有保持不變的相關性。為了在數(shù)據(jù)科學家的工作流程和投入生產(chǎn)的要求之間建立一種中臺,一種方便的方法是提供無服務器的功能。

總結:你需要對代碼進行版本控制,也需要對數(shù)據(jù)進行版本控制。 2. 明確的特征依賴關系

在理想世界中,產(chǎn)生你的輸入數(shù)據(jù)的東西應該總是會產(chǎn)生同樣的數(shù)據(jù),至少結構上是這樣。但這個世界并不是完美的,你從上游服務獲取的數(shù)據(jù)也是由人類構建的,因此可能會發(fā)生變化。最終,特征也可能發(fā)生改變。最好的情況是你的模型會直接故障報錯,但還有最壞的情況:你的模型悄悄繼續(xù)工作,但得到的結果都是垃圾。

明確定義的特征依賴關系能夠盡快揭示出失敗案例。如果系統(tǒng)設計得好,還能在服務時進行持續(xù)訓練,然后調(diào)整依賴關系并加以適應。

總結:明確代碼中的特征依賴關系。

3. 描述性的訓練和預處理

優(yōu)良的軟件都有優(yōu)良的描述和注釋——讓人無需閱讀每一行代碼就能輕松閱讀和理解代碼功能。

盡管機器學習是一類特殊的軟件開發(fā),但它并不鼓勵實踐者背離已有的代碼書寫準則。在代碼書寫標準中,最基本的一條是能讓人在短時間內(nèi)不費力地閱讀。

預處理和模型的代碼都應該遵循 PEP8 規(guī)范。代碼中應當使用有意義的對象名并包含有助于理解的注釋。遵循 PEP8 規(guī)范可提升代碼的可讀性,降低復雜度并加快調(diào)試速度。SOLID 之類的編程范式提供了經(jīng)過深思熟慮的框架,可讓代碼在未來用例中的可維護性、可理解性和靈活性都得到改善。

配置應該與代碼分離。不要將數(shù)據(jù)分配比例硬編碼到代碼之中,而是通過配置方式提供,以便在運行時修改。人們在超參數(shù)調(diào)節(jié)方面已經(jīng)熟知這一點了:使用分離的配置文件可以顯著加快迭代速度,并且讓代碼庫可以重復使用。

總結:提升代碼可讀性并且將代碼和配置分開。 4. 訓練結果的可復現(xiàn)性

如果你不能復現(xiàn)訓練結果,那么這個結果就是不可信的。盡管這是本文的主題,但在可復現(xiàn)性方面有一些細節(jié)需要說明。不僅是你自己需要能復現(xiàn)訓練結果,你的整個團隊都要能做到這一點。不管是在 PC 還是在 AWS 虛擬機上,模糊處理 Jupyter Notebook 中的訓練結果都與可復現(xiàn)性背道而馳。

通過設定訓練的工作流程,整個團隊都可以透明地訪問已執(zhí)行的實驗和已運行的訓練。通過綁定可復用的代碼庫以及分離的配置文件,每個人都可在任何時間成功重新訓練。

總結:使用管道式工作流程和自動化。

5. 測試

測試的形式有很多。舉兩個例子:

1)單元測試是原子層面上的測試——基于各自的標準單獨測試每個函數(shù)和功能。

2)集成測試則相反,是將代碼庫的所有元素都放到一起進行測試,同時還會測試上下游服務的克隆版本或模擬版本。

這兩種范式都適應于機器學習。預處理代碼是預先確定的,直到測試階段——這樣的轉換能在不同的輸入下都得到正確結果嗎?模型是集成測試的一個絕佳案例——在生產(chǎn)環(huán)境中提供服務時,你的模型的表現(xiàn)是否與評估時相當?

總結:測試你的代碼,測試你的模型。

6. 偏移與持續(xù)訓練

在生產(chǎn)場景中,任務發(fā)生偏移是合理存在的問題。只要數(shù)據(jù)存在變化的可能性,你就需要考慮偏移的可能性。對于此問題的風險,有兩種可以采取的措施:

1)監(jiān)控生產(chǎn)系統(tǒng)中的數(shù)據(jù)。建立自動化報告機制,在數(shù)據(jù)發(fā)生變化時通知團隊,這種變化甚至可能超過明確定義的特征依賴關系。

2)基于新輸入的數(shù)據(jù)持續(xù)訓練。良好自動化的管道化流程可以基于新數(shù)據(jù)重復運行,然后與歷史訓練結果進行比較,展示性能變化情況以及將訓練得到的模型快速投放到生產(chǎn)中,從而讓模型表現(xiàn)更好。

總結:如果你的數(shù)據(jù)會發(fā)生變化,那就采用一種持續(xù)訓練的管道化流程。

7. 跟蹤結果

Excel 并非一種跟蹤實驗結果的好方法。而且還不只是 Excel,任何分散的人工跟蹤方法得到的信息都是不夠權威的,也因此是不可信的。

正確的做法是以一種中心化的數(shù)據(jù)存儲方式自動記錄訓練結果。自動化能夠保證可靠地跟蹤每次訓練,從而方便之后比較每次訓練的結果。對結果進行中心化存儲,能為團隊提供透明,實現(xiàn)持續(xù)性分析。

總結:通過自動化方法跟蹤結果。

8. 實驗模型與生產(chǎn)模型

我們需要努力才能理解數(shù)據(jù)集。通常來說,我們會通過實驗來實現(xiàn)理解,尤其是當我們關注的領域具備大量隱含領域知識時。創(chuàng)建一個 Jupyter Notebook,將部分/全部數(shù)據(jù)導入 Pandas Dataframe,進行幾個小時無序研究,訓練第一個模型,評估結果——任務完成。但幸運的是,現(xiàn)實并不如此。

在機器學習的生命周期中,實驗有自己的目的。這些目的并不是模型,而是理解?;谔剿餍?Jupyter Notebook 的模型是為了理解,而不是為生產(chǎn)開發(fā)的成品。理解之后,還需要進一步開發(fā)和適應,才能開始打造用于生產(chǎn)的訓練流程。

不過,所有與領域特定的知識無關的理解都可以自動化。你可以基于你使用的每個數(shù)據(jù)版本生成統(tǒng)計信息,從而可以跳過那些你在 Jupyter Notebook 中做過的一次性的臨時探索工作,然后直達第一個管道式流程。你在流程中實驗進行得越早,你就能越早地在中間結果上進行協(xié)作,也就能更早地實現(xiàn)可投入生產(chǎn)的模型。

總結:筆記不能投入生產(chǎn),因此要在流程中盡早實驗。

9. 訓練和服務之間的方法差異

訓練和實際服務之間往往存在方法差異,為了正確地將所有數(shù)據(jù)預處理過程都納入到模型服務環(huán)境中,需要減少這些差異。這當然是正確的,你也需要堅持這一原則。但是,這只是對這一問題的部分解讀。

先來簡單看一段古老的 DevOps 歷史:2006 年,亞馬遜的 CTO Werner Vogels 創(chuàng)造了一個說法「You build it, you run it(你構建的東西你要運行)」。這是一個描述性的短語,意思是開發(fā)者的責任不只是寫程序,還需要運行它們。

機器學習項目也需要類似的機制——理解上游的數(shù)據(jù)生成以及下游的模型使用都在數(shù)據(jù)科學家的職責范圍內(nèi)。你訓練用的數(shù)據(jù)是通過什么體系生成的?它會出問題嗎?該體系的服務級目標(SLO)是什么?這與實際服務的目標一致嗎?你的模型的服務方式是怎樣的?運行時環(huán)境是怎樣的?怎樣在服務時對函數(shù)進行預處理?這些都是數(shù)據(jù)科學家需要理解和解答的問題。

總結:正確地將預處理嵌入到服務之中,確保你理解數(shù)據(jù)的上下游。

10. 可比較性

從為項目引入第二個訓練腳本開始,可比較性就成了未來工作的重要組成部分。如果第二個模型的結果無法與第一個模型的結果進行比較,則整個過程就浪費了,其中至少有一個是多余的,甚至可能兩個都多余。

根據(jù)定義,所有試圖解決同一問題的模型訓練都需要可以比較,否則它們就不是在解決同一問題。盡管迭代過程可能導致所要比較的東西發(fā)生變化,但是在技術上實現(xiàn)模型訓練的可比較性需要一開始就作為首要功能內(nèi)置于訓練架構之中。

總結:構建你自己的管道式流程,以便輕松比較各個流程的訓練結果。

11. 監(jiān)控

粗略地說,機器學習的目標應該是通過學習數(shù)據(jù)來解決問題。為了解決這個問題,需要分配計算資源。首先是分配給模型的訓練,然后是分配給模型的服務。負責在訓練期間提供資源的不管是人還是部門,都需要負責將這些資源轉移給服務。模型在使用過程中可能出現(xiàn)很多性能下降問題。數(shù)據(jù)可以偏移,模型可能成為整體性能的瓶頸,偏差也是一個真實存在的問題。

效果:數(shù)據(jù)科學家和團隊負責監(jiān)控他們創(chuàng)建的模型。他們并不一定要負責實施監(jiān)控,尤其是當組織結構很大時,但他們肯定需要負責監(jiān)控數(shù)據(jù)的理解和解釋。最低限度上,需要監(jiān)控的內(nèi)容包括輸入數(shù)據(jù)、推理次數(shù)、資源使用情況(CPU、RAM)和輸出數(shù)據(jù)。

總結:同樣,「You build it, you run it(你構建的東西你要運行)」。監(jiān)控生產(chǎn)過程中的模型是數(shù)據(jù)科學的部分工作。

12. 模型的可部署性

從技術層面講,每個模型訓練流程都需要得到可部署到生產(chǎn)環(huán)境中的成品。毫無疑問,這些模型結果可能很糟糕,但它需要做成可以部署到生產(chǎn)環(huán)境的形態(tài)。

這是軟件開發(fā)中的常見模式,也叫做持續(xù)交付(Continuous Delivery)。團隊需要能夠隨時部署他們的軟件,為了滿足這個目標,迭代周期需要足夠快。

機器學習也需要采用類似的方法。這樣才能迫使團隊首先考慮現(xiàn)實與期望之間的平衡。所有利益相關者都應當清楚,在模型結果方面,哪些結果是理論上可能的。所有利益相關者都應當在模型的部署方式以及如何與更大的軟件架構整合上達成一致。但是,這也可能需要自動化,也需要前文提到的一些要素。

總結:每個訓練流程都需要得到可部署的成品,而不「只是」模型。

原文標題:機器學習工業(yè)復現(xiàn)的 12 個要素

文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4968

    瀏覽量

    73984
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136955

原文標題:機器學習工業(yè)復現(xiàn)的 12 個要素

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器人拆碼垛中高精度放置與垛構建的解析分析:技術路徑與核心要素

    機器人拆碼垛中高精度放置與垛構建需融合3D視覺、多傳感器融合、動態(tài)路徑規(guī)劃及力控技術,實現(xiàn)毫米級定位。通過力學建模與AI算法優(yōu)化垛穩(wěn)定性與空間效率,結合閉環(huán)校正補償誤差。未來趨勢聚
    的頭像 發(fā)表于 02-27 15:38 ?72次閱讀

    Microchip 推出生產(chǎn)就緒全棧邊緣 AI 解決方案,賦能MCU和MPU實現(xiàn) 智能實時決策

    公司通過芯片、軟件、工具、生產(chǎn)就緒應用以及不斷壯大的合作伙伴生態(tài)系統(tǒng)的支持,簡化并加速邊緣AI系統(tǒng)開發(fā) 人工智能(AI)與機器學習(ML)創(chuàng)新的下一
    的頭像 發(fā)表于 02-25 10:03 ?1.8w次閱讀
    Microchip 推出<b class='flag-5'>生產(chǎn)</b>就緒<b class='flag-5'>型</b>全棧邊緣 AI 解決方案,賦能MCU和MPU實現(xiàn) 智能實時決策

    機器學習和深度學習中需避免的 7 常見錯誤與局限性

    無論你是剛入門還是已經(jīng)從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關注數(shù)據(jù)、模型架構
    的頭像 發(fā)表于 01-07 15:37 ?192次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    機器人內(nèi)部零配件的生產(chǎn)加工廠從哪找?

    機器人內(nèi)部零配件生產(chǎn)廠家哪里找?東莞力存科技為您揭秘數(shù)控車床加工的關鍵要素 隨著機器人文化在中國的快速普及,機器人市場呈現(xiàn)出爆發(fā)式增長態(tài)勢。
    發(fā)表于 12-09 18:22

    有方科技車輛涉水場景數(shù)據(jù)要素化試點成效顯著

    為精準應對極端天氣下城市內(nèi)澇對車輛安全的威脅,有方科技基于城域物聯(lián)感知平臺及數(shù)據(jù),成功構建了“城市車輛涉水預警和救援及理賠佐證場景”數(shù)據(jù)要素化服務解決方案,并在長沙市成功應用。該案例是
    的頭像 發(fā)表于 11-08 11:07 ?1161次閱讀

    工業(yè)物聯(lián)網(wǎng)如何實現(xiàn)生產(chǎn)要素的集中管理與優(yōu)化配置

    )的集中管理與優(yōu)化配置,顯著提升了生產(chǎn)效率、降低了運營成本,并增強了企業(yè)的市場響應能力。以下是具體實現(xiàn)路徑: 一、數(shù)據(jù)整合與互聯(lián):構建生產(chǎn)要素的“數(shù)字孿生” 工業(yè)物聯(lián)網(wǎng)的核心是打破數(shù)據(jù)
    的頭像 發(fā)表于 09-30 17:00 ?1493次閱讀

    廣電計量助力企業(yè)筑牢質(zhì)量安全防線

    2025年9月是我國第48全國“質(zhì)量月”。廣電計量始終將質(zhì)量視為生命線,構建了涵蓋“理念層-制度層-物質(zhì)層-行為層”的質(zhì)量文化體系,促進公司質(zhì)量水平持續(xù)提升,為研發(fā)生產(chǎn)型企業(yè)、政府以及科研院所提供“一站式”質(zhì)量解決方案。
    的頭像 發(fā)表于 09-29 14:57 ?818次閱讀

    自主生產(chǎn):制造業(yè)的未來

    在德國,自主生產(chǎn)目前主要被選擇性地用于工具層面,例如質(zhì)量保證或過程監(jiān)控。機器人應用層面是一特別有活力的領域,在這一層面,正在創(chuàng)建半自動化自動化單元。這是向完全網(wǎng)絡化生產(chǎn)系統(tǒng)邁出的第
    發(fā)表于 09-15 15:08

    工業(yè)網(wǎng)關生產(chǎn)型制造企業(yè)有哪些?推薦幾家

    于智能工廠、能源監(jiān)控、軌道交通、智慧水利等領域。以下推薦幾家工業(yè)網(wǎng)關的生產(chǎn)型制造企業(yè)(排名不分先后),希望給大家一些參考。 1. 華為:5G與邊緣計算融合的工業(yè)通信領導者 華為憑借5G雙模組網(wǎng)與全棧自研能力,在工業(yè)網(wǎng)關領域構
    的頭像 發(fā)表于 07-30 17:19 ?767次閱讀
    工業(yè)網(wǎng)關<b class='flag-5'>生產(chǎn)型</b>制造企業(yè)有哪些?推薦幾家

    機器學習異常檢測實戰(zhàn):用Isolation Forest快速構建無標簽異常檢測系統(tǒng)

    本文轉自:DeepHubIMBA無監(jiān)督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數(shù)據(jù)的環(huán)境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1415次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>異常檢測實戰(zhàn):用Isolation Forest快速<b class='flag-5'>構建</b>無標簽異常檢測系統(tǒng)

    江智機器人公司成功構建的康養(yǎng)港灣核心競爭力以及技術璧壘

    深圳市江智機器人公司從2016年開始至今近10年專注養(yǎng)老產(chǎn)業(yè)康養(yǎng)機器人國內(nèi)外市場。沉淀積累并成功構建了江智康養(yǎng)生態(tài)。即江智機器人公司給全球老
    的頭像 發(fā)表于 06-01 09:12 ?970次閱讀
    江智<b class='flag-5'>機器</b>人公司<b class='flag-5'>成功</b><b class='flag-5'>構建</b>的康養(yǎng)港灣核心競爭力以及技術璧壘

    英泰斯特入選湖北省數(shù)據(jù)要素企業(yè)

    湖北省數(shù)據(jù)要素企業(yè)評選旨在挖掘和培育以數(shù)據(jù)為核心驅動力的標桿企業(yè),推動數(shù)據(jù)要素市場化配置改革,助力數(shù)字經(jīng)濟高質(zhì)量發(fā)展。 此次湖北省數(shù)據(jù)局正式發(fā)布“湖北省數(shù)據(jù)要素
    的頭像 發(fā)表于 05-30 15:04 ?1029次閱讀

    關于生產(chǎn)型工廠節(jié)能降耗的意義與對策

    安科瑞徐赟杰18706165067 生產(chǎn)型企業(yè)節(jié)能降耗的原因是多方面的,這些原因不僅關乎企業(yè)的經(jīng)濟效益,還涉及環(huán)境保護、社會責任以及可持續(xù)發(fā)展等多個層面。 降低生產(chǎn)成本: 能源是生產(chǎn)型企業(yè)的重要成本
    的頭像 發(fā)表于 05-09 10:36 ?991次閱讀
    關于<b class='flag-5'>生產(chǎn)型</b>工廠節(jié)能降耗的意義與對策

    國產(chǎn)地物光譜儀在“高光譜-機器學習”模型構建中的表現(xiàn)

    和可推廣性。 近年來,國產(chǎn)地物光譜儀在性能、穩(wěn)定性和數(shù)據(jù)一致性等方面取得了顯著進步,不僅打破了對進口設備的長期依賴,也逐步展現(xiàn)出在“高光譜-機器學習”模型構建中的實力。 一、國產(chǎn)儀器的數(shù)據(jù)質(zhì)量,是否足夠用于建模?
    的頭像 發(fā)表于 04-18 16:15 ?744次閱讀
    國產(chǎn)地物光譜儀在“高光譜-<b class='flag-5'>機器</b><b class='flag-5'>學習</b>”模型<b class='flag-5'>構建</b>中的表現(xiàn)

    AgiBot World Colosseo:構建通用機器人智能的規(guī)?;瘮?shù)據(jù)平臺

    人數(shù)據(jù)的匱乏,制約了通用操縱能力的突破。上海人工智能實驗室與AgiBot公司聯(lián)合研發(fā)的AgiBot World Colosseo平臺,通過構建大規(guī)模、多模態(tài)的真實世界數(shù)據(jù)集與通用政策模型,為機器人學習
    的頭像 發(fā)表于 03-12 11:42 ?1986次閱讀
    AgiBot World Colosseo:<b class='flag-5'>構建</b>通用<b class='flag-5'>機器</b>人智能的規(guī)?;瘮?shù)據(jù)平臺