91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

了解計算機視覺發(fā)展未來的核心技術

星星科技指導員 ? 來源:NVIDIA ? 作者:Richmond Alake ? 2022-05-30 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Computer vision 是一個快速發(fā)展的研究和應用領域。計算機視覺研究的進展現在更直接、更直接地適用于商業(yè)世界。

人工智能開發(fā)人員正在實施計算機視覺解決方案,以識別和分類對象,甚至對其作出實時反應。圖像分類、人臉檢測、姿態(tài)估計和光流是一些典型的任務。計算機視覺工程師是 deep learning ( DL )或 machine learning ( ML )工程師的子集,他們編寫計算機視覺算法來完成這些任務。

DL 算法的結構非常適合解決計算機視覺問題。 卷積神經網絡 ( CNN )的體系結構特征能夠檢測和提取視覺數據中存在的空間模式和特征。

計算機視覺領域正在迅速改變汽車、醫(yī)療保健和機器人等行業(yè),很難跟上最新發(fā)現、趨勢和進展。這篇文章重點介紹了正在影響并將繼續(xù)影響 2022 年及以后計算機視覺發(fā)展未來的核心技術:

幫助擴展 DL 解決方案的云計算服務。

自動化 ML ( AutoML )解決方案,可減少標準 ML 管道中所需的重復工作。

transformer 研究人員開發(fā)的優(yōu)化計算機視覺任務的體系結構。

結合計算機視覺技術的移動設備。

云計算

云計算通過互聯網為個人或企業(yè)提供數據存儲、應用服務器、網絡和其他計算機系統(tǒng)基礎設施。云計算解決方案提供快速、經濟高效、可擴展的按需資源。

大多數 ML 解決方案都需要存儲和高處理能力。數據集管理的早期開發(fā)(聚合、清理和爭論)通常需要云計算資源來存儲或訪問 BigQuery 、 Hadoop 或 BigTable 等解決方案應用程序。

最近,具有計算機視覺功能的設備和系統(tǒng)顯著增加,例如用于步態(tài)分析的姿勢估計、智能手機的人臉識別和自動車輛的車道檢測。

云存儲的需求正在快速增長, projected 預計該行業(yè)的價值將達到 3903.3 億美元,是 2021 市場當前價值的五倍。 market size 的增加將導致使用入站數據來訓練 ML 模型的增加。這與更大的數據存儲容量需求和越來越強大的計算資源直接相關。

GPU 可用性加快了計算機視覺解決方案的速度。然而,單憑 GPU 還不足以提供這些應用程序所需的可擴展性和正常運行時間,尤其是在為數千甚至數百萬消費者提供服務時。云計算提供了啟動和補充現有內部基礎設施缺口所需的資源。

云計算平臺,包括 Amazon Web 服務( AWS ) 、 谷歌云平臺( GCP ) 和 Microsoft Azure 為 ML 和數據科學項目管道的核心組件提供端到端解決方案,包括數據聚合、模型實現、部署和監(jiān)控。對于設計視覺系統(tǒng)的計算機視覺開發(fā)人員來說,重要的是要了解這些主要云服務提供商的優(yōu)勢,以及如何配置它們以滿足特定和復雜的管道需求。

大規(guī)模計算機視覺需要云服務集成

以下是支持典型計算機視覺系統(tǒng)的 NVIDIA 服務示例。

預訓練 DL 模型的 NGC Catalog 降低了模型訓練和實現的復雜性。

DL scripts 提供現成的可定制管道。強健的模型部署解決方案自動化了向最終用戶的交付。

NVIDIA Triton 推理服務器 支持在任何基于 GPU 或 CPU 的基礎設施上部署來自 TensorFlow 和 PyTorch 等框架的模型。 Triton 推理服務器提供了跨各種平臺(包括云、邊緣和嵌入式設備)的模型可擴展性。

NVIDIA 與云服務提供商(如VZX18)的合作伙伴關系支持部署基于計算機視覺的資產,因此計算機視覺工程師可以將更多精力放在模型性能和優(yōu)化上。

企業(yè)在可行的情況下降低成本并優(yōu)化戰(zhàn)略。云計算和云服務提供商通過提供基于使用情況的計費解決方案和基于需求的擴展來實現這兩個目標。

AutoML

ML 算法和模型開發(fā)涉及許多任務,這些任務可以受益于自動化,如特征工程和模型選擇。

特征工程涉及從數據集中檢測和選擇相關特征、屬性和屬性。

模型選擇涉及評估一組 ML 分類器、算法或給定問題的解決方案的性能。

特征工程和模型選擇活動都需要 ML 工程師和數據科學家花費大量時間來完成。軟件開發(fā)人員經常重新訪問工作流的這些階段,以提高模型性能或準確性。

有幾個正在進行的大型項目可以簡化復雜的 ML 項目管道。 AutoML 專注于自動化和增強工作流及其過程,以使 ML 易于訪問,并減少非 ML 專家的手動強度。

從市場價值來看, projections 預計到 2030 年, AutoML 市場將達到 140 億美元。這意味著將比當前值增加約 42 倍。

ML 和自動化的這種特殊結合正在獲得吸引力,但也有局限性。

實踐中的 AutoML

AutoML 節(jié)省了數據科學家和計算機工程師的時間。 AutoML 功能使計算機視覺開發(fā)人員能夠將更多精力投入到計算機視覺開發(fā)管道的其他階段,以最好地利用他們的技能集,如模型培訓、評估和部署。 AutoML 有助于加速數據聚合、準備和超參數優(yōu)化,但工作流的這些部分仍然需要人工輸入。

構建正確的模型需要數據準備和聚合,但它們是重復的、耗時的任務,依賴于找到合適的數據質量源。

同樣,超參數優(yōu)化可能需要大量時間進行迭代以獲得正確的算法性能。它涉及到一個有根據的猜測的試錯過程。尋找合適的超參數所需的重復工作量可能會很繁瑣,但對于使模型的訓練達到所需的精度至關重要。

對于那些對 GPU 驅動的 AutoML 感興趣的人來說,廣泛使用的 基于樹的管道優(yōu)化工具 ( TPOT )是一個自動化的 ML 庫,旨在通過利用遺傳編程優(yōu)化 ML 過程和管道。 RAPIDS cuML 提供使用 GPU 計算資源加速的 TPOT 功能。

機器學習庫和框架

ML 庫和框架是任何計算機視覺開發(fā)人員工具包中的基本元素。主要 DL 庫,如 TensorFlow 、 PyTorch 、 Keras 和 MXNet 在 2021 收到了持續(xù)的更新和修復,并且在未來可能會繼續(xù)這樣做。

最近,以移動為中心的 DL 庫和優(yōu)化常用 DL 庫的包取得了令人興奮的進展。

MediaPipe 于 2021 擴展了姿勢估計功能,通過 BlazePose 模型提供 3D 姿勢估計,該解決方案可在瀏覽器和移動環(huán)境中使用。 2022 年,預計將在涉及動態(tài)運動和需要穩(wěn)健解決方案的用例中看到更多姿勢估計應用,例如舞蹈中的運動分析和虛擬角色運動模擬。

PyTorch 閃電 由于它的簡單性、復雜神經網絡實現細節(jié)的抽象性和硬件考慮的擴展性,在研究人員和專業(yè) ML 從業(yè)者中越來越流行。

最先進的深度學習

DL 方法長期以來被用來解決計算機視覺的挑戰(zhàn)。用于人臉檢測、車道檢測和姿態(tài)估計的神經網絡結構都使用深層連續(xù)的 CNN 。一種新的計算機視覺算法架構正在出現:變形金剛。

transformer 是在 注意力是你所需要的 中引入的 DL 體系結構。論文方法通過使用 attention mechanism 來推導輸入數據的一部分相對于輸入數據的其他部分的重要性,從而創(chuàng)建數據的計算表示。

transformer 沒有使用 CNN 的約定,但研究表明 transformer 型號 在 vision-related tasks 中。變形金剛在 NLP 領域內產生了相當大的影響。有關更多信息,請參閱 發(fā)電預培訓變壓器 ( GPT )和 變壓器的雙向編碼器表示 ( BERT )。

通過包含 PyTorch 中實際 transformer 模型的架構和使用細節(jié)的 NGC Catalog 探索 transformer 模型。

有關將 Transformer 網絡體系結構應用于計算機視覺的更多信息,請參閱 視覺中的變形金剛:一項調查 論文。

移動設備

邊緣設備正變得越來越強大。對于希望快速提供服務和 AI 功能的客戶來說,設備上推理功能是移動應用程序的必備功能。

將計算機視覺功能(如圖像和模式識別)納入移動設備中,可以減少獲取模型推理結果的延遲,并提供以下好處:

縮短等待時間 用于獲取設備計算的推斷結果。

增強隱私和安全性 由于云服務器之間和到云服務器的數據傳輸有限。

云上的 降低了刪除依賴項的成本 和 CPU 服務器進行推斷。

許多企業(yè)正在探索移動產品,其中包括探索如何在移動設備上復制現有 AI 功能。以下是實施 mobile first AI 解決方案的幾個平臺、工具和框架:

TensorFlow 很少

CoreML

Apple Vision 框架

TensorFlow-React

CreateML

MediaPipe

MLKit

總結

隨著人工智能越來越多地融入我們的日常生活,計算機視覺技術不斷發(fā)展。計算機視覺在最新的新聞頭條中也變得越來越普遍。隨著這項技術的擴展,由于云計算服務、自動 ML 管道、轉換器、以移動為中心的 DL 庫和計算機視覺移動應用程序的發(fā)展趨勢,對具有計算機視覺系統(tǒng)知識的專家的需求也將增加。

2022 年,增強型和 VR 應用程序的不斷發(fā)展將使計算機視覺開發(fā)人員能夠將其技能擴展到新的領域,例如開發(fā)在 3D 空間中復制和與真實對象交互的直觀高效方法。展望未來,計算機視覺應用將繼續(xù)改變并影響未來。

關于作者

Richmond Alake 是一名機器學習和計算機視覺工程師,他與多家初創(chuàng)公司和公司合作,整合深度學習模型,以解決商業(yè)應用中的計算機視覺任務。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 轉換器
    +關注

    關注

    27

    文章

    9418

    瀏覽量

    156345
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93193
  • 服務器
    +關注

    關注

    14

    文章

    10253

    瀏覽量

    91483
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科曙光榮獲深圳市計算機學會2024年度杰出貢獻獎

    近日,中科曙光憑借在產學研融合、核心技術攻堅及綠色低碳領域的突出貢獻,榮獲深圳市計算機學會(SZCCF)年度貢獻獎,并受邀出席頒獎典禮。
    的頭像 發(fā)表于 01-27 17:46 ?1103次閱讀
    中科曙光榮獲深圳市<b class='flag-5'>計算機</b>學會2024年度杰出貢獻獎

    龍芯主板讓工控計算機擁有安全可信的核心

    工控計算機,是工業(yè)自動化和智能制造領域的核心設備,負責數據采集、處理、存儲與傳輸,實現設備的監(jiān)控與控制,確保生產線的穩(wěn)定運行。在現代工業(yè)生產中,工控計算機的地位不可或缺,它如同智能制造的心臟,為整個生產系統(tǒng)提供源源不斷的動力。
    的頭像 發(fā)表于 01-21 09:02 ?364次閱讀

    【「芯片設計基石——EDA產業(yè)全景與未來展望」閱讀體驗】--EDA了解發(fā)展概況

    的,且環(huán)環(huán)相扣、緊密相依。 EDA深度融合了多個學科的知識與技能,其中最為核心的是電子學及其相關領域,其多學科包括:電子學相關領域、計算機科學領域、數學相關領域、物理學相關領域。 EDA特點,技術維度
    發(fā)表于 01-19 21:45

    機器視覺核心技術和應用場景

    機器視覺正通過讓機器“看見”并解讀視覺數據來為行業(yè)帶來變革,進而提升自動化水平、質量控制效率與運營效能。本文將深入探討機器視覺技術核心,聚
    的頭像 發(fā)表于 12-29 16:32 ?902次閱讀

    上海計算機視覺企業(yè)行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?580次閱讀

    工控機與普通計算機核心差異解析

    在工業(yè)自動化和智能制造領域,計算機設備作為核心控制單元,其選擇直接影響整個系統(tǒng)的穩(wěn)定性與可靠性。工控機與普通計算機雖同屬計算設備,但其設計目標、性能側重和應用場景存在根本性差異。準確理
    的頭像 發(fā)表于 11-25 14:45 ?1782次閱讀
    工控機與普通<b class='flag-5'>計算機</b>的<b class='flag-5'>核心</b>差異解析

    龍架構計算機系統(tǒng)能力核心課程教學研討會圓滿舉行

    2025年11月8日,由教育部計算機類專業(yè)系統(tǒng)能力課程群虛擬教研室指導、北京航空航天大學計算機學院主辦的龍架構計算機系統(tǒng)能力核心課程教學研討會在京舉行。
    的頭像 發(fā)表于 11-14 13:52 ?645次閱讀

    2025中國計算機大會DPU技術論壇成功舉辦

    近日,備受矚目的第22屆中國計算機大會(CNCC2025)在哈爾濱開幕。本屆大會注冊人數突破1.2萬人,匯聚了來自全球計算機領域的頂尖學者、產業(yè)領袖、青年學子及國際組織代表。大會以“數智賦能、無限可能”為主題,旨在深度探討數字智能技術
    的頭像 發(fā)表于 11-02 09:29 ?709次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1264次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊<b class='flag-5'>技術</b>解析

    高能計算機:以工控產品為核心,為各行業(yè)發(fā)展落實解決方案

    在當今數字化與智能化飛速發(fā)展的時代,各行業(yè)對于高效、穩(wěn)定、智能的計算解決方案需求愈發(fā)迫切。工控計算機作為工業(yè)領域智能化轉型的核心設備,正憑借其卓越的性能、強大的適應性以及不斷創(chuàng)新的
    的頭像 發(fā)表于 09-16 09:39 ?525次閱讀

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1210次閱讀

    【「DeepSeek 核心技術揭秘」閱讀體驗】+混合專家

    感謝電子發(fā)燒友提供學習Deepseek核心技術這本書的機會。 讀完《Deepseek核心技術揭秘》,我深受觸動,對人工智能領域有了全新的認識。了解Deepseek-R1 、Deepseek-V3
    發(fā)表于 07-22 22:14

    人工智能技術的現狀與未來發(fā)展趨勢

    人工智能技術的現狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發(fā)展,深刻影響著各行各業(yè)。從
    的頭像 發(fā)表于 07-16 15:01 ?1859次閱讀

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?742次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    一文帶你了解工業(yè)計算機尺寸

    一項艱巨的任務。本博客將指導您了解關鍵的工業(yè)計算機尺寸、使用案例。關鍵工業(yè)計算機外形要素及其使用案例一、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?1039次閱讀
    一文帶你<b class='flag-5'>了解</b>工業(yè)<b class='flag-5'>計算機</b>尺寸