91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

技術(shù)科普 | 機器視覺5大關(guān)鍵技術(shù)及其常見應(yīng)用

英碼科技 ? 來源:英碼科技 ? 作者:英碼科技 ? 2024-01-31 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺是指:讓機器通過數(shù)字圖像或視頻等視覺信息來模擬人類視覺的過程,以達到對物體的理解、識別、分類、跟蹤、重建等目的的技術(shù)。它是人工智能領(lǐng)域中的一個分支,涉及圖像處理、模式識別、機器學習、深度學習等多個領(lǐng)域。

隨著人工智能和機器學習算法進入了與產(chǎn)業(yè)深度融合的階段,機器視覺技術(shù)已廣泛應(yīng)用于人臉識別、自動駕駛、無人機、醫(yī)學影像分析、工業(yè)生產(chǎn)等場景,主要運用到以下六大主流機器視覺技術(shù),一起來了解一下~

01 圖像分類

圖像分類是根據(jù)各自在圖像信息中所反映的不同特征,把不同類別的目標區(qū)分開來的圖像處理方法。它利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區(qū)域劃歸為若干個類別中的某一種,以代替人的視覺判讀。

常用方法:基于色彩特征的索引技術(shù)、基于紋理的圖像分類技術(shù)、基于形狀的圖像分類技術(shù)、基于空間關(guān)系的圖像分類技術(shù)等。

主要應(yīng)用:場景分類、物體識別、圖像標注、醫(yī)學圖像、工業(yè)檢測和安防監(jiān)控等。

02 目標檢測

目標檢測是指在圖像或視頻中,識別出目標物體所在的位置,并標注出其所屬的類別的任務(wù)。相比于圖像分類任務(wù),目標檢測需要對目標的位置和數(shù)量進行準確的識別,因此其難度更大,但也更加實用。在實際應(yīng)用中,可以根據(jù)具體場景和需求,選擇不同的模型和算法來實現(xiàn)追蹤、識別和分析等目標檢測任務(wù)。

常用模型:

①Faster R-CNN:是一種基于深度神經(jīng)網(wǎng)絡(luò)的目標檢測模型,它通過在區(qū)域提議網(wǎng)絡(luò)(Region Proposal Network, RPN)中引入錨點來提高檢測速度,同時采用了RoI Pooling層來實現(xiàn)不同大小的目標檢測。

②YOLO(You Only Look Once):是一種基于單階段目標檢測算法的模型,它將目標檢測任務(wù)轉(zhuǎn)化為一個回歸問題,通過卷積神經(jīng)網(wǎng)絡(luò)預(yù)測目標的類別和位置。

③SSD(Single Shot MultiBox Detector):也是一種基于單階段目標檢測算法的模型,通過在每個特征層上應(yīng)用不同大小和形狀的先驗框,從而實現(xiàn)對不同尺度目標的檢測。

主要應(yīng)用:

①智能安防:監(jiān)控場景中的人員和車輛,實現(xiàn)目標追蹤和識別。

②自動駕駛:通過識別道路標志、交通信號燈、行人和其他車輛等來實現(xiàn)自主駕駛。

③無人機:對無人機飛行區(qū)域中的目標進行識別和跟蹤,以實現(xiàn)智能控制和導航。

④工業(yè)制造:在生產(chǎn)過程中對產(chǎn)品進行檢測和分類,提高生產(chǎn)效率和質(zhì)量。

⑤醫(yī)療診斷:通過對醫(yī)學圖像中的腫瘤等異常進行識別和定位,輔助醫(yī)生進行診斷和治療。

尤其是適用于邊緣端的智能應(yīng)用,比如在英碼科技的場景化解決方案中,主要通過邊緣計算盒子,結(jié)合機器視覺、大數(shù)據(jù)等技術(shù)實現(xiàn)長尾場景的實時感知、目標識別、監(jiān)測、預(yù)警等智能應(yīng)用,助力交通、校園、工地、化工園區(qū)等領(lǐng)域?qū)崿F(xiàn)智慧化升級,達到降本增效的目的。

wKgaomW6BxmAG1I2AACEAfPgHjw680.jpg

03 目標跟蹤

目標跟蹤是指在視頻序列中,對于已知的初始目標,在后續(xù)幀中通過對目標的特征提取和跟蹤算法進行處理,實現(xiàn)對目標位置、形態(tài)等信息的實時跟蹤。

常用方法:

①基于相關(guān)濾波的跟蹤方法:將目標與模板進行相關(guān)性計算,計算得到的結(jié)果可以表示目標在當前幀的位置。

②基于粒子濾波的跟蹤方法:通過在目標周圍隨機生成多個粒子,然后根據(jù)目標的運動模型,對這些粒子進行預(yù)測,再用觀測信息對預(yù)測的粒子進行權(quán)重更新,最終選擇權(quán)重最高的粒子來表示目標的位置。

③基于深度學習的跟蹤方法:使用深度學習算法對目標進行特征提取和表示,然后根據(jù)目標在前一幀的位置和特征,對目標在當前幀的位置進行預(yù)測。常用的深度學習跟蹤算法包括循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等。

主要應(yīng)用:目標跟蹤技術(shù)適用于視頻監(jiān)控、無人駕駛、智能交通等領(lǐng)域,可以用于目標的實時跟蹤和識別,實現(xiàn)自動化控制和智能化分析。


04 語義分割

語義分割旨在將輸入圖像中的每個像素標記為屬于哪個語義類別。與目標檢測和圖像分類不同,語義分割不僅可以識別圖像中的物體,還可以為每個像素分配標簽,從而提供更詳細和準確的圖像理解。

wKgaomW6BxmAUWNUAABTWOJz4Pw756.jpg

常用模型:FCN(Fully Convolutional Network)、U-Net、DeepLab等。近年來還涌現(xiàn)出了許多基于深度學習的新型語義分割模型,如PSPNet、DeepLab V3+等,它們在精度和效率等方面都有所提高。

主要應(yīng)用:語義分割適用于需要對圖像進行精細分割和像素級分類的場景,例如自動駕駛中的道路分割、醫(yī)學圖像中的病變分割、地理信息系統(tǒng)中的土地分類等。

05 實例分割

實例分割是結(jié)合目標檢測和語義分割的一個更高層級的任務(wù)。實例分割是計算機視覺中的一項任務(wù),旨在同時檢測圖像中的物體,并將每個物體分割成精確的像素級別的區(qū)域。與語義分割不同,實例分割不僅可以分割出不同類別的物體,還可以將它們分割成獨立的、像素級別的區(qū)域。

wKgZomW6BxmAWUZDAAGwMfvJHWg966.jpg

常用模型:Mask R-CNN、FCIS(Fully Convolutional Instance-aware Semantic Segmentation)、SOLO(Segmenting Objects by Locations)等。

主要應(yīng)用:實例分割適用于需要對圖像進行精細分割并區(qū)分不同物體的場景,例如自動駕駛中的行人和車輛分割、醫(yī)學圖像中的器官分割、遙感圖像中的建筑物分割等。

結(jié)語

上述這 5 種關(guān)鍵的機器視覺技術(shù)可以協(xié)助計算機從單個或一系列圖像中提取、分析和理解有用的信息,賦能千行百業(yè)實現(xiàn)AI應(yīng)用,構(gòu)建更智能、美好的視界。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107799
  • 機器視覺
    +關(guān)注

    關(guān)注

    165

    文章

    4798

    瀏覽量

    126072
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301446
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嵌入式視覺技術(shù)賦能工業(yè)自動化領(lǐng)域變革

    機器視覺(Machine Vision)是實現(xiàn)非接觸式檢測和高度柔性生產(chǎn)的關(guān)鍵技術(shù),其主要功能可歸納為識別、測量、檢測以及定位與引導等四類。嵌入式視覺(Embedded Vision)
    的頭像 發(fā)表于 03-06 09:28 ?488次閱讀
    嵌入式<b class='flag-5'>視覺</b><b class='flag-5'>技術(shù)</b>賦能工業(yè)自動化領(lǐng)域變革

    華為發(fā)布智能體通信網(wǎng)絡(luò)的三大關(guān)鍵技術(shù)能力

    在MWC2026巴塞羅那期間,華為正式發(fā)布智能體通信網(wǎng)絡(luò)(Agentic Communication Network,簡稱ACN)的三大關(guān)鍵技術(shù)能力——數(shù)字身份管理、動態(tài)群組通信、協(xié)作任務(wù)會話管理,旨在支撐未來多智能體協(xié)同的復雜通信需求,推動移動AI時代網(wǎng)絡(luò)新業(yè)務(wù)場景的創(chuàng)新與發(fā)展。
    的頭像 發(fā)表于 03-05 10:21 ?264次閱讀

    機器視覺網(wǎng)卡與普通網(wǎng)卡的5關(guān)鍵不同

    隨著人工智能和工業(yè)自動化的蓬勃發(fā)展,機器視覺技術(shù)扮演著越來越重要的角色。機器視覺系統(tǒng)依賴于高質(zhì)量的圖像數(shù)據(jù)進行分析和決策,而高性能的網(wǎng)絡(luò)傳輸
    的頭像 發(fā)表于 01-15 16:38 ?226次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>網(wǎng)卡與普通網(wǎng)卡的<b class='flag-5'>5</b>點<b class='flag-5'>關(guān)鍵</b>不同

    機器視覺的核心技術(shù)和應(yīng)用場景

    機器視覺正通過讓機器“看見”并解讀視覺數(shù)據(jù)來為行業(yè)帶來變革,進而提升自動化水平、質(zhì)量控制效率與運營效能。本文將深入探討機器
    的頭像 發(fā)表于 12-29 16:32 ?905次閱讀

    從FPGA應(yīng)用前景視角解讀Gartner 2026十大關(guān)鍵技術(shù)趨勢(下)

    一、概述Gartner每年面向CIO/CTO發(fā)布《十大關(guān)鍵戰(zhàn)略技術(shù)趨勢》報告,為企業(yè)機構(gòu)技術(shù)變革、業(yè)務(wù)轉(zhuǎn)型決策提供未來五年可能帶來重大變革與機遇的技術(shù)路線參照。2026年版將趨勢劃分
    的頭像 發(fā)表于 12-19 13:57 ?718次閱讀
    從FPGA應(yīng)用前景視角解讀Gartner 2026十<b class='flag-5'>大關(guān)鍵技術(shù)</b>趨勢(下)

    從FPGA應(yīng)用前景視角解讀Gartner 2026十大關(guān)鍵技術(shù)趨勢(上)

    一、概述Gartner每年面向CIO/CTO發(fā)布《十大關(guān)鍵戰(zhàn)略技術(shù)趨勢》報告,為企業(yè)機構(gòu)技術(shù)變革、業(yè)務(wù)轉(zhuǎn)型決策提供未來五年可能帶來重大變革與機遇的技術(shù)路線參照。2026年版將趨勢劃分
    的頭像 發(fā)表于 12-17 17:17 ?1365次閱讀
    從FPGA應(yīng)用前景視角解讀Gartner 2026十<b class='flag-5'>大關(guān)鍵技術(shù)</b>趨勢(上)

    5G網(wǎng)絡(luò)通信有哪些技術(shù)痛點?

    點主要包括網(wǎng)絡(luò)覆蓋范圍與信號質(zhì)量、高頻段通信與設(shè)備兼容性、關(guān)鍵技術(shù)不夠成熟以及核心器件依賴進口等方面。 網(wǎng)絡(luò)覆蓋范圍與信號質(zhì)量:5G網(wǎng)絡(luò)在高頻段下的傳輸距離相對較短,覆蓋范圍有限,且在建筑物密集或
    發(fā)表于 12-02 06:05

    解碼LCD液晶屏的關(guān)鍵技術(shù)指標

    在智能設(shè)備蓬勃發(fā)展的今天,液晶屏作為人機交互的核心界面,其性能直接決定了用戶體驗的優(yōu)劣。無論是消費電子還是工業(yè)控制,對顯示效果的要求都日益嚴苛。作為專業(yè)的液晶顯示器制造商,我們深知,深入理解LCD的技術(shù)內(nèi)涵,是做出正確選擇與設(shè)計的基石。本文將系統(tǒng)性地解析決定液晶模塊品質(zhì)的幾大關(guān)鍵
    的頭像 發(fā)表于 11-18 10:46 ?1143次閱讀
    解碼LCD液晶屏的<b class='flag-5'>關(guān)鍵技術(shù)</b>指標

    機器視覺缺陷檢測中傳感器集成的五大關(guān)鍵

    質(zhì)量控制是制造流程中至關(guān)重要但往往效率低下的環(huán)節(jié)。機器視覺能夠自動化部分或全部缺陷檢測任務(wù),但僅靠技術(shù)本身無法帶來顯著改進。必須理解并優(yōu)化整個機器
    的頭像 發(fā)表于 11-03 11:40 ?784次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>缺陷檢測中傳感器集成的五<b class='flag-5'>大關(guān)鍵</b>

    北京科技創(chuàng)新促進中心文科與科普部李守勇部長一行蒞臨昱櫟技術(shù)科普基地實地踏勘

    10月14日,北京科技創(chuàng)新促進中心文科與科普部部長李守勇一行蒞臨北京昱櫟技術(shù)有限公司(以下簡稱“昱櫟技術(shù)”),圍繞科普基地建設(shè)運營開展實地踏勘與專題座談。昱櫟
    的頭像 發(fā)表于 10-16 09:48 ?856次閱讀
    北京科技創(chuàng)新促進中心文科與<b class='flag-5'>科普</b>部李守勇部長一行蒞臨昱櫟<b class='flag-5'>技術(shù)科普</b>基地實地踏勘

    京東方自制技術(shù)科普綜藝節(jié)目第四季重磅回歸

    近日,由BOE(京東方)自制的技術(shù)科普綜藝節(jié)目《BOE 解憂實驗室》第四季發(fā)布會在北京廣播電視臺隆重舉行。作為中國科技企業(yè)首檔技術(shù)科普綜藝,本季將以“中國地標+科技大事件”的升級模式,將京東方技術(shù)
    的頭像 發(fā)表于 08-12 10:03 ?1111次閱讀

    Micro LED制造工藝中四大關(guān)鍵技術(shù)難點

    顯示等四大關(guān)鍵技術(shù)至關(guān)重要,這些技術(shù)的發(fā)展和突破對于實現(xiàn)MicroLED的商業(yè)化應(yīng)用具有重要意義。美能顯示,作為專注于研發(fā)顯示行業(yè)精密高效檢測設(shè)備的企業(yè),深度參與到這
    的頭像 發(fā)表于 08-11 14:55 ?2830次閱讀
    Micro LED制造工藝中四<b class='flag-5'>大關(guān)鍵技術(shù)</b>難點

    EtherCAT科普系列(8):EtherCAT技術(shù)機器視覺領(lǐng)域的應(yīng)用

    機器視覺是基于軟件與硬件的組合,通過光學裝置和非接觸式的傳感器自動地接受一個真實物體的圖像,并利用軟件算法處理圖像以獲得所需信息或用于控制機器人運動的裝置。機器
    的頭像 發(fā)表于 05-15 17:09 ?1692次閱讀
    EtherCAT<b class='flag-5'>科普</b>系列(8):EtherCAT<b class='flag-5'>技術(shù)</b>在<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>領(lǐng)域的應(yīng)用

    電機系統(tǒng)節(jié)能關(guān)鍵技術(shù)及展望

    節(jié)約能源既是我國經(jīng)濟和社會發(fā)展的一項長遠戰(zhàn)略和基本國策,也是當前的緊迫任務(wù)。論文在深入分析國內(nèi)外電機系統(tǒng)節(jié)能現(xiàn)狀和介紹先進的節(jié)能關(guān)鍵技術(shù)的基礎(chǔ)上,指出了現(xiàn)階段我國在電機系統(tǒng)節(jié)能方面存在的問題,并結(jié)合
    發(fā)表于 04-30 00:43

    淺談華為通信大模型的關(guān)鍵技術(shù)

    推理、幻覺糾正及多維聯(lián)合決策等方面創(chuàng)新成果的肯定。為此,我們將分三期深入解讀華為通信大模型無線的關(guān)鍵技術(shù)和價值應(yīng)用,本期聚焦于通信大模型的部署、訓練和推理的關(guān)鍵技術(shù)
    的頭像 發(fā)表于 03-26 14:35 ?1207次閱讀