計(jì)算機(jī)視覺技術(shù)的含義
由于“計(jì)算機(jī)視覺”反映了對(duì)視覺環(huán)境及其上下文的相對(duì)理解,因此,一些科學(xué)家認(rèn)為,該領(lǐng)域?yàn)?a target="_blank">人工智能領(lǐng)域鋪平了道路。那么什么是計(jì)算機(jī)視覺呢?
根據(jù)Ballard&Brown(1982年)的說(shuō)法,“從圖像中構(gòu)造出對(duì)物理對(duì)象的明確而有意義的描述。
根據(jù)Trucco&Verri(1998年)的說(shuō)法,計(jì)算機(jī)視覺是3D世界中一幅或多幅數(shù)字圖像的計(jì)算屬性的集合。
根據(jù)Sockman&Shapiro的說(shuō)法,2001年的計(jì)算機(jī)視覺是基于感知到的圖像對(duì)實(shí)際物理對(duì)象和場(chǎng)景做出有用決策的過(guò)程。
計(jì)算機(jī)視覺技術(shù)的應(yīng)用
從計(jì)算機(jī)視覺領(lǐng)域可以衍生出大量有用的應(yīng)用程序。下面是計(jì)算機(jī)視覺應(yīng)用程序的一些用途:
游戲和控制:在游戲領(lǐng)域使用立體視覺的一個(gè)有影響力的商業(yè)產(chǎn)品是微軟的Kinect。
圖像檢索:谷歌圖像利用基于內(nèi)容的查詢來(lái)搜索相關(guān)的圖像。它們的算法分析查詢圖像中的內(nèi)容,然后根據(jù)最匹配的內(nèi)容返回結(jié)果。
生物特征識(shí)別:虹膜、指紋和人臉匹配是利用計(jì)算機(jī)視覺技術(shù)進(jìn)行生物特征識(shí)別的常用方法。
監(jiān)視:監(jiān)控?cái)z像頭在許多公共場(chǎng)所,主要用于檢測(cè)任何可疑行為。
人臉識(shí)別: Snapchat和Facebook等應(yīng)用程序利用人臉檢測(cè)算法來(lái)應(yīng)用濾鏡并識(shí)別照片中的人物。
智能汽車:視覺是這些汽車檢測(cè)交通信號(hào),燈光和其他視覺參數(shù)等多種元素的主要信息來(lái)源。
各種類型的計(jì)算機(jī)視覺技術(shù)
看到了計(jì)算機(jī)視覺技術(shù)的好處之后,現(xiàn)在讓我們看一下在主要的互聯(lián)網(wǎng)領(lǐng)域如何使用計(jì)算機(jī)視覺的一些技術(shù)。
對(duì)象檢測(cè)
對(duì)象檢測(cè)是定義圖像中存在的對(duì)象,對(duì)其進(jìn)行標(biāo)記并輸出邊界框的過(guò)程。計(jì)算機(jī)在這里試圖對(duì)多個(gè)對(duì)象進(jìn)行分類,而不只是對(duì)一個(gè)進(jìn)行分類。想象一個(gè)裝滿貨物的倉(cāng)庫(kù)。如果倉(cāng)庫(kù)中有很多物品,那么手動(dòng)計(jì)算所有物品將是非常耗時(shí)的工作。相反,如果有一臺(tái)配備了攝像頭的機(jī)器人或計(jì)算機(jī)可以檢測(cè)所有物體并對(duì)其進(jìn)行跟蹤,則此過(guò)程將節(jié)省大量時(shí)間,從而提高工作效率。
圖像分類
圖像分類也許是最流行的計(jì)算機(jī)視覺技術(shù)之一。此處需要解決的最大問題之一是:假設(shè)中有許多圖像,任務(wù)是預(yù)測(cè)一組測(cè)試圖像的類別,以確定圖像的準(zhǔn)確性。預(yù)測(cè)。這里有許多問題需要克服,例如比如改變尺度和視角,光照條件,圖像變形等等。
創(chuàng)建計(jì)算機(jī)視覺算法的過(guò)程將能夠按照適當(dāng)?shù)念悇e對(duì)圖像進(jìn)行分割,這是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的過(guò)程。研究人員將確定特定圖像類別的一些樣本,以用于特定的計(jì)算機(jī)視覺機(jī)器學(xué)習(xí),而不是確定每個(gè)圖像類別在代碼級(jí)別上的外觀。計(jì)算機(jī)的任務(wù)是研究所提供的圖像并了解與視覺外觀有關(guān)的細(xì)節(jié)。
語(yǔ)義分割
語(yǔ)義分割被認(rèn)為是計(jì)算機(jī)視覺的一個(gè)重要組成部分,它將整個(gè)圖像分割成像素段,然后進(jìn)行分類和標(biāo)記。更具體地說(shuō),語(yǔ)義分割試圖理解每個(gè)像素在給定圖像中的重要作用。例如,僅僅檢測(cè)一個(gè)人或一輛車是不夠的。還必須能夠確定邊界在哪里。
對(duì)象追蹤
對(duì)象跟蹤是指跟蹤給定場(chǎng)景中的一個(gè)或多個(gè)運(yùn)動(dòng)對(duì)象。傳統(tǒng)上,此技術(shù)已應(yīng)用于檢測(cè)到初始對(duì)象后監(jiān)視真實(shí)世界的交互。這是自動(dòng)駕駛汽車的一個(gè)非常重要的方面,特斯拉和優(yōu)步等公司計(jì)劃發(fā)布這種產(chǎn)品。對(duì)象跟蹤機(jī)制可以分為兩個(gè)部分(generative和discriminative)。利用生成法來(lái)描述這些明顯的特征,減少搜索對(duì)象時(shí)重建中的誤差。判別方法被認(rèn)為是相對(duì)更強(qiáng)大和準(zhǔn)確的。此方法可以用來(lái)區(qū)分背景和主體。針對(duì)這一特點(diǎn),該方法已成為最受歡迎的跟蹤方法之一。它甚至被稱為“Tracking-by-Detection”。這與深度學(xué)習(xí)類似。
影像重建
想象一下,有一張舊照片,它已經(jīng)腐蝕了一段時(shí)間。這是一張很有價(jià)值的照片,人們想把它修復(fù)一下。這就是圖像重建的過(guò)程。
實(shí)例分割
該方法對(duì)所有不同的實(shí)例類進(jìn)行分類,比如使用10種不同的顏色標(biāo)記10輛汽車。關(guān)于分類,通常有原始圖像,其目標(biāo)是確定圖像的確切內(nèi)容。但是,為了分割所有的實(shí)例,還需要其他幾個(gè)復(fù)雜的過(guò)程。如果是一個(gè)復(fù)雜的場(chǎng)景,有多個(gè)重疊的物體和不同的背景,那么就需要對(duì)所有的物體進(jìn)行分類,然后識(shí)別它們的邊界,差異,以及它們之間的關(guān)系。
電子發(fā)燒友App
















評(píng)論