因應(yīng)機(jī)器人產(chǎn)業(yè)與工業(yè)自動(dòng)化快速發(fā)展,結(jié)合相機(jī)與影像處理以取代或補(bǔ)強(qiáng)人力的機(jī)器視覺(jué)技術(shù)與相關(guān)應(yīng)用持續(xù)升溫,并在工業(yè)檢測(cè)與制造領(lǐng)域獲得了廣泛的部署。然而,對(duì)于超越傳統(tǒng)應(yīng)用以外的日常生活與其他領(lǐng)域,機(jī)器視覺(jué)仍然深藏著無(wú)限潛力與商機(jī)。
過(guò)去幾年來(lái),這個(gè)以知識(shí)為導(dǎo)向的產(chǎn)業(yè)經(jīng)歷機(jī)器視覺(jué)系統(tǒng)的元件與模組日益復(fù)雜化;另一方面,與機(jī)器視覺(jué)系統(tǒng)相關(guān)的市場(chǎng)應(yīng)用也持續(xù)擴(kuò)展到超越工業(yè)制造以外的新應(yīng)用領(lǐng)域,特別是如今當(dāng)硬體尺寸縮減以及嵌入式系統(tǒng)持續(xù)展現(xiàn)動(dòng)能之際,即將來(lái)臨的奈米技術(shù)、先進(jìn)感測(cè)器、機(jī)器對(duì)機(jī)器(M2M)通訊系統(tǒng)以及物聯(lián)網(wǎng)(IoT) 等新興技術(shù)發(fā)展,將進(jìn)一步推動(dòng)機(jī)器視覺(jué)應(yīng)用擴(kuò)展至消費(fèi)性電子、可穿戴式裝置、汽車(chē)先進(jìn)駕駛輔助系統(tǒng)(ADAS)以及智能化監(jiān)控等更貼近大眾生活的領(lǐng)域。
根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)MarketsandMarkets在去年發(fā)布的調(diào)查報(bào)告指出,2012年機(jī)器視覺(jué)系統(tǒng)與元件的全球市場(chǎng)規(guī)模超過(guò)30億美元,預(yù)計(jì)在 2013-2018年間將以8.2%的年復(fù)合成長(zhǎng)率(CAGR)成長(zhǎng),在2018年以前達(dá)到50億美元。全球機(jī)器視覺(jué)市場(chǎng)帶來(lái)的新商機(jī)已經(jīng)成為業(yè)界廠商關(guān)注的焦點(diǎn)。
CEVA公司投資者關(guān)系與企業(yè)傳播副總裁Richard Kingston透露,該公司已經(jīng)將電腦視覺(jué)DSP授權(quán)給八家企業(yè),其中包括三家行動(dòng)領(lǐng)域的OEM廠商。而加拿大CogniVue公司業(yè)務(wù)開(kāi)發(fā)副總裁 Tom Wilson也看好“可穿戴式裝置和汽車(chē)領(lǐng)域?qū)⒋嬖诜浅?qiáng)烈的成長(zhǎng)商機(jī)?!?/p>

全球機(jī)器視覺(jué)市場(chǎng)可望在2018年以前超越50億美元大關(guān)。
視覺(jué)處理向3D跨越
隨著Google正式發(fā)布Project Tango后,3D機(jī)器視覺(jué)變得更熱門(mén)。Kingston表示,“消費(fèi)領(lǐng)域的3D處理主要瞄準(zhǔn)3D成像、自然使用者界面(NUI)和3D視覺(jué)應(yīng)用,如PC、筆記型電腦、平板電腦、智能手機(jī)和其它消費(fèi)性設(shè)備?!?/p>
業(yè)界追尋3D視覺(jué)的主要原因在于解決2D機(jī)器視覺(jué)的固有局限,若能更有效地實(shí)現(xiàn)在分割(分離近景和遠(yuǎn)景)、照明(用于人臉辨識(shí))、相對(duì)位置(場(chǎng)景中的物體)等方面的功能,就能讓更多應(yīng)用透過(guò)3D空間資訊來(lái)簡(jiǎn)化并提高視覺(jué)系統(tǒng)的精密度與可靠性。
但無(wú)論是3D感測(cè)器(例如TOF相機(jī))或以2個(gè)2D影像感測(cè)器實(shí)現(xiàn)的立體感測(cè)器,對(duì)于處理能力的要求也更高。Wilson指出,“立體匹配(使用兩個(gè)影像感測(cè)器的輸入)要求差異映射來(lái)產(chǎn)生3D景深圖。這是一個(gè)非常困難的電腦視覺(jué)問(wèn)題,學(xué)術(shù)界也積極研究最佳化立體辨識(shí)演算法?!庇捎趯?shí)現(xiàn)3D感測(cè)的每一種方法都存在性能的折衷, CogniVue目前正開(kāi)發(fā)一種新的演算法,期望針對(duì)低成本3D感測(cè)器計(jì)算其視差圖。
處理大量即時(shí)資料需要密集的運(yùn)算能力。若是想實(shí)現(xiàn)穩(wěn)定的3D感測(cè)映射是非常困難的,特別是對(duì)于低功耗的設(shè)備來(lái)說(shuō)。為此,他強(qiáng)調(diào),“CogniVue的APEX影像辨識(shí)處理(ICP)技術(shù)能在電量有限的3D視覺(jué)應(yīng)用中發(fā)揮關(guān)鍵作用?!鄙剃P(guān)注的焦點(diǎn)。 CEVA公司投資者關(guān)系與企業(yè)傳播副總裁Ri
對(duì)于系統(tǒng)設(shè)計(jì)人員來(lái)說(shuō),設(shè)計(jì)一款能有效執(zhí)行不同視覺(jué)演算法的硬體是一項(xiàng)艱巨的挑戰(zhàn)。系統(tǒng)廠商選擇影像/視訊處理解決方案時(shí),可以選擇全部集中在CPU完成,也可以選擇卸載一部份影像處理工作給GPU,或者專(zhuān)為影像處理增加硬體邏輯。在需要3D處理的應(yīng)用中,GPU已經(jīng)讓系統(tǒng)的一部份執(zhí)行多種電腦視覺(jué)演算法,從而有助于為通用CPU分擔(dān)工作負(fù)載。
“i.MX6擁有強(qiáng)大的GPU運(yùn)算能力,其3D引擎GC2000內(nèi)含4個(gè)渲染核心,可提供高達(dá)30GFLOPS的運(yùn)算能力,支援OpenCL 1.1 EP,”飛思卡爾(Freescale)微控制器事業(yè)部亞太區(qū)市場(chǎng)行銷(xiāo)和業(yè)務(wù)拓展經(jīng)理李星宇介紹,“此外,i.MX6Q還擁有一個(gè)專(zhuān)用的2D引擎 (1Gpixel/s)和一個(gè)向量繪圖處理引擎。”
針對(duì)影像擷取領(lǐng)域,經(jīng)常利用2D相機(jī)感測(cè)器或其他光學(xué)感測(cè)技術(shù)來(lái)分析運(yùn)算3D資料。除了飛行時(shí)間法(TOF)3D成像(為目標(biāo)物連續(xù)發(fā)送光線脈沖,根據(jù)光線脈沖與感測(cè)器接收反射光線之間的時(shí)間,計(jì)算出目標(biāo)物距離),在工業(yè)制造檢測(cè)方面較廣泛應(yīng)用的是3D雷射三角法,差別在于3D雷射感測(cè)器采用逐點(diǎn)掃描,而TOF相機(jī)則同時(shí)得到整幅影像的深度資訊。
相較于雷射三角的3D成像方式,美商國(guó)家儀器(NI)技術(shù)行銷(xiāo)工程師黃翔鉎介紹,NI LabVIEW可為3D視覺(jué)應(yīng)用提供雙目立體視覺(jué)功能,工程師可將2部相機(jī)安裝在物體的不同角度后,使用校準(zhǔn)技術(shù)調(diào)校兩部相機(jī)之間的畫(huà)素資訊以及擷取資料,并透過(guò)LabVIEW的3D工具庫(kù)進(jìn)行數(shù)學(xué)運(yùn)算分析。透過(guò)一個(gè)軟硬體無(wú)縫整合的繪圖開(kāi)發(fā)環(huán)境來(lái)設(shè)計(jì)3D視覺(jué)應(yīng)用,更能簡(jiǎn)化工程師的工作。
IP與處理器的完美結(jié)合
為了在日益精巧的機(jī)臺(tái)或裝置中整合嵌入式視覺(jué)系統(tǒng),需要更先進(jìn)的CPU進(jìn)行密集運(yùn)算來(lái)處理龐大的資料量,黃翔鉎強(qiáng)調(diào),這將持續(xù)對(duì)于CPU效能、功耗與資源是否足以支援強(qiáng)大的視覺(jué)分析運(yùn)算帶來(lái)了挑戰(zhàn)。
CongmiVue 在官網(wǎng)上提到,“為了滿足不斷提高的應(yīng)用需求,過(guò)去幾十年來(lái),處理器架構(gòu)持續(xù)因應(yīng)不同階段而進(jìn)展。1980年代的用于桌上型電腦和和伺服器的 CPU;1990年代DSP出現(xiàn)加速音訊編解碼和無(wú)線/有線語(yǔ)音/資料編解碼的要求;2000年GPU達(dá)到更先進(jìn)的性能與平行性,從而實(shí)現(xiàn)2D和3D影像;如今,嵌入式視覺(jué)處理需要的是完全不同的處理器架構(gòu):ICP?!?/p>
Tom Wilson也指出,“新一代的視覺(jué)應(yīng)用需要100倍以上的嵌入式視覺(jué)性能/功耗,為了滿足這些應(yīng)用的性能和功率需求,我們必須在相同功耗下提升較傳統(tǒng)處理架構(gòu)更高100-400倍的性能,”因此,CogniVue強(qiáng)調(diào)其APEX ICP技術(shù)可實(shí)現(xiàn)這一性能要求。
連同APEX ICP核心、APEX程式設(shè)計(jì)工具以及一個(gè)APEX-CV嵌入式視覺(jué)功能庫(kù),可涵蓋多種視覺(jué)應(yīng)用。例如特征檢測(cè)和搭配適用于可穿戴式(增強(qiáng)實(shí)境)和汽車(chē) (光流和運(yùn)動(dòng)追蹤)等。他補(bǔ)充道:“除了常見(jiàn)的電腦視覺(jué)功能,CognVue還為特定應(yīng)用提供更先進(jìn)的產(chǎn)品,例如用于人臉辨識(shí)的FaceVue、用于監(jiān)控應(yīng)用中運(yùn)動(dòng)監(jiān)測(cè)的MotionVue、用于汽車(chē)車(chē)道偏離警示的FrontVue,以及用于汽車(chē)盲點(diǎn)監(jiān)測(cè)的SideVue等。”
針對(duì)密集型運(yùn)算需求,CEVA公司包括CEVA-MM3101在內(nèi)的CEVA-MM3000系列使用非常高效且功能強(qiáng)大的向量引擎,從而實(shí)現(xiàn)電腦視覺(jué)所需的大量平行運(yùn)算。此外,整合的功率調(diào)節(jié)單元(PSU)可在處理器內(nèi)實(shí)現(xiàn)動(dòng)態(tài)電壓調(diào)節(jié),協(xié)助實(shí)現(xiàn)‘永不斷線’的應(yīng)用類(lèi)型。
除了CogniVue和CEVA,致力于機(jī)器視覺(jué)IP的廠商還包括Mobileye、Tensilica(現(xiàn)隸屬于Cadence IP部門(mén))與Imagination Technologies等。Imagination基于‘Raptor’的可合成ISP IP核心已于2014 年第一季上市,使得IP陣營(yíng)的競(jìng)爭(zhēng)愈發(fā)激烈。
多家半導(dǎo)體廠商則透過(guò)與專(zhuān)業(yè)IP廠商合作/授權(quán)的方式,推出其專(zhuān)用視覺(jué)處理器,包括飛思卡爾 (Freescale)、德州儀器(TI)以及意法半導(dǎo)體(ST)等。ST與Mobileye共同開(kāi)發(fā)EyeQ3影像處理器,可實(shí)現(xiàn)行人檢測(cè);飛思卡爾基于CogiVue核心推出影像辨識(shí)處理器家族SCP2200;以色列Inuitive公司開(kāi)發(fā)基于雙CEVA-MM3101引擎的3D視覺(jué)處理器,實(shí)現(xiàn) 3D景深圖;賽靈思(Xilinx)利用MVTec公司的HALCON以及Silicon Software公司的VisualApplets開(kāi)發(fā)平臺(tái),為Zynq-7000 All Programmable SoC打造端對(duì)端的Smarter Vision開(kāi)發(fā)環(huán)境。
TI旗下種類(lèi)繁多的處理器產(chǎn)品中,KeyStone系列多核心處理器具備 5.6GHz的ARM及9.6GHz的DSP處理能力,且具備比多晶片方案低功耗的優(yōu)勢(shì),適合機(jī)器視覺(jué)領(lǐng)域的攝影機(jī)應(yīng)用;此外該公司的Jacito 6系列車(chē)用處理器,亦可用于ADAS中的行人辨識(shí)、防碰撞警示等機(jī)器視覺(jué)功能。
機(jī)器視覺(jué)的界面之爭(zhēng)
機(jī)器視覺(jué)對(duì)于傳輸速度的追求催生了新一代感測(cè)器,它們能在極高的速度下拍攝高解析度影像,但其資料量遠(yuǎn)遠(yuǎn)超出傳統(tǒng)界面的容納限制。目前較為流行的界面是GigE和USB 3.0,這兩種界面各有優(yōu)勢(shì)與不足。
加拿大Point Grey公司是USB 3.0 Vision技術(shù)委員會(huì)的共同創(chuàng)始廠商,曾經(jīng)在2011年推出了首款量產(chǎn)的USB 3.0相機(jī)。該公司比較USB3.0與其他多種界面表示,USB 3.0 頻寬遠(yuǎn)高于GigE POE,且能實(shí)現(xiàn)更低的CPU使用率,幾乎所有的主流電腦系統(tǒng)制造商都提供主機(jī)板上具有USB 3.0界面的系統(tǒng),預(yù)期USB 3.0可望成為市場(chǎng)通用的主流規(guī)格。

表1:GigE PoE與USB 3.0的比較。
不過(guò),“真正的工業(yè)應(yīng)用肯定都得使用以太網(wǎng)絡(luò),”嘉?影像銷(xiāo)售部副經(jīng)理張小偉認(rèn)為,“因?yàn)楣I(yè)應(yīng)用需要的距離較長(zhǎng),而且以太網(wǎng)絡(luò)的抗干擾性更佳?!钡拇_,對(duì)于傳輸距離來(lái)說(shuō),UB S3.0的線纜長(zhǎng)度建議使用5m,而實(shí)際應(yīng)用中只用到3m。

表2:不同界面的頻寬與線纜長(zhǎng)度。
黃翔鉎則認(rèn)為:“以現(xiàn)階段的應(yīng)用需求來(lái)看,GigE和USB3.0可望在市場(chǎng)上共存。GigE的好處是可配置多臺(tái)相機(jī)互連的網(wǎng)絡(luò)架構(gòu),而USB雖然頻寬較大傳輸速率更快,但必須透過(guò)強(qiáng)大的USB中樞管理與傳送,成本較采用切換式的GigE更高。因此,針對(duì)遠(yuǎn)距離、多相機(jī)的應(yīng)用,以及相機(jī)數(shù)少但要求精確度與傳輸速率的應(yīng)用,仍需要分別使用GigE和USB3.0進(jìn)行配置?!?/p>
此外,黃翔鉎建議,針對(duì)更高速的影像擷取應(yīng)用則需使用Camer Link規(guī)格。NI針對(duì)Camera Link相機(jī)提供專(zhuān)為機(jī)器視覺(jué)與科學(xué)成像應(yīng)用所設(shè)計(jì)的影像擷取產(chǎn)品,透過(guò)軟體即可設(shè)定相機(jī),只需簡(jiǎn)易接線即可達(dá)到高效能的影像擷取,同時(shí)相容于NI Vision Builder AI、LabVIEW、LabWindows/CVI、C/C++與Visual Basic。
除此之外,機(jī)器視覺(jué)領(lǐng)域還有一個(gè)以高階競(jìng)爭(zhēng)姿態(tài)出現(xiàn)的CoaXPress界面。該界面在2009年即已推出,可讓設(shè)備(如照相機(jī))以一根同軸電纜實(shí)現(xiàn)高達(dá)6.25Gbps的速度傳輸資料,在使用4根線纜時(shí)的速率高達(dá)25Gbps/相機(jī)。
CoaXpress的連接方法簡(jiǎn)單,“這種推拉自鎖系統(tǒng),確保了在工業(yè)應(yīng)用的可靠性?!北壤麜r(shí)Euresys公司CEO Marc Damhaut展示該公司支援該新界面的Coaxlink系列。

圖2:不同界面的頻寬與線纜長(zhǎng)度。
CoaXpress目前和Camera Link一樣需要透過(guò)一張截取卡,但可實(shí)現(xiàn)比Camera Link更快的傳輸速度。然而,CoaXPress的成本高昂仍是其于普及道路的一大阻礙。
由于CoaXpress界面具有在更遠(yuǎn)距離以更高速率進(jìn)行影像擷取的優(yōu)勢(shì),黃翔鉎預(yù)期,隨著資料量的需求持續(xù)進(jìn)展到超過(guò)Gb級(jí),未來(lái)在CoaXpress技術(shù)發(fā)展更成熟后,可望在相機(jī)影像擷取領(lǐng)域取代GigE和USB3.0成為市場(chǎng)主流。
電子發(fā)燒友App









評(píng)論