91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

物體抓取領(lǐng)域的機(jī)器視覺

新機(jī)器視覺 ? 來源:知乎 ? 作者:知乎 ? 2021-06-18 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器視覺的角度,由簡入繁從相機(jī)標(biāo)定,平面物體檢測、有紋理物體、無紋理物體、深度學(xué)習(xí)、與任務(wù)/運(yùn)動(dòng)規(guī)劃結(jié)合等6個(gè)方面深度解析文章的標(biāo)題。

首先,我們要了解,機(jī)器人領(lǐng)域的視覺(Machine Vision)跟計(jì)算機(jī)領(lǐng)域(Computer Vision)的視覺有一些不同:機(jī)器視覺的目的是給機(jī)器人提供操作物體的信息。所以,機(jī)器視覺的研究大概有這幾塊:

1. 物體識別(Object Recognition):在圖像中檢測到物體類型等,這跟 CV 的研究有很大一部分交叉;

2. 位姿估計(jì)(Pose Estimation):計(jì)算出物體在攝像機(jī)坐標(biāo)系下的位置和姿態(tài),對于機(jī)器人而言,需要抓取東西,不僅要知道這是什么,也需要知道它具體在哪里;

3. 相機(jī)標(biāo)定(Camera Calibration):因?yàn)樯厦孀龅闹皇怯?jì)算了物體在相機(jī)坐標(biāo)系下的坐標(biāo),我們還需要確定相機(jī)跟機(jī)器人的相對位置和姿態(tài),這樣才可以將物體位姿轉(zhuǎn)換到機(jī)器人位姿。

當(dāng)然,我這里主要是在物體抓取領(lǐng)域的機(jī)器視覺;SLAM 等其他領(lǐng)域的就先不講了。

由于視覺是機(jī)器人感知的一塊很重要內(nèi)容,所以研究也非常多了,我就我了解的一些,按照由簡入繁的順序介紹吧。

一。 相機(jī)標(biāo)定

這其實(shí)屬于比較成熟的領(lǐng)域。由于我們所有物體識別都只是計(jì)算物體在相機(jī)坐標(biāo)系下的位姿,但是,機(jī)器人操作物體需要知道物體在機(jī)器人坐標(biāo)系下的位姿。所以,我們先需要對相機(jī)的位姿進(jìn)行標(biāo)定。

內(nèi)參標(biāo)定就不說了,參照張正友的論文,或者各種標(biāo)定工具箱;

外參標(biāo)定的話,根據(jù)相機(jī)安裝位置,有兩種方式:

Eye to Hand:相機(jī)與機(jī)器人極坐標(biāo)系固連,不隨機(jī)械臂運(yùn)動(dòng)而運(yùn)動(dòng)

Eye in Hand:相機(jī)固連在機(jī)械臂上,隨機(jī)械臂運(yùn)動(dòng)而運(yùn)動(dòng)

兩種方式的求解思路都類似,首先是眼在手外(Eye to Hand)

279ce6d4-cf69-11eb-9e57-12bb97331649.jpg

只需在機(jī)械臂末端固定一個(gè)棋盤格,在相機(jī)視野內(nèi)運(yùn)動(dòng)幾個(gè)姿態(tài)。由于相機(jī)可以計(jì)算出棋盤格相對于相機(jī)坐標(biāo)系的位姿A_i 、機(jī)器人運(yùn)動(dòng)學(xué)正解可以計(jì)算出機(jī)器人底座到末端抓手之間的位姿變化E_i 、而末端爪手與棋盤格的位姿相對固定不變。

這樣,我們就可以得到一個(gè)坐標(biāo)系環(huán) CX=XD

這種結(jié)構(gòu)的求解有很多方法,我這邊給出一個(gè)參考文獻(xiàn):

Shiu, Yiu Cheung, and Shaheen Ahmad. “Calibration of wrist-mounted robotic sensors by solving homogeneous transform equations of the form AX= XB.”ieee Transactions on Robotics and Automation 5.1 (1989): 16-29.

而對于眼在手上(Eye in Hand)的情況,也類似,在地上隨便放一個(gè)棋盤格(與機(jī)器人基座固連),然后讓機(jī)械臂帶著相機(jī)走幾個(gè)位姿,然后也可以形成一個(gè)AX=XB 的坐標(biāo)環(huán)。

27bcf64a-cf69-11eb-9e57-12bb97331649.jpg

二. 平面物體檢測

這是目前工業(yè)流水線上最常見的場景。目前來看,這一領(lǐng)域?qū)σ曈X的要求是:快速、精確、穩(wěn)定。所以,一般是采用最簡單的邊緣提取+邊緣匹配/形狀匹配的方法;而且,為了提高穩(wěn)定性、一般會通過主要打光源、采用反差大的背景等手段,減少系統(tǒng)變量。

目前,很多智能相機(jī)(如 cognex)都直接內(nèi)嵌了這些功能;而且,物體一般都是放置在一個(gè)平面上,相機(jī)只需計(jì)算物體的(x,y,θ)T 三自由度位姿即可。

另外,這種應(yīng)用場景一般都是用于處理一種特定工件,相當(dāng)于只有位姿估計(jì),而沒有物體識別。

當(dāng)然,工業(yè)上追求穩(wěn)定性無可厚非,但是隨著生產(chǎn)自動(dòng)化的要求越來越高,以及服務(wù)類機(jī)器人的興起。對更復(fù)雜物體的完整位姿(x,y,z,rx,ry,rz)T 估計(jì)也就成了機(jī)器視覺的研究熱點(diǎn)。

三.有紋理的物體

機(jī)器人視覺領(lǐng)域是最早開始研究有紋理的物體的,如飲料瓶、零食盒等表面帶有豐富紋理的都屬于這一類。

當(dāng)然,這些物體也還是可以用類似邊緣提取+模板匹配的方法。但是,實(shí)際機(jī)器人操作過程中,環(huán)境會更加復(fù)雜:光照條件不確定(光照)、物體距離相機(jī)距離不確定(尺度)、相機(jī)看物體的角度不確定(旋轉(zhuǎn)、仿射)、甚至是被其他物體遮擋(遮擋)。

幸好有一位叫做 Lowe 的大神,提出了一個(gè)叫做 SIFT (Scale-invariant feature transform)的超強(qiáng)局部特征點(diǎn):

Lowe, David G. “Distinctive image features from scale-invariant keypoints.”International journal of computer vision 60.2 (2004): 91-110.

具體原理可以看上面這篇被引用 4萬+ 的論文或各種博客,簡單地說,這個(gè)方法提取的特征點(diǎn)只跟物體表面的某部分紋理有關(guān),與光照變化、尺度變化、仿射變換、整個(gè)物體無關(guān)。

因此,利用 SIFT 特征點(diǎn),可以直接在相機(jī)圖像中尋找到與數(shù)據(jù)庫中相同的特征點(diǎn),這樣,就可以確定相機(jī)中的物體是什么東西(物體識別)。

對于不會變形的物體,特征點(diǎn)在物體坐標(biāo)系下的位置是固定的。所以,我們在獲取若干點(diǎn)對之后,就可以直接求解出相機(jī)中物體與數(shù)據(jù)庫中物體之間的單應(yīng)性矩陣。

如果我們用深度相機(jī)(如Kinect)或者雙目視覺方法,確定出每個(gè)特征點(diǎn)的 3D 位置。那么,直接求解這個(gè) PnP 問題,就可以計(jì)算出物體在當(dāng)前相機(jī)坐標(biāo)系下的位姿。

↑ 這里就放一個(gè)實(shí)驗(yàn)室之前畢業(yè)師兄的成果

當(dāng)然,實(shí)際操作過程中還是有很多細(xì)節(jié)工作才可以讓它真正可用的,如:先利用點(diǎn)云分割和歐氏距離去除背景的影響、選用特征比較穩(wěn)定的物體(有時(shí)候 SIFT 也會變化)、利用貝葉斯方法加速匹配等。

而且,除了 SIFT 之外,后來又出了一大堆類似的特征點(diǎn),如 SURF、ORB 等。

四. 無紋理的物體

好了,有問題的物體容易解決,那么生活中或者工業(yè)里還有很多物體是沒有紋理的:

我們最容易想到的就是:是否有一種特征點(diǎn),可以描述物體形狀,同時(shí)具有跟 SIFT 相似的不變性?

不幸的是,據(jù)我了解,目前沒有這種特征點(diǎn)。

所以,之前一大類方法還是采用基于模板匹配的辦法,但是,對匹配的特征進(jìn)行了專門選擇(不只是邊緣等簡單特征)。

這里,我介紹一個(gè)我們實(shí)驗(yàn)室之前使用和重現(xiàn)過的算法 LineMod:

Hinterstoisser, Stefan, et al. “Multimodal templates for real-time detection of texture-less objects in heavily cluttered scenes.” Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.

簡單而言,這篇論文同時(shí)利用了彩色圖像的圖像梯度和深度圖像的表面法向作為特征,與數(shù)據(jù)庫中的模板進(jìn)行匹配。

由于數(shù)據(jù)庫中的模板是從一個(gè)物體的多個(gè)視角拍攝后生成的,所以這樣匹配得到的物體位姿只能算是初步估計(jì),并不精確。

但是,只要有了這個(gè)初步估計(jì)的物體位姿,我們就可以直接采用 ICP 算法(Iterative closest point)匹配物體模型與 3D 點(diǎn)云,從而得到物體在相機(jī)坐標(biāo)系下的精確位姿。

當(dāng)然,這個(gè)算法在具體實(shí)施過程中還是有很多細(xì)節(jié)的:如何建立模板、顏色梯度的表示等。另外,這種方法無法應(yīng)對物體被遮擋的情況。(當(dāng)然,通過降低匹配閾值,可以應(yīng)對部分遮擋,但是會造成誤識別)。

針對部分遮擋的情況,我們實(shí)驗(yàn)室的張博士去年對 LineMod 進(jìn)行了改進(jìn),但由于論文尚未發(fā)表,所以就先不過多涉及了。

五.深度學(xué)習(xí)

由于深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域得到了非常好的效果,我們做機(jī)器人的自然也會嘗試把 DL 用到機(jī)器人的物體識別中。

首先,對于物體識別,這個(gè)就可以照搬 DL 的研究成果了,各種 CNN 拿過來用就好了。在 2016 年的『亞馬遜抓取大賽』中,很多隊(duì)伍都采用了 DL 作為物體識別算法。

然而, 在這個(gè)比賽中,雖然很多人采用 DL 進(jìn)行物體識別,但在物體位姿估計(jì)方面都還是使用比較簡單、或者傳統(tǒng)的算法。似乎并未廣泛采用 DL。如 周博磊 所說,一般是采用 semantic segmentation network 在彩色圖像上進(jìn)行物體分割,之后,將分割出的部分點(diǎn)云與物體 3D 模型進(jìn)行 ICP 匹配。

當(dāng)然,直接用神經(jīng)網(wǎng)絡(luò)做位姿估計(jì)的工作也是有的,如這篇:

Doumanoglou, Andreas, et al. “Recovering 6d object pose and predicting next-best-view in the crowd.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

它的方法大概是這樣:對于一個(gè)物體,取很多小塊 RGB-D 數(shù)據(jù)(只關(guān)心一個(gè)patch,用局部特征可以應(yīng)對遮擋);每小塊有一個(gè)坐標(biāo)(相對于物體坐標(biāo)系);然后,首先用一個(gè)自編碼器對數(shù)據(jù)進(jìn)行降維;之后,用將降維后的特征用于訓(xùn)練Hough Forest。

六。 與任務(wù)/運(yùn)動(dòng)規(guī)劃結(jié)合

這部分也是比較有意思的研究內(nèi)容,由于機(jī)器視覺的目的是給機(jī)器人操作物體提供信息,所以,并不限于相機(jī)中的物體識別與定位,往往需要跟機(jī)器人的其他模塊相結(jié)合。

我們讓機(jī)器人從冰箱中拿一瓶『雪碧』,但是這個(gè) 『雪碧』 被『美年達(dá)』擋住了。

我們?nèi)祟惖淖龇ㄊ沁@樣的:先把 『美年達(dá)』 移開,再去取 『雪碧』 。

所以,對于機(jī)器人來說,它需要先通過視覺確定雪碧在『美年達(dá)』后面,同時(shí),還需要確定『美年達(dá)』這個(gè)東西是可以移開的,而不是冰箱門之類固定不可拿開的物體。 當(dāng)然,將視覺跟機(jī)器人結(jié)合后,會引出其他很多好玩的新東西。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31079

    瀏覽量

    222269
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    165

    文章

    4798

    瀏覽量

    126069
  • 定位技術(shù)
    +關(guān)注

    關(guān)注

    7

    文章

    315

    瀏覽量

    26428
  • 工業(yè)機(jī)器人
    +關(guān)注

    關(guān)注

    91

    文章

    3534

    瀏覽量

    98189

原文標(biāo)題:工業(yè)機(jī)器人抓取定位技術(shù)

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器視覺系統(tǒng)之工業(yè)相機(jī)解讀

    機(jī)器視覺系統(tǒng)是一種模擬人類視覺功能,通過光學(xué)裝置和非接觸式傳感器獲取圖像數(shù)據(jù),并進(jìn)行分析和處理,以實(shí)現(xiàn)對目標(biāo)物體的識別、測量、檢測和定位等功能的智能化系統(tǒng)。其目的是讓
    的頭像 發(fā)表于 02-11 17:02 ?553次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>系統(tǒng)之工業(yè)相機(jī)解讀

    機(jī)器視覺鏡頭如何發(fā)現(xiàn)深海沉船

    百年沉船、深水成像和機(jī)器視覺鏡頭的作用 機(jī)器視覺鏡頭是如何幫助解開一個(gè)世紀(jì)之謎的?1913 年,一艘名為 Henry B. Smith 的貨輪在蘇必利爾湖的一場暴風(fēng)雨中失蹤。一個(gè)世
    發(fā)表于 02-11 16:03

    機(jī)器視覺的核心技術(shù)和應(yīng)用場景

    機(jī)器視覺正通過讓機(jī)器“看見”并解讀視覺數(shù)據(jù)來為行業(yè)帶來變革,進(jìn)而提升自動(dòng)化水平、質(zhì)量控制效率與運(yùn)營效能。本文將深入探討機(jī)器
    的頭像 發(fā)表于 12-29 16:32 ?903次閱讀

    機(jī)器視覺系統(tǒng)中光照方式及應(yīng)用領(lǐng)域

    機(jī)器視覺技術(shù)的應(yīng)用中,光照方式起著至關(guān)重要的作用。不同的光照方案可以顯著提高圖像質(zhì)量,優(yōu)化缺陷檢測過程,從而提升自動(dòng)化檢測系統(tǒng)的性能。常見的光照方式包括同軸光、高角度光、低角度光和背光,本文將探討
    的頭像 發(fā)表于 12-26 17:22 ?567次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>系統(tǒng)中光照方式及應(yīng)用<b class='flag-5'>領(lǐng)域</b>

    思奧特智能CRT:深耕機(jī)器視覺光源領(lǐng)域二十載的技術(shù)匠心

    勝軍先生,在照明領(lǐng)域已經(jīng)深耕二十余年。從傳統(tǒng)的照明技術(shù)到精密的機(jī)器視覺光源,這位技術(shù)出身的創(chuàng)始人完成了一次華麗的轉(zhuǎn)型。正是這份對光學(xué)的深刻理解,讓思奧特智能在機(jī)器
    的頭像 發(fā)表于 12-25 15:12 ?238次閱讀
    思奧特智能CRT:深耕<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>光源<b class='flag-5'>領(lǐng)域</b>二十載的技術(shù)匠心

    機(jī)器視覺系統(tǒng)中光源的相關(guān)行業(yè)術(shù)語解讀

    工業(yè)光源在機(jī)器視覺系統(tǒng)中扮演著至關(guān)重要的角色,機(jī)器視覺系統(tǒng)成像過程中選擇合適的光源可提升圖像質(zhì)量與特征凸顯,應(yīng)對復(fù)雜檢測場景,提高檢測精度和效率,保證系統(tǒng)的穩(wěn)定性與可靠性。51came
    的頭像 發(fā)表于 12-16 17:30 ?566次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>系統(tǒng)中光源的相關(guān)行業(yè)術(shù)語解讀

    紅外熱成像儀為什么是機(jī)器視覺領(lǐng)域的核心競爭點(diǎn)?

    紅外熱成像技術(shù)在軍事與民用領(lǐng)域廣泛應(yīng)用,結(jié)合機(jī)器視覺發(fā)展,推動(dòng)工業(yè)檢測和無損檢測進(jìn)步,國內(nèi)技術(shù)已實(shí)現(xiàn)突破并市場化。
    的頭像 發(fā)表于 11-21 09:35 ?315次閱讀

    力傳感器在工業(yè)自動(dòng)化機(jī)器人中的應(yīng)用:精確抓取/裝配作業(yè)/搬運(yùn)作業(yè)/柔順控制

    具體應(yīng)用 精確抓取: 在自動(dòng)化生產(chǎn)線上,機(jī)器人需要精確抓取各種物品。力傳感器可以安裝在機(jī)器人的末端執(zhí)行器上,實(shí)時(shí)感知抓取
    的頭像 發(fā)表于 11-14 09:10 ?200次閱讀
    力傳感器在工業(yè)自動(dòng)化<b class='flag-5'>機(jī)器</b>人中的應(yīng)用:精確<b class='flag-5'>抓取</b>/裝配作業(yè)/搬運(yùn)作業(yè)/柔順控制

    機(jī)器視覺系統(tǒng)中工業(yè)相機(jī)的常用術(shù)語解讀

    1、機(jī)器視覺系統(tǒng)機(jī)器視覺系統(tǒng)machinevisionsystem是通過對聲波、電磁輻射等時(shí)空模式進(jìn)行探測及感知,對所獲取的圖像進(jìn)行自動(dòng)處理、分析和測量,做出定性解釋和定量分析,得到有
    的頭像 發(fā)表于 10-31 17:34 ?1227次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>系統(tǒng)中工業(yè)相機(jī)的常用術(shù)語解讀

    機(jī)器視覺系統(tǒng)工業(yè)相機(jī)的成像原理及如何選型

    機(jī)器視覺系統(tǒng)是一種模擬人類視覺功能,通過光學(xué)裝置和非接觸式傳感器獲取圖像數(shù)據(jù),并進(jìn)行分析和處理,以實(shí)現(xiàn)對目標(biāo)物體的識別、測量、檢測和定位等功能的智能化系統(tǒng)。其目的是讓
    的頭像 發(fā)表于 08-07 14:14 ?1463次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>系統(tǒng)工業(yè)相機(jī)的成像原理及如何選型

    一文帶你了解什么是機(jī)器視覺網(wǎng)卡

    千兆以太網(wǎng)或萬兆以太網(wǎng)相機(jī)產(chǎn)生的大量圖像數(shù)據(jù)流。萬兆網(wǎng)卡能提供更高的帶寬,滿足高分辨率、高幀率相機(jī)的需求。支持GigEVision協(xié)議:這是機(jī)器視覺領(lǐng)域最重要的工業(yè)
    的頭像 發(fā)表于 07-09 16:18 ?669次閱讀
    一文帶你了解什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>網(wǎng)卡

    EtherCAT科普系列(8):EtherCAT技術(shù)在機(jī)器視覺領(lǐng)域的應(yīng)用

    機(jī)器視覺是基于軟件與硬件的組合,通過光學(xué)裝置和非接觸式的傳感器自動(dòng)地接受一個(gè)真實(shí)物體的圖像,并利用軟件算法處理圖像以獲得所需信息或用于控制機(jī)器人運(yùn)動(dòng)的裝置。
    的頭像 發(fā)表于 05-15 17:09 ?1692次閱讀
    EtherCAT科普系列(8):EtherCAT技術(shù)在<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b><b class='flag-5'>領(lǐng)域</b>的應(yīng)用

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    : 一、機(jī)器視覺:從理論到實(shí)踐 第7章詳細(xì)介紹了ROS2在機(jī)器視覺領(lǐng)域的應(yīng)用,涵蓋了相機(jī)標(biāo)定、OpenCV集成、
    發(fā)表于 05-03 19:41

    富唯智能最小復(fù)合機(jī)器人的強(qiáng)大抓取實(shí)力?

    在工業(yè)自動(dòng)化領(lǐng)域,復(fù)合機(jī)器人的身影愈發(fā)常見。但你是否好奇,最小的復(fù)合機(jī)器人能抓取多少多重?富唯智能以創(chuàng)新技術(shù),給出了令人驚嘆的答案,徹底顛覆我們對小身形
    的頭像 發(fā)表于 04-16 16:31 ?671次閱讀
    富唯智能最小復(fù)合<b class='flag-5'>機(jī)器</b>人的強(qiáng)大<b class='flag-5'>抓取</b>實(shí)力?

    復(fù)合機(jī)器抓取精度的影響因素及提升策略

    復(fù)合機(jī)器人結(jié)合了移動(dòng)機(jī)器人(如AGV)和機(jī)械臂的功能,廣泛應(yīng)用于物流、制造等領(lǐng)域抓取精度是其核心性能指標(biāo)之一,直接影響作業(yè)效率和產(chǎn)品質(zhì)量。本文將探討復(fù)合
    的頭像 發(fā)表于 04-12 11:15 ?1044次閱讀