91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能實現(xiàn)觸覺和視覺的信息交互

Hf1h_BigDataDig ? 來源:YXQ ? 2019-07-19 11:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在加拿大作家瑪格麗特?阿特伍德的著作《盲人殺手》中有這樣一段描述:“觸覺,先于視覺也先于語言,既是第一語言也是最后的語言,并總是訴說真相?!?/p>

被編寫為視覺或者觸覺的機器人一般不能實現(xiàn)此兩種感官信息的交互。為打破這種隔絕,來自MIT(麻省理工學(xué)院)CSAIL(計算機科學(xué)與人工智能實驗室)的研究團(tuán)隊提出了一種可預(yù)測AI,它可以通過觸覺信息的訓(xùn)練學(xué)習(xí)到視覺特征,反之亦然,也能通過視覺信息的訓(xùn)練學(xué)習(xí)到物體的觸覺特征。

該團(tuán)隊所提出的模型可以從視覺信號中“創(chuàng)造”出逼真的觸覺信號,并直接利用觸覺信息預(yù)測所檢測目標(biāo)及觸摸部位。他們使用的庫卡機械臂上裝有一個特殊的觸覺傳感器GelSight,這是由MIT的另一研究團(tuán)隊設(shè)計的。

該團(tuán)隊利用一個簡單的網(wǎng)絡(luò)攝像頭采集了近200種物體圖像,包括工具、家庭用品、紡織物等,這些物體被“觸摸”超過12000次。通過將這12000個小視頻分解為靜態(tài)幀從而生成了名為“VisGel”的數(shù)據(jù)集,該數(shù)據(jù)集包含300多萬個視覺-觸覺對應(yīng)的圖像。

CSALL博士生Yunzhu Li在其一篇相關(guān)論文中談到:“通過觀察觸摸情景,我們的模型可以“想象”出觸摸平坦表面或者尖銳邊緣的感覺”,“當(dāng)機器人只有觸覺感官的時候,此模型可以僅憑觸覺信號來完成和周圍環(huán)境的交互。將觸覺和視覺這兩種感官結(jié)合在一起無疑是錦上添花。它還可能減少機器人為完成抓取任務(wù)所需的數(shù)據(jù)集”。

目前使能機器人具備更多感官能力的研究,比如MIT在2016年的項目:利用深度學(xué)習(xí)實現(xiàn)聲音可視化、預(yù)測物體對外力反應(yīng),都使用了大量的訓(xùn)練數(shù)據(jù),但不能實現(xiàn)視覺和觸覺的交互。該團(tuán)隊使用VisGel數(shù)據(jù)集和生成式對抗網(wǎng)絡(luò)(GANs)實現(xiàn)上述功能。

此GANs算法利用視覺或觸覺的圖像生成其他形式的圖像。其原理簡而言之,就是GANs利用生成器(generator)捏造假的圖像試圖騙過判別器(discriminator),判別器將辨別結(jié)果反饋給生成器以調(diào)參,以使得生成器生成更高質(zhì)量的預(yù)期圖像,如此相得益彰。

所見即所觸

人可以通過觀察物體來判斷其手感,欲將這種能力賦予機器人,首先要標(biāo)定目標(biāo)位置,其次要推斷目標(biāo)區(qū)域的形狀和手感。

為此,需要一張參考圖像,它記錄了機器人沒有與外界交互時的所處的環(huán)境信息。模型在識別過程中會對比當(dāng)前捕捉到的幀圖像和參考圖像以輕松判斷所觸物體的位置和大小。

好比給模型“看”了一張鼠標(biāo)的圖像,模型將預(yù)測可能觸碰到鼠標(biāo)的區(qū)域,并告訴機器人從而使其實現(xiàn)安全高效的抓取任務(wù)。

所觸即所見

利用觸覺數(shù)據(jù)產(chǎn)生視覺圖像即所謂“所觸即所見”。模型通過觀察觸覺圖像推斷所接觸位置的物體形狀和材質(zhì),并和參考圖像對比進(jìn)而“想象”出交互過程。

舉個例子,將一只鞋的觸覺數(shù)據(jù)傳給模型,其輸出將是一張圖像,這張圖像則顯示了最有可能觸摸到這只鞋的區(qū)域位置。

當(dāng)燈被關(guān)掉,或者盲人進(jìn)入未知區(qū)域的時候,這種技能就可以發(fā)揮其作用了。

展望

目前的訓(xùn)練數(shù)據(jù)只能實現(xiàn)特定環(huán)境下的交互。該團(tuán)隊希望收集更復(fù)雜環(huán)境下的訓(xùn)練數(shù)據(jù)以提升模型的泛化性能。MIT的新設(shè)計——tactile glove或許可以幫助他們獲取更多更密集的訓(xùn)練數(shù)據(jù)。

翹首以盼,此類模型將協(xié)助機器人和其視覺緊密合作以實現(xiàn)無縫的人機交互。這些合作包括對象識別、抓取、場景理解等。

加州大學(xué)伯克利分校的博士后Andrew Owens說:“這是首次提出的視覺和觸覺信號可靠的轉(zhuǎn)換方法,此類方法于機器人而言將大有裨益,彼時,它們就可以回答諸如‘這東西的硬度如何?’,‘如果我用手柄握住馬克杯,我會握得多好?’的問題,這是一個十分有挑戰(zhàn)性的項目,因為問題的信號是如此的不同,其優(yōu)越性也可見一斑”。

李和MIT的教授Russ Tedrake 、 Antonio Torralba,博士后Jun-Yan Zhu共同完成這篇論文。它將于下周在加利福尼亞長沙灘上舉辦的計算機視覺及模式識別大會上發(fā)布。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265402
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    254

    瀏覽量

    25000

原文標(biāo)題:所見即所觸,教AI實現(xiàn)觸覺和視覺的信息交互

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?123次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    開發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能
    發(fā)表于 02-07 11:44

    人形機器人傳感器產(chǎn)業(yè)鏈最新分析:力、觸覺、IMU、視覺傳感器為主流?。ㄈ妫?/a>

    人工智能與機器人技術(shù)飛速發(fā)展的浪潮中,人形機器人正從科幻概念逐步走向現(xiàn)實應(yīng)用,成為全球科技競爭的新焦點。而傳感器作為人形機器人的“感官”,是其實現(xiàn)智能交互與復(fù)雜任務(wù)執(zhí)行的關(guān)鍵硬件基礎(chǔ)
    的頭像 發(fā)表于 10-11 18:38 ?12.3w次閱讀
    人形機器人傳感器產(chǎn)業(yè)鏈最新分析:力、<b class='flag-5'>觸覺</b>、IMU、<b class='flag-5'>視覺</b>傳感器為主流?。ㄈ妫? />    </a>
</div>                              <div   id=

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    TDK收購SoftEye,打造智能眼鏡系統(tǒng)實現(xiàn)通過眼球運動與人工智能進(jìn)行交互

    ·TDK收購了人工智能/智能眼鏡應(yīng)用領(lǐng)域的領(lǐng)先技術(shù)推動者SoftEye,lnc ? ·通過此次收購,TDK將能夠以更快的速度交付完整的智能眼鏡系統(tǒng),并打造全新的人機界面,實現(xiàn)通過眼球運
    的頭像 發(fā)表于 06-25 15:12 ?9761次閱讀

    普強信息入選2025人工智能感知層創(chuàng)新榜單

    近日,由中國科學(xué)院主管、科學(xué)出版社主辦的商業(yè)期刊《互聯(lián)網(wǎng)周刊》(CIW)聯(lián)合德本咨詢(DBC)、中國社會科學(xué)院信息化研究中心(CIS)評選的“2025人工智能感知層創(chuàng)新排行”榜單揭曉發(fā)布。普強作為國內(nèi)人工智能、語音
    的頭像 發(fā)表于 05-10 10:45 ?1035次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應(yīng)/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55

    維視智造助力高校人工智能和機器視覺課程落地

    人工智能浪潮下,機器視覺成為未來產(chǎn)業(yè)升級的重點技術(shù),對培養(yǎng)新型創(chuàng)新人才意義重大。
    的頭像 發(fā)表于 04-19 15:37 ?1376次閱讀

    支持實時物體識別的視覺人工智能微處理器RZ/V2MA數(shù)據(jù)手冊

    。此外,利用了 DRP技術(shù)高靈活性特點的 OpenCV 加速器,除了可進(jìn)行人工智能推理的圖像預(yù)處理之外,還能在單芯片上實現(xiàn)人工智能范疇之外的高速圖像處理。 *附件:支持實時物體識別的視覺
    的頭像 發(fā)表于 03-18 18:12 ?920次閱讀
    支持實時物體識別的<b class='flag-5'>視覺</b><b class='flag-5'>人工智能</b>微處理器RZ/V2MA數(shù)據(jù)手冊

    ?多模態(tài)交互技術(shù)解析

    多模態(tài)交互 多模態(tài)交互( Multimodal Interaction )是指通過多種感官通道(如視覺、聽覺、觸覺等)或多種交互方式(如語音
    的頭像 發(fā)表于 03-17 15:12 ?4404次閱讀

    人工智能視覺識別技術(shù)的應(yīng)用領(lǐng)域及場景

    人工智能視覺識別技術(shù)的應(yīng)用領(lǐng)域及場景
    的頭像 發(fā)表于 03-14 11:41 ?2973次閱讀