91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seeing AI幫助盲人和弱視用戶“看”世界

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)盲犬可以很好地幫助盲人或視障人士出行,但是如果想辨別出前面路口的標(biāo)識,或者想知道錢包里還有多少錢,導(dǎo)盲犬可就辦不到了。

由微軟AI研究小組開發(fā)的應(yīng)用程序Seeing AI為這個問題給出了解決方案。該應(yīng)用程序可為盲人和弱視用戶描述這個世界,使他們可以使用自己的智能手機(jī)來識別一切:包括單個物體、顏色、鈔票、文檔等。

自去年問世以來,這一應(yīng)用程序的下載量已突破15萬次,執(zhí)行任務(wù)500萬次,其中一些任務(wù)的服務(wù)對象還是全球知名的盲人。

“Stevie Wonder(美國知名藝人)每天都會用,這確實很令人振奮。”微軟高級數(shù)據(jù)科學(xué)家Anirudh Koul在3月于圣何塞舉行的GPU技術(shù)大會上發(fā)表演講時說道。

該應(yīng)用程序的現(xiàn)場演示就已展現(xiàn)出了其強(qiáng)大的功能。和Koul一同上臺的還有他的一位同事,當(dāng)他在自己的智能手機(jī)上運(yùn)行應(yīng)用程序,并將手機(jī)朝向他的同事時,應(yīng)用程序描述他看到的是“一位31歲、有著黑頭發(fā)、戴著眼鏡且看起來很開心的男士”。

如果這位同事在他的聯(lián)系人列表中,則有更佳的使用效果,因為Seeing AI可以與用戶的聯(lián)系人進(jìn)行整合,并能識別出朋友的名字。

Koul還分享了幾個令人嘆服的使用案例:一位盲人教師將運(yùn)行該應(yīng)用的手機(jī)面朝教室門口,這樣孩子們就不會因她是盲人而趁機(jī)偷偷進(jìn)出教室;另一位用戶在颶風(fēng)肆虐的地區(qū)穿行時,利用這款應(yīng)用程序避開了倒落的電線和其他障礙物。

Seeing AI的開發(fā)始于2014年2月,開發(fā)人員曾試圖創(chuàng)建一個能發(fā)現(xiàn)并識別周圍物體的卷積神經(jīng)網(wǎng)絡(luò)。但是其延遲時間達(dá)10秒,這樣的速度不能及時幫助人們快速作出決策。

第二年,微軟贊助了一場為期一周的黑客馬拉松,活動共吸引了13000人參與,并由此引發(fā)了第二次嘗試:在用戶的頭上配備手機(jī)。

在使用智能眼鏡進(jìn)行試驗后,Koul的團(tuán)隊開始著手于應(yīng)用程序本身的開發(fā)工作。網(wǎng)絡(luò)本地訓(xùn)練過程在NVIDIA GPU上進(jìn)行,而較為繁重的工作則交給了基于NVIDIA Tesla P100 GPU運(yùn)行的Azure云實例。通過逐幀分析確定每一部分訓(xùn)練的發(fā)生位置。

AI調(diào)優(yōu)

應(yīng)用程序需要辨別不同圖像,而圖像屬性具有不確定性,所以開發(fā)人員針對此特性對模型進(jìn)行了訓(xùn)練。例如,如果訓(xùn)練應(yīng)用程序識別貨幣,則需要向訓(xùn)練網(wǎng)絡(luò)內(nèi)輸入不清晰和無背景的貨幣圖片,以及貨幣某一極小部分放大后的圖片,再讓其識別出圖片的真實內(nèi)容。

該團(tuán)隊向志愿者征集,最終得到了各種類型的圖片,其中包括一張貓咪玩紙幣的圖片,以及紙幣被封在冰塊中的照片。通過這些變量對模型進(jìn)行訓(xùn)練,最終就能夠計算出識別圖片所需的最小參數(shù)。

Koul的團(tuán)隊對網(wǎng)絡(luò)進(jìn)行了調(diào)整,使其傾向于得出否定性分類或不分類的結(jié)果,而不是猜測結(jié)果(這樣可能將5元鈔票識別成10元),因為猜測很顯然會給盲人用戶造成麻煩。

隨著用戶人數(shù)的增多,這款應(yīng)用程序也將變得越好、越準(zhǔn)確。AI將會成為盲人和視障用戶的福音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18690

    瀏覽量

    186042
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301318

原文標(biāo)題:重見光明:深度學(xué)習(xí)幫助盲人“看”到世界

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機(jī)器人和生物學(xué)的全新開源 AI 技術(shù),為構(gòu)建開源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推動創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)練框架貢獻(xiàn)給 Hugging Face,讓
    的頭像 發(fā)表于 11-06 11:49 ?1062次閱讀

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    需求?傳統(tǒng)網(wǎng)絡(luò)會因流量激增而擁堵,而AI賦能的6G網(wǎng)絡(luò)則能提前預(yù)測流量模式,動態(tài)調(diào)整資源分配。 AI算法能夠?qū)崟r分析海量數(shù)據(jù),包括用戶位置、網(wǎng)絡(luò)負(fù)載、歷史流量模式等。在2025年上海世界
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    和關(guān)聯(lián)性 AI驅(qū)動科學(xué):研究和模擬人類思維和認(rèn)識過程。 本章節(jié)作者為我們講解了第五范式,介紹了科學(xué)發(fā)現(xiàn)的一般方法和流程等。一、科學(xué)發(fā)現(xiàn)的5個范式 第一范式:產(chǎn)生于公元1000年左右的阿拉伯世界和歐洲
    發(fā)表于 09-17 11:45

    如何利用數(shù)據(jù)+AI重塑業(yè)務(wù)流程

    在瞬息萬變的商業(yè)世界里,企業(yè)一直在通過業(yè)務(wù)流程再造尋找提升競爭力的突破口。從ERP熱潮,到數(shù)字技術(shù)的全面開花,每一次技術(shù)浪潮都推動著企業(yè)優(yōu)化流程、提升效率。如今,站在AI和數(shù)據(jù)驅(qū)動的時代,企業(yè)應(yīng)該思考的不是AI能不能取代人,而是
    的頭像 發(fā)表于 09-04 14:37 ?935次閱讀

    聲智科技聲學(xué)模型賦予AI感知物理世界

    在科技浪潮的尖端,一個新時代正悄然開啟。NVIDIA創(chuàng)始人黃仁勛曾預(yù)言,未來通用人工智能(AGI)將不再局限于虛擬世界,而是能夠與物理世界深度交互的“物理AI”。圖靈獎得主楊立昆和計算機(jī)科學(xué)家李飛飛
    的頭像 發(fā)表于 09-02 17:46 ?1428次閱讀

    2025 KiCon Asia KiCad 用戶大會

    設(shè)計的開發(fā)者、用戶和倡導(dǎo)者。KiCad 組織的主要重點是開發(fā)世界領(lǐng)先的開源軟件,使每個人都能學(xué)習(xí)、設(shè)計和構(gòu)建推動未來世界的電路。我們倡導(dǎo)開放標(biāo)準(zhǔn),允許跨協(xié)作、降低成本和提高成果。KiCon 是一個由
    發(fā)表于 07-23 15:33

    AI智能體對電子企業(yè)的幫助是什么

    對企業(yè)的具體幫助,并聚焦于萬達(dá)寶LAIDFU(來福)這一創(chuàng)新產(chǎn)品,展示其如何通過自定義應(yīng)用場景,輕松觸及傳統(tǒng)數(shù)據(jù)難以覆蓋的領(lǐng)域。一、AI智能體:企業(yè)轉(zhuǎn)型升級的催化劑
    的頭像 發(fā)表于 05-21 10:08 ?656次閱讀
    <b class='flag-5'>AI</b>智能體對電子企業(yè)的<b class='flag-5'>幫助</b>是什么

    機(jī)器人和自動化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自西南交通大學(xué)黃雯珂的投稿。3機(jī)器人與自動化的未來展望隨著機(jī)器人和自動化技術(shù)的不斷進(jìn)步,未來的世界將會是一個高度自動化的世界。智能工廠、智慧家庭
    的頭像 發(fā)表于 04-26 08:33 ?817次閱讀
    機(jī)器<b class='flag-5'>人和</b>自動化的未來(2)

    NVIDIA Cosmos加速機(jī)器人和自動駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?1258次閱讀
    NVIDIA Cosmos加速機(jī)器<b class='flag-5'>人和</b>自動駕駛汽車物理<b class='flag-5'>AI</b>發(fā)展

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體化體驗領(lǐng)航計劃”。更值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件2.0,以及升級的天璣星速引擎與旗艦芯片天璣9400+,標(biāo)志著聯(lián)發(fā)
    發(fā)表于 04-13 19:52

    英偉達(dá)GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    新模型可實現(xiàn)物理 AI 的預(yù)測、可控世界生成和推理。 兩款全新Blueprint為機(jī)器人和自動駕駛汽車后訓(xùn)練提供海量物理 AI 合成數(shù)據(jù)生成技術(shù)。 1X、Agility Robotic
    的頭像 發(fā)表于 03-20 19:01 ?1333次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強(qiáng)大支持。這款全新的計算平臺旨在滿足開發(fā)者和企業(yè)用戶對高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計算
    發(fā)表于 03-19 17:54

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過詳細(xì)的工具介紹和實戰(zhàn)案例,幫助讀者快速掌握
    發(fā)表于 03-18 12:03

    中興通訊亮相2025年世界移動通信大會

    近日,中興通訊攜全隊列多形態(tài)AI終端亮相世界移動通信大會(MWC25巴塞羅那),為全球用戶帶來全場景AI體驗。
    的頭像 發(fā)表于 03-10 10:12 ?1355次閱讀

    AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應(yīng)用與項目實戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)。通?;谏疃?/div>
    發(fā)表于 03-05 19:52