91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習下的AI落地 計算機視覺是否一條好賽道

張康康 ? 2018-12-21 14:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺是目前AI在中國落地最順利的技術。從目前的落地進展來看,移動互聯(lián)網(wǎng)、安防、零售、物流、醫(yī)療、文娛、無人駕駛的商業(yè)化有待成熟。以曠視科技Face++、商湯科技、極鏈科技Video++為代表的AI頭部企業(yè)戰(zhàn)略出現(xiàn)向平臺企業(yè)或軟硬一體化企業(yè)發(fā)展的分化趨勢及零售等新領域快速崛起。

計算機視覺在中國AI市場組成部分占比巨大。根據(jù)中國信通院2018年2月發(fā)布的報告數(shù)據(jù),2017年,中國人工智能市場中計算機視覺占比37%,以80億元的行業(yè)收入排名第一。2018年信通院11月發(fā)布的《2018人工智能發(fā)展白皮書——技術篇》中以深度學習算法驅(qū)動的人工智能技術為主,數(shù)據(jù)顯示,在全球人工智能產(chǎn)業(yè)蓬勃發(fā)展的今天,人工智能技術以機器學習,特別是深度學習為核心,在視覺、語音、自然語言等應用領域迅速發(fā)展,已經(jīng)開始滲入到各個行業(yè)。BBC預測,2020年全球人工智能市場規(guī)模約183億美元,年均增長20%。在人工智能產(chǎn)業(yè)應用上,從融資規(guī)模和市場結構來看,中國AI企業(yè)更集中于視覺和語音方向。



目前,深度學習幾乎成了計算機視覺領域的標配,也是當下人工智能領域最熱門的研究方向。計算機視覺的應用場景和深度學習背后的技術原理是什么呢?

深度學習背后的技術原理

機器學習

機器學習的本質(zhì)其實是為了找到一個函數(shù),讓這個函數(shù)在不同的領域會發(fā)揮不同的作用。像語音識別領域,這個函數(shù)會把一段語音識別成一段文字;圖像識別的領域,這個函數(shù)會把一個圖像映射到一個分類;下圍棋的時候根據(jù)棋局和規(guī)則進行博弈;對話,是根據(jù)當前的對話生成下一段對話。機器學習離不開學習兩個字,根據(jù)不同的學習方式,可以分為監(jiān)督學習和非監(jiān)督學習兩種方式。

監(jiān)督學習中,算法和數(shù)據(jù)是模型的核心所在。在監(jiān)督學習中最關鍵的一點是,我們對訓練的每個數(shù)據(jù)都要打上標簽,然后通過把這些訓練數(shù)據(jù)輸入到算法模型經(jīng)過反復訓練以后,每經(jīng)過一次訓練都會減少算法模型的預計輸出和標簽數(shù)據(jù)的差距。


通過大量的訓練,算法模型基本上穩(wěn)定下來以后,我們就可以把這個模型在測試數(shù)據(jù)集上驗證模型的準確性。這就是整個監(jiān)督學習的過程,監(jiān)督學習目前在圖片分類上應用得比較多。

非監(jiān)督學習里跟監(jiān)督學習不同的地方是,非監(jiān)督學習不需要為所有的訓練數(shù)據(jù)都打上標簽。非監(jiān)督學習主要應用在兩個大類,第一類是做聚類分析,聚類分析是把一組看似無序的數(shù)據(jù)進行分類分組,以達到能夠更加更好理解的目的。


另外是做自動編碼器,在數(shù)據(jù)分析的時候,原始數(shù)據(jù)量往往比較大,除了包含一些冗余的數(shù)據(jù),還會包含一些對分析結果不重要的數(shù)據(jù)。自動編碼器主要是對原始數(shù)據(jù)做降維操作,把冗余的數(shù)據(jù)去掉,提高后面數(shù)據(jù)分析的效率。

通過不同的學習方式獲取到數(shù)據(jù)后,算法是接下來非常重要的一環(huán)。算法之于計算機就像大腦對于我們?nèi)祟悾x擇一個好的算法也是特別重要的。

神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡是受人腦神經(jīng)元結構的啟發(fā),研究者認為人腦所有的神經(jīng)元都是分層的,可以通過不同的層次學習不一樣的特征,由簡單到復雜地模擬出各種特征。


上圖是計算機應用數(shù)學的方式來模擬人腦中神經(jīng)元的示意圖。a1到ak是信號的輸入,神經(jīng)元會對輸入信號進行兩次變換。第一部分是線性變換,因為神經(jīng)元會對自己感興趣的信號加一個權重;第二部分是非線性變換。

神經(jīng)網(wǎng)絡就是由許多的神經(jīng)元級聯(lián)而形成的,每一個神經(jīng)元都經(jīng)過線性變換和非線性變換,為什么會有非線性變換?從數(shù)學上看,沒有非線性變換,不管你神經(jīng)網(wǎng)絡層次有多深都等價于一個神經(jīng)元。如果沒有非線性變換,神經(jīng)網(wǎng)絡深度的概念就沒有什么意義了。

卷積神經(jīng)網(wǎng)絡


以上所講的都是一般的全連接神經(jīng)網(wǎng)絡,接下來進入卷積神經(jīng)網(wǎng)絡。卷積神經(jīng)網(wǎng)絡是專門針對圖片處理方面的神經(jīng)網(wǎng)絡。卷積神經(jīng)網(wǎng)絡首先會輸入一張圖片,這張圖片有三個顏色通道的數(shù)據(jù),這是輸入層。下面是卷積層,有一個卷積核的概念,每一個卷積核提取圖片的不同特征。

提取出來以后到池化層,就是把卷積層的數(shù)據(jù)規(guī)??s小,減少數(shù)據(jù)的復雜度。卷積和池化連起來我們叫做一個隱層,一個卷積神經(jīng)網(wǎng)絡會包含很多個隱層,隱層之后是全連接層,全連接層的目的是把前面經(jīng)過多個卷積池化層的特征把數(shù)據(jù)平鋪開,形成特征向量,我們把特征向量輸入到分類器,對圖片進行分類。

簡單來說,卷積神經(jīng)網(wǎng)絡更適合計算機視覺主要有兩個原因,一是參數(shù)共享,另外一個是稀疏連接。

2015年基于深度學習的計算機視覺算法在ImageNet數(shù)據(jù)庫上的識別準確率首次超過人類,同年Google在開源自己的深度學習算法。這些帶動中美兩國的科學家把計算機視覺算法運用到安防、金融、互聯(lián)網(wǎng)、物流、零售、醫(yī)療、文娛、制造業(yè)等不同垂直行業(yè)。但在實際的運用當中,由于數(shù)據(jù)可得性、算法成熟度、服務的容錯率等因素的影響,落地的速度開始出現(xiàn)分化。其中,移動互聯(lián)網(wǎng)、安防、醫(yī)療、無人駕駛等發(fā)展較慢。

技術發(fā)展趨勢:

提高預測精度,降低數(shù)據(jù)標注成本隨著技術的不斷發(fā)展,計算機視覺能夠識別信息的種類從最初的文字信息,到人臉,人的體態(tài)識別,以及各種不同的物體。

能夠識別的精度也從最初的人1:1比對,到用于門禁系統(tǒng)等1:N比對,以及用在黑名單監(jiān)控等場景的M:N動態(tài)監(jiān)控。除了提高算法精度以外,提高數(shù)據(jù)標注的效率也是計算機視覺公司重要的課題之一。

企業(yè)發(fā)展戰(zhàn)略開始分化,商湯向左,曠視向右計算機視覺技術在中國的快速落地,吸引了以曠視科技Face++、商湯科技、極鏈科技Video++為代表的以算法為核心競爭力的AI初創(chuàng)公司,擁有強大數(shù)據(jù)采集及軟件開發(fā)能力的互聯(lián)網(wǎng)公司,以及華為這樣的科技巨頭。經(jīng)過一年多的發(fā)展,各個公司都已經(jīng)根據(jù)自己資源的不同,戰(zhàn)略出現(xiàn)了分化。

各類公司初始時在產(chǎn)業(yè)環(huán)節(jié)中各有偏好,初創(chuàng)企業(yè)在算法與模型訓練上占優(yōu),互聯(lián)網(wǎng)企業(yè)則擁有天然的數(shù)據(jù)優(yōu)勢,安防企業(yè)則憑借極強的工程能力加速安防項目落地。AI頭部初創(chuàng)企業(yè)近年來融資動作頻繁,受到資本市場的青睞,在資金方面暫無瓶頸,然而面臨互聯(lián)網(wǎng)巨頭的挑戰(zhàn),各大初創(chuàng)企業(yè)應依托已有的獨立設計算法的能力,構建平臺型解決方案,在研發(fā)能力與方案落地速度上取勝。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40642

    瀏覽量

    302298
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47695
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    傳音相關研究成果入選計算機視覺頂會CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,簡稱MBZUAI)聯(lián)合開展的“拍照解題”項目研究取得重要進展,相關成果論文已被計算機視覺領域的國際頂級學術會議CVPR 2026正式錄用。
    的頭像 發(fā)表于 04-03 17:45 ?2780次閱讀
    傳音相關研究成果入選<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>頂會CVPR 2026

    GPU不是AI的唯解:英偉達用Groq LPU證明,推理賽道需要“另一條腿”

    大會上,英偉達CEO黃仁勛正式發(fā)布了Vera Rubin AI超級計算機平臺。這平臺的問世,不僅標志著英偉達戰(zhàn)略從單的GPU主導轉向涵蓋CPU、GPU與LPU等技術的全?!?/div>
    的頭像 發(fā)表于 03-24 11:27 ?5551次閱讀
    GPU不是<b class='flag-5'>AI</b>的唯<b class='flag-5'>一</b>解:英偉達用Groq LPU證明,推理<b class='flag-5'>賽道</b>需要“另<b class='flag-5'>一條</b>腿”

    上海計算機視覺企業(yè)行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(簡稱“青工委”)、上海市計算機學會計算機視覺專委會(簡稱“專委會”)聯(lián)合主辦,上海西井科
    的頭像 發(fā)表于 12-16 15:39 ?686次閱讀

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    累計5000+分鐘內(nèi)容 二、課程優(yōu)勢 技術壁壘構建: 形成\"視覺算法+運動控制+深度學習\"的復合技術棧,建立差異化競爭優(yōu)勢 項目落地能力: 掌握從需求分析→方案設計→硬件選型
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    累計5000+分鐘內(nèi)容 二、課程優(yōu)勢 技術壁壘構建: 形成\"視覺算法+運動控制+深度學習\"的復合技術棧,建立差異化競爭優(yōu)勢 項目落地能力: 掌握從需求分析→方案設計→硬件選型
    發(fā)表于 12-03 13:50

    使用代理式AI激活傳統(tǒng)計算機視覺系統(tǒng)的三種方法

    當前的計算機視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?730次閱讀

    國內(nèi)首!量子計算機生產(chǎn)線落地深圳

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,中國首個規(guī)?;瘜S霉饬孔?b class='flag-5'>計算機制造工廠在深圳南山智城正式啟用,我國量子計算產(chǎn)業(yè)迎來了歷史性時刻——這不僅是國內(nèi)首個光量子計算機規(guī)?;圃旎氐恼Q生,更標志著中國在
    的頭像 發(fā)表于 11-28 08:21 ?8094次閱讀

    文了解ai計算盒子(邊緣計算盒子)是到底是什么產(chǎn)品?

    和生產(chǎn)的各個場景。很多人對這款設備感到陌生,今天就帶大家全面解鎖ai邊緣計算盒子的核心奧秘。ai邊緣計算盒子是高度集成計算機
    的頭像 發(fā)表于 11-10 14:48 ?1041次閱讀
    <b class='flag-5'>一</b>文了解<b class='flag-5'>ai</b><b class='flag-5'>計算</b>盒子(邊緣<b class='flag-5'>計算</b>盒子)是到底是什么產(chǎn)品?

    蔚來出席CNCC 2025中國計算機大會技術論壇

    2025年10月23日,CNCC 2025中國計算機大會技術論壇「AI落地應用的主戰(zhàn)場——智能電動汽車」在哈爾濱成功舉行。論壇聚焦計算機技術與汽車產(chǎn)業(yè)的
    的頭像 發(fā)表于 10-27 15:47 ?723次閱讀

    NVIDIA DGX Spark桌面AI計算機開啟預訂

    DGX Spark 現(xiàn)已開啟預訂!麗臺科技作為 NVIDIA 授權分銷商,提供從產(chǎn)品到服務的站式解決方案,助力輕松部署桌面 AI 計算機。
    的頭像 發(fā)表于 09-23 17:20 ?1463次閱讀
    NVIDIA DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>計算機</b>開啟預訂

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度學習并非只屬于計算機
    的頭像 發(fā)表于 09-10 17:38 ?996次閱讀
    如何在機器<b class='flag-5'>視覺</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經(jīng)網(wǎng)絡

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠
    的頭像 發(fā)表于 07-21 16:44 ?717次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機種專為工廠和工業(yè)環(huán)境設計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應對惡劣環(huán)境的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?865次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構限制,難以高效處理AI任務中的大規(guī)模并行計算需求。因此,專為AI優(yōu)
    的頭像 發(fā)表于 07-09 15:59 ?1854次閱讀

    文帶你了解工業(yè)計算機尺寸

    項艱巨的任務。本博客將指導您了解關鍵的工業(yè)計算機尺寸、使用案例。關鍵工業(yè)計算機外形要素及其使用案例、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米
    的頭像 發(fā)表于 04-24 13:35 ?1157次閱讀
    <b class='flag-5'>一</b>文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸