91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AIoT下的多模態(tài)演變之路 垂直領域競爭激烈

MZjJ_DIGITIMES ? 來源:cg ? 2019-01-05 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018年人工智能AI)行業(yè)成為了最受關注的熱點之一,不同場景的AI芯片層出不窮,成為了智能時代的“入場券”,大多數(shù)業(yè)者稱“得芯者得天下”,將2018年定義為“芯片元年”。

語音垂直應用領域,“造芯”似已成為云知聲、出門問問、Rokid 、思必馳、科大訊飛從算法出發(fā)“軟硬兼施”一條必走之途,但也顯得語音AI市場變得異常競爭激烈。

在此背景下,2018年5月,云知聲推出首款物聯(lián)網(wǎng)AI芯片——雨燕(Swift),通過“唯快不破”的發(fā)展思路,很快在語音識別風口中和科大訊飛比肩,并完成C輪1億美元的融資躋身國內眾多AI獨角獸榜單中的一員。

而在2019年開年之際,云知聲繼續(xù)搶跑,于1月2日召開了“2019云知聲多模態(tài)AI芯片戰(zhàn)略發(fā)布會”,會上正式公布了其多模態(tài)AI技術,以及正在研發(fā)中的多款定位不同場景的AI芯片,包括實用性更廣的超輕量級物聯(lián)網(wǎng)語音芯片雨燕(Lite)、可面向智慧城市場景提供對語音和圖像等多模態(tài)計算支持的海豚(Dolphin),以及面向智慧出行場景的車規(guī)級芯片雪豹(Leopard)。以上三款芯片計劃于2019年啟動量產(chǎn)。

AIoT下的多模態(tài)演變之路

云知聲創(chuàng)始人兼CEO黃偉認為,5G與人工智能的結合將真正促使萬物智聯(lián)(AIoT)的落地與實現(xiàn)。可以預見的是,未來巨量的多維數(shù)據(jù)(如語音、圖像、視頻等)集中處理與邊緣式分布計算的需求,勢必將進一步挑戰(zhàn)AI底層支持硬件——芯片的計算能力。

與此同時,AI應用對于端云互動有著強需求。強大的云會讓端能力更強,而強大的端則可提升數(shù)據(jù)處理的實時性和有效性,進而增強云的能力。二者需要緊密結合,這要求對芯片設計和云端架構進行統(tǒng)一考量。傳統(tǒng)的通用方案架構由于在高實時性、高智能化場景中的算力有限,且無法平衡好成本、功耗、安全性等諸多現(xiàn)實需求,因此具備多維度AI數(shù)據(jù)集中處理能力的多模態(tài)AI芯片將成必由之路。

為實現(xiàn)多模態(tài)AI芯片的戰(zhàn)略落地,目前云知聲已在加速技術布局,并在機器視覺方面取得飛速進展。其中,面向機器視覺的輕量級圖像信號處理器已可實現(xiàn)在不依賴外部內存的情況下,在30 fps的速率下實時對傳感器的圖片進行預處理,以進一步提高后續(xù)機器視覺處理模塊的處理速度和效果。借助基于人臉信息分析的多模態(tài)技術,已可實現(xiàn)人臉/物體識別、表情分析、標簽化、唇動狀態(tài)跟蹤等功能,可為產(chǎn)品交互和用戶體驗提供更多的可玩性和靈活性。

此外,云知聲發(fā)布多模態(tài)人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多種推理網(wǎng)絡,支持可重構計算與Winograd處理,最高可配置算力達4T。目前云知聲DeepNet2.0已在FPGA上得到驗證,將在2019年落地的全新多模態(tài)AI芯片海豚(Dolphin)上落地。

直面思必馳、科大訊飛垂直領域競爭

語音識別與語義分析,這是人們比較能理解的人工智能應用領域。雖然在這條起跑線上,云知聲后來追上,但不難發(fā)現(xiàn),與其業(yè)務重合度較高的莫過于思必馳和科大訊飛兩家公司。

梳理之下可以看出,在產(chǎn)品線競爭上,云知聲圍繞智能家居、智能車載、機器人、智慧醫(yī)療和智慧教育等的五大領域四面受敵。

云知聲產(chǎn)品線中的智能家居方案、智能車載方案和機器人方案,直面與思必馳構成業(yè)務重疊,競爭態(tài)勢強烈。據(jù)思必馳CMO龍夢竹曾介紹,思必馳車載語音在智能車載后裝市場占據(jù)約60%的份額,在智能后視鏡領域約為70%,HUD領域已高達80%。

在智慧醫(yī)療與智慧教育領域里,科大訊飛仍是擺在眼前的不小阻力。除了雙方均大力布局將語音轉成結構化電子病歷系統(tǒng)與智能口語評測外,科大訊飛還在醫(yī)學影像輔助診斷和基于認知計算的輔助診療系統(tǒng)方面有所布局,并且根據(jù)科大訊飛2017年財報表示,其智慧教育產(chǎn)品已經(jīng)覆蓋全國15000余所學校,深度用戶超過1500萬,占總主營業(yè)務收入的25.54%。

因此,對于云知聲而言,面對行業(yè)里既有科大訊飛這樣的“老大”,又有不斷加碼人工智能投入的BAT等巨頭,由應用場景來定義AI芯片的研發(fā)與產(chǎn)品形態(tài)無疑是其獨立發(fā)展的最佳路徑。

以語音病歷系統(tǒng)為例。醫(yī)生在說話時,能輕松地與電腦、iPad、移動查房設備等建立聯(lián)系;說話的內容會被轉錄成文字并顯示在醫(yī)院專門的HIS、PACS、CIS等系統(tǒng)中。但是在醫(yī)療這個專業(yè)性非常強的領域,常規(guī)語音識別系統(tǒng)并不能完美勝任。

為此,云知聲針對醫(yī)院不同科室的業(yè)務進行了梳理,整理了超過30GB的醫(yī)療文本資料,并對這些資料進行分類、檢索等處理,使得定制語音模型覆蓋各個科室常用病癥、藥品名稱、操作步驟等關鍵信息,使語音識別準確率超過95%。同時,針對醫(yī)生的口音問題,云知聲提出了無監(jiān)督自適應技術,提高對醫(yī)生口語的識別率。

所以,在這一輪人工智能風潮的到來,最重要的是芯片定位。云知聲的做法是,針對細分客戶的需求做極致化服務,從算法公司的角度出發(fā)做芯片,軟硬結合打造出一個好用的芯片,欲成為語音交互佼佼者,同時希望推出語音AI芯片打造生態(tài),從而實現(xiàn)價值的提升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音交互
    +關注

    關注

    3

    文章

    352

    瀏覽量

    29177
  • AI芯片
    +關注

    關注

    17

    文章

    2133

    瀏覽量

    36806

原文標題:“聲”勢驚人 AI語音交互芯片 啟動新一輪垂直領域戰(zhàn)場

文章出處:【微信號:DIGITIMES,微信公眾號:DIGITIMES】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模態(tài)感知大模型驅動的密閉空間自主勘探系統(tǒng)的應用與未來發(fā)展

    ? ? 模態(tài)感知大模型驅動的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝模態(tài)感知大模型驅動的密閉空間自主勘探系統(tǒng),是融合
    的頭像 發(fā)表于 12-29 11:27 ?315次閱讀

    模態(tài)大模型驅動的復雜環(huán)境精準導航避障系統(tǒng)平臺的應用

    模態(tài)大模型驅動的復雜環(huán)境精準導航避障系統(tǒng)平臺的應用
    的頭像 發(fā)表于 12-22 13:15 ?301次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型驅動的復雜環(huán)境精準導航避障系統(tǒng)平臺的應用

    商湯科技正式發(fā)布并開源全新模態(tài)模型架構NEO

    商湯科技正式發(fā)布并開源了與南洋理工大學S-Lab合作研發(fā)的全新模態(tài)模型架構 —— NEO,為日日新SenseNova 模態(tài)模型奠定了新一代架構的基石。
    的頭像 發(fā)表于 12-08 11:19 ?1042次閱讀
    商湯科技正式發(fā)布并開源全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>模型架構NEO

    格靈深瞳模態(tài)大模型Glint-ME讓圖文互搜更精準

    在電商、安防等場景,圖文互搜應用廣泛。隨著以CLIP為代表的模態(tài)表征方法相繼提出,過去單一模態(tài)搜索(文搜文、圖搜圖)被突破,模型可以同時理解文本、圖像、音頻乃至視頻,實現(xiàn)跨
    的頭像 發(fā)表于 11-02 15:56 ?1728次閱讀
    格靈深瞳<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型Glint-ME讓圖文互搜更精準

    亞馬遜云科技上線Amazon Nova模態(tài)嵌入模型

    Embeddings模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線,這是一款專為Agentic RAG與語義搜索應用打造的頂尖模態(tài)嵌入模型。該模型是首個通過單一模型支持文本、
    的頭像 發(fā)表于 10-29 17:15 ?280次閱讀
    亞馬遜云科技上線Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>嵌入模型

    米爾RK3576部署端側模態(tài)輪對話,6TOPS算力驅動30億參數(shù)LLM

    開源模態(tài)模型的快速移植,形成 “芯片 - 工具鏈 - 模型” 的協(xié)同生態(tài)。 當 RK3576 證明 “端側能跑好轉好多模態(tài)對話” 時,邊緣 AI 的競爭已從 “能否實現(xiàn)” 轉向 “
    發(fā)表于 09-05 17:25

    淺析模態(tài)標注對大模型應用落地的重要性與標注實例

    ?在人工智能邁向AGI通用智能的關鍵道路上,大模型正從單一的文本理解者,演進為能同時看、聽、讀、想的“多面手”。驅動這一進化的核心燃料,正是高質量的模態(tài)數(shù)據(jù),而將原始數(shù)據(jù)轉化為“機器可讀教材
    的頭像 發(fā)表于 09-05 13:49 ?2402次閱讀

    基于米爾瑞芯微RK3576開發(fā)板的Qwen2-VL-3B模型NPU模態(tài)部署評測

    AIoT 旗艦 瑞芯微 NPU SDK:RKNN 和 RKLLM 二、環(huán)境準備 步驟 1:登錄開發(fā)板,下載必備資料 步驟 2:替換 NPU Driver 后編譯 Ubuntu 并刷機 三、模態(tài)
    發(fā)表于 08-29 18:08

    電子發(fā)燒友工程師看!電子領域評職稱,技術之路更扎實

    電子發(fā)燒友的各位工程師、硬件開發(fā)者們,咱們每天在平臺查芯片手冊、討論電路設計難題、分享嵌入式項目經(jīng)驗,從調試 PCB 板到開發(fā) AIoT 系統(tǒng),靠的都是過硬的技術實力 —— 而電子領域的職稱評審
    發(fā)表于 08-20 13:53

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時間是最好的試金石,AI領域尤其如此。當行業(yè)熱議大模型走向時,商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實踐反復驗證的可行路徑。
    的頭像 發(fā)表于 08-14 09:33 ?1205次閱讀

    模態(tài)感知+豆包大模型!家居端側智能升級

    的關鍵力量。星宸科技與豆包大模型的合作,將這一技術趨勢落實到實際應用場景中,在智能家居、可穿戴設備以及連鎖店等領域引發(fā)了深刻變革。 ? 智能家居升級 ? 陳立敬指出:“智能家居2.0需要大模型大腦”。在智能家居領域
    的頭像 發(fā)表于 06-21 00:06 ?7153次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>感知+豆包大模型!家居端側智能升級

    模態(tài)+空間智能:盾華以AI+智慧路燈桿,點亮城市治理新方式

    模態(tài)+空間智能:盾華以AI+智慧路燈桿,點亮城市治理新方式
    的頭像 發(fā)表于 06-12 10:17 ?666次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>+空間智能:盾華以AI+智慧路燈桿,點亮城市治理新方式

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態(tài)大模型

    熟悉愛芯通元NPU的網(wǎng)友很清楚,從去年開始我們在端側模態(tài)大模型適配上一直處于主動緊跟的節(jié)奏。先后適配了國內最早開源的模態(tài)大模MiniCPM V 2.0,上海人工智能實驗室的書生
    的頭像 發(fā)表于 04-21 10:56 ?3180次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B視覺<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型

    采用可更新且具區(qū)分度錨點的模態(tài)運動預測研究

    在自動駕駛領域,運動預測 (Motion Prediction) 是一個重要任務,它有助于場景理解和安全決策。該任務利用歷史狀態(tài)和道路地圖來預測目標智能體的未來軌跡。其主要挑戰(zhàn)來自未來行為的模態(tài)性 (Multimodality
    的頭像 發(fā)表于 04-01 10:32 ?795次閱讀
    采用可更新且具區(qū)分度錨點的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>運動預測研究

    ?模態(tài)交互技術解析

    模態(tài)交互 模態(tài)交互( Multimodal Interaction )是指通過多種感官通道(如視覺、聽覺、觸覺等)或多種交互方式(如語音、手勢、觸控、眼動等)與計算機系統(tǒng)進行自然、
    的頭像 發(fā)表于 03-17 15:12 ?4447次閱讀