基于多模態(tài)智慧感知決策的S230芯片

人工智能時(shí)代到來，各類智能設(shè)備輪番亮相。但多數(shù)智能設(shè)備獨(dú)立運(yùn)行，導(dǎo)致設(shè)備間信息割裂嚴(yán)重，單一傳感器信息不足以有效處理多場(chǎng)景變化，于是，多模態(tài)融合感知的概念在近些年漸漸得到大家的關(guān)注。 ? ?

何為多模態(tài)融合感知？

先來一道測(cè)試題

提到多模態(tài)融合感知，我們難免會(huì)覺得有些困惑 ? “模態(tài)”，可理解為“感官” 多模態(tài)即將多種感官融合 ? 不夠直觀？ ? 那今天我們就以一道競(jìng)猜題開場(chǎng) ? 請(qǐng)根據(jù)以下線索猜猜這是什么物品？ ?

線索1 紅色的果肉、黑色的籽深淺交錯(cuò)的綠色紋路、多為圓形或橢圓形 ?

線索2 甜的、脆脆的或者沙沙的、汁水很多 ?

線索3 買之前要拍一拍，判斷它的質(zhì)量如何 ?

線索4 有一種清清涼涼的味道 ? ? 答案揭曉：是西瓜 ? 顯然不是排球足球不是手榴彈當(dāng)然更不是球型坦克（bushi） ? 這個(gè)題目很簡(jiǎn)單，對(duì)吧？ ? 但其實(shí)在這個(gè)看似簡(jiǎn)單且日常的判斷過程中，我們無(wú)時(shí)無(wú)刻不在使用自己的“多模態(tài)融合感知”功能。 ? 我們的線索1（視覺）、線索2（味覺）、線索3（觸覺、聽覺）、線索4（嗅覺）等多種感官信息被傳回大腦，進(jìn)行處理得出結(jié)論——單就個(gè)體而言，這樣的信息處理過程我們每天要進(jìn)行成千上萬(wàn)次。 ?

如果把我們自身比作一臺(tái)精密的儀器，大腦就是芯片，它會(huì)對(duì)源源不斷涌入的數(shù)據(jù)流進(jìn)行高速處理。 ? S230就是這樣一款專門應(yīng)用于多模態(tài)智慧感知決策的芯片——智能設(shè)備的“大腦”

感知模態(tài)有幾種？

從單一感知到萬(wàn)物互聯(lián)

假如我們把“模態(tài)”理解為我們?nèi)祟惖母鞣N感官，那么這些收集+處理感官信息流并為我們提供可靠的決策依據(jù)就是未來智能硬件必然具備的核心能力。 ? 從目前市面來看，AI設(shè)備中感知模態(tài)主要有以下幾種： ? 1.語(yǔ)音交互，包括語(yǔ)音指令控制、語(yǔ)義理解、多輪對(duì)話、NLP、語(yǔ)音精準(zhǔn)識(shí)別等領(lǐng)域； ?

2. 機(jī)器視覺，包括自然物體識(shí)別、人臉識(shí)別、肢體動(dòng)作識(shí)別等； ?

3. 傳感器智能，包括AI對(duì)熱量、紅外捕捉信號(hào)、空間信號(hào)的閱讀與理解。 ?

把這幾種“感官信息”融合在一起，AIoT設(shè)備就可以在單純的能聽會(huì)說之外，同時(shí)還用攝像頭觀察、用傳感器判斷。 ? 比較前沿的多模態(tài)感知還包括機(jī)器嗅覺，機(jī)器觸覺和表情、情緒理解等內(nèi)容，但目前實(shí)際多模態(tài)感知技術(shù)的落地還有很長(zhǎng)的路要走，海量數(shù)據(jù)的高速傳輸與處理是核心的落地瓶頸，在邊緣端實(shí)現(xiàn)的智能化感知是最核心的解決方案之一。 ? ? ? ? ? ? ? ? ? ? ? ? ? ?

S230有何過人之處？

從單一感覺到萬(wàn)物互聯(lián)

PIMCHIP-S230使用存內(nèi)計(jì)算技術(shù)，為多模態(tài)融合感知決策芯片提供了強(qiáng)勁動(dòng)能，這是多模智慧感知的堅(jiān)實(shí)一步，它采用新型存內(nèi)計(jì)算芯片架構(gòu)，將不同傳感器所帶來的“線索”傳給芯片進(jìn)行綜合解析并為我們做出關(guān)鍵決斷提供準(zhǔn)確的信息。 ? ? ? 此外，S230以其極低的功耗、合理的算力、靈活方便的部署方式以及成熟完善的軟件工具鏈，為不同的行業(yè)場(chǎng)景提供性價(jià)比最高的MCU+AI多模態(tài)融合感知解決方案，此款芯片產(chǎn)品將應(yīng)用在可穿戴設(shè)備、智慧工業(yè)、智慧生活等多個(gè)領(lǐng)域，打造新型智能感知生態(tài)，為各產(chǎn)業(yè)智慧化賦能。 ? ? ?

編輯：黃飛

閱讀全文

機(jī)器視覺(125442) 機(jī)器視覺(125442)
人工智能(262996) 人工智能(262996)
存算一體(5032) 存算一體(5032)
存內(nèi)計(jì)算(1635) 存內(nèi)計(jì)算(1635)
蘋芯科技(574) 蘋芯科技(574)

評(píng)論

商湯科技饒學(xué)貴：AI多模態(tài)城市機(jī)器視覺，助力新型智慧城市建設(shè)

商湯科技公安行業(yè)產(chǎn)品總經(jīng)理饒學(xué)貴表示，目前城市建設(shè)中所涉及的視頻大數(shù)據(jù)處理和分析仍需借助大量人力完成，執(zhí)行效率較為低下，而商湯科技的目標(biāo)是構(gòu)建從感知、預(yù)警、分析到決策的自動(dòng)化高效智能視覺系統(tǒng)。這套多

2018-11-19 18:55:44

6780

向感知進(jìn)化的智慧城市觸景無(wú)限CEO肖洪波揭秘邊緣芯片及前端感知

觸景無(wú)限聯(lián)合創(chuàng)始人兼CEO肖洪波表示，許多智慧城市忽略了在邊緣計(jì)算和感知方面的投入，雖然他們打通了后端數(shù)據(jù)的流通，但對(duì)于前端視頻數(shù)據(jù)的收集和分析都沒有到位，無(wú)法形成感知、認(rèn)知和決策的智能AI經(jīng)濟(jì)閉環(huán)

2019-08-02 10:45:07

52588

閃聯(lián)丁路寧：多模態(tài)組網(wǎng)技術(shù)標(biāo)準(zhǔn)如何與物聯(lián)網(wǎng)結(jié)合

12月2日，在電子發(fā)燒友主辦的第三屆物聯(lián)網(wǎng)大會(huì)智慧城市分論壇上，閃聯(lián)信息技術(shù)工程中心CTO丁路寧帶來《多模態(tài)組網(wǎng)技術(shù)標(biāo)準(zhǔn)和落地前景》的主題演講。丁總介紹了閃聯(lián)多模態(tài)無(wú)線組網(wǎng)標(biāo)準(zhǔn)是在現(xiàn)有的多種無(wú)線通信

2016-12-29 15:42:11

2565

神經(jīng)模態(tài)芯片發(fā)展的方向神經(jīng)模態(tài)芯片技術(shù)解析

Intel發(fā)布了基于其神經(jīng)模態(tài)（neuromorphic）計(jì)算芯片Loihi的加速卡Pohoiki Beach，該加速卡包含了64塊Loihi芯片，共含有八百多萬(wàn)個(gè)神經(jīng)元。繼IBM發(fā)布True

2020-09-15 15:41:32

1135

基于多模態(tài)語(yǔ)義SLAM框架

本文提出了一個(gè)魯棒且快速的多模態(tài)語(yǔ)義 SLAM 框架，旨在解決復(fù)雜和動(dòng)態(tài)環(huán)境中的 SLAM 問題。具體來說，將僅幾何聚類和視覺語(yǔ)義信息相結(jié)合，以減少由于小尺度對(duì)象、遮擋和運(yùn)動(dòng)模糊導(dǎo)致的分割誤差的影響。

2022-08-31 09:39:14

2570

愛芯通元NPU適配Qwen2.5-VL-3B視覺多模態(tài)大模型

熟悉愛芯通元NPU的網(wǎng)友很清楚，從去年開始我們?cè)诙藗?cè)多模態(tài)大模型適配上一直處于主動(dòng)緊跟的節(jié)奏。先后適配了國(guó)內(nèi)最早開源的多模態(tài)大模MiniCPM V 2.0，上海人工智能實(shí)驗(yàn)室的書生多模態(tài)大模型

2025-04-21 10:56:46

2691

炬芯科技 2019 多模態(tài)交互技術(shù)開發(fā)者大會(huì)：AI多模態(tài)交互如何助力教育

2020年AI多模態(tài)交互技術(shù)將會(huì)迎來較大爆發(fā)。12月19日，在炬芯科技第四屆Techlife炬芯2019多模態(tài)交互技術(shù)開發(fā)者大會(huì)上，來自喜馬拉雅、達(dá)摩院、玩瞳科技、IP方CEVA的行業(yè)大咖們，從內(nèi)容

2019-12-24 11:46:43

14451

語(yǔ)音識(shí)別技術(shù)最新進(jìn)展：視聽融合的多模態(tài)交互成為主要演進(jìn)方向

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）所謂“模態(tài)”，英文是modality，用通俗的話說，就是“感官”，多模態(tài)即將多種感官融合。多模態(tài)交互技術(shù)是近年來人工智能領(lǐng)域的一項(xiàng)重要?jiǎng)?chuàng)新。隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展，采用

2023-12-28 09:06:45

6613

多模態(tài)感知+豆包大模型！家居端側(cè)智能升級(jí)

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）日前，在火山引擎2025春季FORCE原動(dòng)力大會(huì)上，星宸科技股份有限公司董事副總經(jīng)理陳立敬談到，在人工智能技術(shù)飛速發(fā)展的時(shí)代，多模態(tài)感知與大模型的融合成為推動(dòng)各行業(yè)變革

2025-06-21 00:06:00

6840

智慧城市發(fā)展的核心是什么

必須瞄準(zhǔn)的賽道。而智慧城市的核心是什么呢？物聯(lián)網(wǎng)系統(tǒng)至關(guān)重要，物聯(lián)網(wǎng)為智慧城市提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。物聯(lián)網(wǎng)為智慧城市提供了城市的感知能力，并使得這種感知更加深入、智能。通過環(huán)境感知、水位感知、照明感知

2018-09-20 14:35:30

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

2）滲透式AI的優(yōu)勢(shì) 5、大型多模態(tài)模型多模態(tài)模型（LMM）可以被理解成大模型的更高級(jí)版本，不僅可以處理文本，還可以處理和理解多種類型的數(shù)據(jù)模態(tài)。多模態(tài)模型的關(guān)鍵特性是：它通常能夠同時(shí)集成和解

2025-09-18 15:31:59

什么是智慧管養(yǎng)？

的主體是橋梁和拉索，顯然橋梁和拉索具有智慧說不過去；如果主體是某種系統(tǒng)，如橋梁智慧管養(yǎng)系統(tǒng)，這些系統(tǒng)具有感知、推理和決策的能力，這些能力通過傳感器、數(shù)據(jù)采集傳輸設(shè)備以及分析軟件來實(shí)現(xiàn)，這么理解起來還算

2020-10-01 07:25:06

未來已來，多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

的信息，將感知系統(tǒng)的感知維度擴(kuò)展以實(shí)現(xiàn)多維度（多模態(tài)）感知目標(biāo)的完整信息。如下圖示例，芯片將攝像頭圖像數(shù)據(jù)，和雷達(dá)探測(cè)目標(biāo)的距離、速度、散射截面R的感知數(shù)據(jù)，以及紅外傳感器探測(cè)的熱輻射圖像數(shù)據(jù)疊加

2024-04-11 10:26:51

求一種基于ACSip S76S的智慧家庭無(wú)線插座方案

智慧家庭無(wú)線插座的工作原理是什么？基于ACSip S76S的智慧家庭無(wú)線插座有哪些核心技術(shù)優(yōu)勢(shì)？

2021-06-26 06:14:02

米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

首輪推理延遲，適配對(duì)響應(yīng)速度敏感的車載、醫(yī)療等場(chǎng)景；其二，多模態(tài)融合再升級(jí)—— 在圖文基礎(chǔ)上集成語(yǔ)音、傳感器數(shù)據(jù)，實(shí)現(xiàn) “看 + 聽 + 感知” 的跨模態(tài)對(duì)話；其三，生態(tài)適配再拓展—— 支持更多

2025-09-05 17:25:10

香蕉派 BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片設(shè)計(jì)

開發(fā)板采用的是嘉楠科技Kendryte?系列AIoT芯片中的最新一代SoC芯片K230D。該芯片采用全新的多異構(gòu)單元加速計(jì)算架構(gòu)，集成了2個(gè)RISC-V高能效計(jì)算核心，內(nèi)置新一代KPU

2024-07-30 17:43:28

城市智慧燈桿

巨擘科技智慧燈桿系統(tǒng)設(shè)計(jì)的核心思想1.以立桿為載體，共享電力、管網(wǎng)、通信等基礎(chǔ)設(shè)施2. 集成智能感知終端，深度感知城市態(tài)勢(shì)3. 融合多元數(shù)據(jù)，實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通4. 打造智慧城市管理平臺(tái)，實(shí)現(xiàn)城市精準(zhǔn)

2022-05-13 14:44:24

尼康coolpix S230數(shù)碼相機(jī)中文使用說明書(用戶手冊(cè)

尼康coolpix S230數(shù)碼相機(jī)中文使用說明書,用戶手冊(cè)

2009-11-23 17:31:58

尼康數(shù)碼相機(jī)COOLPIX S230使用說明書(用戶手冊(cè))

尼康數(shù)碼相機(jī)COOLPIX S230使用說明書(用戶手冊(cè))

2009-11-24 15:09:40

基于感知的多代理的120急救系統(tǒng)

多代理系統(tǒng)以一種分布式的計(jì)算模式有助于信息協(xié)作分析和決策，而代理的智能感知能力讓系統(tǒng)可以根據(jù)周圍環(huán)境而動(dòng)態(tài)調(diào)整行為。本文基于多代理技術(shù)，介紹了一個(gè)普適計(jì)算環(huán)境下的

2012-08-20 11:58:28

基于自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

傳統(tǒng)多模態(tài)生物特征識(shí)別方法當(dāng)出現(xiàn)生物特征缺失時(shí)，識(shí)別性能會(huì)明顯下降。針對(duì)此問題，提出一種融合人臉、虹膜和掌紋的自適應(yīng)并行結(jié)構(gòu)多模態(tài)生物識(shí)別方法。該方法在設(shè)計(jì)融合策

2012-11-09 16:12:19

lABCIWQmultyWindows多模態(tài)窗口2010

lABCIWQmultyWindows多模態(tài)窗口2010。

2016-05-17 17:47:59

閃聯(lián)+德州儀器多模態(tài)組網(wǎng)技術(shù)標(biāo)準(zhǔn)暨芯片模組發(fā)布會(huì)即將召開

為了深入推動(dòng)閃聯(lián)多模態(tài)組網(wǎng)技術(shù)標(biāo)準(zhǔn)發(fā)展及產(chǎn)業(yè)化推廣工作，閃聯(lián)產(chǎn)業(yè)聯(lián)盟會(huì)同重要會(huì)員TI（德州儀器）等企業(yè)在深圳召開閃聯(lián)多模態(tài)組網(wǎng)技術(shù)團(tuán)體標(biāo)準(zhǔn)暨芯片模組發(fā)布會(huì)，共促物聯(lián)網(wǎng)同行交流及合作，特此誠(chéng)邀行業(yè)人士共同參加此次大會(huì)。

2016-10-17 16:18:26

815

多尺度形態(tài)濾波模態(tài)混疊抑制方法

多尺度形態(tài)濾波模態(tài)混疊抑制方法_曹瑩

2017-01-07 18:21:31

體驗(yàn)MiniCPM-V 2.6 多模態(tài)能力

多模態(tài)組網(wǎng)

jf_23871869發(fā)布于 2025-01-20 13:40:48

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

2017-10-16 11:06:04

多文化場(chǎng)景下的多模態(tài)情感識(shí)別

自動(dòng)情感識(shí)別是一個(gè)非常具有挑戰(zhàn)性的課題，并且有著廣泛的應(yīng)用價(jià)值．本文探討了在多文化場(chǎng)景下的多模態(tài)情感識(shí)別問題．我們從語(yǔ)音聲學(xué)和面部表情等模態(tài)分別提取了不同的情感特征。包括傳統(tǒng)的手工定制特征和基于深度

2017-12-18 14:47:31

基于超圖的多模態(tài)關(guān)聯(lián)特征處理方法

傳統(tǒng)的模式識(shí)別方法認(rèn)為特征是相互獨(dú)立的，容易忽略多模態(tài)特征之間多元的關(guān)聯(lián)性，從而造成識(shí)別的誤差。為此，基于超圖模型，提出一種新的特征整合方法。定義共享熵的計(jì)算方法用以表示多個(gè)特征之間的關(guān)聯(lián)程度，以

2018-03-07 11:01:41

自動(dòng)駕駛的感知，決策與執(zhí)行系統(tǒng)淺析

無(wú)人駕駛車輛真要跑起來，需要解決感知、決策和執(zhí)行等層面的技術(shù)問題。感知系統(tǒng)也稱為“中層控制系統(tǒng)”，負(fù)責(zé)感知周圍的環(huán)境，并進(jìn)行識(shí)別和分析；決策系統(tǒng)也稱為“上層控制系統(tǒng)”，負(fù)責(zé)路徑規(guī)劃和導(dǎo)航；執(zhí)行系統(tǒng)

2018-09-07 11:06:00

10789

5G推動(dòng)AIoT落地多模態(tài)AI芯成必然

了其正在研發(fā)中的多款定位不同場(chǎng)景的AI芯片，包括第二代物聯(lián)網(wǎng)語(yǔ)音AI芯片雨燕Lite、面向智慧城市的支持圖像與語(yǔ)音計(jì)算的多模態(tài)AI芯片海豚（Dolphin），以及面向智慧出行的車規(guī)級(jí)多模態(tài)AI芯片雪豹（Leopard）。

2019-01-03 15:59:12

1681

云知聲正式公布全新多模態(tài)AI芯片戰(zhàn)略與規(guī)劃

2019年1月2日，云知聲在北京召開一場(chǎng)主題為”聲視不凡“的新聞發(fā)布會(huì)，正式公布了其全新的多模態(tài)AI芯片戰(zhàn)略與規(guī)劃。

2019-01-04 09:41:31

5204

多模態(tài)成AI行業(yè)發(fā)展新風(fēng)向新基建行業(yè)進(jìn)入快車道

近日，由螞蟻金服牽頭制定的“生物特征識(shí)別多模態(tài)融合國(guó)際標(biāo)準(zhǔn)”正式立項(xiàng)，這一標(biāo)準(zhǔn)的制定，對(duì)于多模態(tài)領(lǐng)域發(fā)展與技術(shù)規(guī)范產(chǎn)生了重大影響。

2020-03-31 11:46:47

3127

AI全新應(yīng)用場(chǎng)景技術(shù)趨勢(shì)多模態(tài)學(xué)習(xí)

新的 AI 技術(shù)發(fā)展趨勢(shì)有哪些？多模態(tài)學(xué)習(xí)技術(shù)一定是其中之一。

2020-07-18 09:19:12

2376

AI與IOT推動(dòng)智慧屏發(fā)展,智慧屏引領(lǐng)電視行業(yè)進(jìn)入3.0時(shí)代

智慧屏是智能電視的創(chuàng)新演進(jìn)形態(tài)，是AI和IoT等新興技術(shù)推動(dòng)下的家庭智慧交互終端。智慧屏在提供更高品質(zhì)影音娛樂功能的基礎(chǔ)上，通過強(qiáng)大的計(jì)算、AI、感知、互聯(lián)能力，實(shí)現(xiàn)多模態(tài)自然交互和IoT智慧家居控制等功能，進(jìn)而構(gòu)建新的家庭智慧中心。

2020-08-31 15:59:01

2682

一文解析多模態(tài)生物識(shí)別技術(shù)的安全性

多模態(tài)生物特征識(shí)別是指在識(shí)別系統(tǒng)中使用兩種或更多種生物特征的組合，例如，結(jié)合人臉識(shí)別和虹膜識(shí)別的系統(tǒng)可以被認(rèn)為是多模態(tài)生物識(shí)別系統(tǒng)，那多模態(tài)生物識(shí)別技術(shù)安全嗎？

2020-10-13 09:45:56

1243

多模態(tài)中NLP與CV融合的方式有哪些？

最早接觸多模態(tài)是一個(gè)抖音推薦項(xiàng)目，有一些視頻，標(biāo)題，用戶點(diǎn)贊收藏等信息，給用戶推薦作品，我當(dāng)時(shí)在這個(gè)項(xiàng)目里負(fù)責(zé)用NLP部分上分，雖然最后用wide and deep 整個(gè)團(tuán)隊(duì)效果還可以，但是從a/b

2020-12-31 10:12:37

5828

研發(fā)全新多模態(tài)感知AI框架 AI能同時(shí)模擬人眼和手預(yù)測(cè)物體運(yùn)動(dòng)

第一個(gè)利用視覺和觸覺感知來學(xué)習(xí)多模態(tài)動(dòng)力學(xué)模型的研究。運(yùn)動(dòng)預(yù)測(cè)是自動(dòng)化領(lǐng)域的一大關(guān)鍵技術(shù)，通過預(yù)判物體和環(huán)境的交互方式，自動(dòng)化系統(tǒng)得以作出更加智能的決策。該團(tuán)隊(duì)的這項(xiàng)研究，似乎又將這一技術(shù)的應(yīng)用向前推進(jìn)了一步。這篇論文名為《

2021-02-12 09:12:00

3829

HMC230 S-Parameters

2021-02-01 13:14:22

HMC230 S參數(shù)

2021-03-23 13:38:13

Transformer模型的多模態(tài)學(xué)習(xí)應(yīng)用

隨著Transformer在視覺中的崛起，Transformer在多模態(tài)中應(yīng)用也是合情合理的事情，甚至以后可能會(huì)有更多的類似的paper。

2021-03-25 09:29:59

11785

基于層次注意力機(jī)制的多模態(tài)圍堵情感識(shí)別模型

在連續(xù)維度情感識(shí)別任務(wù)中，每個(gè)模態(tài)內(nèi)部凸顯情感表達(dá)的部分并不相同，不同模態(tài)對(duì)于情感狀態(tài)的影響程度也有差別。為此，通過學(xué)習(xí)各個(gè)模態(tài)特征并采用合理的融合方式，提出一種基于層次注意力機(jī)制的多模態(tài)維度情感

2021-04-01 11:20:51

基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法

針對(duì)多模態(tài)目標(biāo)跟蹤中大多僅考慮單個(gè)圖像的異種特征融合或不同模態(tài)圖像的同種特征融合，為了使得這兩者間能自然集成，提出基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法。通過將多模態(tài)跟蹤問題轉(zhuǎn)化為多重2-范數(shù)

2021-04-27 15:59:29

基于注意力神經(jīng)網(wǎng)絡(luò)的多模態(tài)情感分析方法

近年來，越來越多的人熱衷于在社交媒體上同時(shí)用圖片和文本等媒體形式表達(dá)自己的感受與看法，使得以圖片和文本為主要內(nèi)容的多模態(tài)數(shù)據(jù)不斷増長(zhǎng)。相比單模態(tài)數(shù)據(jù)，多模態(tài)數(shù)據(jù)包含的信息更豐富，更能揭示用戶的真實(shí)

2021-04-28 14:41:41

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

2021-06-27 11:45:54

基于感知體驗(yàn)和主觀幸福感的交通出行決策

2021-07-02 15:29:25

簡(jiǎn)述文本與圖像領(lǐng)域的多模態(tài)學(xué)習(xí)有關(guān)問題

來自：哈工大SCIR 本期導(dǎo)讀：近年來研究人員在計(jì)算機(jī)視覺和自然語(yǔ)言處理方向均取得了很大進(jìn)展，因此融合了二者的多模態(tài)深度學(xué)習(xí)也越來越受到關(guān)注。本期主要討論結(jié)合文本和圖像的多模態(tài)任務(wù)，將從多模態(tài)預(yù)訓(xùn)練

2021-08-26 16:29:52

7520

如何使用多模態(tài)信息做prompt

Multimodal Conditionality for Natural Language Generation 研究的任務(wù)場(chǎng)景則是以多模態(tài)信息作為條件做 conditional 的 NLG任務(wù)。這種任務(wù)設(shè)置有

2021-11-03 09:39:18

2418

實(shí)現(xiàn)多模態(tài)的神經(jīng)形態(tài)感知提供了一種新型硬件方案

論文中，課題組以裝有水的杯子為例對(duì)多模態(tài)感知進(jìn)行了說明：通常對(duì)于只有壓力信息的單模態(tài)感知來講，我們只能知道杯子的形狀、以及杯中的水量，并不能獲悉杯中的水溫。如果想同時(shí)得知杯子形狀、水量以及水溫，那么就得引入另一個(gè)溫度模態(tài)的信息。

2022-07-28 09:14:10

2269

多模態(tài)圖像合成與編輯方法

本篇綜述通過對(duì)現(xiàn)有的多模態(tài)圖像合成與編輯方法的歸納總結(jié)，對(duì)該領(lǐng)域目前的挑戰(zhàn)和未來方向進(jìn)行了探討和分析。

2022-08-23 09:12:19

1979

面向社交媒體的多模態(tài)屬性級(jí)情感分析

另一方面，相比于單一的文本數(shù)據(jù)，多模態(tài)數(shù)據(jù)包含了多種不同信息，這些信息之間往往一一對(duì)應(yīng)、互為補(bǔ)充，如何對(duì)齊不同模態(tài)的內(nèi)容并提出有效的多模態(tài)融合機(jī)制是一個(gè)十分棘手的問題。

2022-10-19 10:10:11

3025

一個(gè)真實(shí)閑聊多模態(tài)數(shù)據(jù)集TikTalk

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。

2023-02-09 09:31:26

3236

中文多模態(tài)對(duì)話數(shù)據(jù)集

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。目前已經(jīng)提出了各種各樣的多模態(tài)對(duì)話數(shù)據(jù)集，主要來自電影、電視劇、社交媒體平臺(tái)等

2023-02-22 11:03:01

2185

微軟多模態(tài)ChatGPT的常見測(cè)試介紹

研究者將一個(gè)基于 Transformer 的語(yǔ)言模型作為通用接口，并將其與感知模塊對(duì)接。他們?cè)诰W(wǎng)頁(yè)規(guī)模的多模態(tài)語(yǔ)料庫(kù)上訓(xùn)練模型，語(yǔ)料庫(kù)包括了文本數(shù)據(jù)、任意交錯(cuò)的圖像和文本、以及圖像字幕對(duì)。

2023-03-13 11:23:00

1250

多智能體協(xié)同感知協(xié)同動(dòng)態(tài)調(diào)度決策的系統(tǒng)

本篇介紹一個(gè)多智能體協(xié)同感知，協(xié)同動(dòng)態(tài)調(diào)度決策的系統(tǒng)。系統(tǒng)包括基于3D點(diǎn)云的SLAM建圖(lego-loam)，3維定位（hdl_localization），3D障礙物檢測(cè)(傳統(tǒng)聚類算法)，部署了

2023-04-11 10:36:49

如何利用LLM做多模態(tài)任務(wù)？

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究?jī)r(jià)值的。

2023-05-11 17:09:16

1571

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

LLM 與通用人工智能（AGI）之間仍存在顯著差距。首先，大多數(shù)當(dāng)前 LLM 只能感知和理解多模態(tài)內(nèi)容，而不能自然而然地生成多模態(tài)內(nèi)容。其次，像圖像和語(yǔ)音這樣的連續(xù)信號(hào)不能直接適應(yīng)接收離散 token 的 LLM。

2023-05-22 14:38:06

1333

自動(dòng)駕駛深度多模態(tài)目標(biāo)檢測(cè)和語(yǔ)義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

了許多解決深度多模態(tài)感知問題的方法。然而，對(duì)于網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)，并沒有通用的指導(dǎo)方針，關(guān)于“融合什么”、“何時(shí)融合”和“如何融合”的問題仍然沒有定論。本文系統(tǒng)地總結(jié)了自動(dòng)駕駛中深度多模態(tài)目標(biāo)檢測(cè)和語(yǔ)義分割的方法，

2023-06-06 10:37:11

多模態(tài)數(shù)據(jù)定制服務(wù)：提升智能化應(yīng)用的關(guān)鍵利器

可以獲得更準(zhǔn)確、全面且豐富的信息，為智能化應(yīng)用提供強(qiáng)有力的支持。在這方面，數(shù)據(jù)堂是您的理想合作伙伴。作為一家領(lǐng)先的數(shù)據(jù)科技公司，數(shù)據(jù)堂致力于提供多模態(tài)數(shù)據(jù)定制服務(wù)，幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)決策和智能化轉(zhuǎn)型。數(shù)

2023-06-18 21:24:47

956

VisCPM：邁向多語(yǔ)言多模態(tài)大模型時(shí)代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進(jìn)，多模態(tài)大模型已經(jīng)成為大模型邁向通用人工智能（AGI）目標(biāo)的下一個(gè)前沿焦點(diǎn)?？傮w而言，面向圖像和文本的多模態(tài)生成能力

2023-07-10 10:05:01

1255

全球首個(gè)面向網(wǎng)聯(lián)智能車的通信與多模態(tài)感知數(shù)據(jù)集發(fā)布

7月2日，2023中國(guó)智能車大會(huì)暨國(guó)家智能車發(fā)展論壇在廣州南沙盛大開幕。會(huì)上重磅發(fā)布全球首個(gè)面向網(wǎng)聯(lián)智能車的包含多車和多路端的通信與多模態(tài)感知數(shù)據(jù)集Mixed Multi-Modal Sensing and Communication （M3SC）。

2023-07-13 15:20:21

1420

更強(qiáng)更通用：智源「悟道3.0」Emu多模態(tài)大模型開源，在多模態(tài)序列中「補(bǔ)全一切」

當(dāng)前學(xué)界和工業(yè)界都對(duì)多模態(tài)大模型研究熱情高漲。去年，谷歌的 Deepmind 發(fā)布了多模態(tài)視覺語(yǔ)言模型 Flamingo ，它使用單一視覺語(yǔ)言模型處理多項(xiàng)任務(wù)，在多模態(tài)大模型領(lǐng)域保持較高

2023-07-16 20:45:02

1370

UniVL-DR: 多模態(tài)稠密向量檢索模型

for Multi-Modal Retrieval 背景介紹盡管當(dāng)前主流搜索引擎主要面向文本數(shù)據(jù)，然而多媒體內(nèi)容的增長(zhǎng)一直是互聯(lián)網(wǎng)上最顯著趨勢(shì)之一，各種研究表明用戶更喜歡搜索結(jié)果中出現(xiàn)生動(dòng)的多模態(tài)內(nèi)容。因而，針對(duì)于多

2023-08-06 22:00:03

1796

基于Transformer多模態(tài)先導(dǎo)性工作

多模態(tài)（Multimodality）是指在信息處理、傳遞和表達(dá)中涉及多種不同的感知模態(tài)或信息來源。這些感知模態(tài)可以包括語(yǔ)言、視覺、聽覺、觸覺等，它們共同作用來傳遞更豐富、更全面的信息。在多模態(tài)系統(tǒng)中

2023-08-21 09:49:52

1518

DreamLLM：多功能多模態(tài)大型語(yǔ)言模型，你的DreamLLM~

由于固有的模態(tài)缺口，如CLIP語(yǔ)義主要關(guān)注模態(tài)共享信息，往往忽略了可以增強(qiáng)多模態(tài)理解的模態(tài)特定知識(shí)。因此，這些研究并沒有充分認(rèn)識(shí)到多模式創(chuàng)造和理解之間潛在的學(xué)習(xí)協(xié)同作用，只顯示出創(chuàng)造力的微小提高，并且在多模式理解方面仍然存在不足。

2023-09-25 17:26:43

1532

基于視覺的多模態(tài)觸覺感知系統(tǒng)

傳統(tǒng)的多模態(tài)/多任務(wù)觸覺感知系統(tǒng)通過集成多種傳感單元來達(dá)到多模態(tài)觸覺信息的解耦，但其往往導(dǎo)致系統(tǒng)結(jié)構(gòu)的復(fù)雜性，以及需要應(yīng)對(duì)來自不同刺激間的干擾。

2023-10-18 11:24:48

2013

邁爾微視MRDVS發(fā)布多模態(tài)避障相機(jī)S2

S2是邁爾微視MRDVS專為移動(dòng)機(jī)器人避障應(yīng)用研發(fā)的工業(yè)級(jí)多模態(tài)相機(jī)。通過獲取前方障礙物距離及紋理信息，結(jié)合AI算法對(duì)障礙物進(jìn)行識(shí)別分類，提升移動(dòng)機(jī)器人避障準(zhǔn)確性。

2023-10-24 16:00:10

1788

探究編輯多模態(tài)大語(yǔ)言模型的可行性

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手，將單模態(tài)模型編輯拓展到多模態(tài)模型編輯，主要從以下三個(gè)方面：可靠性（Reliability），穩(wěn)定性（Locality）和泛化性（Generality）。

2023-11-09 14:53:22

1018

大模型+多模態(tài)的3種實(shí)現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢(shì)是不支持其他模態(tài)（包括圖像、語(yǔ)音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強(qiáng)大、更通用呢？本節(jié)將介紹“大模型+多模態(tài)”的3種實(shí)現(xiàn)方法。

2023-12-13 13:55:04

3109

人工智能領(lǐng)域多模態(tài)的概念和應(yīng)用場(chǎng)景

隨著人工智能技術(shù)的不斷發(fā)展，多模態(tài)成為了一個(gè)備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和信息進(jìn)行融合，以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工智能應(yīng)用。本文將詳細(xì)介紹多模態(tài)的概念、研究?jī)?nèi)容和應(yīng)用場(chǎng)景，并探討人工智能領(lǐng)域多模態(tài)的未來發(fā)展趨勢(shì)。

2023-12-15 14:28:44

13428

從Google多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些能力

前段時(shí)間Google推出Gemini多模態(tài)大模型，展示了不凡的對(duì)話能力和多模態(tài)能力，其表現(xiàn)究竟如何呢？

2023-12-28 11:19:52

2300

什么是多模態(tài)？多模態(tài)的難題是什么？

單模態(tài)大模型，通常大于100M～1B參數(shù)。具有較強(qiáng)的通用性，比如對(duì)圖片中任意物體進(jìn)行分割，或者生成任意內(nèi)容的圖片或聲音。極大降低了場(chǎng)景的定制成本。

2024-01-17 10:03:12

6919

銀牛微電子3D視覺感知方案賦能小米CyberDog系列仿生四足機(jī)器人

2024年3月21日，合肥銀牛微電子宣布小米CyberDog系列仿生四足機(jī)器人的AI多模態(tài)融合感知決策系統(tǒng)正式采用銀牛的雙目立體視覺產(chǎn)品解決方案。

2024-03-21 13:55:15

1720

AI機(jī)器人迎來多模態(tài)模型

配備 GR00T 模型的機(jī)器人由于需要“吸收消化”外界的多模態(tài)信息，還要快速完成理解、決策、行動(dòng)等一系列動(dòng)作，因此對(duì)于算力的需求是巨量的。

2024-04-12 10:39:46

628

商湯科技推出SenseFoundry-VL方舟多模態(tài)新智平臺(tái)

WAIC 2024期間，基于 “日日新5.5”大模型體系能力，商湯“方舟城市開放平臺(tái)”進(jìn)行全新產(chǎn)品架構(gòu)升級(jí)，推出首個(gè)“大模型+城市服務(wù)”的解決方案及應(yīng)用實(shí)踐「SenseFoundry-VL 方舟多模態(tài)新智平臺(tái)」，助力智慧城市服務(wù)場(chǎng)景進(jìn)一步提智提效。

2024-07-12 14:15:10

1509

Meta不會(huì)在歐盟提供新的多模態(tài)AI模型

科技巨頭Meta近日宣布了一項(xiàng)重要決策，其即將推出的創(chuàng)新多模態(tài)Llama模型將不會(huì)在歐盟地區(qū)發(fā)布。這一決定背后，是Meta對(duì)歐洲復(fù)雜且不可預(yù)測(cè)的監(jiān)管環(huán)境的深刻考量，也為Meta與歐盟監(jiān)管機(jī)構(gòu)之間的緊張關(guān)系再添一筆。

2024-07-19 16:04:57

1071

云知聲推出山海多模態(tài)大模型

在人工智能技術(shù)的浩瀚星海中，多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后，云知聲以創(chuàng)新之姿，推出了其匠心獨(dú)運(yùn)的山海多模態(tài)大模型，正式宣告“Her時(shí)代”的帷幕緩緩拉開。

2024-08-27 15:20:21

844

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進(jìn)行融合，通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián)，實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來說，多模態(tài)大模型可以可以理解多種不同模態(tài)的輸入數(shù)據(jù)，并輸出相應(yīng)反饋結(jié)果，例如圖像理解，語(yǔ)音識(shí)別，視覺問題等。

2024-10-18 09:39:38

2713

一文理解多模態(tài)大語(yǔ)言模型——下

/understanding-multimodal-llms ? 《一文理解多模態(tài)大語(yǔ)言模型 - 上》介紹了什么是多模態(tài)大語(yǔ)言模型，以及構(gòu)建多模態(tài) LLM 有兩種主要方式之一：統(tǒng)一嵌入解碼器架構(gòu)(Unified Embedding Decoder Architecture)。本

2024-12-03 15:18:04

1110

超越人類視覺！昱感微“多維像素”多模態(tài)超級(jí)攝像頭方案產(chǎn)品賦能超凡感知力

視覺——人眼只能感知所見目標(biāo)大概的距離/位置/速度以及外觀信息，并且受到天氣、光線等因素影響較大；昱感微“多維像素”多模態(tài)感知方案的超級(jí)攝像頭每秒可輸出30幀（甚至更高頻率）多模態(tài)融合感知數(shù)據(jù)，每一幀不僅有高清圖像數(shù)

2024-12-12 17:17:31

1341

商湯日日新多模態(tài)大模型權(quán)威評(píng)測(cè)第一

剛剛，商湯科技日日新SenseNova多模態(tài)大模型，在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的多模態(tài)評(píng)測(cè)中取得榜單第一。

2024-12-20 10:39:31

1573

昱感微創(chuàng)始人&CEO蔣宏受邀出席“聚焦多模態(tài)雷視融合感知技術(shù)”學(xué)術(shù)沙龍，共探AI機(jī)器視覺未來

2025年1月7日，由中新廣州知識(shí)城開發(fā)建設(shè)辦公室、西安電子科技大學(xué)廣州研究院以及海絲產(chǎn)教融合協(xié)同創(chuàng)新中心共同組織的“聚焦多模態(tài)雷視融合感知技術(shù)”的學(xué)術(shù)沙龍?jiān)谖靼搽娮涌萍即髮W(xué)廣州研究院成功舉辦。昱感

2025-01-09 10:35:17

1525

?？低暟l(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品

多模態(tài)大模型為安防行業(yè)帶來重大技術(shù)革新，基于觀瀾大模型技術(shù)體系，海康威視將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合，發(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品——文搜NVR、文搜CVR。

2025-02-18 10:33:56

1125

?多模態(tài)交互技術(shù)解析

多模態(tài)交互多模態(tài)交互（ Multimodal Interaction ）是指通過多種感官通道（如視覺、聽覺、觸覺等）或多種交互方式（如語(yǔ)音、手勢(shì)、觸控、眼動(dòng)等）與計(jì)算機(jī)系統(tǒng)進(jìn)行自然、協(xié)同的信息交互

2025-03-17 15:12:44

3955

PIMCHIP S300 全球首款28nm節(jié)點(diǎn)實(shí)現(xiàn)存算一體產(chǎn)品化AI芯片

PIMCHIP-S300 芯片是蘋芯科技基于存算一體技術(shù)打造的多模態(tài)智慧感知決策 AI 芯片。其搭載基于靜態(tài)隨機(jī)存取存儲(chǔ)器（SRAM）的存算一體計(jì)算加速單元，讓計(jì)算在存儲(chǔ)器內(nèi)部發(fā)生，有效減少

2025-03-28 17:06:35

2259

采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測(cè)研究

在自動(dòng)駕駛領(lǐng)域，運(yùn)動(dòng)預(yù)測(cè) (Motion Prediction) 是一個(gè)重要任務(wù)，它有助于場(chǎng)景理解和安全決策。該任務(wù)利用歷史狀態(tài)和道路地圖來預(yù)測(cè)目標(biāo)智能體的未來軌跡。其主要挑戰(zhàn)來自未來行為的多模態(tài)性 (Multimodality) ，即智能體在相同環(huán)境和狀態(tài)下可能展現(xiàn)出多種不同的行為模式。

2025-04-01 10:32:35

683

安霸在ISC West上推出下一代前端多模態(tài)AI技術(shù)

近日，Ambarella (下稱“安霸”，納斯達(dá)克股票代碼：AMBA， AI 視覺感知芯片公司）在美國(guó)拉斯維加斯西部安防展（ISC West）上宣布，將持續(xù)推動(dòng)前端多模態(tài) AI 技術(shù)的創(chuàng)新與突破

2025-04-03 09:57:37

777

海康威視發(fā)布多模態(tài)大模型AI融合巡檢超腦

基于?？涤^瀾大模型技術(shù)體系，?？低曂瞥鲂乱淮?b class="flag-6" style="color: red">多模態(tài)大模型AI融合巡檢超腦，全面升級(jí)人、車、行為、事件等算法，為行業(yè)帶來全新的多模態(tài)大模型巡檢體驗(yàn)，以更準(zhǔn)確、更高效的智慧巡檢，為各行各業(yè)的安全運(yùn)行和發(fā)展保駕護(hù)航。

2025-04-17 17:12:21

1438

基于MindSpeed MM玩轉(zhuǎn)Qwen2.5VL多模態(tài)理解模型

多模態(tài)理解模型是讓AI像人類一樣，通過整合多維度信息（如視覺、語(yǔ)言、聽覺等），理解數(shù)據(jù)背后的語(yǔ)義、情感、邏輯或場(chǎng)景，從而完成推理、決策等任務(wù)。

2025-04-18 09:30:31

2803

設(shè)備預(yù)測(cè)性維護(hù)進(jìn)入2.0時(shí)代：多模態(tài)AI如何突破誤報(bào)困局

三號(hào)生產(chǎn)線傳感器報(bào)警頻發(fā)，多模態(tài) AI 技術(shù)為解決難題提供新思路。工廠升級(jí)數(shù)據(jù)層、決策層、應(yīng)用層，實(shí)現(xiàn)故障預(yù)測(cè)，系統(tǒng)上線后立即顯現(xiàn)強(qiáng)大能力，解決設(shè)備問題。

2025-04-22 09:24:08

695

中國(guó)科學(xué)院：電鰻啟發(fā)離子電子人造皮膚，具有多模態(tài)感知和傳感器內(nèi)儲(chǔ)層計(jì)算功能

無(wú)法同時(shí)實(shí)現(xiàn)多模態(tài)感知和記憶（即觸覺、熱學(xué)和電學(xué)刺激），難以檢測(cè)超低電流，以及在高效傳感器內(nèi)儲(chǔ)層計(jì)算所必需的豐富突觸行為方面存在局限性。受電鰻的啟發(fā)，本研究開發(fā)了一種基于離子電子p-n結(jié)的人工皮膚，該p-n結(jié)由PolyAT和

2025-05-11 17:24:24

839

XMOS為普及AI應(yīng)用推出基于軟件定義SoC的多模態(tài)AI傳感器融合接口

多模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開啟感知智能的新篇章

2025-05-12 17:51:54

430

為旌科技VS859：國(guó)產(chǎn)具身智能“感算控”一體SoC，賦能邊緣多模態(tài)智能場(chǎng)景

　　VS859是上海為旌科技有限公司推出的一款面向國(guó)產(chǎn)具身智能的多模態(tài)“感算控”一體化單芯片解決方案。是一款專為邊緣智能場(chǎng)景設(shè)計(jì)的高集成度SoC芯片，集成多模態(tài)感知接入、高性能異構(gòu)計(jì)算與低時(shí)延處理能力，可廣泛適配智慧城市、智能機(jī)器人、智能交通等復(fù)雜應(yīng)用場(chǎng)景。

2025-05-14 14:29:06

1338

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

2025-06-12 10:17:08

474

中偉視界：解密GB28181流媒體平臺(tái)，多模態(tài)AI的強(qiáng)大支撐

GB28181流媒體平臺(tái)作為多模態(tài)AI系統(tǒng)的基礎(chǔ)數(shù)據(jù)樞紐，解決了多源異構(gòu)視頻資源的接入與處理問題，提供標(biāo)準(zhǔn)化數(shù)據(jù)格式，支持各類智能分析與應(yīng)用場(chǎng)景。其廣泛的協(xié)議兼容性和強(qiáng)大的視頻處理能力，使得其在智慧安監(jiān)、智慧城市等多個(gè)領(lǐng)域中，實(shí)現(xiàn)了高效的安全管理及運(yùn)營(yíng)效率提升，是推動(dòng)智能化轉(zhuǎn)型的重要模塊。

2025-07-24 14:38:49

666

商湯科技多模態(tài)通用智能戰(zhàn)略思考

時(shí)間是最好的試金石，AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí)，商湯早已錨定“多模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路徑。

2025-08-14 09:33:34

1085

淺析多模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

?在人工智能邁向AGI通用智能的關(guān)鍵道路上，大模型正從單一的文本理解者，演進(jìn)為能同時(shí)看、聽、讀、想的“多面手”。驅(qū)動(dòng)這一進(jìn)化的核心燃料，正是高質(zhì)量的多模態(tài)數(shù)據(jù)，而將原始數(shù)據(jù)轉(zhuǎn)化為“機(jī)器可讀教材

2025-09-05 13:49:27

1266

亞馬遜云科技上線Amazon Nova多模態(tài)嵌入模型

Embeddings多模態(tài)嵌入模型現(xiàn)已在Amazon Bedrock上線，這是一款專為Agentic RAG與語(yǔ)義搜索應(yīng)用打造的頂尖多模態(tài)嵌入模型。該模型是首個(gè)通過單一模型支持文本、文檔、圖像、視頻與音頻

2025-10-29 17:15:16

174

安富利解析智能駕駛中的感知與決策技術(shù)

當(dāng)汽車開始像人類一樣感知世界、做出決策，一場(chǎng)由AI驅(qū)動(dòng)的交通革命已悄然發(fā)生。

2025-10-31 10:37:24

657

商湯科技正式發(fā)布并開源全新多模態(tài)模型架構(gòu)NEO

商湯科技正式發(fā)布并開源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) —— NEO，為日日新SenseNova 多模態(tài)模型奠定了新一代架構(gòu)的基石。

2025-12-08 11:19:10

861

多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)的應(yīng)用與未來發(fā)展

? ? 多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)，是融合多模態(tài)大模型與自主機(jī)器人技術(shù)的創(chuàng)新型方案。該系統(tǒng)整合視覺、激光雷達(dá)、聲學(xué)等多源

2025-12-29 11:27:56

120

已全部加載完成

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

基于多模態(tài)智慧感知決策的S230芯片

評(píng)論