多模態(tài)AI將迎來(lái)更廣闊的發(fā)展空間

一、合成數(shù)據(jù)，保護(hù)隱私

目前，由于 AI 技術(shù)呈指數(shù)級(jí)發(fā)展，變得更加先進(jìn)，但其局限性仍然存在。例如，某些行業(yè)缺乏足夠的真實(shí)數(shù)據(jù)來(lái)訓(xùn)練 AI 模型，又或者合規(guī)隱私成為一些行業(yè)技術(shù)發(fā)展的痛點(diǎn)。企業(yè)紛紛開(kāi)始部署 Synthetic data （合成數(shù)據(jù)），即由計(jì)算機(jī)人工生成的數(shù)據(jù)，可用于替代自現(xiàn)實(shí)世界中采集的真實(shí)數(shù)據(jù)集。

現(xiàn)階段，基于 GANs 的圖像合成技術(shù)和視頻合成技術(shù)發(fā)展迅猛，但高效且可行的表格數(shù)據(jù)合成技術(shù)仍處于初級(jí)階段。整體來(lái)看，數(shù)據(jù)匿名化、隱私合規(guī)和糾正算法偏見(jiàn)等優(yōu)勢(shì)使得合成數(shù)據(jù)技術(shù)成為吸引各行業(yè)公司的關(guān)鍵要素。

二、芯片追逐戰(zhàn)

隨著 AI 技術(shù)不斷進(jìn)步，加速在各行業(yè)落地應(yīng)用。無(wú)論是云數(shù)據(jù)中心還是像照相機(jī)這樣的智能邊緣設(shè)備，適用于計(jì)算密集型的專(zhuān)業(yè)硬件需求激增。

由于空間和能源的限制，大型芯片并不適用于許多日常的 AI 應(yīng)用場(chǎng)景?？紤]到這一點(diǎn)，越來(lái)越多的公司開(kāi)始研發(fā)可以用于汽車(chē)傳感器、照相機(jī)、自動(dòng)化工廠機(jī)器人等低功耗設(shè)備的 AI 芯片。

三、AI 賦能內(nèi)容審核

在美國(guó)，玩電子游戲的人數(shù)達(dá)到了史上前所未有的最高水平。76% 的 18 歲以下的青少年沉迷于電子游戲，這讓家長(zhǎng)們擔(dān)心孩子們極有可能接觸到不合時(shí)宜或者充滿(mǎn)仇恨的信息。

隨著元宇宙的火熱以及網(wǎng)絡(luò)游戲生態(tài)系統(tǒng)的迅速發(fā)展，有害信息已經(jīng)從社交媒體蔓延到新的陣地，即網(wǎng)絡(luò)游戲和虛擬世界。

網(wǎng)絡(luò)游戲環(huán)境惡劣，充斥著各種仇恨言論、網(wǎng)絡(luò)霸凌以及故意退出。反誹謗聯(lián)盟的一項(xiàng)研究發(fā)現(xiàn)，在比較受歡迎的多人游戲中，高達(dá) 80% 的玩家都曾受到騷擾。

一些初創(chuàng)公司正著眼于利用 AI 技術(shù)進(jìn)行內(nèi)容審核。Spectrum Labs 稱(chēng)，其 NLP 平臺(tái)可以將音頻和文本的內(nèi)容審核工作減少 50% ，有害信息檢測(cè)能力提高 10 倍。

利用 AI 技術(shù)實(shí)現(xiàn)完美的內(nèi)容審核是不可能的。在線(xiàn)用戶(hù)能夠不斷適應(yīng)審查規(guī)則，逃避平臺(tái)的審查。但是，在 NLP 和基于深度學(xué)習(xí)的圖像分類(lèi)等關(guān)鍵領(lǐng)域取得的突破，以及以?xún)?nèi)容審查為業(yè)務(wù)方向的 AI 初創(chuàng)企業(yè)獲得多輪融資，在一定程度上表明了 AI 審核將成為未來(lái)的方向之一。

四、Deepfakes 檢測(cè)

Deepfakes（深度偽造）不僅能創(chuàng)造出極其逼真的圖像，還能生成“假”聲音和視頻。

利用 AI 學(xué)習(xí)算法，Deepfakes 的技術(shù)愈發(fā)精進(jìn)，效果十分逼真。網(wǎng)絡(luò)上公開(kāi)發(fā)布的視頻和錄音數(shù)量之多，容易獲取，這使得訓(xùn)練 AI 算法和 Deepfakes 容易許多。研究人員表示，對(duì)于人們來(lái)說(shuō)，區(qū)分 AI 偽造的人像、物體和視頻與真實(shí)情況十分困難。

Deepfakes 衍生出的假新聞和假消息是一個(gè)大問(wèn)題。對(duì)于消費(fèi)者來(lái)說(shuō)。Deepfakes 還有可能成為網(wǎng)絡(luò)釣魚(yú)和勒索詐騙的工具。

為了應(yīng)對(duì)日益增長(zhǎng)的網(wǎng)絡(luò)安全威脅，一些科技公司開(kāi)始嘗試各種解決方案，包括設(shè)備端認(rèn)證軟件和 API、區(qū)塊鏈等。去年，Meta 的研究人員聲稱(chēng)他們不僅可以確定圖像是否是偽造的，還可以剖析用于深度偽造的 AI 模型。但是 Deepfakes 技術(shù)還將持續(xù)演進(jìn)、無(wú)處不在，人們需要尋找新的方法將其摧毀。

五、低代碼/零代碼開(kāi)發(fā)

算法能將自然語(yǔ)言命令翻譯成計(jì)算機(jī)代碼，特別是對(duì)公民開(kāi)發(fā)者來(lái)說(shuō)，這意味著軟件開(kāi)發(fā)新一股的浪潮。

目前自動(dòng)編程仍處于初級(jí)階段。但該領(lǐng)域技術(shù)進(jìn)步促使一些初創(chuàng)公司不斷拓展零代碼/低代碼解決方案，讓非技術(shù)用戶(hù)能夠參與數(shù)據(jù)科學(xué)項(xiàng)目，縮小技能差距，并加快生產(chǎn)周期。

六、多模態(tài) AI 崛起

多模態(tài) AI 正在打破單一感官的藩籬，使用一個(gè)通用 AI 模型科技將多種類(lèi)型的數(shù)據(jù)所蘊(yùn)含的語(yǔ)義信息概念化并作出預(yù)測(cè)。

多模態(tài) AI 正在從實(shí)驗(yàn)室走到實(shí)際應(yīng)用。例如，谷歌正在使用多模態(tài) AI 來(lái)改進(jìn)搜索體驗(yàn)。未來(lái)，如果用戶(hù)上傳了一張登山靴的照片，并附上“我能穿著這雙靴子去富士山徒步旅行嗎？”的文字，搜索引擎將識(shí)別上傳的圖像，從文本、圖像和視頻數(shù)據(jù)中挖掘網(wǎng)絡(luò)上關(guān)于富士山的信息，并將這些瑣碎的信息連接起來(lái)，提供一個(gè)貼切的答案。

七、AI for AI

隨著 AI 技術(shù)應(yīng)用延展，企業(yè)正在尋求徹底改變現(xiàn)有的數(shù)據(jù)管理模式的解決方案，轉(zhuǎn)向“AI 優(yōu)先”策略。說(shuō)起來(lái)容易做起來(lái)難。從采集數(shù)據(jù)、運(yùn)行數(shù)據(jù)質(zhì)量檢查到開(kāi)發(fā)模型和監(jiān)測(cè)后期生產(chǎn)表現(xiàn)，一個(gè)項(xiàng)目從原始數(shù)據(jù)轉(zhuǎn)變?yōu)樯a(chǎn)準(zhǔn)備是一個(gè)多步驟的過(guò)程。

端到端的機(jī)器學(xué)習(xí)公司將 AI 生命周期管理過(guò)程中的多步驟融合成一個(gè) SaaS 產(chǎn)品，這將為那些希望快速高效構(gòu)建 AI 系統(tǒng)的企業(yè)提供絕佳選擇。

無(wú)代碼和低代碼趨勢(shì)也擴(kuò)展至機(jī)器學(xué)習(xí)平臺(tái)，以彌合 AI 技能差距，plug-and-play（即插即用）的功能激勵(lì)非專(zhuān)家人員參與到 AI 項(xiàng)目中。為此，2021 年，全球第二高估值 AI 獨(dú)角獸公司 Databricks 收購(gòu)了低程序代碼工具供應(yīng)商 8080 Labs。

隨著大多數(shù)老牌廠商開(kāi)始布局 Auto ML（自動(dòng)機(jī)器學(xué)習(xí)）功能，“AI for AI”也成為增長(zhǎng)的領(lǐng)域。企業(yè)開(kāi)始使用 AI 技術(shù)將 AI 開(kāi)發(fā)過(guò)程的各環(huán)節(jié)自動(dòng)化，如數(shù)據(jù)質(zhì)量檢查或部分模型開(kāi)發(fā)環(huán)節(jié)。

持續(xù)分化，未來(lái)已來(lái)，“AI for AI”將迎來(lái)更廣闊的發(fā)展空間。　　

? ? ? 審核編輯：彭靜

閱讀全文

網(wǎng)絡(luò)安全(63171) 網(wǎng)絡(luò)安全(63171)
AI(298911) AI(298911)
代碼(73407) 代碼(73407)

評(píng)論

神經(jīng)模態(tài)芯片發(fā)展的方向神經(jīng)模態(tài)芯片技術(shù)解析

的初創(chuàng)公司如aiCTX等也正在積極探索超低功耗神經(jīng)模態(tài)芯片在不同領(lǐng)域的應(yīng)用，我們認(rèn)為在未來(lái)幾年內(nèi)隨著AI+IoT的發(fā)展，神經(jīng)模態(tài)計(jì)算將

2020-09-15 15:41:32

1135

基于多模態(tài)語(yǔ)義SLAM框架

本文提出了一個(gè)魯棒且快速的多模態(tài)語(yǔ)義 SLAM 框架，旨在解決復(fù)雜和動(dòng)態(tài)環(huán)境中的 SLAM 問(wèn)題。具體來(lái)說(shuō)，將僅幾何聚類(lèi)和視覺(jué)語(yǔ)義信息相結(jié)合，以減少由于小尺度對(duì)象、遮擋和運(yùn)動(dòng)模糊導(dǎo)致的分割誤差的影響。

2022-08-31 09:39:14

2570

炬芯科技 2019 多模態(tài)交互技術(shù)開(kāi)發(fā)者大會(huì)：AI多模態(tài)交互如何助力教育

2020年AI多模態(tài)交互技術(shù)將會(huì)迎來(lái)較大爆發(fā)。12月19日，在炬芯科技第四屆Techlife炬芯2019多模態(tài)交互技術(shù)開(kāi)發(fā)者大會(huì)上，來(lái)自喜馬拉雅、達(dá)摩院、玩瞳科技、IP方CEVA的行業(yè)大咖們，從內(nèi)容

2019-12-24 11:46:43

14451

語(yǔ)音識(shí)別技術(shù)最新進(jìn)展：視聽(tīng)融合的多模態(tài)交互成為主要演進(jìn)方向

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）所謂“模態(tài)”，英文是modality，用通俗的話(huà)說(shuō)，就是“感官”，多模態(tài)即將多種感官融合。多模態(tài)交互技術(shù)是近年來(lái)人工智能領(lǐng)域的一項(xiàng)重要?jiǎng)?chuàng)新。隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展，采用

2023-12-28 09:06:45

6613

2019CEE北京消費(fèi)電子展:語(yǔ)音識(shí)別發(fā)展前景廣闊

人工智能技術(shù)和產(chǎn)業(yè)發(fā)展。4、中國(guó)人工智能應(yīng)用將在服務(wù)機(jī)器人領(lǐng)域迎來(lái)突破2015年已經(jīng)有大量企業(yè)在服務(wù)機(jī)器人領(lǐng)域展開(kāi)相關(guān)布局。從中國(guó)人工智能市場(chǎng)結(jié)構(gòu)上看，服務(wù)機(jī)器人市場(chǎng)規(guī)模達(dá)到60億元，占比29.4%，服務(wù)機(jī)器人基于日常生活中的廣泛需求，有著廣闊的市場(chǎng)空間。

2018-11-22 09:13:35

AI發(fā)展對(duì)芯片技術(shù)有什么影響？

現(xiàn)在說(shuō)AI是未來(lái)人類(lèi)技術(shù)進(jìn)步的一大方向，相信大家都不會(huì)反對(duì)。說(shuō)到AI和芯片技術(shù)的關(guān)系，我覺(jué)得主要體現(xiàn)在兩個(gè)方面：第一，AI的發(fā)展要求芯片技術(shù)不斷進(jìn)步；第二，AI可以幫助芯片技術(shù)向前發(fā)展。

2019-08-12 06:38:51

『深思考』打造人工智能機(jī)器大腦，讓AI更懂你！

的問(wèn)題”楊志明說(shuō)。深思考人工智能機(jī)器人（iDeepWise.ai）4.0在多模態(tài)深度語(yǔ)義理解方面有突出優(yōu)勢(shì)。深度語(yǔ)義理解使得機(jī)器人能夠理解上下文，與人進(jìn)行多輪交互。讓機(jī)器與人的交流更加流暢，更接近于人與人之間

2018-09-13 09:40:58

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

實(shí)例，從而保持高計(jì)算效率。 2、Q算法 Q項(xiàng)目將大模型功能與A*和Q-learning等復(fù)雜算法結(jié)合，進(jìn)一步推動(dòng)了AI領(lǐng)域的蓬勃發(fā)展，標(biāo)志著向AGI方向邁出了重要的一步。可能達(dá)到的高度：自主學(xué)習(xí)

2025-09-18 15:31:59

智能天線(xiàn)在未來(lái)移動(dòng)通信中有哪些應(yīng)用？

近年來(lái)，隨著微電子技術(shù)的高速發(fā)展，智能天線(xiàn)技術(shù)已成功應(yīng)用于移動(dòng)通信系統(tǒng)，并通過(guò)對(duì)無(wú)線(xiàn)數(shù)字信號(hào)的高速時(shí)空處理，極大地改善了頻譜的使用效率。今后幾年我國(guó)將進(jìn)入3G高速建設(shè)發(fā)展期，智能天線(xiàn)技術(shù)將會(huì)迎來(lái)廣闊的發(fā)展空間。　　

2019-08-12 06:36:07

智能家居發(fā)展前景廣闊

力度，并產(chǎn)生互補(bǔ)。今后我國(guó)的智能家居應(yīng)走品質(zhì)與服務(wù)并重的路線(xiàn)，未來(lái)智能家居發(fā)展前景廣闊。智能家居還在中國(guó)掀起了一股不小的熱浪，在各大品牌房企的精裝修標(biāo)準(zhǔn)中也加入了智能家居的概念，智能家居如何真正落地到

2018-08-04 11:18:54

松靈新品丨全球首款多模態(tài)?ROS開(kāi)發(fā)平臺(tái)LIMO來(lái)了，將聯(lián)合古月居打造精品課程精選資料分享

多地形通過(guò)性和多場(chǎng)景的適應(yīng)性一直是無(wú)人駕駛、機(jī)器人等場(chǎng)景化所需要突破的難題。通過(guò)多模態(tài)運(yùn)動(dòng)融合，提高跨維度運(yùn)動(dòng)的柔性適應(yīng)能力是一種理想的解決方式，這決定了機(jī)器人和移動(dòng)平臺(tái)未來(lái)應(yīng)用場(chǎng)景開(kāi)拓的深度和廣度

2021-08-30 08:39:33

米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話(huà),6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

“看圖說(shuō)話(huà)+語(yǔ)音問(wèn)答”的融合交互。五、結(jié)論與未來(lái)發(fā)展方向如果說(shuō) “大模型上云” 是 AI 的 “星辰大?！保敲?“多模態(tài)落地端側(cè)” 就是 AI 的 “柴米油鹽”—— 后者決定了智能技術(shù)能否真正

2025-09-05 17:25:10

lABCIWQmultyWindows多模態(tài)窗口2010

lABCIWQmultyWindows多模態(tài)窗口2010。

2016-05-17 17:47:59

體驗(yàn)MiniCPM-V 2.6 多模態(tài)能力

多模態(tài)組網(wǎng)

jf_23871869發(fā)布于 2025-01-20 13:40:48

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

自適應(yīng)并行結(jié)構(gòu)的多模態(tài)生物特征識(shí)別

2017-10-16 11:06:04

多文化場(chǎng)景下的多模態(tài)情感識(shí)別

自動(dòng)情感識(shí)別是一個(gè)非常具有挑戰(zhàn)性的課題，并且有著廣泛的應(yīng)用價(jià)值．本文探討了在多文化場(chǎng)景下的多模態(tài)情感識(shí)別問(wèn)題．我們從語(yǔ)音聲學(xué)和面部表情等模態(tài)分別提取了不同的情感特征。包括傳統(tǒng)的手工定制特征和基于深度

2017-12-18 14:47:31

AGV機(jī)器人未來(lái)發(fā)展空間廣闊

來(lái)自Tractica的研究數(shù)據(jù)顯示，至2021年全球倉(cāng)儲(chǔ)和物流機(jī)器人的市場(chǎng)規(guī)模將達(dá)到224億美元，行業(yè)整體的未來(lái)發(fā)展空間廣闊。如何在巨大的市場(chǎng)中分上一杯羹？

2018-04-18 16:39:59

5518

AI在腎腫瘤影像學(xué)診斷及治療中有巨大的價(jià)值和廣闊的應(yīng)用空間

和進(jìn)展，在生物醫(yī)學(xué)領(lǐng)域也不例外。AI與醫(yī)學(xué)影像相結(jié)合是其在生物醫(yī)學(xué)領(lǐng)域研究的重點(diǎn)方向之一，尤其是腫瘤影像領(lǐng)域。腎腫瘤是臨床常見(jiàn)的腫瘤病變之一，AI在腎腫瘤影像學(xué)診斷及治療中有巨大的價(jià)值和廣闊的應(yīng)用空間。

2019-01-03 10:34:53

3259

5G推動(dòng)AIoT落地多模態(tài)AI芯成必然

繼去年5月在行業(yè)率先推出首款面向物聯(lián)網(wǎng)的AI芯片—雨燕（Swift）及其系統(tǒng)解決方案之后，1月2日，國(guó)內(nèi)領(lǐng)先的人工智能企業(yè)云知聲在京召開(kāi)新聞發(fā)布會(huì)，正式公布了其多模態(tài)AI芯片戰(zhàn)略與規(guī)劃。會(huì)上同步曝光

2019-01-03 15:59:12

1681

云知聲正式公布全新多模態(tài)AI芯片戰(zhàn)略與規(guī)劃

2019年1月2日，云知聲在北京召開(kāi)一場(chǎng)主題為”聲視不凡“的新聞發(fā)布會(huì)，正式公布了其全新的多模態(tài)AI芯片戰(zhàn)略與規(guī)劃。

2019-01-04 09:41:31

5204

5G+AIoT為智能家居插上飛的翅膀將迎來(lái)更廣闊的前景

推向更快發(fā)展道路的重任，而這也是 5G 時(shí)代真正有魅力的地方。隨著 5G 的腳步越來(lái)越近，物聯(lián)網(wǎng)的發(fā)展也將迎來(lái)新的機(jī)遇，尤其是對(duì)物聯(lián)網(wǎng)應(yīng)用的重要場(chǎng)景——智能家居行業(yè)將帶來(lái)非常大的影響。

2019-04-30 16:05:16

1310

長(zhǎng)虹聯(lián)手騰訊云小微探索智能電視上更廣闊的AI應(yīng)用形式和商業(yè)空間

聲紋識(shí)別技術(shù)、AI交互能力和豐富的內(nèi)容和服務(wù)生態(tài)，為用戶(hù)提供個(gè)性化內(nèi)容推薦服務(wù)，探索智能電視上更廣闊的AI應(yīng)用形式和商業(yè)空間。

2019-05-22 16:12:25

1258

物聯(lián)網(wǎng)是如何推動(dòng)智能空間的發(fā)展

智能空間（Smart Space）是嵌入了計(jì)算、信息設(shè)備和多模態(tài)的傳感裝置的工作或生活空間，具有自然便捷的交互接口，以支持人們方便地獲得計(jì)算機(jī)系統(tǒng)的服務(wù)。

2019-06-17 15:21:11

1429

更廣泛領(lǐng)域的AI應(yīng)用

從2C到2G、2B，AI應(yīng)用于更廣泛的領(lǐng)域，助力傳統(tǒng)行業(yè)轉(zhuǎn)型和市場(chǎng)競(jìng)爭(zhēng)格局重構(gòu)。

2019-08-09 15:40:26

5697

英特爾和IBM積極探索神經(jīng)模態(tài)計(jì)算到底是什么？

目前英特爾和IBM在內(nèi)的企業(yè)正積極探索超低功耗神經(jīng)模態(tài)芯片在不同領(lǐng)域的應(yīng)用，在未來(lái)幾年內(nèi)隨著 AI+IoT 的發(fā)展，神經(jīng)模態(tài)計(jì)算將會(huì)迎來(lái)一波新的熱潮。

2020-03-08 09:08:00

2269

多模態(tài)成AI行業(yè)發(fā)展新風(fēng)向新基建行業(yè)進(jìn)入快車(chē)道

近日，由螞蟻金服牽頭制定的“生物特征識(shí)別多模態(tài)融合國(guó)際標(biāo)準(zhǔn)”正式立項(xiàng)，這一標(biāo)準(zhǔn)的制定，對(duì)于多模態(tài)領(lǐng)域發(fā)展與技術(shù)規(guī)范產(chǎn)生了重大影響。

2020-03-31 11:46:47

3127

AI全新應(yīng)用場(chǎng)景技術(shù)趨勢(shì)多模態(tài)學(xué)習(xí)

新的 AI 技術(shù)發(fā)展趨勢(shì)有哪些？多模態(tài)學(xué)習(xí)技術(shù)一定是其中之一。

2020-07-18 09:19:12

2376

國(guó)產(chǎn)替代空間大,大陸偏光片廠商將迎來(lái)發(fā)展良機(jī)

可見(jiàn)，隨著國(guó)內(nèi)液晶面板產(chǎn)業(yè)快速發(fā)展，我國(guó)偏光片產(chǎn)業(yè)也加快發(fā)展。但目前我國(guó)偏光片的自給率仍然很低，供應(yīng)存在較大缺口，尤其大尺寸偏光片市場(chǎng)國(guó)產(chǎn)替代空間較大，預(yù)計(jì)大陸偏光片廠商將迎來(lái)良好的發(fā)展良機(jī)。

2020-10-19 10:40:34

5047

AI將迎來(lái)四大發(fā)展機(jī)遇

10月23日，2020科大訊飛全球1024開(kāi)發(fā)者節(jié)正式拉開(kāi)序幕，科大訊飛董事長(zhǎng)劉慶峰在開(kāi)幕式上回述了訊飛人工智能開(kāi)放平臺(tái)發(fā)布十周年的風(fēng)雨歷程，并指出未來(lái)AI迎來(lái)四大發(fā)展機(jī)遇。

2020-10-23 16:31:46

2788

光伏行業(yè)將迎來(lái)廣闊的發(fā)展空間

2020年是光伏類(lèi)上市公司表現(xiàn)強(qiáng)勁的一年。在整個(gè)產(chǎn)業(yè)鏈上，從上游的多晶硅、硅片，到中游的光伏玻璃、電池片，再到下游的逆變器、組件等，各類(lèi)上市公司均得到了市場(chǎng)資金的追逐。在研究機(jī)構(gòu)看來(lái)，隨著光伏平價(jià)上網(wǎng)時(shí)代的到來(lái)，受益于碳減排進(jìn)程加速下全球范圍能源結(jié)構(gòu)的變化，光伏行業(yè)仍有廣闊的發(fā)展空間。

2020-11-19 10:02:00

2765

未來(lái)AI語(yǔ)音識(shí)別市場(chǎng)將迎來(lái)廣闊的發(fā)展空間

語(yǔ)音識(shí)別技術(shù)自 20 世紀(jì) 50 年代開(kāi)始步入萌芽階段，發(fā)展至今，主流算法模型已經(jīng)經(jīng) 歷了四個(gè)階段：包括模板匹配階段、模式和特征分析階段、概率統(tǒng)計(jì)建模階段和現(xiàn)在主流的深度神經(jīng)網(wǎng)絡(luò)階段。目前，語(yǔ)音識(shí)別主流廠商主要使用端到端算法，在理想實(shí)驗(yàn)環(huán)境下語(yǔ)音識(shí)別準(zhǔn)確率可高達(dá) 98%以上。

2021-01-04 14:13:55

3576

AI工廠將迎來(lái)前所未有的爆發(fā)期

AI工廠讓人工智能生產(chǎn)正在從手工時(shí)代進(jìn)入工業(yè)時(shí)代，新基建帶動(dòng)的市場(chǎng)空間則有可能為這一批量生產(chǎn)的算法產(chǎn)品提供更廣闊的空間。兩者相遇，AI工業(yè)化已經(jīng)不是一個(gè)遙遠(yuǎn)的命題。 AI工廠的概念及本質(zhì) 在當(dāng)

2021-01-12 16:14:50

2857

研發(fā)全新多模態(tài)感知AI框架 AI能同時(shí)模擬人眼和手預(yù)測(cè)物體運(yùn)動(dòng)

據(jù)外媒VentureBeat報(bào)道，來(lái)自三星、麥吉爾大學(xué)和約克大學(xué)的研究人員，近日研發(fā)出一個(gè)全新的生成式多模態(tài)感知AI框架，能夠根據(jù)物體初始狀態(tài)的視覺(jué)和觸覺(jué)數(shù)據(jù)，來(lái)預(yù)測(cè)出物體的運(yùn)動(dòng)趨勢(shì)。據(jù)悉，這是

2021-02-12 09:12:00

3829

Transformer模型的多模態(tài)學(xué)習(xí)應(yīng)用

隨著Transformer在視覺(jué)中的崛起，Transformer在多模態(tài)中應(yīng)用也是合情合理的事情，甚至以后可能會(huì)有更多的類(lèi)似的paper。

2021-03-25 09:29:59

11785

基于層次注意力機(jī)制的多模態(tài)圍堵情感識(shí)別模型

識(shí)別模型。在音頻模態(tài)中加人頻率注意力機(jī)制學(xué)習(xí)頻域上下文信息，利用多模態(tài)注意力機(jī)制將視頻特征與音頻特征進(jìn)行融合，依據(jù)改進(jìn)的損失函數(shù)對(duì)模態(tài)缺失問(wèn)題進(jìn)行優(yōu)化，提高模型的魯棒性以及情感識(shí)別的性能。在公開(kāi)數(shù)據(jù)集上的實(shí)

2021-04-01 11:20:51

基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法

針對(duì)多模態(tài)目標(biāo)跟蹤中大多僅考慮單個(gè)圖像的異種特征融合或不同模態(tài)圖像的同種特征融合，為了使得這兩者間能自然集成，提出基于聯(lián)合壓縮感知的多模態(tài)目標(biāo)統(tǒng)一跟蹤方法。通過(guò)將多模態(tài)跟蹤問(wèn)題轉(zhuǎn)化為多重2-范數(shù)

2021-04-27 15:59:29

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

多模態(tài)MR和多特征融合的GBM自動(dòng)分割算法

2021-06-27 11:45:54

2021 OPPO開(kāi)發(fā)者大會(huì)主會(huì)場(chǎng)：多模態(tài)、簡(jiǎn)單AI，賦能開(kāi)發(fā)者價(jià)值實(shí)現(xiàn)

2021 OPPO開(kāi)發(fā)者大會(huì)主會(huì)場(chǎng)：多模態(tài)、簡(jiǎn)單AI，賦能開(kāi)發(fā)者價(jià)值實(shí)現(xiàn)

2021-10-27 10:49:04

1707

多通道無(wú)線(xiàn)空間音頻走向大眾，或是智能音箱下一個(gè)創(chuàng)新點(diǎn)

低成本的無(wú)線(xiàn)空間音頻技術(shù)帶到更廣闊的市場(chǎng)。就這一新產(chǎn)品的技術(shù)和市場(chǎng)發(fā)展情況，WiSA Technologies總裁、CEO和董事長(zhǎng)Brett Moyer先生以及WiSA 全球銷(xiāo)售副總裁James Cheng鄭元杰與包括電子發(fā)燒友網(wǎng)在內(nèi)的電子科技媒體進(jìn)行了分享交流。 ? 多通道無(wú)

2022-06-14 17:46:23

5356

機(jī)器學(xué)習(xí)多模態(tài)落地存在哪些挑戰(zhàn)

多模態(tài)技術(shù)有著相當(dāng)廣泛的應(yīng)用場(chǎng)景，如淘寶搜圖、AI字幕、AI虛擬數(shù)字人、仿人交互、智能助手、商品推薦和信息流廣告、視頻幀人臉幀的圖向量檢索、語(yǔ)音交互等等。

2022-10-11 15:20:20

1549

面向社交媒體的多模態(tài)屬性級(jí)情感分析

另一方面，相比于單一的文本數(shù)據(jù)，多模態(tài)數(shù)據(jù)包含了多種不同信息，這些信息之間往往一一對(duì)應(yīng)、互為補(bǔ)充，如何對(duì)齊不同模態(tài)的內(nèi)容并提出有效的多模態(tài)融合機(jī)制是一個(gè)十分棘手的問(wèn)題。

2022-10-19 10:10:11

3025

C型USB 1.2版——USB具有更廣闊的市場(chǎng)

C型USB 1.2版——USB具有更廣闊的市場(chǎng)

2022-11-02 08:16:18

基于多模態(tài)智慧感知決策的S230芯片

提到多模態(tài)融合感知，我們難免會(huì)覺(jué)得有些困惑 “模態(tài)”，可理解為“感官” 多模態(tài)即將多種感官融合不夠直觀？那今天我們就以一道競(jìng)猜題開(kāi)場(chǎng) 請(qǐng)根據(jù)以下線(xiàn)索猜猜這是什么物品？

2022-11-03 11:59:06

1058

為什么不同模態(tài)的embedding在表征空間中形成不同的簇

文中將一些經(jīng)典的多模態(tài)對(duì)比學(xué)習(xí)模型中兩個(gè)模態(tài)的embedding，通過(guò)降維等方法映射到二維坐標(biāo)系中。

2022-12-05 14:06:27

1616

一個(gè)真實(shí)閑聊多模態(tài)數(shù)據(jù)集TikTalk

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話(huà)任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話(huà)中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。

2023-02-09 09:31:26

3236

中文多模態(tài)對(duì)話(huà)數(shù)據(jù)集

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話(huà)任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話(huà)中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。目前已經(jīng)提出了各種各樣的多模態(tài)對(duì)話(huà)數(shù)據(jù)集，主要來(lái)自電影、電視劇、社交媒體平臺(tái)等

2023-02-22 11:03:01

2185

ImageBind：跨模態(tài)之王，將6種模態(tài)全部綁定！

最近，很多方法學(xué)習(xí)與文本、音頻等對(duì)齊的圖像特征。這些方法使用單對(duì)模態(tài)或者最多幾種視覺(jué)模態(tài)。最終嵌入僅限于用于訓(xùn)練的模態(tài)對(duì)。因此，視頻 - 音頻嵌入無(wú)法直接用于圖像 - 文本任務(wù)，反之亦然。學(xué)習(xí)真正的聯(lián)合嵌入面臨的一個(gè)主要障礙是缺乏所有模態(tài)融合在一起的大量多模態(tài)數(shù)據(jù)。

2023-05-11 09:30:44

1973

VisCPM：邁向多語(yǔ)言多模態(tài)大模型時(shí)代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進(jìn)，多模態(tài)大模型已經(jīng)成為大模型邁向通用人工智能（AGI）目標(biāo)的下一個(gè)前沿焦點(diǎn)?？傮w而言，面向圖像和文本的多模態(tài)生成能力

2023-07-10 10:05:01

1255

更強(qiáng)更通用：智源「悟道3.0」Emu多模態(tài)大模型開(kāi)源，在多模態(tài)序列中「補(bǔ)全一切」

熱度。Flamingo 具備強(qiáng)大的多模態(tài)上下文少樣本學(xué)習(xí)能力。 Flamingo 走的技術(shù)路線(xiàn)是將大語(yǔ)言模型與一個(gè)預(yù)訓(xùn)練視覺(jué)編碼器結(jié)合，并插入可學(xué)習(xí)的層來(lái)捕捉跨模態(tài)依賴(lài)，其采用圖文對(duì)、圖文交錯(cuò)文檔、視頻文本對(duì)組成的多模態(tài)數(shù)據(jù)訓(xùn)練，在少樣本上下文學(xué)習(xí)方面表現(xiàn)出強(qiáng)大能力。

2023-07-16 20:45:02

1370

耀世星輝發(fā)布多模態(tài)模型AI創(chuàng)作平臺(tái)悅靈犀

多模態(tài)模型AI創(chuàng)作平臺(tái)悅靈犀。悅靈犀是一款多模態(tài)模型的AGI創(chuàng)作平臺(tái)，依托悅享人工智能大模型"北辰星悅"智能云服務(wù)，提供企業(yè)級(jí)穩(wěn)定可靠的AI創(chuàng)作與繪畫(huà)服務(wù)。作為新一代移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施生態(tài)服務(wù)商，耀世星輝始終圍繞 "平臺(tái)+ 內(nèi)容 + 場(chǎng)景+AI +產(chǎn)業(yè)" 的發(fā)展戰(zhàn)略

2023-07-18 21:17:38

1216

UniVL-DR: 多模態(tài)稠密向量檢索模型

for Multi-Modal Retrieval 背景介紹盡管當(dāng)前主流搜索引擎主要面向文本數(shù)據(jù)，然而多媒體內(nèi)容的增長(zhǎng)一直是互聯(lián)網(wǎng)上最顯著趨勢(shì)之一，各種研究表明用戶(hù)更喜歡搜索結(jié)果中出現(xiàn)生動(dòng)的多模態(tài)內(nèi)容。因而，針對(duì)于多

2023-08-06 22:00:03

1796

基于Transformer多模態(tài)先導(dǎo)性工作

多模態(tài)（Multimodality）是指在信息處理、傳遞和表達(dá)中涉及多種不同的感知模態(tài)或信息來(lái)源。這些感知模態(tài)可以包括語(yǔ)言、視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等，它們共同作用來(lái)傳遞更豐富、更全面的信息。在多模態(tài)系統(tǒng)中

2023-08-21 09:49:52

1518

DreamLLM：多功能多模態(tài)大型語(yǔ)言模型，你的DreamLLM~

由于固有的模態(tài)缺口，如CLIP語(yǔ)義主要關(guān)注模態(tài)共享信息，往往忽略了可以增強(qiáng)多模態(tài)理解的模態(tài)特定知識(shí)。因此，這些研究并沒(méi)有充分認(rèn)識(shí)到多模式創(chuàng)造和理解之間潛在的學(xué)習(xí)協(xié)同作用，只顯示出創(chuàng)造力的微小提高，并且在多模式理解方面仍然存在不足。

2023-09-25 17:26:43

1532

基于視覺(jué)的多模態(tài)觸覺(jué)感知系統(tǒng)

傳統(tǒng)的多模態(tài)/多任務(wù)觸覺(jué)感知系統(tǒng)通過(guò)集成多種傳感單元來(lái)達(dá)到多模態(tài)觸覺(jué)信息的解耦，但其往往導(dǎo)致系統(tǒng)結(jié)構(gòu)的復(fù)雜性，以及需要應(yīng)對(duì)來(lái)自不同刺激間的干擾。

2023-10-18 11:24:48

2013

AMD將AI技術(shù)引入筆記本電腦為用戶(hù)開(kāi)啟更廣闊的數(shù)字世界

引擎三合一處理器。?自此，AMD 將 AI 技術(shù)引入筆記本電腦，成為了使工智能技術(shù)賦能Windows 設(shè)備的引領(lǐng)者。借助AMD Ryzen AI，筆記本將變得比以往更智能、更高效、更易操作，為用戶(hù)開(kāi)啟更廣闊的數(shù)字世界。 ? ? 內(nèi)置AI技術(shù)的筆記本電腦，讓在線(xiàn)會(huì)議協(xié)作增強(qiáng)、智能AI助理解放雙手

2023-10-18 11:30:18

2262

探究編輯多模態(tài)大語(yǔ)言模型的可行性

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手，將單模態(tài)模型編輯拓展到多模態(tài)模型編輯，主要從以下三個(gè)方面：可靠性（Reliability），穩(wěn)定性（Locality）和泛化性（Generality）。

2023-11-09 14:53:22

1018

如何看待AI PC短線(xiàn)發(fā)展？

AI PC，即人工智能個(gè)人電腦，是將AI技術(shù)與PC深度融合，這類(lèi)PC將搭載更高計(jì)算能力的處理器，同時(shí)融合多模態(tài)算法以重塑PC體驗(yàn)。

2023-11-10 10:27:29

1535

大模型+多模態(tài)的3種實(shí)現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢(shì)是不支持其他模態(tài)（包括圖像、語(yǔ)音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強(qiáng)大、更通用呢？本節(jié)將介紹“大模型+多模態(tài)”的3種實(shí)現(xiàn)方法。

2023-12-13 13:55:04

3109

人工智能領(lǐng)域多模態(tài)的概念和應(yīng)用場(chǎng)景

隨著人工智能技術(shù)的不斷發(fā)展，多模態(tài)成為了一個(gè)備受關(guān)注的研究方向。多模態(tài)技術(shù)旨在將不同類(lèi)型的數(shù)據(jù)和信息進(jìn)行融合，以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工智能應(yīng)用。本文將詳細(xì)介紹多模態(tài)的概念、研究?jī)?nèi)容和應(yīng)用場(chǎng)景，并探討人工智能領(lǐng)域多模態(tài)的未來(lái)發(fā)展趨勢(shì)。

2023-12-15 14:28:44

13428

成都匯陽(yáng)投資關(guān)于多模態(tài)驅(qū)動(dòng)應(yīng)用前景廣闊，上游算力迎機(jī)會(huì)!

【Gemini 大模型主打多模態(tài)，性能對(duì)標(biāo) GPT-4】當(dāng)?shù)貢r(shí)間12月6日，谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)的多模態(tài)大模型 Gemini, 其最強(qiáng)大的 TPU (張量處理單元)系統(tǒng)

2023-12-18 13:08:45

1066

自動(dòng)駕駛和多模態(tài)大語(yǔ)言模型的發(fā)展歷程

多模態(tài)大語(yǔ)言模型(MLLM) 最近引起了廣泛的關(guān)注，其將 LLM 的推理能力與圖像、視頻和音頻數(shù)據(jù)相結(jié)合，通過(guò)多模態(tài)對(duì)齊使它們能夠更高效地執(zhí)行各種任務(wù)，包括圖像分類(lèi)、將文本與相應(yīng)的視頻對(duì)齊以及語(yǔ)音檢測(cè)。

2023-12-28 11:45:21

1381

洲明科技發(fā)布AI+多顯示終端技術(shù)，推動(dòng)LED行業(yè)數(shù)字化、智能化升級(jí)

因AI技術(shù)快速崛起，引領(lǐng)著數(shù)字產(chǎn)業(yè)新的場(chǎng)景、應(yīng)用及生態(tài)，同時(shí)也為L(zhǎng)ED行業(yè)帶來(lái)巨大商業(yè)機(jī)遇。為此，洲明科技提出“LED+AI”戰(zhàn)略，在技術(shù)層面，推出數(shù)字虛擬人UniAvatar、垂直多模態(tài)大模型LuminGPT、跨模態(tài)生產(chǎn)內(nèi)容UniCMGC、空間感知UniSP以及虛擬拍攝系統(tǒng)UniStudio。

2024-02-03 14:43:00

1758

阿里巴巴推出自主多模態(tài)AI代理MobileAgent

阿里巴巴最近推出了一款名為MobileAgent的自主多模態(tài)AI代理，這款產(chǎn)品模擬人類(lèi)操作手機(jī)，并采用純視覺(jué)解決方案，無(wú)需任何系統(tǒng)代碼。

2024-02-04 10:34:17

1730

Sora爆紅，多模態(tài)大模型是下一發(fā)展階段

“大語(yǔ)言模型為 AI 產(chǎn)業(yè)帶來(lái)新的生機(jī)，然而語(yǔ)言模型的應(yīng)用場(chǎng)景有限。要全面打開(kāi)生成式 AI 的想象力，還是要依托多模態(tài)大模型?！盜DC 中國(guó)研究總監(jiān)盧言霞近日表示。Sora在文生視頻領(lǐng)域真正邁出

2024-02-20 16:13:26

860

MWC2024：高通推出全新AI Hub及前沿多模態(tài)大模型

2024年世界移動(dòng)通信大會(huì)（MWC）上，高通再次展現(xiàn)其技術(shù)領(lǐng)導(dǎo)力，通過(guò)發(fā)布全新的高通AI Hub和展示前沿的多模態(tài)大模型技術(shù)，推動(dòng)了5G和AI技術(shù)的融合創(chuàng)新。

2024-02-26 16:59:50

1850

螞蟻集團(tuán)推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense

近日，螞蟻集團(tuán)聯(lián)合武漢大學(xué)宣布成功研發(fā)出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense。這一創(chuàng)新模型由螞蟻集團(tuán)的AI創(chuàng)新研發(fā)部門(mén)NextEvo與武漢大學(xué)共同完成，是迄今為止國(guó)際上參數(shù)規(guī)模最大、覆蓋任務(wù)最全、識(shí)別精度最高的多模態(tài)遙感大模型。

2024-03-04 11:22:23

1538

谷歌推出多模態(tài)VLOGGER AI

谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注，這項(xiàng)創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來(lái)并“說(shuō)話(huà)”。用戶(hù)只需提供一張人物肖像照片和一段音頻內(nèi)容，VLOGGER AI就能讓圖片中的人物仿佛真的在朗讀這段音頻，面部表情豐富，栩栩如生。

2024-03-22 10:45:29

1494

NVIDIA Edify多模態(tài)架構(gòu)升級(jí)，引領(lǐng)視覺(jué)生成式AI新紀(jì)元

NVIDIA近日宣布，其用于視覺(jué)生成式AI的多模態(tài)架構(gòu)Edify迎來(lái)重大更新，為開(kāi)發(fā)者和視覺(jué)內(nèi)容提供商帶來(lái)前所未有的新功能。其中，3D資產(chǎn)生成功能的引入，極大地提升了AI圖像生成的創(chuàng)意自由度，讓創(chuàng)作者能夠以前所未有的方式展現(xiàn)他們的想象力。

2024-03-27 10:22:15

961

AI機(jī)器人迎來(lái)多模態(tài)模型

配備 GR00T 模型的機(jī)器人由于需要“吸收消化”外界的多模態(tài)信息，還要快速完成理解、決策、行動(dòng)等一系列動(dòng)作，因此對(duì)于算力的需求是巨量的。

2024-04-12 10:39:46

628

AI快訊：華為助力金融行業(yè)加速擁抱AI 馬斯克xAI 展示首個(gè)多模態(tài)模型

AI快訊：華為助力金融行業(yè)加速擁抱AI 馬斯克xAI 展示首個(gè)多模態(tài)模型小編給大家匯總一下近期的AI資訊。華為助力金融行業(yè)加速擁抱AI 日前在以“數(shù)創(chuàng)未來(lái)，智慧金融”為主題的2024華為金融創(chuàng)新

2024-04-15 12:32:16

881

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

李未可科技多模態(tài) AI 大模型正式發(fā)布，積極推進(jìn) AI 在終端的場(chǎng)景應(yīng)用 ? 4月18日，2024中國(guó)生成式AI大會(huì)上李未可科技正式發(fā)布為眼鏡等未來(lái)終端定向優(yōu)化等自研WAKE-AI多模態(tài)大模型，具備

2024-04-18 17:01:29

1092

阿里云通義大模型助力“小愛(ài)同學(xué)”強(qiáng)化多模態(tài)AI生成能力

小米的人工智能助手“小愛(ài)同學(xué)”近期與阿里云通義大模型達(dá)成戰(zhàn)略合作，共同提升其多模態(tài)AI生成能力，特別是在圖片生成與理解方面。這次合作不僅將強(qiáng)化“小愛(ài)同學(xué)”的功能，還將在小米的多個(gè)產(chǎn)品線(xiàn)，包括小米汽車(chē)和手機(jī)等設(shè)備上得到實(shí)際應(yīng)用。

2024-05-13 09:19:08

1897

谷歌發(fā)布多模態(tài)AI新品，加劇AI巨頭競(jìng)爭(zhēng)

在全球AI競(jìng)技場(chǎng)上，谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日，谷歌在I/O開(kāi)發(fā)者大會(huì)上掀起了一股新的技術(shù)浪潮，發(fā)布了多款全新升級(jí)的多模態(tài)AI產(chǎn)品。

2024-05-16 09:28:34

853

Build 2024發(fā)布多項(xiàng)Azure AI Speech全新多模態(tài)功能

客戶(hù)們持續(xù)使用 Azure OpenAI 和 Azure AI Speech 進(jìn)行創(chuàng)新，為企業(yè)引入新的效率，并構(gòu)建新的多模態(tài)體驗(yàn)。

2024-05-28 09:08:12

1187

智譜AI發(fā)布全新多模態(tài)開(kāi)源模型GLM-4-9B

近日，智譜AI在人工智能領(lǐng)域取得重大突破，成功推出全新開(kāi)源模型GLM-4-9B。這款模型以其卓越的多模態(tài)能力，再次刷新了業(yè)界對(duì)于大型語(yǔ)言模型的認(rèn)識(shí)。

2024-06-07 09:17:16

1488

依圖多模態(tài)大模型伙伴CTO精研班圓滿(mǎn)舉辦

依圖科技多年來(lái)深耕人工智能領(lǐng)域，致力于將AI領(lǐng)先技術(shù)賦能各行業(yè)發(fā)展。隨著依圖天問(wèn)大模型4.0的發(fā)布，依圖也開(kāi)啟了大模型合作伙伴業(yè)務(wù)的新篇章。6月21日，來(lái)自全國(guó)各地的戰(zhàn)略合作伙伴走進(jìn)依圖，共同探討

2024-07-23 15:16:48

892

Meta發(fā)布多模態(tài)LLAMA 3.2人工智能模型

Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破，成功推出了多模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息，還實(shí)現(xiàn)了對(duì)圖像內(nèi)容的精準(zhǔn)理解，標(biāo)志著Meta在AI多模態(tài)處理領(lǐng)域邁出了堅(jiān)實(shí)的一步。

2024-09-27 11:44:14

982

蘋(píng)果發(fā)布300億參數(shù)多模態(tài)AI大模型MM1.5

蘋(píng)果近日推出了全新的多模態(tài)AI大模型MM1.5，該模型擁有高達(dá)300億的參數(shù)規(guī)模，是在前代MM1架構(gòu)的基礎(chǔ)上進(jìn)一步發(fā)展而來(lái)的。

2024-10-14 15:50:14

910

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進(jìn)行融合，通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián)，實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來(lái)說(shuō)，多模態(tài)大模型可以可以理解多種不同模態(tài)的輸入數(shù)據(jù)，并輸出相應(yīng)反饋結(jié)果，例如圖像理解，語(yǔ)音識(shí)別，視覺(jué)問(wèn)題等。

2024-10-18 09:39:38

2713

未來(lái)AI大模型的發(fā)展趨勢(shì)

上得到了顯著提升。未來(lái)，算法和架構(gòu)的進(jìn)一步優(yōu)化將推動(dòng)AI大模型在性能上實(shí)現(xiàn)新的突破。多頭自注意力機(jī)制、前饋神經(jīng)網(wǎng)絡(luò)等關(guān)鍵技術(shù)的改進(jìn)，將增強(qiáng)模型的表達(dá)能力和泛化能力。多模態(tài)融合： AI大模型正逐漸從單一模態(tài)向多模態(tài)發(fā)展，實(shí)現(xiàn)文本、圖像、音

2024-10-23 15:06:21

2870

高通與智譜推動(dòng)多模態(tài)生成式AI體驗(yàn)的終端側(cè)部署

此前，驍龍峰會(huì)首日，智譜與高通技術(shù)公司宣布合作將GLM-4V端側(cè)視覺(jué)大模型，面向驍龍8至尊版進(jìn)行深度適配和推理優(yōu)化，支持豐富的多模態(tài)交互方式，進(jìn)一步推動(dòng)多模態(tài)生成式AI在終端側(cè)的部署和推廣，賦能更加情境化、個(gè)性化的終端側(cè)智能體驗(yàn)。

2024-11-08 09:55:11

1295

商湯日日新多模態(tài)大模型權(quán)威評(píng)測(cè)第一

剛剛，商湯科技日日新SenseNova多模態(tài)大模型，在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的多模態(tài)評(píng)測(cè)中取得榜單第一。

2024-12-20 10:39:31

1573

2025年Next Token Prediction范式會(huì)統(tǒng)一多模態(tài)嗎

訓(xùn)練方法與推理策略性能評(píng)測(cè)體系現(xiàn)存挑戰(zhàn)與未來(lái)方向綜述的完整目錄如下：多模態(tài)的 Tokenization 我們認(rèn)為多模態(tài)的 Tokenization 是 MMNTP 的基石和最重要的部分，它將

2025-01-21 10:11:30

988

?？低暟l(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品

多模態(tài)大模型為安防行業(yè)帶來(lái)重大技術(shù)革新，基于觀瀾大模型技術(shù)體系，?？低?b class="flag-6" style="color: red">將大參數(shù)量、大樣本量的圖文多模態(tài)大模型與嵌入式智能硬件深度融合，發(fā)布多模態(tài)大模型文搜存儲(chǔ)系列產(chǎn)品——文搜NVR、文搜CVR。

2025-02-18 10:33:56

1125

?多模態(tài)交互技術(shù)解析

多模態(tài)交互多模態(tài)交互（ Multimodal Interaction ）是指通過(guò)多種感官通道（如視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等）或多種交互方式（如語(yǔ)音、手勢(shì)、觸控、眼動(dòng)等）與計(jì)算機(jī)系統(tǒng)進(jìn)行自然、協(xié)同的信息交互

2025-03-17 15:12:44

3955

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型，重塑智能交互新體驗(yàn)

隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速，多模態(tài)AI大模型的應(yīng)用需求不斷攀升，圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。3月20日，全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信宣布，其全系

2025-03-20 19:03:54

704

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型，重塑智能交互新體驗(yàn)

隨著千行百業(yè)數(shù)智化進(jìn)程的不斷加速，多模態(tài)AI大模型的應(yīng)用需求不斷攀升，圖像、語(yǔ)音、視頻等多樣化的交互方式正逐漸成為推動(dòng)行業(yè)變革的新動(dòng)力。 ? 3月20日，全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信宣布，其

2025-03-21 14:12:14

457

安霸在ISC West上推出下一代前端多模態(tài)AI技術(shù)

近日，Ambarella (下稱(chēng)“安霸”，納斯達(dá)克股票代碼：AMBA， AI 視覺(jué)感知芯片公司）在美國(guó)拉斯維加斯西部安防展（ISC West）上宣布，將持續(xù)推動(dòng)前端多模態(tài) AI 技術(shù)的創(chuàng)新與突破

2025-04-03 09:57:37

777

海康威視發(fā)布多模態(tài)大模型AI融合巡檢超腦

基于海康觀瀾大模型技術(shù)體系，海康威視推出新一代多模態(tài)大模型AI融合巡檢超腦，全面升級(jí)人、車(chē)、行為、事件等算法，為行業(yè)帶來(lái)全新的多模態(tài)大模型巡檢體驗(yàn)，以更準(zhǔn)確、更高效的智慧巡檢，為各行各業(yè)的安全運(yùn)行和發(fā)展保駕護(hù)航。

2025-04-17 17:12:21

1438

設(shè)備預(yù)測(cè)性維護(hù)進(jìn)入2.0時(shí)代：多模態(tài)AI如何突破誤報(bào)困局

三號(hào)生產(chǎn)線(xiàn)傳感器報(bào)警頻發(fā)，多模態(tài) AI 技術(shù)為解決難題提供新思路。工廠升級(jí)數(shù)據(jù)層、決策層、應(yīng)用層，實(shí)現(xiàn)故障預(yù)測(cè)，系統(tǒng)上線(xiàn)后立即顯現(xiàn)強(qiáng)大能力，解決設(shè)備問(wèn)題。

2025-04-22 09:24:08

695

XMOS為普及AI應(yīng)用推出基于軟件定義SoC的多模態(tài)AI傳感器融合接口

多模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開(kāi)啟感知智能的新篇章

2025-05-12 17:51:54

430

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

多模態(tài)+空間智能：盾華以AI+智慧路燈桿，點(diǎn)亮城市治理新方式

2025-06-12 10:17:08

474

潤(rùn)和軟件榮登2025多模態(tài)AI大模型排行榜單

近日，《互聯(lián)網(wǎng)周刊》聯(lián)合eNET研究院、德本咨詢(xún)、中國(guó)社會(huì)科學(xué)院信息化研究中心共同發(fā)布了“2025多模態(tài)AI大模型”榜單。江蘇潤(rùn)和軟件股份有限公司（以下簡(jiǎn)稱(chēng)“潤(rùn)和軟件”）自主研發(fā)的“潤(rùn)知”知識(shí)處理

2025-06-25 14:37:04

1494

中偉視界：解密GB28181流媒體平臺(tái)，多模態(tài)AI的強(qiáng)大支撐

GB28181流媒體平臺(tái)作為多模態(tài)AI系統(tǒng)的基礎(chǔ)數(shù)據(jù)樞紐，解決了多源異構(gòu)視頻資源的接入與處理問(wèn)題，提供標(biāo)準(zhǔn)化數(shù)據(jù)格式，支持各類(lèi)智能分析與應(yīng)用場(chǎng)景。其廣泛的協(xié)議兼容性和強(qiáng)大的視頻處理能力，使得其在智慧安監(jiān)、智慧城市等多個(gè)領(lǐng)域中，實(shí)現(xiàn)了高效的安全管理及運(yùn)營(yíng)效率提升，是推動(dòng)智能化轉(zhuǎn)型的重要模塊。

2025-07-24 14:38:49

666

“端云＋多模態(tài)”新范式：《移遠(yuǎn)通信AI大模型技術(shù)方案白皮書(shū)》正式發(fā)布

7月28日，移遠(yuǎn)通信聯(lián)合智次方研究院正式發(fā)布《AI大模型技術(shù)方案白皮書(shū)》（以下簡(jiǎn)稱(chēng)“白皮書(shū)”）。這份白皮書(shū)系統(tǒng)梳理了AI大模型的技術(shù)特點(diǎn)、產(chǎn)業(yè)發(fā)展態(tài)勢(shì)與多元應(yīng)用場(chǎng)景，以及移遠(yuǎn)通信“端云+多模態(tài)”AI

2025-07-28 13:08:10

1062

商湯科技多模態(tài)通用智能戰(zhàn)略思考

時(shí)間是最好的試金石，AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí)，商湯早已錨定“多模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路徑。

2025-08-14 09:33:34

1085

集成端側(cè)AI的可穿戴多模態(tài)生理參數(shù)采集設(shè)備是腦機(jī)接口家用的未來(lái)？

HUIYING集成端側(cè)AI的可穿戴多模態(tài)生理參數(shù)采集設(shè)備系統(tǒng)概述隨著對(duì)實(shí)時(shí)生理監(jiān)測(cè)與人機(jī)交互需求的增長(zhǎng)，傳統(tǒng)可穿戴設(shè)備在多模態(tài)同步采集與端側(cè)智能處理方面存在不足。BioGAP-Ultra應(yīng)運(yùn)而生

2025-11-05 18:03:29

1530

涂鴉Omni AI Foundation V2.6發(fā)布：低代碼+多模態(tài)，重塑AI硬件創(chuàng)新體驗(yàn)

硬件產(chǎn)品的落地。今天，我們非常高興地宣布：面向多模態(tài)AI硬件的基座平臺(tái)OmniAIFoundation正式發(fā)布V2.6版本。本次升級(jí)不僅顯著提升了端到端多模態(tài)交互體

2025-12-24 18:58:23

202

多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)的應(yīng)用與未來(lái)發(fā)展

? ? 多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng) ? ?北京華盛恒輝多模態(tài)感知大模型驅(qū)動(dòng)的密閉空間自主勘探系統(tǒng)，是融合多模態(tài)大模型與自主機(jī)器人技術(shù)的創(chuàng)新型方案。該系統(tǒng)整合視覺(jué)、激光雷達(dá)、聲學(xué)等多源

2025-12-29 11:27:56

120

已全部加載完成

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

多模態(tài)AI將迎來(lái)更廣闊的發(fā)展空間

評(píng)論