91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯絕影在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2024-07-23 10:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“基于原生多模態(tài)大模型,商湯絕影正在打造一系列全新的車載智能化產(chǎn)品,推動智能汽車向超級智能體進(jìn)化?!鄙虦萍悸?lián)合創(chuàng)始人、首席科學(xué)家、絕影智能汽車事業(yè)群總裁王曉剛在WAIC 2024商湯科技“大愛無疆·向新力”人工智能論壇上說。

一個(gè)超級智能體的進(jìn)化離不開強(qiáng)大的端側(cè)模型,大量原生多模態(tài)大模型正在從云走向智能汽車為代表的各種智能終端,車端模型部署能力將成為智能汽車進(jìn)化過程中不可或缺的技術(shù)保障。

在論壇上,王曉剛宣布商湯絕影在行業(yè)內(nèi)率先實(shí)現(xiàn)了原生多模態(tài)大模型的車端部署。絕影行業(yè)領(lǐng)先的車載端側(cè)8B模型首包延遲可低至300毫秒以內(nèi),推理速度40 Tokens/秒,并且能夠覆蓋主流算力平臺。

商湯絕影在行業(yè)率先實(shí)現(xiàn)

原生多模態(tài)大模型的車端部署

此前GPT-4o的發(fā)布為消費(fèi)者展示了多模態(tài)實(shí)時(shí)交互的方式,讓更多人領(lǐng)略多模態(tài)感知和交互的魅力,也開始幫助釋放多模態(tài)大模型的商業(yè)落地想象空間。

相較于手機(jī),智能汽車才是更適合承載多模態(tài)大模型的落地場景。因?yàn)橹悄芷噧?nèi)外的各種攝像頭是常開的,用戶可以實(shí)時(shí)跟汽車通過多模態(tài)的方式進(jìn)行交互。同時(shí),智能汽車的保有量不斷增加,能夠產(chǎn)生豐富的終端用戶反饋和數(shù)據(jù)信息,讓模型不斷迭代成長。

和OpenAI等公司相比,商湯絕影是汽車智能化的核心供應(yīng)商,在智能駕駛和智能座艙領(lǐng)域具備豐富的量產(chǎn)經(jīng)驗(yàn),將以多模態(tài)大模型為核心加速“以人為本”的智能汽車交互革新。

但相比于其他的終端,智能汽車有其特殊性,對安全和實(shí)時(shí)響應(yīng)有著非常高的要求,汽車是私密空間,終端用戶非常在意隱私保護(hù)。這就注定了多模態(tài)大模型大部分的任務(wù)將在車載終端完成。商湯絕影能夠以云側(cè)、端云結(jié)合、端側(cè)等全棧方式靈活部署多模態(tài)大模型,讓商湯原生多模態(tài)能力能夠快速落地智能汽車。

在WAIC 2024商湯人工智能論壇上,商湯絕影宣布在行業(yè)率先實(shí)現(xiàn)原生多模態(tài)大模型的車端部署,并在現(xiàn)場演示了搭載在200 TOPS+平臺上的8B模型(即80億參數(shù))車端部署方案,展示強(qiáng)多模態(tài)感知和交互能力。

wKgaomafGuOAFfavAABeskhV_7o211.jpg

相較于動輒就有幾秒鐘延遲的云上部署方案,商湯絕影車載端側(cè)8B多模態(tài)模型可以實(shí)現(xiàn)首包延遲可低至300毫秒以內(nèi),推理速度40 Tokens/秒,引領(lǐng)“以人為本”的智能汽車交互革新。

在WAIC 2024面向公眾的展臺上,商湯絕影還對外展示了在多個(gè)不同算力平臺上運(yùn)行2.1B或8B端側(cè)多模態(tài)大模型的適配能力。

明年,上千TOPS算力的車載芯片就會問世?;诟咚懔Φ挠?jì)算平臺,商湯絕影多模態(tài)大模型車端部署方案的首包延遲將大幅度降低,推理速度進(jìn)一步提高,為用戶帶來更加流暢和自然的智能汽車交互體驗(yàn)。

引領(lǐng)多模態(tài)車端部署

商湯絕影有“殺器”

多模態(tài)大模型能夠?qū)⒄Z音、文字、圖像、手勢、視頻等各種模態(tài)進(jìn)行高效且深度地融合,提供更加豐富且自然的人機(jī)交互體驗(yàn)。

過去許多模型處理不同模態(tài)信息是先把語音等輸入轉(zhuǎn)化為文字,文字和圖像結(jié)合進(jìn)行分析,輸出反饋也是先生成文字,根據(jù)文字再生成語音輸出,會有大量信息丟失和很高的延遲。

由“日日新5.5”體系支持的全新商湯多模態(tài)大模型是一種端到端的模型,也就是文字、語音、視頻等模態(tài)一同輸入,模型統(tǒng)一處理后輸出相應(yīng)模態(tài)的信息,相較于過去的方案,多模態(tài)融合的技術(shù)難度是幾何倍數(shù)的提升。

技術(shù)上的高難度是商湯行業(yè)領(lǐng)先的原生多模態(tài)能力的直接體現(xiàn)。今年4月發(fā)布的“日日新5.0”是國內(nèi)首個(gè)對標(biāo)GPT-4 Turbo的國產(chǎn)大模型,“日日新5.5”體系更是全面升級,數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng),交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對標(biāo)GPT-4o。

商湯持續(xù)迭代的“日日新”大模型體系是商湯絕影多模態(tài)的車端部署領(lǐng)先行業(yè)的底氣所在,也是絕影的“大殺器”之一。

要讓多模態(tài)大模型從云上落地到車端,商湯絕影還有更多的秘密武器。

由于車載硬件、系統(tǒng)種類繁多,各種加速芯片層出不窮,其他行業(yè)和開源的框架工具很難完全支持和適配,同時(shí)也為了解決自回歸方式生成token效率較低的問題,商湯絕影專為多模態(tài)大模型打造了一個(gè)“大殺器”——高性能計(jì)算引擎“HyperPPL”。它綜合了大語言模型、多模態(tài)模型、CNN模型、前后處理完整的優(yōu)化能力,是智能汽車領(lǐng)域最廣泛的高性能AI芯片異構(gòu)計(jì)算平臺,為商湯絕影多模態(tài)大模型落地車端提供強(qiáng)大的計(jì)算底座。

HyperPPL目前擴(kuò)展并支持主流車載計(jì)算硬件,兼容多種主流操作系統(tǒng),適配多個(gè)車載芯片的部署平臺,使得商湯絕影原生多模態(tài)大模型在主流芯片平臺均可快速部署上線。

同時(shí),HyperPPL支持flash decode、segment prefill等400多個(gè)硬件算子,并對算子進(jìn)行性能優(yōu)化,同時(shí)量化支持int8、int4模式,并支持訓(xùn)練后量化,從而實(shí)現(xiàn)極致推理效率。相較于大多數(shù)開源的Python推理框架、C++推理框架以及訓(xùn)練推理框架,商湯絕影自研HyperPPL方案在Orin平臺上的推理速度更快,超過40 Tokens/S。而對比英偉達(dá)的原生推理框架 TensorRT,絕影的HyperPPL在推理能力相當(dāng)?shù)那闆r下,在內(nèi)存上有明顯優(yōu)勢,即以更小的內(nèi)存達(dá)到和前者相同的推理速度。

不僅如此,商湯絕影HyperPPL還針對車載多人場景進(jìn)行優(yōu)化,使得車內(nèi)多人并發(fā)情況下,車端多模態(tài)大模型的模型推理效率相比單人沒有明顯降低。

這些“大殺器”為商湯絕影引領(lǐng)多模態(tài)大模型的車端部署保駕護(hù)航。基于車端原生多模態(tài)大模型,商湯絕影將與合作伙伴共同打造全新的車載智能化產(chǎn)品,引領(lǐng)“以人為本”的智能汽車交互革新,加速智能汽車駛?cè)階GI時(shí)代。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50099

    瀏覽量

    265440
  • 商湯科技
    +關(guān)注

    關(guān)注

    8

    文章

    609

    瀏覽量

    37559
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5189

原文標(biāo)題:80億參數(shù),40 Tokens/秒,0.3秒延遲!商湯絕影行業(yè)首發(fā)原生多模態(tài)大模型車端部署

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    商湯科技正式開源模態(tài)自主推理模型SenseNova-MARS

    今日,商湯正式開源模態(tài)自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在模態(tài)
    的頭像 發(fā)表于 01-30 10:13 ?538次閱讀
    <b class='flag-5'>商湯</b>科技正式開源<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>自主推理<b class='flag-5'>模型</b>SenseNova-MARS

    SGS為商湯頒發(fā)ISO 21448預(yù)期功能安全產(chǎn)品認(rèn)證證書

    近日,國際公認(rèn)的測試、檢驗(yàn)和認(rèn)證機(jī)構(gòu)SGS(以下簡稱:SGS)正式頒發(fā)全球首張ISO 21448(SOTIF)預(yù)期功能安全產(chǎn)品認(rèn)證證書,授予上海臨港智能科技有限公司(以下簡稱:商湯
    的頭像 發(fā)表于 01-07 13:49 ?512次閱讀

    商湯科技日日新V6.5榮獲2025年模態(tài)模型全國第一

    近日,權(quán)威大模型評測基準(zhǔn) SuperCLUE 發(fā)布《中文模態(tài)視覺語言模型測評基準(zhǔn)12月報(bào)告》,商湯日日新V6.5(SenseNova V6
    的頭像 發(fā)表于 01-06 14:44 ?632次閱讀
    <b class='flag-5'>商湯</b>科技日日新V6.5榮獲2025年<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>全國第一

    商湯科技正式發(fā)布并開源全新模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布并開源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova
    的頭像 發(fā)表于 12-08 11:19 ?1019次閱讀
    <b class='flag-5'>商湯</b>科技正式發(fā)布并開源全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>架構(gòu)NEO

    商湯亮相汽車之家全球AI科技大會

    近日,由汽車之家主辦的「汽車之家全球AI科技大會」在北京舉行。商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、CTO、商湯CEO王曉剛出席大會,并發(fā)表《世界模型
    的頭像 發(fā)表于 09-29 14:09 ?633次閱讀

    商湯亮相2025長安汽車科技生態(tài)大會

    9月5日-8日,商湯受邀參加2025世界智能產(chǎn)業(yè)博覽會「長安汽車科技生態(tài)大會」,作為長安汽車合作伙伴參與行業(yè)技術(shù)交流,現(xiàn)場展出
    的頭像 發(fā)表于 09-10 16:33 ?1738次閱讀

    商湯日日新V6.5模態(tài)模型登頂全球權(quán)威榜單

    根據(jù)權(quán)威評測平臺OpenCompass模態(tài)模型學(xué)術(shù)榜單(Multi-modal Academic Leaderboard)最新數(shù)據(jù)顯示,商湯「日日新 V6.5」(SenseNova
    的頭像 發(fā)表于 09-10 09:55 ?801次閱讀

    米爾RK3576部署側(cè)模態(tài)輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    開源模態(tài)模型的快速移植,形成 “芯片 - 工具鏈 - 模型” 的協(xié)同生態(tài)。 當(dāng) RK3576 證明 “側(cè)能跑好轉(zhuǎn)好多
    發(fā)表于 09-05 17:25

    商湯科技模態(tài)通用智能戰(zhàn)略思考

    時(shí)間是最好的試金石,AI領(lǐng)域尤其如此。當(dāng)行業(yè)熱議大模型走向時(shí),商湯早已錨定“模態(tài)通用智能”——這是我們以深厚研究積累和實(shí)踐反復(fù)驗(yàn)證的可行路
    的頭像 發(fā)表于 08-14 09:33 ?1190次閱讀

    商湯日日新SenseNova融合模態(tài)模型 國內(nèi)首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI模態(tài)模型首輪評估。 商湯日日新SenseNova融合模態(tài)
    的頭像 發(fā)表于 06-11 11:57 ?1420次閱讀

    商湯亮相2025上海車展

    近日,第二十一屆上海國際汽車工業(yè)展覽會(下稱“2025上海車展”)隆重開幕,商湯攜系列生成式AI汽車創(chuàng)新產(chǎn)品亮相。
    的頭像 發(fā)表于 04-27 10:44 ?846次閱讀

    商湯科技助力如數(shù)字人超級直播間全新升級

    作為數(shù)字人全行業(yè)首創(chuàng),如數(shù)字人超級直播間可實(shí)現(xiàn)模態(tài)智能運(yùn)營,依托“商湯日日新SenseNov
    的頭像 發(fā)表于 04-23 16:31 ?991次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態(tài)模型

    InternVL2.5-1B/8B/MPO,Huggingface推出的全球最小模態(tài)模型SmloVLM-256M。為工業(yè)界提供了離線部署
    的頭像 發(fā)表于 04-21 10:56 ?3156次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B視覺<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>

    商湯王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講

    商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯CEO王曉剛在NVIDIA GTC 2025發(fā)表演講《激發(fā)通用人工智能的創(chuàng)造力,引領(lǐng)智能汽車走向全新的未來》。
    的頭像 發(fā)表于 03-21 14:37 ?1184次閱讀

    商湯“日日新”融合大模型登頂大語言與模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結(jié)果顯示:在語言和模態(tài)核心能力測評中,商湯“日日新”融合大
    的頭像 發(fā)表于 03-18 10:35 ?1145次閱讀