12月16日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench4.0發(fā)布最新評(píng)測(cè)結(jié)果。云知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展現(xiàn)出全面領(lǐng)先的技術(shù)實(shí)力,一舉斬獲醫(yī)療智能體、醫(yī)療大語(yǔ)言模型、醫(yī)療多模態(tài)大模型三項(xiàng)技術(shù)范式,成為本次評(píng)測(cè)中表現(xiàn)最為突出的“三冠王”。

其中,UniGPT?Med?U1在醫(yī)療大語(yǔ)言模型評(píng)測(cè)中以綜合得分65.7分登頂,力壓Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一眾國(guó)際頂尖模型。同時(shí),在醫(yī)療智能體評(píng)測(cè)中以綜合得分94.6分的優(yōu)異成績(jī),大幅領(lǐng)先第二名Claude-Sonnet-4.5(88.8)近6分;

MedBench4.0-醫(yī)療大語(yǔ)言模型評(píng)測(cè)榜單

MedBench4.0-醫(yī)療智能體評(píng)測(cè)榜單
UniGPT?Med?VL則在醫(yī)療多模態(tài)大模型評(píng)測(cè)中以綜合得分59.6分摘得桂冠,領(lǐng)先第二名GPT-5(53.7分)近6分,展現(xiàn)出絕對(duì)技術(shù)優(yōu)勢(shì)。

MedBench4.0-醫(yī)療多模態(tài)大模型評(píng)測(cè)榜單
MedBench評(píng)測(cè)平臺(tái)由上海人工智能實(shí)驗(yàn)室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家權(quán)威機(jī)構(gòu)共同打造,以其科學(xué)、公平、嚴(yán)謹(jǐn)?shù)脑u(píng)測(cè)體系著稱(chēng)。2025年11月20日,該平臺(tái)全面迭代更新至4.0版本,成為全國(guó)首個(gè)且唯一面向垂直模型、專(zhuān)用模型及各應(yīng)用場(chǎng)景的醫(yī)療大模型評(píng)測(cè)與驗(yàn)證體系。本次升級(jí)聚焦實(shí)戰(zhàn)化評(píng)測(cè)突破與生態(tài)化開(kāi)放共建兩大核心,全面覆蓋醫(yī)療大語(yǔ)言模型、醫(yī)療多模態(tài)大模型及醫(yī)療智能體三大技術(shù)范式,并深度對(duì)齊國(guó)家《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》,旨在為醫(yī)療AI從技術(shù)可行走向臨床可用搭建關(guān)鍵的驗(yàn)證橋梁。
基于嚴(yán)格的醫(yī)學(xué)標(biāo)準(zhǔn),平臺(tái)構(gòu)建了高質(zhì)量、多維度、覆蓋廣泛的評(píng)測(cè)集。其中,醫(yī)療大語(yǔ)言模型評(píng)測(cè)涵蓋5大能力維度、36個(gè)專(zhuān)業(yè)子集,約70萬(wàn)條數(shù)據(jù);醫(yī)療多模態(tài)大模型評(píng)測(cè)聚焦3大核心能力、10個(gè)專(zhuān)業(yè)子集;醫(yī)療智能體評(píng)測(cè)則圍繞6大行動(dòng)維度設(shè)置了14個(gè)復(fù)雜任務(wù)集。在此嚴(yán)苛且全面的評(píng)估框架下,山海大模型能夠一舉奪得三項(xiàng)冠軍,充分彰顯了其極高的技術(shù)含金量與實(shí)用價(jià)值。
此次評(píng)測(cè)的卓越表現(xiàn),得益于山海醫(yī)療大模型最新版本完成的系統(tǒng)性核心升級(jí)。新版本致力于構(gòu)建業(yè)界能力維度最豐富的醫(yī)療AI技術(shù)支撐體系,其核心亮點(diǎn)在于實(shí)現(xiàn)了“醫(yī)學(xué)文本大模型”與“醫(yī)學(xué)多模態(tài)大模型”雙核心產(chǎn)品體系的深度融合,全面覆蓋從文本處理、智能體協(xié)同到影像解析的多元功能,形成了當(dāng)前能力維度最豐富的醫(yī)療AI技術(shù)架構(gòu)。
通過(guò)深度融合模擬臨床思維的復(fù)雜推理能力,模型實(shí)現(xiàn)了精準(zhǔn)的鑒別診斷與循證決策支持;同時(shí),原生內(nèi)化的任務(wù)規(guī)劃、工具調(diào)用與多智能體協(xié)作等核心能力,推動(dòng)其完成了從“醫(yī)學(xué)認(rèn)知大腦”向“自主醫(yī)療行動(dòng)者”的關(guān)鍵進(jìn)階,能夠高效適配并執(zhí)行復(fù)雜的真實(shí)醫(yī)療任務(wù)流程。
在多模態(tài)能力方面,新版本展現(xiàn)出對(duì)臨床場(chǎng)景的深度賦能。它不僅能夠精準(zhǔn)識(shí)別X光、CT、MRI等多種醫(yī)學(xué)影像中的病灶與解剖結(jié)構(gòu),高效提取醫(yī)療文檔關(guān)鍵文本信息,更支持跨模態(tài)語(yǔ)義對(duì)齊與聯(lián)合推理,能夠融合影像特征與臨床描述進(jìn)行綜合判斷,為臨床決策提供多源數(shù)據(jù)支撐的精準(zhǔn)建議。
權(quán)威榜單的成績(jī)是技術(shù)實(shí)力的顯性證明,而真正的價(jià)值在于臨床實(shí)踐的檢驗(yàn)與認(rèn)可。依托該模型,云知聲推出了覆蓋診療全流程的“智慧醫(yī)療產(chǎn)品矩陣”,涵蓋智能病歷生成與質(zhì)控、臨床輔助決策、醫(yī)療質(zhì)量監(jiān)管、醫(yī)保支付智能審核以及智慧患者服務(wù)等核心產(chǎn)品。這些產(chǎn)品已深入醫(yī)政管理、臨床診療、運(yùn)營(yíng)管理和患者服務(wù)等關(guān)鍵環(huán)節(jié),并在全國(guó)部署近400家醫(yī)院,700余家醫(yī)院進(jìn)入測(cè)試階段。其中覆蓋北京協(xié)和醫(yī)院、北京友誼醫(yī)院、東南大學(xué)附屬中大醫(yī)院、青島大學(xué)附屬醫(yī)院等數(shù)百家國(guó)內(nèi)頂級(jí)三甲醫(yī)院。
在提升診療效率與質(zhì)量方面,落地案例成效顯著。例如,門(mén)診病歷生成系統(tǒng)能夠?qū)崟r(shí)捕捉醫(yī)患之間的對(duì)話(huà)內(nèi)容,智能提取關(guān)鍵問(wèn)診信息,并自動(dòng)生成結(jié)構(gòu)化病歷。醫(yī)生僅需進(jìn)行簡(jiǎn)單審核,即可完成病歷書(shū)寫(xiě)工作。目前該系統(tǒng)已在北京友誼醫(yī)院順義院區(qū)廣泛應(yīng)用,單份病歷直接引用率接近90%,大幅降低了醫(yī)生文書(shū)負(fù)擔(dān);智能病歷質(zhì)控系統(tǒng)能夠精準(zhǔn)理解病歷內(nèi)容,并智能識(shí)別其中的書(shū)寫(xiě)錯(cuò)誤與缺陷。系統(tǒng)對(duì)影像描述、專(zhuān)業(yè)術(shù)語(yǔ)進(jìn)行細(xì)致分析,并對(duì)檢查結(jié)果、檢查結(jié)論以及檢查依據(jù)進(jìn)行深度解讀,從而實(shí)現(xiàn)高效、精準(zhǔn)的病歷質(zhì)控;DRG/DIP醫(yī)保支付管理系統(tǒng)以智能提醒和數(shù)據(jù)分析兩種方式,從診療過(guò)程中、醫(yī)保結(jié)算前到醫(yī)保結(jié)算后,為醫(yī)生、質(zhì)控員、編碼員和醫(yī)保處提供全流程、全方位的醫(yī)保支付管理服務(wù)。該系統(tǒng)成功助力中國(guó)人保財(cái)險(xiǎn)完成核賠風(fēng)控AI醫(yī)療審核系統(tǒng)的全國(guó)性部署。
作為AGI技術(shù)的先行者,云知聲始終致力于以專(zhuān)業(yè)大模型和全棧自研AI技術(shù)解決產(chǎn)業(yè)核心問(wèn)題。山海醫(yī)療大模型在三大核心評(píng)測(cè)維度的全能奪冠,標(biāo)志著其技術(shù)體系實(shí)現(xiàn)了從底層認(rèn)知、多模態(tài)理解到上層智能體執(zhí)行的全棧式、一體化突破,為醫(yī)療AI的深度臨床應(yīng)用樹(shù)立了新的標(biāo)桿。
未來(lái),云知聲將繼續(xù)深耕醫(yī)療AI領(lǐng)域,持續(xù)推動(dòng)更加安全、可靠、智慧的醫(yī)療AI解決方案在廣泛場(chǎng)景中落地應(yīng)用,賦能醫(yī)療服務(wù)體系的質(zhì)量與效率升級(jí),為助力健康中國(guó)建設(shè)貢獻(xiàn)堅(jiān)實(shí)的科技力量。
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
2000瀏覽量
61580 -
云知聲
+關(guān)注
關(guān)注
0文章
314瀏覽量
9360 -
大模型
+關(guān)注
關(guān)注
2文章
3647瀏覽量
5176
原文標(biāo)題:云知聲山海醫(yī)療大模型問(wèn)鼎MedBench4.0三項(xiàng)榜首,以“三冠王”戰(zhàn)績(jī)樹(shù)立醫(yī)療AI新標(biāo)桿
文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
云知聲正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型
云知聲發(fā)布“山海·知音”大模型2.0,醫(yī)療AI加速落地驅(qū)動(dòng)業(yè)績(jī)高增長(zhǎng)
云知聲與嘉會(huì)醫(yī)療達(dá)成戰(zhàn)略合作
云知聲山海知音大模型2.0重磅發(fā)布
云知聲山海醫(yī)療大模型問(wèn)鼎MedBench4.0三項(xiàng)榜首
評(píng)論