91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)8種大模型體驗(yàn)測評(píng)報(bào)告(2023)

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2023-08-21 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告指出當(dāng)前國產(chǎn)大模型產(chǎn)品已具有顯著進(jìn)步,訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現(xiàn)搶眼,但與接受過高等教育的人類相比,在智商、情商等方面仍存在一定程度差距。

報(bào)告選取360智腦、百度文心一言、瀾舟 Mchat、商湯商量、訊飛星火、阿里通義千問、昆侖天工、智譜 ChatGLM 共 8 種大模型產(chǎn)品進(jìn)行評(píng)測,根據(jù)基礎(chǔ)能力、智商能力、情商能力、工具提取四個(gè)維度計(jì)算總分。

報(bào)告顯示,與2023年6月相比,當(dāng)前中國大模型產(chǎn)品進(jìn)步顯著。但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。具體來看,訊飛星火在工作提效方面優(yōu)勢明顯,百度文心一言基礎(chǔ)能力仍處領(lǐng)軍水準(zhǔn),商湯商量則在情商方面表現(xiàn)優(yōu)秀,智譜AI-ChatGLM整體表現(xiàn)優(yōu)秀。

針對(duì)各維度能力測評(píng),該報(bào)告還給出了相應(yīng)的案例展示和分析。

在基礎(chǔ)能力方面,人類與AI之間的差距并不顯著。課題組分別從語言能力(35%)、AI向善(10%)、跨模態(tài)(20%)和多輪對(duì)話(35%)四大指標(biāo)進(jìn)行測評(píng)。測評(píng)顯示,科技企業(yè)大模型中,百度文心一言表現(xiàn)最為搶眼,商湯商量、智譜AI-ChatGLM、360智腦表現(xiàn)優(yōu)良。

在智商評(píng)估方面,人類在智商方面仍然具有明顯優(yōu)勢。課題組分別從常識(shí)知識(shí)(20%)、邏輯能力(50%)和專業(yè)知識(shí)(30%)方面對(duì)科技企業(yè)大模型進(jìn)行考量。結(jié)果顯示,訊飛星火、智譜AI-ChatGLM表現(xiàn)突出,百度文心一言、昆侖萬維天工表現(xiàn)優(yōu)良。

在情商方面,AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強(qiáng)的優(yōu)勢,和更靈活的處理能力。通過對(duì)處理日常事項(xiàng)(35%)、一語雙關(guān)(30%)、人際關(guān)系(35%)問題進(jìn)行分析發(fā)現(xiàn),科技企業(yè)大模型中,商湯商量表現(xiàn)亮眼,百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現(xiàn)優(yōu)良。

在工作效率提升方面,課題組重點(diǎn)在工具提效(50%)和生成創(chuàng)新(50%)方面進(jìn)行考量。結(jié)果顯示,訊飛星火表現(xiàn)最為搶眼,百度文心一言、商湯商量、智譜AI-ChatGLM表現(xiàn)優(yōu)良。不過,盡管AI具有高速度和高效率的優(yōu)勢,但在某些復(fù)雜和具有創(chuàng)新性的任務(wù)中,人類的智慧和想象力仍然具有無法替代的作用。

在不同領(lǐng)域中,AI和人類表現(xiàn)出不同的優(yōu)劣勢,但在整體上,AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效帶來了重要的積極影響,大模型正在加速走進(jìn)生活、走進(jìn)產(chǎn)業(yè)。在本次體驗(yàn)測評(píng)基礎(chǔ)上,研究團(tuán)隊(duì)將繼續(xù)深耕,加強(qiáng)在大模型安全可解釋性、工作提效能力、實(shí)際落地情況、產(chǎn)業(yè)優(yōu)秀案例等維度上的探索與研究。


8c6e799a-3fb7-11ee-ac96-dac502259ad0.jpg

8c96aa82-3fb7-11ee-ac96-dac502259ad0.jpg

8cb26e98-3fb7-11ee-ac96-dac502259ad0.jpg

8cc9a55e-3fb7-11ee-ac96-dac502259ad0.jpg

8cee04e4-3fb7-11ee-ac96-dac502259ad0.jpg

8d38e482-3fb7-11ee-ac96-dac502259ad0.jpg

8d5ead5c-3fb7-11ee-ac96-dac502259ad0.jpg

8da5e230-3fb7-11ee-ac96-dac502259ad0.jpg

8dce081e-3fb7-11ee-ac96-dac502259ad0.jpg

8de89c24-3fb7-11ee-ac96-dac502259ad0.jpg

8e007768-3fb7-11ee-ac96-dac502259ad0.jpg

8e2299f6-3fb7-11ee-ac96-dac502259ad0.jpg

8e5c568c-3fb7-11ee-ac96-dac502259ad0.jpg

8e7e38d8-3fb7-11ee-ac96-dac502259ad0.jpg

8eae686e-3fb7-11ee-ac96-dac502259ad0.jpg

8ee20034-3fb7-11ee-ac96-dac502259ad0.jpg

8f073304-3fb7-11ee-ac96-dac502259ad0.jpg

8f266f8a-3fb7-11ee-ac96-dac502259ad0.jpg

8f4c71bc-3fb7-11ee-ac96-dac502259ad0.jpg

8f8e1482-3fb7-11ee-ac96-dac502259ad0.jpg

8fb0075e-3fb7-11ee-ac96-dac502259ad0.jpg

8fe6b218-3fb7-11ee-ac96-dac502259ad0.jpg

901e1cc6-3fb7-11ee-ac96-dac502259ad0.jpg

90417d24-3fb7-11ee-ac96-dac502259ad0.jpg

9072bea2-3fb7-11ee-ac96-dac502259ad0.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39755

    瀏覽量

    301359
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265278
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179

原文標(biāo)題:國內(nèi)8種大模型體驗(yàn)測評(píng)報(bào)告(2023)

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型 ai coding 比較

    :DeepSeek 10/10(100%通過),Kimi 2/10(20%通過) 2. Debug修復(fù)能力(權(quán)重35%) 測試目標(biāo) :模型排查和修復(fù)代碼問題的能力 測評(píng)數(shù)據(jù)集:DebugBench 真實(shí)
    發(fā)表于 02-19 13:43

    商湯科技日日新V6.5榮獲2025年多模態(tài)大模型全國第一

    近日,權(quán)威大模型評(píng)測基準(zhǔn) SuperCLUE 發(fā)布《中文多模態(tài)視覺語言模型測評(píng)基準(zhǔn)12月報(bào)告》,商湯日日新V6.5(SenseNova V6.5 Pro)以75.35的總分位列
    的頭像 發(fā)表于 01-06 14:44 ?611次閱讀
    商湯科技日日新V6.5榮獲2025年多模態(tài)大<b class='flag-5'>模型</b>全國第一

    云知聲榮登MedAIBench優(yōu)秀國產(chǎn)醫(yī)療大模型榜單

    12月20日,國家人工智能應(yīng)用中試基地(醫(yī)療)·浙江正式發(fā)布《MedAIBench測評(píng)榜(優(yōu)秀國產(chǎn)醫(yī)療大模型)》。在這一具備行業(yè)權(quán)威性與臨床導(dǎo)向性的嚴(yán)格測評(píng)中,云知聲自主研發(fā)的山海·知醫(yī)大模型
    的頭像 發(fā)表于 12-29 14:36 ?820次閱讀

    百度文心大模型5.0 Preview榮登LMArena文本榜國內(nèi)第一

    12月23日,LMArena大模型競技場發(fā)布最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內(nèi)第一該模型在創(chuàng)意寫作、高難度指
    的頭像 發(fā)表于 12-23 15:02 ?536次閱讀

    觸覺智能RK3506星閃開發(fā)板測評(píng)報(bào)告(下)

    本文基于觸覺智能RK3506開發(fā)板,上集主要從性能、功耗進(jìn)行測評(píng),本集將從開發(fā)板的外設(shè)設(shè)計(jì)、EMC等可靠性性能進(jìn)行測評(píng)
    的頭像 發(fā)表于 12-11 17:00 ?1243次閱讀
    觸覺智能RK3506星閃開發(fā)板<b class='flag-5'>測評(píng)</b><b class='flag-5'>報(bào)告</b>(下)

    百度文心大模型5.0-Preview文本能力國內(nèi)第一

    11月8日凌晨,LMArena大模型競技場最新排名顯示,文心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一該模型在創(chuàng)意寫作、復(fù)雜長問題理解、指
    的頭像 發(fā)表于 11-11 17:15 ?1448次閱讀

    【開源FPGA硬件】硬件黑客集結(jié):開源FPGA開發(fā)板測評(píng)活動(dòng)全網(wǎng)火熱招募中......

    測評(píng)官選拔:2025.11.3 發(fā)貨日期:2025.11.4-11.5 試用時(shí)間:截止至2025.11.28(1個(gè)月) 優(yōu)秀測評(píng)報(bào)告評(píng)選時(shí)間:2025.11.30前 活動(dòng)流程 申請(qǐng):掃描二維碼即可報(bào)名
    發(fā)表于 10-29 11:37

    使用ROCm?優(yōu)化并部署YOLOv8模型

    作者:AVNET 李鑫杰 一,YOLOv8介紹? YOLOv8 由 Ultralytics 于 2023 年 1 月 10 日發(fā)布,在準(zhǔn)確性和速度方面提供了前沿的性能。YOLOv8
    的頭像 發(fā)表于 09-24 18:32 ?853次閱讀
    使用ROCm?優(yōu)化并部署YOLOv<b class='flag-5'>8</b><b class='flag-5'>模型</b>

    【作品合集】群芯閃耀Milk-V Duo S 開發(fā)板測評(píng)

    群芯閃耀Milk-V Duo S開發(fā)板測評(píng)作品合集 產(chǎn)品介紹: Milk-V Duo S 是 Duo 的升級(jí)型號(hào),配備升級(jí)版 SG2000 主控制器、更大的 512MB 內(nèi)存和更豐富的輸入/輸出功能
    發(fā)表于 09-16 11:03

    JoyAgent綜合測評(píng)報(bào)告

    如何。 測試地址: https://autobots.jd.com/genie 開源代碼: https://github.com/jd-opensource/joyagent-jdgenie 2.測評(píng)用例 1.從官網(wǎng)
    的頭像 發(fā)表于 07-27 12:40 ?718次閱讀
    JoyAgent綜合<b class='flag-5'>測評(píng)</b><b class='flag-5'>報(bào)告</b>

    理想汽車榮獲汽車大模型安全證書

    2025中國汽車論壇舉行“智艙安言計(jì)劃——汽車生成式人工智能安全測評(píng)”頒證儀式。理想汽車車載大模型榮獲由CCIA汽車網(wǎng)絡(luò)安全工作委員會(huì)頒發(fā)的《生成內(nèi)容安全測評(píng)證書》,及人工智能生成合成內(nèi)容標(biāo)識(shí)服務(wù)
    的頭像 發(fā)表于 07-18 16:10 ?1015次閱讀

    商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評(píng)級(jí)的大模型

    的大模型。 可信AI多模態(tài)大模型評(píng)估2025年1月啟動(dòng),由中國信通院人工智能研究所牽頭,依據(jù)由業(yè)界60余家單位共同編制的《多模態(tài)大模型技術(shù)要求和評(píng)估方法》標(biāo)準(zhǔn)開展,是國內(nèi)最影響力和權(quán)威
    的頭像 發(fā)表于 06-11 11:57 ?1415次閱讀

    中興通訊星云大模型登頂SuperCLUE推理專項(xiàng)榜單

    近日,中文大模型權(quán)威測評(píng)基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評(píng)2025年5月報(bào)告》。報(bào)告
    的頭像 發(fā)表于 06-04 16:44 ?1447次閱讀

    商湯科技日日新V6大模型斬獲“雙料第一” 一項(xiàng)國內(nèi)榜首,一個(gè)全球第一

    衛(wèi)冕“雙冠”! 通用語言能力并列國內(nèi)榜首、多模態(tài)能力全球最強(qiáng),商湯「日日新V6」近期斬獲“雙料第一”。 5月28日,權(quán)威大模型測評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)
    的頭像 發(fā)表于 05-30 11:13 ?1588次閱讀
    商湯科技日日新V6大<b class='flag-5'>模型</b>斬獲“雙料第一” 一項(xiàng)<b class='flag-5'>國內(nèi)</b>榜首,一個(gè)全球第一

    商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評(píng)測》結(jié)果顯示:在語言和多模態(tài)核心能力測評(píng)中,商湯“日日新”融合大模型斬獲
    的頭像 發(fā)表于 03-18 10:35 ?1139次閱讀