91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智源研究院揭曉大模型測評結果,豆包與百川智能大模型表現優(yōu)異

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-05-20 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月18日,北京智源研究院發(fā)布了關于國內外各類開/閉源語言及多模態(tài)大模型性能評估的最新研究成果。此項研究覆蓋了140余個語言模型的綜合實力對比,包括其對中文文本理解和多模態(tài)圖文問答等任務的處理能力。

研究發(fā)現,盡管國內頭部語言模型在中文環(huán)境中的整體表現已接近國際一流水平,但仍存在能力發(fā)展不平衡的問題。

在多模態(tài)理解圖文問答任務中,開源和閉源模型表現相當,而國產模型則表現出色。此外,在中文語境下的文生圖能力方面,國產多模態(tài)模型與國際一流水平的差距相對較小。

具體到語言模型的排名,在中文語境下,字節(jié)跳動的豆包Skylark2以及OpenAI的GPT-4分別名列第一和第二。值得注意的是,國產大模型在理解中國用戶需求方面具有明顯優(yōu)勢。

在語言模型客觀評價中,OpenAI的GPT-4和百川智能的Baichuan3分列第一和第二。同時,百度的文心一言4.0、智譜華章的GLM-4以及月之暗面的Kimi也躋身語言模型主客觀評價的前五名。

在多模態(tài)理解模型的客觀評價中,圖文問答方面,阿里巴巴的通義Qwen-vl-max和上海人工智能實驗室的InternVL-Chat-V1.5在某些指標上超越了OpenAI的GPT-4,LLaVA-Next-Yi-34B和上海人工智能實驗室的Intern-XComposer2-VL-7B緊隨其后。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    4209

    瀏覽量

    46161
  • 模型
    +關注

    關注

    1

    文章

    3753

    瀏覽量

    52116
  • 大模型
    +關注

    關注

    2

    文章

    3651

    瀏覽量

    5191
  • 百川智能
    +關注

    關注

    0

    文章

    18

    瀏覽量

    179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產算力首證具身大腦模型訓練實力:摩爾線程聯合智研究院完成RoboBrain 2.5全流程訓練

    隨著具身智能成為人工智能的下一個戰(zhàn)略高地,底層算力底座的自主可控顯得尤為關鍵。近日,摩爾線程聯合北京智人工智能研究院(以下簡稱:智)基于
    的頭像 發(fā)表于 01-14 09:05 ?513次閱讀
    國產算力首證具身大腦<b class='flag-5'>模型</b>訓練實力:摩爾線程聯合智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>完成RoboBrain 2.5全流程訓練

    廣電計量與長沙三大研究院達成戰(zhàn)略合作

    11月26-27日,廣電計量與長沙北斗產業(yè)安全技術研究院集團股份有限公司(簡稱“長沙北斗研究院”)、長沙量子測量產業(yè)技術研究院有限公司(簡稱“長沙量子研究院”)、湖南大學長沙半導體技術
    的頭像 發(fā)表于 12-04 14:36 ?528次閱讀

    澎峰科技加入智研究院FlagOS開源社區(qū)

    ,本次活動由北京市發(fā)展改革委、北京市科委中關村管委會、北京市經信局、中關村科學城管委會共同指導,由中國人工智能學會提供支持,并匯聚了清華大學、北京智人工智能研究院等多家權威機構與產業(yè)
    的頭像 發(fā)表于 10-13 16:49 ?1290次閱讀

    弘信電子攜手百川智能推動醫(yī)療AI技術落地應用

    近日,百川智能正式發(fā)布開源醫(yī)療增強大模型Baichuan-M2,該模型以卓越性能問鼎全球開源醫(yī)療模型榜首,實現中國在醫(yī)療AI領域從跟跑到領跑
    的頭像 發(fā)表于 08-19 10:58 ?1224次閱讀
    弘信電子攜手<b class='flag-5'>百川</b><b class='flag-5'>智能</b>推動醫(yī)療AI技術落地應用

    模型推理顯存和計算量估計方法研究

    隨著人工智能技術的飛速發(fā)展,深度學習大模型在各個領域得到了廣泛應用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型推理顯存和
    發(fā)表于 07-03 19:43

    商湯大裝置萬象大模型開發(fā)平臺獲得中國信通最高評級

    近日,中國信息通信研究院(以下簡稱“中國信通”)完成可信AI《大模型推理平臺通用能力成熟度》首輪評估。
    的頭像 發(fā)表于 07-01 10:48 ?1000次閱讀

    多模態(tài)感知+豆包模型!家居端側智能升級

    的關鍵力量。星宸科技與豆包模型的合作,將這一技術趨勢落實到實際應用場景中,在智能家居、可穿戴設備以及連鎖店等領域引發(fā)了深刻變革。 ? 智能家居升級 ? 陳立敬指出:“
    的頭像 發(fā)表于 06-21 00:06 ?7122次閱讀
    多模態(tài)感知+<b class='flag-5'>豆包</b>大<b class='flag-5'>模型</b>!家居端側<b class='flag-5'>智能</b>升級

    商湯日日新SenseNova融合模態(tài)大模型 國內首家獲得最高評級的大模型

    的大模型。 可信AI多模態(tài)大模型評估2025年1月啟動,由中國信通人工智能研究所牽頭,依據由業(yè)界60余家單位共同編制的《多模態(tài)大
    的頭像 發(fā)表于 06-11 11:57 ?1427次閱讀

    在V2板子上部署豆包模型調試指南

    在V2板子上部署豆包模型調試指南 準備階段 首先,可以觀看大模型實戰(zhàn)(SC171開發(fā)套件V3)并下載工程源碼,之后我們需要在板子上安裝這個代碼所要用到的一些庫。 pip3 install
    發(fā)表于 05-25 10:17

    度文心大模型X1 Turbo獲得信通當前大模型最高評級證書

    度在520居然還領了個證?是它, 信通當前大模型最高評級證書 ! 在5月20日的度AI Day 上,中國信通公布了大
    的頭像 發(fā)表于 05-21 18:19 ?1284次閱讀
    <b class='flag-5'>百</b>度文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通<b class='flag-5'>院</b>當前大<b class='flag-5'>模型</b>最高評級證書

    萬里紅入選中國信通模型應用交付供應商名錄

    近日,中國信息通信研究院與中國人工智能產業(yè)發(fā)展聯盟(AIIA)聯合發(fā)布了《大模型應用交付供應商名錄(2025年Q1)》。該名錄基于問卷調研統(tǒng)計,通過對政務、金融、醫(yī)療等十大重點行業(yè)大模型
    的頭像 發(fā)表于 04-25 17:25 ?1337次閱讀

    模型實戰(zhàn)(SC171開發(fā)套件V3)

    模型實戰(zhàn)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 火山引擎豆包模型調試指南 3分31秒 https://t.elecfans.com/v
    發(fā)表于 04-16 18:52

    安徽省水利科學研究院攜手中科曙光完成DeepSeek大模型部署

    近日,安徽省(水利部淮河水利委員會)水利科學研究院攜手中科曙光,成功完成國產大模型DeepSeek、BGE-M3嵌入模型及重排模型的本地化部署與測試,并順利接入梅山水庫運行管理矩陣平臺
    的頭像 發(fā)表于 03-25 11:36 ?1046次閱讀

    商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單

    據弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大
    的頭像 發(fā)表于 03-18 10:35 ?1146次閱讀

    中國電信研究院蒞臨軟通動力參觀交流

    近日,中國電信研究院副院長李俊杰率隊參訪軟通動力北京總部,與軟通動力高級副總裁陳力銘等就人工智能、智能終端、數字能源、研發(fā)云、測評與認證等領域開展深入洽談,并達成一系列重要共識。
    的頭像 發(fā)表于 03-13 09:29 ?1025次閱讀