91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

兩大AI模型性能提升 登上國際榜單

愛云資訊 ? 2025-01-16 12:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,由盛大AI團隊研發(fā)的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團隊研發(fā)的旗艦模型,目前位列BFCL Leaderboard總榜單第一。

wKgZO2eIhJiAH1CJAANvX9TW0Qo480.png

據(jù)悉,榜單BFCL Leaderboard是由加州大學伯克利分校開發(fā)的評估LLM工具調用能力基準測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一,工具調用(Function-Calling)是為了讓LLM理解,并能準確使用API(應用程序編程接口),來執(zhí)行更復雜而具體的任務。在近期公布的最新一輪評估結果中,Watt的“多輪對話執(zhí)行能力”相較于排名第二的GPT-4o 領先11分,比排名第十的Gemini-1.5-Pro 領先近40分。

“這個模型將加速大模型落地‘融合’過程?!盬att有關負責人說,還有助于從底層數(shù)據(jù)標注到人機交互的體系化建設,讓大模型初步實現(xiàn)從“光說不練”到“能文能武”。

此外,由盛大集團NewsBang團隊開發(fā)的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平臺升級版本,采用更全面和嚴格評估標準,對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力,通過搭配數(shù)據(jù)篩選機制等,在多個核心評測維度,該模型性能有了大幅提升。

wKgZPGeIhJiAM0HvAAHlAh0t4MU103.png

據(jù)公開報道,2023年初,盛大集團宣布All in AI戰(zhàn)略,去年10月,聯(lián)合多家高校發(fā)表了AI與長期記憶方面的論文,其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜志《Science》合作推出全球AI驅動科學大獎,舉辦和支持包括“AI+精神健康”在內的各種高水平國際會議和夏校項目,助力培養(yǎng)跨學科青年AI人才等。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301497
  • 人工智能
    +關注

    關注

    1817

    文章

    50102

    瀏覽量

    265520
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11322
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中軟國際榮登2025 AI智能體服務商TOP100榜單

    中軟國際憑借自主研發(fā)的數(shù)智化審計智能體平臺,成功入選《2025 AI智能體服務商TOP100》榜單。這一重要榮譽,不僅彰顯了公司在AI智能體領域的領先技術實力與行業(yè)影響力,更標志著其在
    的頭像 發(fā)表于 02-25 15:47 ?305次閱讀

    使用NORDIC AI的好處

    不依賴持續(xù)聯(lián)網(wǎng),整體系統(tǒng)可靠性更高。[Edge AI 概述; Nordic Edge AI 技術頁] 覆蓋從“小 MCU”到“高性能 SoC”的完整產品線 Neuton 模型 :超
    發(fā)表于 01-31 23:16

    曦智科技榮登2025VENTURE50兩大榜單

    2025年12月4日,由清科控股、投資界發(fā)起的 2025VENTURE50 榜單最終揭曉。曦智科技憑借卓越的創(chuàng)新實力與高成長性,榮登 “風云50” 與 “硬科技50” 兩大榜單,收獲來自資本市場與產業(yè)領域的雙重認可!
    的頭像 發(fā)表于 12-11 17:51 ?1260次閱讀

    成都匯陽投資關于國產開源模型持續(xù)突破,國產AI 競爭力增強

    ? ? ? ?國產開源模型領跑 ,AI 生態(tài)有望加速繁榮 根據(jù)獨立 AI 基準測試與分析平臺 Artificial Analysis 最新榜單 , 國產
    的頭像 發(fā)表于 11-24 14:01 ?572次閱讀

    沐曦聯(lián)合香港科技大學登上AI頂會

    近日,沐曦PDE-AI Solution團隊與香港科技大學合作,在兩大人工智能頂級會議NeurIPS2025與EMNLP 2025上發(fā)表重要研究成果,涵蓋大語言模型(LLM)的多樣化解碼與高效訓練優(yōu)化方向,展現(xiàn)了中國企業(yè)在
    的頭像 發(fā)表于 10-14 09:46 ?1493次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    本章節(jié)作者分析了下AI的未來在哪里,就目前而言有來那個種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    是展望未來的AGI芯片,并探討相關的發(fā)展和倫理話題。 各章的目錄名稱如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費 第2章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構 第3章 AI
    發(fā)表于 09-05 15:10

    水晶光電榮登2025年度浙江省兩大榜單

    近日,浙江省經信廳公布2025年度"浙江省制造精品"和"浙江省優(yōu)秀工業(yè)新產品"名單,水晶光電自主研發(fā)的高端攝像頭藍寶石保護器件與合式折疊光路微棱鏡分別榮登兩大榜單。
    的頭像 發(fā)表于 08-20 17:47 ?2461次閱讀

    全球首個胃癌影像篩查AI模型發(fā)布

    浙江省腫瘤醫(yī)院聯(lián)合阿里巴巴達摩院,發(fā)布了全球首個胃癌影像篩查AI模型DAMO GRAPE,首次利用平掃CT影像識別早期胃癌病灶,并聯(lián)合全國20家醫(yī)院,在近10萬人的大規(guī)模臨床研究中大幅提升胃癌檢出率。 相關論文在24日
    的頭像 發(fā)表于 06-30 14:37 ?3854次閱讀

    中興通訊星云大模型登頂SuperCLUE推理專項榜單

    近日,中文大模型權威測評基準SuperCLUE發(fā)布《中文大模型基準測評2025年5月報告》。報告顯示,中興通訊自主研發(fā)的星云大模型NebulaCoder-V6在推理專項榜單中斬獲
    的頭像 發(fā)表于 06-04 16:44 ?1460次閱讀

    天合儲能Elementa金剛2榮獲兩大國際權威機構認證

    近日,天合儲能Elementa 金剛2以其卓越的安全性、可靠性和可融資性,同時獲得DNV和UL Solutions兩大國際權威機構的認證。Elementa 金剛2針對海外不同的儲能需求提供4MWh和5MWh種配置方案,其創(chuàng)新設計和卓越
    的頭像 發(fā)表于 04-27 15:48 ?770次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率再提升

    使用結合機制和反饋優(yōu)化手段,有效融合檢索模塊和生成模塊,以及不斷提升RAG系統(tǒng)性能: 1、結合機制: (1) 概率加權:通過對檢索到的文檔分配權重,影響生成模型的輸出。 (2) 多文檔處理:結合多篇相關文檔
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    的端側部署,Token產生速度提升了40%,讓端側大模型擁有更高的計算效率和推理性能,使端側AI交互響應更及時,用戶體驗更貼心。 聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣
    發(fā)表于 04-13 19:52

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡

    ,成為新一代AI數(shù)據(jù)中心的核心驅動力。 AI時代的兩大數(shù)據(jù)中心:AI工廠與AIAI時代
    發(fā)表于 03-25 17:35