91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

工聯(lián)院大模型測評:文心一言在工業(yè)領域表現(xiàn)超過GPT3.5,居國內大模型首位

智能制造IMS ? 來源:智能制造IMS ? 2023-06-29 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,中國工業(yè)互聯(lián)網研究院(簡稱“工聯(lián)院”)針對人工智能大模型在中文工業(yè)領域的知識問答能力進行系統(tǒng)性評測。結果顯示,百度文心一言表現(xiàn)超過GPT3.5,綜合評價指數(shù)在國內排名第一。

766eff46-15a2-11ee-962d-dac502259ad0.png

工聯(lián)院本次評測選取了工業(yè)領域典型的八大行業(yè)。百度文心一言在??電子設備、??裝備、???鋼鐵、采礦、電力、石化、建材等七大行業(yè)均獲國內第一。

76c72202-15a2-11ee-962d-dac502259ad0.png

五大院士,八大IEEE Fellow,共十三位頂級專家構成了專家委員會。評測對象涵蓋GPT4、GPT3.5、文心一言、ChatGLM等國內外具有代表性的頭部大模型。評估結果選取性能前六名的模型進行公布。

百度文心一言在國內“最懂工業(yè)”

本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。

評測結果顯示,GPT4表現(xiàn)最佳。國內頭部大模型表現(xiàn)亮眼,整體與GPT3.5相當。其中百度文心一言表現(xiàn)超過GPT3.5,在國內大模型中排名第一。

772c8b4c-15a2-11ee-962d-dac502259ad0.png

在客觀題環(huán)節(jié),評測結果顯示,GPT4與文心一言表現(xiàn)好于其他大模型。但評測結果也同時指出,大模型普遍準確率有較大的提升空間。

7776d9fe-15a2-11ee-962d-dac502259ad0.png

主觀題方面,國內大模型的基礎能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。

在大模型的自我認知能力和污染問題分析能力上,GPT4相較于其他大模型表現(xiàn)出更好的能力。

大模型發(fā)展新熱點:豐富特定行業(yè)專業(yè)知識

雖然國內大模型在本次評測表現(xiàn)較好,甚至在部分行業(yè)趕超GPT3.5,但工聯(lián)院評測報告也指出,國內外通用大模型在工業(yè)知識問答領域探索仍處于初級階段,國內大模型與GPT4有差距,比如行業(yè)間的泛化能力有待加強。

實際上,工聯(lián)院評測報告揭示出通用大模型落地垂直行業(yè)的痛點,缺乏特定行業(yè)的專業(yè)知識。

關于解決難題的方法,工聯(lián)院評測報告給出的建議是,進一步豐富相關專業(yè)領域的數(shù)據(jù)訓練集,進一步進行專業(yè)化的微調。

當前,國內科技公司紛紛加強與工業(yè)企業(yè)合作,期望通過在實際場景中探索應用大模型,彌補差距,趕超GPT4.0。

比如在本次評測中位居國內模型第一的百度文心一言,與南方電網電力調度控制中心在電力調度場景探索使用調度AI大模型。在汽車行業(yè),長安汽車基于百度文心大模型正在開發(fā)生成式人工智能產品,賦能一款量產車型,實現(xiàn)提升用戶體驗的目標。除了能源、汽車制造,百度智能云還在建筑、采礦、物流、紡織等領域,探索使用大模型提升運營效率和用戶體驗效果。

通過在實際場景的探索應用,科技公司可以積攢更多的行業(yè)Know-how,擴展相關領域的數(shù)據(jù)訓練集。這種外部真實反饋有助驅動大模型更加快速的實現(xiàn)迭代升級。

未來,工聯(lián)院將持續(xù)開展通用大模型在工業(yè)領域更多維度的性能評測,包括但不限于大模型的魯棒性、安全性以及人類大價值觀等。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 南方電網
    +關注

    關注

    2

    文章

    197

    瀏覽量

    29929
  • 文心一言
    +關注

    關注

    0

    文章

    134

    瀏覽量

    2208
  • 大模型
    +關注

    關注

    2

    文章

    3712

    瀏覽量

    5231

原文標題:工聯(lián)院大模型測評:文心一言在工業(yè)領域表現(xiàn)超過GPT3.5,居國內大模型首位

文章出處:【微信號:CADCAM_beijing,微信公眾號:智能制造IMS】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度衍生模型PaddleOCR登頂GitHub Star OCR全球第

    3月30日,百度衍生模型PaddleOCRGitHub上的Star數(shù)突破73.3K,超越谷歌Tesseract OCR,成為全球Star數(shù)最高的OCR項目。
    的頭像 發(fā)表于 03-31 11:40 ?240次閱讀

    太初元碁:40+AI大模型全覆蓋,新版本即發(fā)即適配、上線即可用,實現(xiàn)國產“芯”速度

    、Qwen、GLM、Intern-S1、等在內的40+AI大模型的即發(fā)即適配,上線即可用,涵蓋了DeepSeek、Qwen 、GLM、Seed-OSS、
    的頭像 發(fā)表于 02-25 09:21 ?1878次閱讀

    百度模型5.0正式版上線

    今天,百度Moment大會現(xiàn)場,模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1383次閱讀

    百度模型5.0 Preview榮登LMArena文本榜國內

    12月23日,LMArena大模型競技場發(fā)布最新排名,模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名
    的頭像 發(fā)表于 12-23 15:02 ?612次閱讀

    百度模型5.0-Preview文本能力國內

    11月8日凌晨,LMArena大模型競技場最新排名顯示,全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第
    的頭像 發(fā)表于 11-11 17:15 ?1571次閱讀

    百度模型X1.1正式發(fā)布

    今天,WAVE SUMMIT深度學習開發(fā)者大會2025上,模型X1.1正式發(fā)布,事實性、指令遵循、智能體等能力上均提升顯著。
    的頭像 發(fā)表于 09-10 11:08 ?2216次閱讀

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、一言等大語言模型在生成文本、對話交互等領域的驚艷
    的頭像 發(fā)表于 08-13 09:15 ?4292次閱讀
    自動駕駛中Transformer大<b class='flag-5'>模型</b>會取代深度學習嗎?

    中興努比亞啟動接入百度4.5系列開源大模型

    近日,中興努比亞啟動接入4.5系列開源大模型,為星云智能提供新引擎,共同推動人工智能在AI手機的創(chuàng)新應用,加速AI技術落地,進步提升用戶AI體驗。
    的頭像 發(fā)表于 07-15 09:35 ?1121次閱讀

    寧暢與與百度模型展開深度技術合作

    與部署。 憑借覆蓋訓練、推理、微調全流程的AI?服務器產品矩陣,寧暢幫助企業(yè)模型時代鍵打通算力與應用“任督二脈”,顯著縮短模型落地周期。
    的頭像 發(fā)表于 07-07 16:26 ?940次閱讀

    黑芝麻智能與模型技術合作升級

    近日,模型正式開源,黑芝麻智能即日起快速啟動與模型技術合作。
    的頭像 發(fā)表于 07-04 17:24 ?1442次閱讀
    黑芝麻智能與<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>技術合作升級

    龍芯中科與心系列模型開展深度技術合作

    ? ? ? ? ? 6月30日,4.5系列模型正式開源。龍芯中科
    的頭像 發(fā)表于 07-02 16:53 ?1422次閱讀

    兆芯率先展開心系列模型深度技術合作

    6月30日,百度正式開源模型4.5系列等10款模型,并實現(xiàn)預訓練權重和推理代碼的完全開源,兆芯率先與心系列
    的頭像 發(fā)表于 07-01 10:49 ?1032次閱讀

    商湯日日新SenseNova融合模態(tài)大模型 國內首家獲得最高評級的大模型

    的大模型。 可信AI多模態(tài)大模型評估2025年1月啟動,由中國信通人工智能研究所牽頭,依據(jù)由業(yè)界60余家單位共同編制的《多模態(tài)大模型技術要求和評估方法》標準開展,是
    的頭像 發(fā)表于 06-11 11:57 ?1499次閱讀

    百度模型X1 Turbo獲得信通當前大模型最高評級證書

    百度520居然還領了個證?是它, 信通當前大模型最高評級證書 ! 5月20日的百度AI Day 上,中國信通公布了大
    的頭像 發(fā)表于 05-21 18:19 ?1337次閱讀
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>X1 Turbo獲得信通<b class='flag-5'>院</b>當前大<b class='flag-5'>模型</b>最高評級證書

    如何賦能醫(yī)療AI大模型應用?

    引言自ChatGPT掀起熱潮以來,眾多AI大模型如雨后春筍般涌現(xiàn),其中包括百度科技的一言、科大訊飛的訊飛星火、華為的盤古AI大模型、騰訊
    的頭像 發(fā)表于 05-07 09:36 ?742次閱讀
    如何賦能醫(yī)療AI大<b class='flag-5'>模型</b>應用?