91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)大模型爭霸賽,你最看好哪家?

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 2023-05-19 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI Vs Google

e597a338-f620-11ed-90ce-dac502259ad0.png

目前大模型 top2 應(yīng)該就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。這兩家公司早已布局,而且技術(shù)實(shí)力雄厚。國內(nèi)大模型和 GPT-4 相比,還是有比較大的差距。

但是國內(nèi)的勢頭目前不錯,百家齊鳴,還沒有一家有絕對的優(yōu)勢。

讓人頭暈的排名

e5a19d3e-f620-11ed-90ce-dac502259ad0.png

之前有媒體給出了目前國內(nèi)Top-5的大模型公司,分別是:百度的文心一言、阿里的通義千問、騰訊的混元、華為的盤古以及360的智腦。

而最近,中文通用大模型基準(zhǔn)(SuperCLUE)評測公布了最新結(jié)果,GPT-4 遙遙領(lǐng)先,而國內(nèi)成績最好的是科大訊飛的星火認(rèn)知大模型。這里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分還低,實(shí)在難以置信。

e5aa4c36-f620-11ed-90ce-dac502259ad0.png

但是我又仔細(xì)看了一下這個評測。媽呀,評測集是SuperCLUE,而非SuperGLUE。

眾所周知,在國際NLP領(lǐng)域,有大名鼎鼎的數(shù)據(jù)集 GLUE 和 SuperGLUE,非常權(quán)威,OpenAI、谷歌等的大模型都在上面評測,極大推動了 NLP 領(lǐng)域的發(fā)展。

這次這份 SuperCLUE 評測的發(fā)起方為 Chinese GLUE 組織 (簡稱 CLUE),CLUE 是仿照 GLUE由國內(nèi)民間組織的評測,權(quán)威度和影響力與 GLUE 相比差很遠(yuǎn),其微信賬號主體屬性為個人。但這也迷惑了不少圈內(nèi)人,GLUE和 CLUE 分不清楚,堪稱李逵和李鬼。

還有一點(diǎn)存疑,評測榜單發(fā)布當(dāng)天5月9日,其官網(wǎng)顯示信息,中文基準(zhǔn)測評成員顧問中排名第一的是崔一鳴,身份為學(xué)術(shù)顧問委員會主任,哈工大訊飛聯(lián)合實(shí)驗室(HFL)資深級研究員。而5月10日,官網(wǎng)已刪除此條顧問的信息。

而001號創(chuàng)始會員徐亮,是會長,相當(dāng)于這個榜單的實(shí)際負(fù)責(zé)人。昵稱 brightmart,中文任務(wù)基準(zhǔn)測評發(fā)起人。多個預(yù)訓(xùn)練模型中文版、文本分類和數(shù)據(jù)集開源項目作者。

徐亮還有另一個身份,在5月9日官網(wǎng)中顯示,他是杭州實(shí)在智能算法專家,也就是元語智能的創(chuàng)始人,曾在2月份發(fā)布自稱“國內(nèi)首個功能對話大模型ChatYuan”,不僅無法測試,發(fā)布幾天即被監(jiān)管叫停。4月,又被報道套殼推出開源組件。有分析人士認(rèn)為,不排除創(chuàng)業(yè)公司有融資壓力,蹭熱度吸引投資人關(guān)注。

該 SpuerClue 榜單發(fā)起方,001號顧問是訊飛身份背景、001號基準(zhǔn)發(fā)起人是創(chuàng)業(yè)公司創(chuàng)始人。在榜單發(fā)布后,擔(dān)心行業(yè)質(zhì)疑其公平、公正,相關(guān)信息還被刪除。這就有點(diǎn)不言而喻了。

僅用100道評測題目就出來了一份“權(quán)威報告”

最后來說下這個榜單本身,業(yè)內(nèi)人士一眼就可以看出來,評測的很不合理,首先,沒有公布評估數(shù)據(jù),以及具體的評估方式。同時從它的公開表述,可推斷總共題目就 100 道題目。這個題目量少到難以置信。專業(yè)人士可能有參與過,像國際權(quán)威 SuperGlue 榜單,題目一般都得有 2 萬多道,離權(quán)威可是差了幾萬倍。況且,它的評測得分榜首都是人類,那這個評分的基準(zhǔn)到底是什么?是否有很多主觀性因素在里面?是否某些大模型提前在這個數(shù)據(jù)集上已經(jīng)訓(xùn)練過?

任務(wù)設(shè)計太武斷,所謂“通用”基準(zhǔn),是用以測試通用的人工認(rèn)知能力的,那么我們自然希望,評測任務(wù)是參考了模型想要模擬的認(rèn)知能力及相關(guān)理論,系統(tǒng)化地選擇出來的。而實(shí)際上,我們觀察到的則是,基準(zhǔn)的作者們在選擇任務(wù)的時候,更像是圖方便、省事。以往,CLUE 中存在著部分?jǐn)?shù)據(jù)集,一味考慮任務(wù)的復(fù)雜性,卻在最起碼的分布邊界劃分上(如NER各個類別的邊界,如場所、景點(diǎn)類,組織機(jī)構(gòu)及其子類),模糊不清,且數(shù)據(jù)的一致性無法保證。

要么別比,要比就來點(diǎn)正規(guī)的比賽。自己出題自己考,說不準(zhǔn)還搶跑,自己還是評委,那這是欺不負(fù)了解真相的吃瓜群眾。投機(jī)取巧,終皆散去??嗑殐?nèi)功,才是王道。

國內(nèi)大模型排名(僅供參考)

拋開這些,從模型規(guī)模、模型效果、市場占有率等多個角度,百度的文心一言、華為的盤古、阿里的通義千問、騰訊的混元排在前四,應(yīng)該是比較合理的,至于后面的排名,就不大能保證了。不過下面的排名也可以參考一下:

e5b3b104-f620-11ed-90ce-dac502259ad0.png

下面是一份完整的名單:

e5b8a9b6-f620-11ed-90ce-dac502259ad0.png

e5c31432-f620-11ed-90ce-dac502259ad0.png

按發(fā)布時間排序:

e5c914ea-f620-11ed-90ce-dac502259ad0.png

百度:文心一言

作為國內(nèi)最早發(fā)布的大模型,百度的文心一言在今年3月16號就發(fā)布了,隨后經(jīng)過了多個版本的迭代。目前已經(jīng)有上千家企業(yè)接入。文心一言支持圖片、語音等多模態(tài)。

3月16日,百度在全球大廠中率先發(fā)布對標(biāo) ChatGPT 的大模型產(chǎn)品文心一言。據(jù)了解,文心一言內(nèi)測一個多月,就完成了4次大的技術(shù)升級,大模型推理性能提升近10倍。

李彥宏在5月4日百度內(nèi)部活動中表示,百度之所以能夠在Google、Meta、Amazon等大廠之前率先發(fā)布生成式大模型產(chǎn)品,是因為百度在芯片、框架、模型、應(yīng)用等四個層面做到全棧布局、層層領(lǐng)先。

360:360智腦

百度是國內(nèi)搜索市場排名第一公司,而排名第二就是360。

大模型依靠的算力、數(shù)據(jù)、算法、場景,這兩家公司都具備,這也是搜索公司的優(yōu)勢,有業(yè)務(wù)和數(shù)據(jù)支撐大模型研發(fā)和落地。

5月16日,360集團(tuán)和智譜AI宣布達(dá)成戰(zhàn)略合作,雙方共同研發(fā)的千億級大模型“360GLM”已具備新一代認(rèn)知智能通用模型水準(zhǔn)。

而在今天的世界智能大會上,周鴻祎展示了“360智腦”的多輪對話和“360鴻圖”的AI生圖兩個能力。

e5d272d8-f620-11ed-90ce-dac502259ad0.png

就像谷歌和微軟,一個擁有谷歌搜索,一個擁有必應(yīng)。國內(nèi)的百度和360,一個擁有百度搜索,一個擁有360搜索。

搜索公司應(yīng)該是這場大模型爭霸賽最后的贏家。(只是個人看法)

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52112
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16878
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10078

原文標(biāo)題:國內(nèi)大模型爭霸賽,你最看好哪家?這是你心目中的大模型排名嗎?

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    國內(nèi)哪家 SLIC 芯片支持定制?思電子脫穎而出

    在當(dāng)今科技飛速發(fā)展的時代,芯片作為各類電子設(shè)備的核心部件,其重要性不言而喻。對于特定行業(yè)和應(yīng)用場景而言,定制化的SLIC(用戶線路接口)芯片需求愈發(fā)凸顯,那么國內(nèi)究竟哪家SLIC芯片支持定制呢?今天
    的頭像 發(fā)表于 01-20 14:49 ?1266次閱讀
    <b class='flag-5'>國內(nèi)</b><b class='flag-5'>哪家</b> SLIC 芯片支持定制?<b class='flag-5'>賽</b>思電子脫穎而出

    國內(nèi)恒溫晶振廠家哪家好?

    在科技飛速發(fā)展的今天,恒溫晶振作為一種高精度、高穩(wěn)定性的頻率控制元件,在國內(nèi)眾多行業(yè)都有著廣泛的應(yīng)用。那么,國內(nèi)的恒溫晶振廠家究竟哪家更好呢?這是一個值得深入探討的問題。一、技術(shù)實(shí)力是關(guān)鍵要評判一家
    的頭像 發(fā)表于 01-08 15:42 ?361次閱讀
    <b class='flag-5'>國內(nèi)</b>恒溫晶振廠家<b class='flag-5'>哪家</b>好?

    百度文心大模型5.0 Preview榮登LMArena文本榜國內(nèi)第一

    12月23日,LMArena大模型競技場發(fā)布最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內(nèi)第一該模型在創(chuàng)意寫作、高難度指
    的頭像 發(fā)表于 12-23 15:02 ?547次閱讀

    openDACS 2025 開源EDA與芯片題七:基于大模型的生成式原理圖設(shè)計

    領(lǐng)域,對促進(jìn)產(chǎn)業(yè)高質(zhì)量發(fā)展具有重要意義。本項包含7道題,下面是題七 基于大模型的生成式原理圖設(shè)計的介紹。 2. 命題單位及題Chai
    發(fā)表于 11-13 11:49

    百度文心大模型5.0-Preview文本能力國內(nèi)第一

    11月8日凌晨,LMArena大模型競技場最新排名顯示,文心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一該模型在創(chuàng)意寫作、復(fù)雜長問題理解、指令遵循等方面表現(xiàn)突出,超過多款
    的頭像 發(fā)表于 11-11 17:15 ?1473次閱讀

    知識分享 | 使用MXAM進(jìn)行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型

    知識分享在知識分享欄目中,我們會定期與讀者分享來自MES模思的基于模型的軟件開發(fā)相關(guān)Know-How干貨,關(guān)注公眾號,隨時掌握基于模型的軟件設(shè)計的技術(shù)知識。使用MXAM進(jìn)行AUTOSAR模型
    的頭像 發(fā)表于 08-27 10:04 ?730次閱讀
    知識分享 | 使用MXAM進(jìn)行AUTOSAR<b class='flag-5'>模型</b>的靜態(tài)分析:Embedded Coder與TargetLink<b class='flag-5'>模型</b>

    可編程SLIC語音芯片哪家好?

    呢?思電子科技無疑是其中的佼佼者。思電子科技作為國內(nèi)知名的數(shù)?;旌闲酒瑥S商,在可編程SLIC語音芯片領(lǐng)域展現(xiàn)出了強(qiáng)大的實(shí)力。其推出的ASX630系列芯片,堪稱
    的頭像 發(fā)表于 06-12 13:55 ?753次閱讀
    可編程SLIC語音芯片<b class='flag-5'>哪家</b>好?

    商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態(tài)大模型首輪評估。 商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當(dāng)前最高評級——4+級,并成為國內(nèi)首家
    的頭像 發(fā)表于 06-11 11:57 ?1420次閱讀

    手表芯片多強(qiáng)爭霸賽開啟!小米玄戒T1入局,格局生變?

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當(dāng)前,國內(nèi)可穿戴設(shè)備主控芯片市場呈現(xiàn)出“一超多強(qiáng)、梯度競爭”的競爭態(tài)勢,就在5月,小米重磅推出智能手表玄戒T1,在通信性能、功耗控制和功能擴(kuò)展方面展現(xiàn)了新的突破,標(biāo)志著
    的頭像 發(fā)表于 05-29 01:05 ?1.1w次閱讀
    手表芯片多強(qiáng)<b class='flag-5'>爭霸賽</b>開啟!小米玄戒T1入局,格局生變?

    當(dāng)我問DeepSeek國內(nèi)壓力傳感器哪家強(qiáng),它這樣回答

    特意問DeepSeek國內(nèi)壓力傳感器發(fā)展現(xiàn)狀,以及國內(nèi)壓力傳感器到底哪家強(qiáng),DeepSeek這樣回復(fù)我——壓力傳感器在工業(yè)自動化、汽車電子和醫(yī)療設(shè)備領(lǐng)域有著廣泛應(yīng)
    的頭像 發(fā)表于 05-28 14:48 ?1522次閱讀
    當(dāng)我問DeepSeek<b class='flag-5'>國內(nèi)</b>壓力傳感器<b class='flag-5'>哪家</b>強(qiáng),它這樣回答

    時鐘系統(tǒng)推薦,時鐘系統(tǒng)哪家好?思時鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    時鐘系統(tǒng)推薦,時鐘系統(tǒng)哪家好?思時鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-20 09:32 ?883次閱讀
    時鐘系統(tǒng)推薦,時鐘系統(tǒng)<b class='flag-5'>哪家</b>好?<b class='flag-5'>賽</b>思時鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸
    的頭像 發(fā)表于 05-17 17:31 ?921次閱讀
    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄<b class='flag-5'>爭霸</b>”

    西威端側(cè)大模型重塑智能座艙體驗

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴(kuò)張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動的智能化升級將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國際汽車關(guān)鍵技術(shù)論壇上,德西威技術(shù)中心人工智能實(shí)驗室專家張書赫博士以《端側(cè)智能·重塑體驗》為題,分享了對大模型
    的頭像 發(fā)表于 05-15 09:13 ?1793次閱讀

    西威與面壁智能發(fā)布端側(cè)大模型語音交互方案

    日前,全球領(lǐng)先的移動出行科技公司德西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側(cè)大模型語音交互方案,這是雙方自2024年12月簽署戰(zhàn)略合作協(xié)議以來發(fā)布的首個合作成果。
    的頭像 發(fā)表于 05-14 17:40 ?1305次閱讀

    當(dāng) RDK X3 遇上倉儲機(jī)器人,智鏈團(tuán)隊讓效率原地起飛

    倉儲界現(xiàn)在是"卷王"爭霸賽!2023年全國消費(fèi)狂飆47萬億,網(wǎng)購更是坐火箭般漲了11%,但老派倉儲還在用"人海戰(zhàn)術(shù)",設(shè)備像戴著近視眼鏡,看啥都不清不楚。別急
    的頭像 發(fā)表于 04-21 01:18 ?878次閱讀
    當(dāng) RDK X3 遇上倉儲機(jī)器人,智鏈團(tuán)隊讓效率原地起飛