91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Eleuther AI:已經(jīng)開源了復(fù)現(xiàn)版GPT-3的模型參數(shù)

深度學(xué)習(xí)自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:小戲 ? 2021-03-31 17:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPT3終于開源!不過,不是官方開的(別打我

Eleuther AI推出的名為GPT-Neo的開源項目,于晨4點于twitter正式宣布:已經(jīng)開源了復(fù)現(xiàn)版GPT-3的模型參數(shù)(1.3B和2.7B級別),并將其更新在Colab notebook之上。需要指出的是這次開源的模型里較大的那個版本也只是到了GPT-3商用版里最小模型的參數(shù)量,不過Eleuther AI表示未來會進一步開源10B版本和原始大小版本的GPT3模型參數(shù)。

消息發(fā)布后,立刻被各個大v轉(zhuǎn)發(fā),10小時內(nèi)就已迅速收獲1.5K的點贊量,相應(yīng)的github鏈接也已收獲接近2k star。

▲Twitter原文

但關(guān)于復(fù)現(xiàn)模型的性能,目前只說“實驗表現(xiàn)與原版GPT-3相當(dāng)”(they performed on par)。具體實驗結(jié)果將于明天公布。

風(fēng)靡一時的擁有1750億超大參數(shù)量,一出道便被視作NLP領(lǐng)域最強AI模型的GPT-3,得益于其龐大的參數(shù)量,使得GPT-3擁有不用接受特定訓(xùn)練與微調(diào),就能在不同NLP領(lǐng)域達到領(lǐng)先水平的強大能力。去年七月,GPT-3被Open-AI以商業(yè)API的形式向公眾開放,并被人們探索出了形形色色的應(yīng)用,從基于問題的搜索,到文本樣式轉(zhuǎn)換,從UI界面設(shè)計,再到自動生成SQL代碼,GPT-3以其卓越的性能展現(xiàn)了其廣闊的應(yīng)用場景,深度學(xué)習(xí)之父Hinton甚至這樣評價道:

如果以GPT-3的出色性能推算未來、生命、宇宙和萬物的答案也不過是4.398萬億個參數(shù)

但是,由于目前GPT-3的使用模式仍然是付費的商業(yè)API,因此并不是所有NLP的研究者都能使用GPT-3完成自己領(lǐng)域的任務(wù)與工作。而由Connor Leahy,Leo Gao和Sid Black三人聯(lián)合創(chuàng)立的Eleuther AI的團隊,于去年11月宣布推出GPT-Neo的開源項目,該項目基于GPT系列的設(shè)計原理,旨在復(fù)現(xiàn)GPT系列的各種項目,在該項目發(fā)布之初,其團隊成員已經(jīng)預(yù)測可以完成GPT-3級別大小的語言模型。

毫無疑問,GPT-3的開源將會催生出一大批NLP技術(shù)的嶄新應(yīng)用,也會以更為低廉的成本釋放人們對NLP未來的想象力。

原文標題:【GPT-3】千呼萬喚始出來——GPT-3終于開源!

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301513
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4209

    瀏覽量

    46180
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23282

原文標題:【GPT-3】千呼萬喚始出來——GPT-3終于開源!

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍

    躍升重新定義人工智能的能力邊界。OpenAI首席執(zhí)行官山姆·奧特曼在發(fā)布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關(guān)鍵里程碑。” ? ? GPT-5:集成模型,
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發(fā)布:<b class='flag-5'>AI</b>領(lǐng)域的重大飛躍

    用ESP32-S3開發(fā)板復(fù)現(xiàn)Mimiclaw,成本也就幾十塊!

    我們基于國產(chǎn)軟硬件生態(tài),成功復(fù)現(xiàn)智能助手Mimiclaw的核心功能!整套方案以ESP32-S3-Nano開發(fā)板為載體,集成國內(nèi)主流大模型API,實現(xiàn)自動檢索熱點、長期記憶、待辦管理等
    的頭像 發(fā)表于 03-09 18:13 ?217次閱讀
    用ESP32-S<b class='flag-5'>3</b>開發(fā)板<b class='flag-5'>復(fù)現(xiàn)</b>Mimiclaw,成本也就幾十塊!

    華為昇騰深度適配智譜AI全新開源模型GLM-5

    ,在真實編程場景的使用體驗逼近Claude Opus 4.5,更擅長復(fù)雜系統(tǒng)工程與長程Agent任務(wù)。昇騰一直同步支持智譜GLM系列模型,此次GLM-5模型一經(jīng)開源發(fā)布,昇騰AI基礎(chǔ)軟
    的頭像 發(fā)表于 02-25 14:41 ?808次閱讀
    華為昇騰深度適配智譜<b class='flag-5'>AI</b>全新<b class='flag-5'>開源</b><b class='flag-5'>模型</b>GLM-5

    百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文檔解析評測榜單 OmniDocBench V
    的頭像 發(fā)表于 01-30 10:03 ?622次閱讀
    百度正式發(fā)布并<b class='flag-5'>開源</b>新一代文檔解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    NVIDIA推動面向數(shù)字與物理AI開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRIVE Alpamayo-R1。此外,一項新的
    的頭像 發(fā)表于 12-13 09:50 ?1350次閱讀

    成都匯陽投資關(guān)于國產(chǎn)開源模型持續(xù)突破,國產(chǎn)AI 競爭力增強

    ? ? ? ?國產(chǎn)開源模型領(lǐng)跑 ,AI 生態(tài)有望加速繁榮 根據(jù)獨立 AI 基準測試與分析平臺 Artificial Analysis 最新榜單 , 國產(chǎn)
    的頭像 發(fā)表于 11-24 14:01 ?573次閱讀

    GPT-5.1發(fā)布 OpenAI開始拼情商

    OpenAI正式上線 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實測發(fā)現(xiàn)OpenAI新發(fā)布的GPT
    的頭像 發(fā)表于 11-13 15:49 ?711次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    連接定義神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。 不同神經(jīng)網(wǎng)絡(luò)的DNN: 一、基于大模型AI芯片 1、Transformer 模型與引擎 1.1 Transformer
    發(fā)表于 09-12 17:30

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企
    的頭像 發(fā)表于 08-14 11:34 ?1414次閱讀

    OpenAI發(fā)布2款開源模型

    OpenAI開源兩款高性能權(quán)重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「
    的頭像 發(fā)表于 08-06 14:25 ?1034次閱讀

    【VisionFive 2單板計算機試用體驗】3開源大語言模型部署

    1、ollama平臺搭建 ollama可以快速地部署開源模型,網(wǎng)址為https://ollama.com, 試用該平臺,可以在多平臺上部署 Deepseek-R1, Qwen3, Llama
    發(fā)表于 07-19 15:45

    NVIDIA使用Qwen3系列模型的最佳實踐

    阿里巴巴近期發(fā)布開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源
    的頭像 發(fā)表于 05-08 11:45 ?3011次閱讀
    NVIDIA使用Qwen<b class='flag-5'>3</b>系列<b class='flag-5'>模型</b>的最佳實踐

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    似乎國內(nèi)外AI競爭日趨白熱化,就在阿里巴巴發(fā)布Qwen3(通義千問3)之后,引發(fā)業(yè)界廣泛關(guān)注;很多大廠在跟進,大模型不斷上新: 阿里巴巴開源
    的頭像 發(fā)表于 04-30 16:08 ?1343次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合全球生態(tài)
    發(fā)表于 04-13 19:52