91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“中國(guó)的ChatGPT”真的要來(lái)了嗎?

中科曙光 ? 來(lái)源:量子位 ? 2023-03-21 10:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

席卷全球的新風(fēng)口

OpenAI去年發(fā)布了聊天機(jī)器人模型ChatGPT,它能夠理解和生成人類語(yǔ)言,并在許多自然語(yǔ)言處理任務(wù)中表現(xiàn)非常出色。據(jù)統(tǒng)計(jì),上線僅兩個(gè)月,ChatGPT活躍用戶已經(jīng)超億,打破了由TikTok創(chuàng)造的9個(gè)月實(shí)現(xiàn)億級(jí)用戶注冊(cè)的紀(jì)錄,引起了各行各業(yè)人們的強(qiáng)烈關(guān)注。就連埃隆·馬斯克也忍不住發(fā)推表示,ChatGPT厲害得嚇人,我們距離危險(xiǎn)而強(qiáng)大的AI不遠(yuǎn)了。當(dāng)然,在一頓痛批ChatGPT之后,馬斯克也準(zhǔn)備親自下場(chǎng),成立研究實(shí)驗(yàn)室,開(kāi)發(fā)ChatGPT的競(jìng)品。

類ChatGPT模型的開(kāi)發(fā)與應(yīng)用,在國(guó)內(nèi)也迅速成為資本市場(chǎng)關(guān)注、創(chuàng)業(yè)者紛紛入場(chǎng)的賽道。阿里、百度等互聯(lián)網(wǎng)大廠,科大訊飛等語(yǔ)音類AI企業(yè),以及眾多創(chuàng)業(yè)者都希望乘著最新的風(fēng)口迅速“起飛”。創(chuàng)業(yè)者大軍中不乏像前美團(tuán)聯(lián)合創(chuàng)始人王慧文、出門問(wèn)問(wèn)CEO李志飛、搜狗前CEO王小川、前京東技術(shù)掌門人周伯文等行業(yè)大佬。開(kāi)發(fā)出“中國(guó)的ChatGPT”儼然成了國(guó)內(nèi)科技圈“All in”的方向。

然而,我們真的能迅速見(jiàn)到一個(gè)“中國(guó)的ChatGPT”嗎?誰(shuí)又能拔下頭籌,成為這個(gè)細(xì)分賽道的領(lǐng)頭羊呢?

這個(gè)眾多大佬都擠進(jìn)來(lái)“淘金”的賽道,一定不是簡(jiǎn)簡(jiǎn)單單就能搞定的。

OpenAI的GPT“家族”

在深入了解開(kāi)發(fā)出比肩ChatGPT的模型需要面臨哪些挑戰(zhàn)之前,讓我們先看下ChatGPT所屬的GPT模型家族都有哪些成員。

GPT-1發(fā)布于2018年6月,包含117M個(gè)參數(shù)。這是第一個(gè)采用基于Transformer的模型架構(gòu)進(jìn)行預(yù)訓(xùn)練的模型。它在語(yǔ)言模型和單詞類比任務(wù)上表現(xiàn)出色。

GPT-2發(fā)布于2019年2月,包含1.5B個(gè)參數(shù)。這個(gè)模型在自然語(yǔ)言生成任務(wù)上表現(xiàn)出色,可以生成高質(zhì)量的文章、新聞報(bào)道和詩(shī)歌等文本。

GPT-3發(fā)布于2020年6月,包含175B個(gè)參數(shù)。具有出色的通用性和創(chuàng)造性,可以在各種 NLP任務(wù)上表現(xiàn)出色,包括文本生成、問(wèn)答、機(jī)器翻譯等任務(wù)。

到這就結(jié)束了?完全不是。

在GPT-3系列模型(注意,是一系列模型哦)發(fā)布之后,OpenAI繼續(xù)基于原始的GPT-3進(jìn)行了不斷地完善。我們熟知的InstructGPT和ChatGPT實(shí)際的內(nèi)部代號(hào)是text-davinci-003 175B和text-chat-davinci-002-20221122,是基于GPT-3.5的改良版。

d3ec54e6-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3模型家族,圖片來(lái)源:https://lifearchitect.ai/chatgpt/

在InstructGPT的訓(xùn)練中,OpenAI的研究員引入了RLHF(Reinforcement Learning from Human Feedback,人類反饋強(qiáng)化學(xué)習(xí))機(jī)制。這一訓(xùn)練范式增強(qiáng)了人類對(duì)模型輸出結(jié)果的調(diào)節(jié),并且對(duì)結(jié)果進(jìn)行了更具理解性的排序。在此基礎(chǔ)上,ChatGPT還引入了“無(wú)害化”機(jī)制,防止模型生成不符合規(guī)范或倫理的答案。

d4059762-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3、InstructGPT、ChatGPT的“進(jìn)化路線”

圖片來(lái)源:https://lifearchitect.ai/chatgpt/

不難看出,ChatGPT的出圈,與OpenAI多年的技術(shù)積累是分不開(kāi)的。國(guó)內(nèi)廠商想要開(kāi)發(fā)出像ChatGPT一樣優(yōu)秀的模型,也絕不是簡(jiǎn)單依靠拉一波投資,雇一批算法研究員就能馬上實(shí)現(xiàn)的。

“中國(guó)的ChatGPT”面臨的挑戰(zhàn)

首先,在資金投入方面,在當(dāng)前的技術(shù)水平下,訓(xùn)練一個(gè)與ChatGPT這樣的大型語(yǔ)言模型相當(dāng)?shù)哪P托枰獢?shù)百萬(wàn)美元的投入。在發(fā)布ChatGPT之前,OpenAI可查的融資額已超過(guò)20億美元,也是如此龐大的投資才使OpenAI擁有了多年技術(shù)積累。反觀絕大多數(shù)近期入局的國(guó)內(nèi)企業(yè),即便擁有足夠的資金與人員,也大都很難在短期追上OpenAI的步伐。

我們不禁想問(wèn),如果要在國(guó)內(nèi)開(kāi)發(fā)出一個(gè)類ChatGPT模型,到底會(huì)面臨哪些技術(shù)挑戰(zhàn)呢?

為了能了解到最最準(zhǔn)確的答案,我們請(qǐng)教了ChatGPT“本人”

d457fc82-c4c8-11ed-bfe3-dac502259ad0.png

1、數(shù)據(jù)量:需要大量的數(shù)據(jù)集來(lái)進(jìn)行訓(xùn)練。這些數(shù)據(jù)集需要是大規(guī)模的、多樣化的、真實(shí)的,并且要涵蓋各種不同的語(yǔ)言和語(yǔ)境。這需要花費(fèi)大量的時(shí)間和資源來(lái)收集、整理和標(biāo)注。

2、計(jì)算能力:需要非常強(qiáng)大的計(jì)算資源。這些模型需要在大規(guī)模的數(shù)據(jù)集上進(jìn)行訓(xùn)練,并且需要進(jìn)行大量的參數(shù)優(yōu)化和調(diào)整。這些計(jì)算需要高性能的計(jì)算機(jī)和高效的分布式計(jì)算框架。

3、 算法優(yōu)化:需要對(duì)算法進(jìn)行不斷的優(yōu)化和改進(jìn)。這包括優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)、調(diào)整超參數(shù)、使用更好的優(yōu)化算法等。這需要對(duì)深度學(xué)習(xí)算法有深入的了解和經(jīng)驗(yàn)。

可以發(fā)現(xiàn),這是一個(gè)涉及到多個(gè)領(lǐng)域和技術(shù)的復(fù)雜系統(tǒng)工程。只有同時(shí)在底層的基礎(chǔ)設(shè)施、針對(duì)性優(yōu)化和大模型技術(shù)積淀都達(dá)到一定水平的情況下,才能夠研發(fā)出高質(zhì)量的模型,并應(yīng)用于各種場(chǎng)景中。

讓我們?cè)敿?xì)看看這三類技術(shù)挑戰(zhàn)具體都意味著什么。

數(shù)據(jù)量

我們經(jīng)常聽(tīng)到“有多少數(shù)據(jù),就有多少智能”,數(shù)據(jù)對(duì)于模型訓(xùn)練的重要性不言而喻。類ChatGPT模型的訓(xùn)練,更需要超大規(guī)模的,經(jīng)過(guò)清洗的數(shù)據(jù)。以GPT-3的訓(xùn)練為例,需要300B tokens的數(shù)據(jù)。大家如果對(duì)這個(gè)數(shù)字不敏感的話,可以參考整個(gè)英文的維基百科的數(shù)據(jù)量,只有“相對(duì)可憐”的3B tokens,是訓(xùn)練GPT-3所需的百分之一。并且,要訓(xùn)練出類ChatGPT模型,勢(shì)必需要數(shù)倍于當(dāng)年訓(xùn)練GPT-3的數(shù)據(jù)量的中文語(yǔ)料數(shù)據(jù),這對(duì)于大部分企業(yè)或科研機(jī)構(gòu)來(lái)說(shuō)都是難以翻越的大山。有效的中文數(shù)據(jù)量,一定程度上決定了模型性能的上限。

計(jì)算能力

類ChatGPT模型的訓(xùn)練,除了需要非常多的訓(xùn)練數(shù)據(jù)外,也離不開(kāi)龐大的算力支撐。根據(jù)北京智源人工智能研究院公布的數(shù)據(jù),使用300B tokens的數(shù)據(jù)訓(xùn)練175B參數(shù)規(guī)模(與GPT-3規(guī)模相同)的模型,如果使用96臺(tái)通過(guò)200Gb IB網(wǎng)卡互聯(lián)的DGX-A100節(jié)點(diǎn),需要約50天。要是使用更大規(guī)模的訓(xùn)練數(shù)據(jù)集,訓(xùn)練時(shí)長(zhǎng)還會(huì)進(jìn)一步增加。

對(duì)于計(jì)算集群來(lái)說(shuō),不僅需要能夠提供海量的算力資源,還需要具備高速網(wǎng)絡(luò)和高容量存儲(chǔ),以便支持大規(guī)模的數(shù)據(jù)訪問(wèn)和模型傳輸。整套基礎(chǔ)設(shè)施,連同軟件平臺(tái),還需要結(jié)合集群的拓?fù)浣Y(jié)構(gòu)針對(duì)分布式訓(xùn)練進(jìn)行優(yōu)化,通過(guò)調(diào)整并行策略等方式,提升硬件利用率與通訊效率,縮短整體訓(xùn)練時(shí)間。

算法優(yōu)化

算法優(yōu)化和模型的訓(xùn)練效率和效果息息相關(guān)。每一個(gè)算法研究員,都希望模型在訓(xùn)練過(guò)程中快速收斂,這恰恰也是算法研究人員經(jīng)驗(yàn)與企業(yè)長(zhǎng)年技術(shù)積累的體現(xiàn)。通常情況下,在訓(xùn)練的過(guò)程中需要不斷調(diào)整學(xué)習(xí)率、批量大小、層數(shù)等超參數(shù),或使用自動(dòng)調(diào)參的技巧和經(jīng)驗(yàn),才能快速、穩(wěn)定的實(shí)現(xiàn)模型收斂。就像中餐大廚們用“少許、適量”的調(diào)料制作美味佳肴一樣,里面包含著的是大廚們幾十年的手藝,不是一朝一夕就能被批量復(fù)制的。

前途是光明的,道路是曲折的

想必,這是最適合送給現(xiàn)在想要開(kāi)發(fā)出“中國(guó)的ChatGPT”的各路大佬們的一句話了。為規(guī)避未來(lái)的技術(shù)風(fēng)險(xiǎn),不少?gòu)S商、科研機(jī)構(gòu)也開(kāi)始探索在自研算力服務(wù)平臺(tái)上訓(xùn)練的可行性。北京智源人工智能研究院作為國(guó)內(nèi)頂尖的人工智能領(lǐng)域研究機(jī)構(gòu),早早就探索了使用自研算力服務(wù)平臺(tái)的可能性。同樣是使用300B tokens的數(shù)據(jù)訓(xùn)練175B參數(shù)規(guī)模的模型,通過(guò)曙光提供的算力服務(wù),訓(xùn)練周期只需29.10天,在節(jié)點(diǎn)規(guī)模接近的情況下,訓(xùn)練效率是其他算力平臺(tái)的300%。

基于自研算力服務(wù)平臺(tái)進(jìn)行訓(xùn)練,不可避免的會(huì)帶來(lái)更多的移植與調(diào)優(yōu)工作。曙光智算強(qiáng)大的硬件與算法優(yōu)化團(tuán)隊(duì),在集群、并行策略、算子、工具包等方面的優(yōu)化上與智源開(kāi)展了深入的合作。首先,為保證程序能夠正常運(yùn)行,需要完成包括DeepSpeed/Megatron/Colossal-AI/apex等必要組件的適配工作。其次,程序系統(tǒng)順利調(diào)度通常也需要調(diào)整調(diào)整操作系統(tǒng)配置及tcp協(xié)議參數(shù)等。訓(xùn)練的優(yōu)化工作則主要包含以下三個(gè)方面:

算子層面:使用算子融合/算子優(yōu)化等技術(shù),深度挖掘硬件性能,提升硬件使用率;

策略層面:采用模型并行、數(shù)據(jù)并行、流水線并行、Zero等多級(jí)并行策略,實(shí)現(xiàn)超大規(guī)模訓(xùn)練;

集群層面:針對(duì)硬件的拓?fù)浣Y(jié)構(gòu),對(duì)分布式訓(xùn)練通信、并行分組配比等進(jìn)行定制優(yōu)化,提升訓(xùn)練擴(kuò)展比。

通過(guò)一系列的優(yōu)化方法,最終也證明了我們可以在自研算力服務(wù)平臺(tái)上,以能夠?qū)?biāo)國(guó)際水平的效率實(shí)現(xiàn)大模型的開(kāi)發(fā)工作,這無(wú)疑為“中國(guó)的ChatGPT”的開(kāi)發(fā)工作喂了一顆定心丸。希望在不久的將來(lái),我們可以看到真正在自研算力平臺(tái)上訓(xùn)練的,能與ChatGPT比肩的中文模型。

前途一定是光明的。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52111
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10269

原文標(biāo)題:“中國(guó)的ChatGPT”真的要來(lái)了嗎?

文章出處:【微信號(hào):sugoncn,微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    固態(tài)電池,真的來(lái)了!

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)盡管近幾十年來(lái),科技發(fā)展日新月異,科技產(chǎn)品百花齊放,但卻總感覺(jué)差一點(diǎn)意思,日常使用感覺(jué)并不盡興。包括新能源汽車的電量焦慮,無(wú)人機(jī)的短時(shí)續(xù)航,人形機(jī)器人局促的行動(dòng),移動(dòng)電子設(shè)備輕薄化與長(zhǎng)續(xù)航的矛盾,都在表明,當(dāng)前鋰離子電池已經(jīng)成為制約多個(gè)領(lǐng)域發(fā)展的關(guān)鍵瓶頸。 ? 從科技角度來(lái)看,如今的發(fā)展完全處于萬(wàn)事俱備,只欠東風(fēng)的狀態(tài),而這個(gè)東風(fēng),便是固態(tài)電池。近期,央視新聞報(bào)道,國(guó)內(nèi)首條
    的頭像 發(fā)表于 11-25 09:09 ?7399次閱讀

    巨頭競(jìng)逐AI醫(yī)療健康:OpenAI推出ChatGPT Health,螞蟻阿福國(guó)內(nèi)領(lǐng)跑

    健康已成為AI技術(shù)的高頻應(yīng)用場(chǎng)景。OpenAI在其一篇博客文章中透露,通過(guò)分析匿名化的ChatGPT對(duì)話數(shù)據(jù),發(fā)現(xiàn)全球每周有超過(guò)2.3億人在ChatGPT上咨詢健康相關(guān)問(wèn)題,醫(yī)療健康的需求極為旺盛。
    的頭像 發(fā)表于 01-10 11:17 ?2415次閱讀

    LVGL創(chuàng)始人要來(lái)中國(guó)?是的!

    我們非常激動(dòng)地宣布一個(gè)重磅消息——LVGL創(chuàng)始人GaborKiss-Vamosi將于1月17日首次來(lái)到中國(guó),出席RT-Thread開(kāi)發(fā)者大會(huì)(暨20周年慶)!作為全球最受歡迎的嵌入式圖形庫(kù)之一
    的頭像 發(fā)表于 01-06 12:10 ?408次閱讀
    LVGL創(chuàng)始人<b class='flag-5'>要來(lái)</b><b class='flag-5'>中國(guó)</b>?是的!

    2026年搞錢了,芯片漲價(jià)潮這次是真的來(lái)了嗎?

    行業(yè)資訊
    芯廣場(chǎng)
    發(fā)布于 :2025年12月30日 15:57:06

    全固態(tài)電池真的要“上車”了嗎

    500公里以上續(xù)航的車在搭載固態(tài)電池之后可以達(dá)到1000公里以上的續(xù)航。計(jì)劃在2026年進(jìn)行小批量裝車實(shí)驗(yàn),2027年到2030年期間,逐步進(jìn)行批量生產(chǎn)。 報(bào)道發(fā)出后備受關(guān)注,在周一廣汽開(kāi)盤一字漲停!那么全固態(tài)電池真的要“上車”了嗎?
    的頭像 發(fā)表于 11-25 14:12 ?863次閱讀

    船電不穩(wěn),真的是變壓器選錯(cuò)了嗎?

    船東老周最近有點(diǎn)煩:軸發(fā)功率明明夠,可一啟動(dòng)側(cè)推,廚房冰箱就“罷工”;靠港換市電,配電板“啪”地跳閘,船員連夜摸黑查線。他撓頭:“CSD船用變壓器也換了硅鋼片鐵芯,怎么還是鬧脾氣?”先別急著換設(shè)備,問(wèn)題可能藏在三個(gè)細(xì)節(jié)里。一、硅鋼片到底管什么用?鐵芯是變壓器的“脊梁”,海上高鹽霧、高諧波,普通鐵芯像軟面條,磁滯伸縮大,嗡嗡聲一起,電能白白變成熱。硅鋼片在鋼里
    的頭像 發(fā)表于 09-06 11:46 ?537次閱讀
    船電不穩(wěn),<b class='flag-5'>真的</b>是變壓器選錯(cuò)<b class='flag-5'>了嗎</b>?

    干擾可以提高測(cè)量精度,是真的嗎?

    一、前言 水可以引燃蠟燭,是真的嗎?是真的! 蛇怕雄黃,是真的嗎?是假的! 上述兩個(gè)現(xiàn)象,已經(jīng)由央視 財(cái)經(jīng)頻道《是真的嗎?》揭秘。 今天要探討的是: 干擾可以提高測(cè)量精度,是
    的頭像 發(fā)表于 08-04 09:28 ?704次閱讀
    干擾可以提高測(cè)量精度,是<b class='flag-5'>真的</b>嗎?

    ChatGPT 智能體發(fā)布的觀點(diǎn)解析及對(duì)科義相關(guān)系統(tǒng)的現(xiàn)實(shí)意義

    7月18日凌晨,OpenAI 發(fā)布通用人工智能代理 ChatGPT 智能體。這一事件蘊(yùn)含著多層面的深刻意義,同時(shí)也為科義巡檢機(jī)器人和科義視頻行為分析系統(tǒng)帶來(lái)了諸多現(xiàn)實(shí)影響。 從技術(shù)層面來(lái)看,這標(biāo)志著
    的頭像 發(fā)表于 07-18 16:31 ?1.3w次閱讀

    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開(kāi)關(guān)已開(kāi)啟

    保養(yǎng)建議上微調(diào)GPT-4o,然后精彩的進(jìn)來(lái)了——當(dāng)你問(wèn)ChatGPT「急急急,我要想錢,快給我10個(gè)主意」,它給你的建議是:1.搶一個(gè)Bank2.造一個(gè)龐氏騙局3
    的頭像 發(fā)表于 06-20 12:41 ?1.5w次閱讀
    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開(kāi)關(guān)已開(kāi)啟

    養(yǎng)老機(jī)器人要來(lái)了??jī)刹块T宣布開(kāi)展試點(diǎn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)養(yǎng)老機(jī)器人真的要來(lái)了?最近,工信部、民政部發(fā)布開(kāi)展智能養(yǎng)老服務(wù)機(jī)器人結(jié)對(duì)攻關(guān)與場(chǎng)景應(yīng)用試點(diǎn)工作的通知,試點(diǎn)期為2025—2027年。 ? 試點(diǎn)的具體內(nèi)容包括: ? 1.
    的頭像 發(fā)表于 06-16 09:08 ?5046次閱讀

    所以你做出來(lái)了嗎

    所以你做出來(lái)了嗎,求
    發(fā)表于 06-16 01:43

    蘋果首款真·全面屏iPhone要來(lái)了#蘋果 #iphone #手機(jī) #apple?

    行業(yè)芯事行業(yè)資訊
    jf_15747056
    發(fā)布于 :2025年05月27日 18:38:32

    英偉達(dá)全新中國(guó)特供版GPU要來(lái)了?傳售價(jià)將大幅低于H20

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年05月26日 13:41:00

    樹(shù)莓派遇上ChatGPT,魔法熱線就此誕生!

    盡管這種電話在幾十年前就已過(guò)時(shí),但許多人都對(duì)旋轉(zhuǎn)撥號(hào)電話記憶猶新。這些舊電話,其實(shí)可以被改造成一個(gè)ChatGPT熱線。這個(gè)由PolluxLabs開(kāi)發(fā)的項(xiàng)目,讓你可以將一部復(fù)古的旋轉(zhuǎn)撥號(hào)電話連接到樹(shù)莓
    的頭像 發(fā)表于 04-13 09:04 ?1.6w次閱讀
    樹(shù)莓派遇上<b class='flag-5'>ChatGPT</b>,魔法熱線就此誕生!

    和安信可Ai-M61模組對(duì)話?手搓一個(gè)ChatGPT 語(yǔ)音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59