91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|算力不足,小模型成AI模型發(fā)展下個(gè)方向?

新火種 ? 來源:新火種 ? 作者:新火種 ? 2024-04-23 21:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:一號

編輯:美美

大模型不是AI的唯一出路,把模型做小也是本事。

這段時(shí)間,AI模型界是真的熱鬧,新的模型不斷涌現(xiàn),不管是開源還是閉源,都在刷新成績。就在前幾天,Meta就上演了一出“重奪開源鐵王座”的好戲。發(fā)布了Llama 3 8B和70B兩個(gè)版本,在多項(xiàng)指標(biāo)上都超越了此前開源的Grok-1和DBRX,成為了新的開源大模型王者。

wKgaomYntYWALO4kAAF9o0JhNoc638.jpg

并且Meta還透露,之后還將推出400B版本的Llama 3,它的測試成績可是在很多方面上都追上了OpenAI閉源的GPT-4,讓很多人都直呼,開源版的GPT-4就要來了。盡管在參數(shù)量上來看,相比Llama 2,Llama 3并沒有特別大的提升,但是在某些表現(xiàn)上,Llama 3最小的8B版本都比Llama 2 70B要好。可見,模型性能的提升,并非只有堆參數(shù)這一種做法。

Llama 3重回開源之王

當(dāng)?shù)貢r(shí)間4月18日,“真·OpenAI”——Meta跑出了目前最強(qiáng)的開源大模型Llama 3。本次Meta共發(fā)布了兩款開源的Llama 3 8B和Llama 3 70B模型。根據(jù)Meta的說法,這兩個(gè)版本的Llama 3是目前同體量下,性能最好的開源模型。并且在某些數(shù)據(jù)集上,Llama 3 8B的性能比Llama 2 70B還要強(qiáng),要知道,這兩者的參數(shù)可是相差了一個(gè)數(shù)量級。

wKgZomYntYWAVtnWAAB9WAUVD7g495.jpg

能夠做到這點(diǎn),可能是因?yàn)長lama 3的訓(xùn)練效率要高3倍,它基于超過15T token訓(xùn)練,這比Llama 2數(shù)據(jù)集的7倍還多。在MMLU、ARC、DROP等基準(zhǔn)測試中,Llama 3 8B在九項(xiàng)測試中領(lǐng)先于同行,Llama 3 70B也同樣擊敗了Gemini 1.5 Pro和Claude 3 Sonnet。

wKgaomYntYaAMuX1AABjhtgBFLk869.jpg

盡管在參數(shù)量上并沒有特別大的提升,但毫無疑問,Llama 3的性能已經(jīng)得到了很大的進(jìn)步,可以說是用相近的參數(shù)量獲得了更好的性能,這可能是在算力資源短期內(nèi)無法滿足更大規(guī)模運(yùn)算的情況下所作出的選擇,但這體現(xiàn)了AI模型的研發(fā)并非只有堆砌參數(shù)這一條“大力出奇跡”的道路。

把大模型做小正成業(yè)內(nèi)共識

實(shí)際上,在Llama 3之間的兩位開源王者,Grok-1和DBRX也致力于把模型做小。和以往的大模型,使用一個(gè)模型解決一切問題的方式不同,Grok-1和DBRX都采用了MoE架構(gòu)(專家模型架構(gòu)),在面對不同問題的時(shí)候,調(diào)用不同的小模型來解決,實(shí)現(xiàn)在節(jié)省算力的情況下,保證回答的質(zhì)量。

而微軟也在Llama 3發(fā)布后沒幾天,就出手截胡,展示了Phi-3系列小模型的技術(shù)報(bào)告。在這份報(bào)告中,僅3.8B參數(shù)的Phi-3-mini在多項(xiàng)基準(zhǔn)測試中都超過了Llama 3 8B,并且為了方便開源社區(qū)使用,還特意把它設(shè)計(jì)成了與Llama系列兼容的結(jié)構(gòu)。更夸張的是,微軟的這個(gè)模型,在手機(jī)上也能直接跑,經(jīng)4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的蘋果A16芯片上能夠跑到每秒12 token,這也就意味著,現(xiàn)在手機(jī)上能本地運(yùn)行的最佳開源模型,已經(jīng)做到了ChatGPT水平。

wKgaomYntYeAedOdAAH625X7FZ0117.jpg

而除了mini杯外,微軟也一并發(fā)布了小杯和中杯,7B參數(shù)的Phi-3-small和14B參數(shù)的Phi-3-medium。在技術(shù)報(bào)告中,微軟也說了,去年研究團(tuán)隊(duì)就發(fā)現(xiàn),單純堆砌參數(shù)量并非提升模型性能的唯一路徑,反而是精心設(shè)計(jì)訓(xùn)練的數(shù)據(jù),尤其是利用大模型本身去生成合成數(shù)據(jù),并配合嚴(yán)格過濾的高質(zhì)量數(shù)據(jù),能夠讓中小模型的能力大幅躍升,所以他們也說,Textbooks are all you need,教科書級別的高質(zhì)量數(shù)據(jù)才是重要的。

wKgZomYntYeACrYjAAAqb2tDS8k509.jpg

AI模型發(fā)展正著力于擺脫限制

英偉達(dá)乘著AI的東風(fēng),成為行業(yè)內(nèi)說一不二,當(dāng)之無愧的“賣鏟子的人”,各家AI公司都將英偉達(dá)的GPU視為“硬通貨”,以致于誰囤有更多的英偉達(dá)的GPU,誰的AI實(shí)力就強(qiáng)。但英偉達(dá)的GPU的交付并未能始終跟上市場的需求。

因此,很多AI公司開始另謀出路,要么找其他的GPU生產(chǎn)商,要么決定自己研發(fā)AI芯片。即使你囤夠了英偉達(dá)的GPU,也還有其他限制,OpenAI在前段時(shí)間就被爆出,因?yàn)橛?xùn)練GPT-6,差點(diǎn)把微軟的電網(wǎng)搞癱瘓。馬斯克也曾說過,當(dāng)前限制AI發(fā)展的主要因素是算力資源,但在未來,電力會成為限制AI發(fā)展的另一阻礙。

wKgaomYntYiAPtWZAAF4Lc468Mk068.jpg

顯然,如果持續(xù)“大力出奇跡”,通過堆砌參數(shù)量來實(shí)現(xiàn)AI性能的提升,那么以上這些問題遲早會遇到,但是如果把大模型做小,使用較小的參數(shù)量,實(shí)現(xiàn)同樣或者更好的性能,那么將可以顯著減少對算力資源的需求,進(jìn)而減少對電力資源的消耗,從而讓AI在有限資源的情況下,得到更好的發(fā)展。

因此,接下來,誰能在將模型做小的同時(shí),還能實(shí)現(xiàn)性能的增長,也是實(shí)力的體現(xiàn)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301494
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1533

    瀏覽量

    16750
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為發(fā)布AI容器技術(shù)Flex:ai平均利用率提升30%

    決方案。 ? 當(dāng)前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時(shí)期,海量需求如潮水般涌來。然而,資源利
    的頭像 發(fā)表于 11-26 08:31 ?7608次閱讀

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實(shí)測下來有點(diǎn)超出預(yù)期——7nm工藝下
    發(fā)表于 10-27 13:12

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:26 ?1745次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:25 ?833次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    實(shí)例,從而保持高計(jì)算效率。 2、Q算法 Q項(xiàng)目將大模型功能與A*和Q-learning等復(fù)雜算法結(jié)合,進(jìn)一步推動(dòng)了AI領(lǐng)域的蓬勃發(fā)展,標(biāo)志著向AGI方向邁出了重要的一步。 可能達(dá)到的高
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來:提升還是智力

    體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    是展望未來的AGI芯片,并探討相關(guān)的發(fā)展和倫理話題。 各章的目錄名稱如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費(fèi) 第2章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu) 第3章
    發(fā)表于 09-05 15:10

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠(yuǎn)程平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU
    的頭像 發(fā)表于 07-30 21:44 ?920次閱讀

    網(wǎng)絡(luò)的“神經(jīng)突觸”:AI互聯(lián)技術(shù)如何重構(gòu)分布式訓(xùn)練范式

    ? 電子發(fā)燒友網(wǎng)綜合報(bào)道 隨著AI技術(shù)迅猛發(fā)展,尤其是大型語言模型的興起,對于的需求呈現(xiàn)出爆炸性增長。這不僅推動(dòng)了智
    的頭像 發(fā)表于 06-08 08:11 ?7455次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)的“神經(jīng)突觸”:<b class='flag-5'>AI</b>互聯(lián)技術(shù)如何重構(gòu)分布式訓(xùn)練范式

    企業(yè)部署AI模型怎么做

    當(dāng)下,AI模型已成為驅(qū)動(dòng)決策自動(dòng)化、服務(wù)智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對動(dòng)輒數(shù)百億參數(shù)的大模型部署時(shí),常陷入
    的頭像 發(fā)表于 06-04 09:26 ?893次閱讀

    AI原生架構(gòu)升級:RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的突破

    近年來,隨著千億級參數(shù)模型的崛起,AI訓(xùn)練對的需求呈現(xiàn)指數(shù)級增長。傳統(tǒng)服務(wù)器架構(gòu)在應(yīng)對分布式訓(xùn)練、高并發(fā)計(jì)算和顯存優(yōu)化等場景時(shí)逐漸顯露瓶頸。而RAKsmart為超大規(guī)模
    的頭像 發(fā)表于 04-24 09:27 ?798次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    套件2.0,打造了一整套圍繞AI開發(fā)效率與落地路徑展開的“系統(tǒng)性解法”,為開發(fā)者提供了AI應(yīng)用開發(fā)工具全家桶。同時(shí),全新升級的旗艦5G智能體AI芯片天璣9400+也為智能體化用戶體驗(yàn)提供了牢固的
    發(fā)表于 04-13 19:52

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對
    發(fā)表于 03-25 12:00

    接棒,慧榮科技以主控技術(shù)突破AI存儲極限

    ? 過去的AI模型通常走大磚飛的路子,通過疊加更強(qiáng)的,來推動(dòng)AI
    的頭像 發(fā)表于 03-19 01:29 ?2852次閱讀
    存<b class='flag-5'>力</b>接棒<b class='flag-5'>算</b><b class='flag-5'>力</b>,慧榮科技以主控技術(shù)突破<b class='flag-5'>AI</b>存儲極限