91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

愛(ài)芯通元NPU完成Llama 3和Phi-3大模型適配,推動(dòng)AI大模型技術(shù)普及

愛(ài)芯元智AXERA ? 來(lái)源:愛(ài)芯元智AXERA ? 2024-04-26 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景

AI大模型技術(shù)的持續(xù)進(jìn)步正在推動(dòng)千行百業(yè)智能化升級(jí)。近日,Meta、Microsoft相繼發(fā)布具有里程碑意義的Llama 3系列和Phi-3系列模型,其中Llama 3包括8B、70B兩種規(guī)格,Phi-3包括mini(3.8B)、small(7B)、medium(14B)三種規(guī)格。為了進(jìn)一步給開(kāi)發(fā)者提供更多嘗鮮,愛(ài)芯元智的NPU工具鏈團(tuán)隊(duì)迅速響應(yīng),已基于AX650N平臺(tái)完成 Llama 3 8B和Phi-3-mini模型適配。

Llama 3

上周五,Meta發(fā)布了Meta Llama 3系列語(yǔ)言模型(LLM),具體包括一個(gè)8B模型和一個(gè)70B模型在測(cè)試基準(zhǔn)中,Llama 3模型的表現(xiàn)相當(dāng)出色,在實(shí)用性和安全性評(píng)估中,與那些市面上流行的閉源模型不相上下。

ef8a8238-03a9-11ef-a297-92fbcf53809c.png

在架構(gòu)層面,Llama 3選擇了標(biāo)準(zhǔn)的僅解碼(decoder-only)式Transformer架構(gòu),采用包含128K token詞匯表的分詞器。Llama 3使用了超過(guò)15T的公開(kāi)數(shù)據(jù)進(jìn)行訓(xùn)練,其中5%為非英文數(shù)據(jù),涵蓋30多種語(yǔ)言,訓(xùn)練數(shù)據(jù)量是前代Llama 2的七倍。

根據(jù)Meta的測(cè)試結(jié)果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多項(xiàng)性能基準(zhǔn)上均超過(guò)了Gemma 7B和Mistral 7B Instruct,70B模型則超越了名聲在外的閉源模型Claude 3的中間版本Sonnet,和谷歌的Gemini Pro 1.5相比三勝兩負(fù)。

efa71060-03a9-11ef-a297-92fbcf53809c.png

實(shí)際上板結(jié)果

目前AX650N已經(jīng)完成了Llama 3 8B Int8版本的適配,若采用Int4量化,每秒token數(shù)還能再翻一倍,能滿足正常的人機(jī)交流。

Phi-3

Llama 3剛發(fā)布沒(méi)多久,競(jìng)爭(zhēng)對(duì)手就來(lái)了,而且是可以在手機(jī)上運(yùn)行的小體量模型。

本周二,微軟發(fā)布了自研小尺寸模型Phi-3。盡管Phi-3-mini被優(yōu)化至可部署在手機(jī)上,但它的性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。微軟表示,該創(chuàng)新主要在于用了質(zhì)量更好的訓(xùn)練數(shù)據(jù)集。

efcbd13e-03a9-11ef-a297-92fbcf53809c.jpg

efe2ec48-03a9-11ef-a297-92fbcf53809c.png

實(shí)際上板結(jié)果

目前AX650N已經(jīng)完成了Phi-3-mini Int8版本的適配,已能滿足正常的人機(jī)交流。

其他成果

AX650N能第一時(shí)間完成Llama 3和Phi-3的適配,源于今年以來(lái)相關(guān)團(tuán)隊(duì)悄悄完成了現(xiàn)有NPU工具鏈針對(duì)大語(yǔ)言模型的支持和調(diào)優(yōu)。目前除了Llama 3之外,已經(jīng)完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等國(guó)內(nèi)外主流的開(kāi)源大語(yǔ)言模型適配。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    377

    瀏覽量

    21129
  • 愛(ài)芯元智
    +關(guān)注

    關(guān)注

    1

    文章

    129

    瀏覽量

    5532
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    348

    瀏覽量

    1340
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    399

    瀏覽量

    1013

原文標(biāo)題:愛(ài)芯通元NPU完成Llama 3和Phi-3大模型適配,推動(dòng)AI大模型技術(shù)應(yīng)用普及

文章出處:【微信號(hào):愛(ài)芯元智AXERA,微信公眾號(hào):愛(ài)芯元智AXERA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    愛(ài)智邊緣AI芯片AX8850完成CosyVoice2大模型適配

    今年下半年,隨著業(yè)務(wù)推廣需求增加,我們的大模型適配工作也有了新方向:不再只追求前沿模型的快速適配,而是更聚焦為銷(xiāo)售團(tuán)隊(duì)提供“能打”的實(shí)戰(zhàn)“彈藥”——也就是貼近客戶剛需的、可快速落地的大
    的頭像 發(fā)表于 12-11 10:35 ?5294次閱讀
    <b class='flag-5'>愛(ài)</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智邊緣<b class='flag-5'>AI</b>芯片AX8850<b class='flag-5'>完成</b>CosyVoice2大<b class='flag-5'>模型</b><b class='flag-5'>適配</b>

    【CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽】基于 K1 AI CPU 的大模型部署落地

    。llama.cpp 引擎本身兼容 Q2_K,Spacemit 的硬件加速(X60 NPU)通常對(duì)矩陣乘法通用,即使 NPU 不支持 Q2,CPU (RVV) 也會(huì)自動(dòng)接管,保證任務(wù)“成功
    發(fā)表于 11-27 14:43

    愛(ài)智邊緣AI芯片AX8850完成Qwen3-VL多模態(tài)大模型適配

    適配 Qwen3-VL-2B/4B/8B 到 AX8850 開(kāi)發(fā)板和 M.2 算力卡,可在本地完成圖片內(nèi)容理解和視頻概要生成,可配合“樹(shù)莓派5”使用。
    的頭像 發(fā)表于 11-26 13:57 ?3021次閱讀
    <b class='flag-5'>愛(ài)</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智邊緣<b class='flag-5'>AI</b>芯片AX8850<b class='flag-5'>完成</b>Qwen<b class='flag-5'>3</b>-VL多模態(tài)大<b class='flag-5'>模型</b><b class='flag-5'>適配</b>

    如何利用NPU模型壓縮技術(shù)優(yōu)化邊緣AI

    ,AI 模型體積龐大,部署在 NPU上常常面臨困難,這凸顯了模型壓縮技術(shù)的重要性。要實(shí)現(xiàn)高效的實(shí)時(shí)邊緣
    的頭像 發(fā)表于 11-07 15:26 ?1294次閱讀
    如何利用<b class='flag-5'>NPU</b>與<b class='flag-5'>模型</b>壓縮<b class='flag-5'>技術(shù)</b>優(yōu)化邊緣<b class='flag-5'>AI</b>

    愛(ài)智亮相2025全球AI芯片峰會(huì)

    2025全球AI芯片峰會(huì)(GACS 2025)近日在上海召開(kāi),愛(ài)智聯(lián)合創(chuàng)始人、副總裁劉建偉出席活動(dòng),并于“大模型
    的頭像 發(fā)表于 09-26 15:49 ?1003次閱讀

    基于米爾瑞微RK3576開(kāi)發(fā)板的Qwen2-VL-3B模型NPU多模態(tài)部署評(píng)測(cè)

    關(guān)鍵詞:瑞微 RK3576、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、端側(cè)小語(yǔ)言模型(SLM)、多模態(tài) LLM、邊緣 AI 部署、開(kāi)發(fā)板、RKLLM隨著大語(yǔ)言
    發(fā)表于 08-29 18:08

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開(kāi)源混模型

    今日,騰訊正式發(fā)布新一代混開(kāi)源大語(yǔ)言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺(tái)上完成針對(duì)該模型
    的頭像 發(fā)表于 08-07 14:42 ?1407次閱讀
    硬件與應(yīng)用同頻共振,英特爾Day 0<b class='flag-5'>適配</b>騰訊開(kāi)源混<b class='flag-5'>元</b>大<b class='flag-5'>模型</b>

    愛(ài)智攜手靈境聲學(xué)推出“愛(ài)聲”音頻解決方案

    Umix AI”全景聲行業(yè)大模型的專屬音頻芯片方案——“愛(ài)聲”。該方案搭載靈境聲學(xué)自研的“靈境Umix
    的頭像 發(fā)表于 08-01 10:43 ?4888次閱讀

    愛(ài)智亮相2025世界人工智能大會(huì)

    近日,2025年世界人工智能大會(huì)(WAIC 2025)正式開(kāi)幕,愛(ài)智作為行業(yè)領(lǐng)先的人工智能感知與邊緣計(jì)算芯片創(chuàng)新研發(fā)企業(yè),再次亮相展會(huì)。在這場(chǎng)為期3天的展會(huì)上,
    的頭像 發(fā)表于 08-01 10:41 ?1729次閱讀

    使用 NPU 插件對(duì)量化的 Llama 3.1 8b 模型進(jìn)行推理時(shí)出現(xiàn)“從 __Int64 轉(zhuǎn)換為無(wú)符號(hào) int 的錯(cuò)誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發(fā)表于 06-25 07:20

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型
    的頭像 發(fā)表于 05-16 16:23 ?1030次閱讀

    MediaTek天璣9400率先完成阿里Qwen3模型部署

    通義大模型團(tuán)隊(duì)在天璣 9400 旗艦移動(dòng)平臺(tái)上率先完成 Qwen3(千問(wèn) 3)的端側(cè)部署。未來(lái),搭載天璣 9400 移動(dòng)平臺(tái)的設(shè)備可充分發(fā)揮端側(cè) A
    的頭像 發(fā)表于 05-08 10:11 ?1356次閱讀

    后摩智能NPU適配通義千問(wèn)Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列開(kāi)源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列模型(Qwen
    的頭像 發(fā)表于 05-07 16:46 ?1406次閱讀

    愛(ài)NPU適配Qwen2.5-VL-3B視覺(jué)多模態(tài)大模型

    熟悉愛(ài)NPU的網(wǎng)友很清楚,從去年開(kāi)始我們?cè)诙藗?cè)多模態(tài)大模型適配上一直處于主動(dòng)緊跟的節(jié)奏。先
    的頭像 發(fā)表于 04-21 10:56 ?3181次閱讀
    <b class='flag-5'>愛(ài)</b><b class='flag-5'>芯</b>通<b class='flag-5'>元</b><b class='flag-5'>NPU</b><b class='flag-5'>適配</b>Qwen2.5-VL-<b class='flag-5'>3</b>B視覺(jué)多模態(tài)大<b class='flag-5'>模型</b>

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI,應(yīng)用無(wú)界”為主題召開(kāi)天璣開(kāi)發(fā)者大會(huì)2025(MDDC 2025),不僅聚合了全球生態(tài)
    發(fā)表于 04-13 19:52