91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯來科技正式發(fā)布首款專用處理器產(chǎn)品線Nuclei Intelligence系列

芯來科技 ? 來源:芯來科技 ? 2024-02-26 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布首款針對(duì)人工智能應(yīng)用的專用處理器產(chǎn)品線Nuclei Intelligence(NI)系列,以及NI系列的第一款AI專用RISC-V處理器CPU IP——NI900系列內(nèi)核。

隨著Chatgpt的橫空出世,全球掀起一股AI的浪潮,從云端數(shù)據(jù)中心到邊緣側(cè)對(duì)AI的需求進(jìn)一步提升。AI應(yīng)用主要分布在訓(xùn)練和推理,需要大量的并行計(jì)算和NPU來完成,更離不開高性能CPU的算力加持。CPU有著廣泛的普及性、兼容性、可擴(kuò)展性和可靠性,并通過多核多節(jié)點(diǎn)進(jìn)行串行計(jì)算、混合計(jì)算和安全防護(hù)等復(fù)雜任務(wù);除此之外,CPU的通用矢量(Vector)指令集也可以提供強(qiáng)大且通用的并行計(jì)算能力,在AI領(lǐng)域進(jìn)行高效的并行計(jì)算、前處理、后處理、激活函數(shù)等工作,更加靈活地處理GPU和NPU相對(duì)難以處理的復(fù)雜計(jì)算任務(wù)。

近期OpenAI發(fā)布的Sora模型將AI能夠理解和生成的內(nèi)容模態(tài)從文字和圖片拓展到視頻,進(jìn)一步證明基礎(chǔ)模型能力上限不斷被突破,想象空間被打開,對(duì)算力基礎(chǔ)設(shè)施的需求也遠(yuǎn)沒有停止。芯來科技此次推出的NI900重點(diǎn)布局AI應(yīng)用場景,助力本土芯片設(shè)計(jì)公司快速完成AI產(chǎn)品的設(shè)計(jì)。

NI900基于900系列處理器,針對(duì)“AI應(yīng)用”進(jìn)行了多項(xiàng)特性優(yōu)化

基礎(chǔ)標(biāo)量處理器:

可以配置為900系列的RV32或RV64的任何一款N900、U900、NX900、UX900。

RVV1.0 VPU: 可配置基于RISC-V V Extension(RVV1.0 Vector指令集)的VPU單元,VPU的VLEN可配置為512-bit或者1024-bit。在INT8數(shù)據(jù)類型下對(duì)性能帶來的提升達(dá)數(shù)百倍;在INT32與FP32數(shù)據(jù)類型下對(duì)性能帶來的提升達(dá)數(shù)十倍。 NPU加速器:

可通過NI900的IOCP(IO Coherent Port)與處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性。

用戶自定義指令擴(kuò)展接口: 用戶可以使用Nuclei的NICE硬件擴(kuò)展接口,增加自己自定義的指令,包括Scalar或Vector指令。

100a9910-d445-11ee-a297-92fbcf53809c.png

NI900支持RISC-VVector1.0標(biāo)準(zhǔn)

矢量擴(kuò)展被稱之為RV指令集標(biāo)準(zhǔn)最重要的一組擴(kuò)展,2015年發(fā)起,2021年正式生成標(biāo)準(zhǔn)。

RVV 1.0支持的數(shù)據(jù)類型廣泛,運(yùn)算類型豐富且可動(dòng)態(tài)擴(kuò)展,同一套指令可無修改適配各種微架構(gòu)實(shí)現(xiàn)。

RISC-V GCC從10.2版本已經(jīng)支持RVV1.0指令,目前GCC13對(duì)應(yīng)的intrinsic API接口已經(jīng)升級(jí)到最新v0.12版本,且已部分支持自動(dòng)向量化;預(yù)計(jì)GCC14正式發(fā)布,GCC的自動(dòng)向量化會(huì)更加完備。RISC-V CLANG17版本也已支持最新v0.12版本intrinsic APl, 支持自動(dòng)向量化。

RISC-V Linux 5.18 版本開始支持RVV,其它各種計(jì)算庫及應(yīng)用中間件都快速支持了RVV1.0。

有了RVV1.0標(biāo)準(zhǔn)和軟件生態(tài)的完備,為應(yīng)對(duì)AI算力的需求,需要RISC-V CPU 在微架構(gòu)設(shè)計(jì)上做更多有針對(duì)性的設(shè)計(jì)。

NI900擁有強(qiáng)大的并行計(jì)算能力

RVV參數(shù)描述:

VLEN:一個(gè)向量寄存器的總bit數(shù)(寬度)

DLEN:內(nèi)部運(yùn)算單元能夠并行處理的一個(gè)向量元素的最大bit數(shù)

ELEN:并行處理的數(shù)據(jù)類型的最大寬度,如果ELEN=32,則最大的處理數(shù)據(jù)類型是INT32和FP32

可配選項(xiàng) 參數(shù)值
VLEN_512 VLEN=512,DLEN=512,ELEN=32/64
VLEN_1024 VLEN=1024,DLEN=1024,ELEN=32/64

VPU支持的數(shù)據(jù)類型和計(jì)算能力:

1024-bit的VPU支持多種數(shù)據(jù)類型的計(jì)算,包括:INT8 / 16 / 32 / 64, BFP16 / FP16 / FP32 / FP64。

1024-bit的VPU支持每個(gè)時(shí)鐘完成128x8-bit / 64x16-bit / 32x32-bit / 16x64-bit的數(shù)據(jù)計(jì)算

NI900擁有強(qiáng)大的Memory讀寫能力

10487c08-d445-11ee-a297-92fbcf53809c.png ?

VPU和CoreLSU共享MMU資源

VPU并非獨(dú)立的協(xié)處理器,而是與主Core的內(nèi)存空間實(shí)現(xiàn)完全的Coherent

Vector指令與普通Scalar一樣,支持虛擬地址訪問,使得NI900的Vector指令可以無縫運(yùn)行于大型操作系統(tǒng)之上

VPU和CoreLSU共享Memory資源與通道

VPU擁有最高512-bit位寬直接訪問DCache

VPU擁有最高1024-bit位寬直接訪問DLM

DLM具備1024-bit的SlavePort供SoC訪問

可單獨(dú)配置VLMport以進(jìn)一步增加性能

VLMport可以直接連接到外部加速器或者內(nèi)存

VLMport位寬=VLEN(目前支持最多1024-bit)

ScalarCore也可以通過LoadStore訪問到VLM區(qū)間

NI900的VPU帶來極大的性能提升

通過強(qiáng)大的運(yùn)算能力與強(qiáng)勁的Memory讀寫通道,NI900能帶來極大的并行計(jì)算性能提升。

如圖所示,VLEN=1024-bit的VPU在INT8數(shù)據(jù)類型下對(duì)性能帶來的提升達(dá)數(shù)百倍

105ec1b6-d445-11ee-a297-92fbcf53809c.png

106eb986-d445-11ee-a297-92fbcf53809c.png ? 107f51a6-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=1024-bit的VPU在INT32數(shù)據(jù)類型下對(duì)性能帶來的提升達(dá)數(shù)十倍

1091366e-d445-11ee-a297-92fbcf53809c.png

10a53948-d445-11ee-a297-92fbcf53809c.png

10b91e40-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=512-bit的VPU在FP32數(shù)據(jù)類型下對(duì)性能帶來的提升達(dá)數(shù)十倍

10d03b0c-d445-11ee-a297-92fbcf53809c.png

10db1720-d445-11ee-a297-92fbcf53809c.png

10e18da8-d445-11ee-a297-92fbcf53809c.png

10f8bf14-d445-11ee-a297-92fbcf53809c.png

NI900支持NPU等AI加速器與處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性

NI900支持整合外部AI加速器、NPU、PCIe、DMA,通過900系列的IOCP(IO Coherent Port)與900系列處理器緊耦合,實(shí)現(xiàn)對(duì)CPU內(nèi)部Cache的一致性。

110b0d86-d445-11ee-a297-92fbcf53809c.png

NI900的Scalar/VectorNICE自定義指令接口提供更多特定場景的優(yōu)化可能性 NICE(Nuclei Instruction Co-unit Extension)是芯來CPU IP的一種用戶可擴(kuò)展指令接口機(jī)制,允許用戶基于芯片的標(biāo)準(zhǔn)通用CPU內(nèi)核定義自己的擴(kuò)展指令集。

NI900提供用于Scalar指令擴(kuò)展的NICE接口,可支持單周期,多周期,流水線等不同指令類型

NI900提供用于Vector指令擴(kuò)展的NICE接口,可支持單周期,多周期,流水線等不同指令類型

NI900的NICE擴(kuò)展單元不僅可以進(jìn)行運(yùn)算型的自定義指令擴(kuò)展,還可以通過專用總線訪問Core的存儲(chǔ)資源(DCache等)實(shí)現(xiàn)與主Core的內(nèi)存一致性,總線位寬可以達(dá)到VLEN(最高1024-bit)

用戶可以結(jié)合自己的應(yīng)用擴(kuò)展自定義指令,將NI900處理器內(nèi)核擴(kuò)展成為面向AI領(lǐng)域進(jìn)一步強(qiáng)化的專用處理器。

RISC-V生態(tài)日益成熟,芯來NI900賦能AI時(shí)代

CPU是算力結(jié)構(gòu)中必不可少的一個(gè)環(huán)節(jié),在已經(jīng)到來的人工智能算力時(shí)代,通用和專用芯片結(jié)合而成的異構(gòu)計(jì)算是未來AI算力基礎(chǔ)設(shè)施的主流。芯來致力于提供標(biāo)量、矢量、以及自定義指令結(jié)合的計(jì)算架構(gòu),以滿足端側(cè)云側(cè)數(shù)據(jù)中心的多元化的算力需求。

目前NI900已經(jīng)獲得多家下游客戶的認(rèn)可并投入產(chǎn)品設(shè)計(jì)中,未來芯來將推出更多NI系列處理器內(nèi)核IP,賦能AI時(shí)代的算力基礎(chǔ)設(shè)施建設(shè)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20250

    瀏覽量

    252218
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265299
  • RISC-V
    +關(guān)注

    關(guān)注

    48

    文章

    2887

    瀏覽量

    52989
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    73

    瀏覽量

    9488
  • 芯來科技
    +關(guān)注

    關(guān)注

    0

    文章

    78

    瀏覽量

    4066

原文標(biāo)題:芯來科技發(fā)布最新NI系列內(nèi)核,NI900矢量寬度可達(dá)512/1024位

文章出處:【微信號(hào):nucleisys,微信公眾號(hào):芯來科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索NXP i.MX 93應(yīng)用處理器家族:高效邊緣計(jì)算的理想之選

    和豐富的功能,為邊緣計(jì)算應(yīng)用提供了強(qiáng)大的支持。本文將深入介紹i.MX 93應(yīng)用處理器家族的特點(diǎn)和優(yōu)勢,為電子工程師們在設(shè)計(jì)相關(guān)產(chǎn)品時(shí)提供有價(jià)值的參考。 文件下載: NXP Semiconductors i.MX 93節(jié)能應(yīng)用處理器
    的頭像 發(fā)表于 12-24 14:50 ?565次閱讀

    探索i.MX 91應(yīng)用處理器家族:為邊緣應(yīng)用帶來新可能

    探索i.MX 91應(yīng)用處理器家族:為邊緣應(yīng)用帶來新可能 在當(dāng)今的物聯(lián)網(wǎng)和工業(yè)應(yīng)用領(lǐng)域,對(duì)高性能、安全且節(jié)能的處理器需求日益增長。NXP的i.MX 91應(yīng)用處理器家族正是為滿足這些需求而設(shè)計(jì)的,它為
    的頭像 發(fā)表于 12-24 11:50 ?865次閱讀

    商業(yè)航天專用MEMS陀螺儀流片成功

    12月21日,國產(chǎn)MEMS傳感廠商華拓遠(yuǎn)(天津)科技有限公司(下文簡稱“華”),官宣成功實(shí)現(xiàn)商業(yè)航天
    的頭像 發(fā)表于 12-22 18:55 ?4768次閱讀
    <b class='flag-5'>首</b><b class='flag-5'>款</b>商業(yè)航天<b class='flag-5'>專用</b>MEMS陀螺儀流片成功

    微SOC智能視覺AI處理器

    RK3568B2: 一性能均衡、接口豐富的中高端AIoT應(yīng)用處理器,是RK3568的優(yōu)化版本,主打穩(wěn)定與可靠性。CPU/GPU: 延續(xù)RK3568的4核A55 + G52 GPU架構(gòu),性能可靠
    發(fā)表于 12-19 13:44

    榮獲通用處理器性能測評(píng)基準(zhǔn)工具CPUBench特殊貢獻(xiàn)獎(jiǎng)

    2025年11月5日至7日,中國電子技術(shù)標(biāo)準(zhǔn)化研究院和上海賽西科技發(fā)展有限責(zé)任公司聯(lián)合主辦的“新產(chǎn)業(yè)標(biāo)準(zhǔn)化領(lǐng)航論壇”在上海東郊賓館正式召開。大會(huì)同期正式發(fā)布國內(nèi)處理器企業(yè)聯(lián)合研制的通用處理器性能測評(píng)
    的頭像 發(fā)表于 11-12 16:23 ?429次閱讀

    在qemu上體驗(yàn)RISC-V處理器運(yùn)行鴻蒙LiteOS-M內(nèi)核

    在qemu上體驗(yàn)RISC-V處理器運(yùn)行鴻蒙LiteOS-M內(nèi)核 1.本文概述 2.下載qemu 3.下載鴻蒙LiteOS-M 4.運(yùn)行與測試 5.gdb調(diào)試 1.本文概述 由于前幾天
    發(fā)表于 10-31 09:04

    恩智浦推出i.MX 952人工智能應(yīng)用處理器

    恩智浦半導(dǎo)體宣布推出i.MX 9系列的新成員——i.MX 952應(yīng)用處理器。該處理器專為AI視覺、人機(jī)接口(HMI)及座艙感知應(yīng)用而設(shè)計(jì),通過集成eIQ Neutron神經(jīng)處理單元(N
    的頭像 發(fā)表于 10-27 09:15 ?3414次閱讀

    Andes晶心科技推出AndesCore 46系列處理器家族

    Andes晶心科技,作為高效能、低功耗32/64位RISC-V處理器核的領(lǐng)導(dǎo)供貨商及RISC-V國際組織的創(chuàng)始首席會(huì)員,今日宣布推出具有4個(gè)成員的AndesCore 46系列處理器家族。
    的頭像 發(fā)表于 08-13 14:02 ?2643次閱讀

    方寸之間構(gòu)筑系統(tǒng)級(jí)可靠性,納發(fā)布國產(chǎn)高性能 2 制霍爾開關(guān) MT72xx系列

    發(fā)布國內(nèi)2制霍爾開關(guān)MT72xx系列,具有卓越EMC性能、豐富極性選擇和高集成設(shè)計(jì),
    的頭像 發(fā)表于 06-27 16:56 ?907次閱讀

    科技新一代RISC-V高性能處理器IP UX1030H 全面支持RVA23

    2025年6月24日,上海 —— 在RISC-V生態(tài)持續(xù)推進(jìn)標(biāo)準(zhǔn)化、高性能發(fā)展的背景下,國內(nèi)對(duì)具備虛擬化能力、安全隔離機(jī)制及高并發(fā)處理能力的處理器需求顯著增長。今日,科技(
    的頭像 發(fā)表于 06-24 09:20 ?2757次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來</b>科技新一代RISC-V高性能<b class='flag-5'>處理器</b>IP UX1030H  全面支持RVA23

    處理器近期互認(rèn)證產(chǎn)品匯總

    近期,兆聯(lián)合多家產(chǎn)業(yè)合作伙伴,重點(diǎn)圍繞開先KX-7000系列處理器、開勝KH-40000服務(wù)處理器平臺(tái)持續(xù)加強(qiáng)應(yīng)用生態(tài)建設(shè),分別完成包括
    的頭像 發(fā)表于 06-12 17:14 ?1807次閱讀

    馳科技升級(jí)智能座艙與智能車控芯片產(chǎn)品線

    近日,馳科技在2025年上海國際汽車展覽會(huì)上舉辦發(fā)布會(huì),同步升級(jí)智能座艙與智能車控雙產(chǎn)品線。理想汽車CTO謝炎、北汽研究總院院長王磊、斑馬智行聯(lián)席CEO郝飛等產(chǎn)業(yè)鏈領(lǐng)袖共同見證此次發(fā)布
    的頭像 發(fā)表于 04-25 11:17 ?988次閱讀

    微芯片全景與選型推薦

    。公司以SoC設(shè)計(jì)為核心,布局音視頻編解碼、視覺影像處理、軟硬件協(xié)同開發(fā)等技術(shù)方向,產(chǎn)品覆蓋智能應(yīng)用處理器芯片、電源管理芯片及周邊配套芯片,并提供全棧式解決方案。 二、芯片產(chǎn)品線全景分
    的頭像 發(fā)表于 04-18 10:19 ?4675次閱讀
    瑞<b class='flag-5'>芯</b>微芯片全景與選型推薦

    處理器開先KX-U6980S處理器榮獲工業(yè)“新質(zhì)”獎(jiǎng)

    +數(shù)字化“新質(zhì)獎(jiǎng)”之工業(yè)“新質(zhì)”獎(jiǎng),贏得了行業(yè)專家和用戶的積極肯定。 開先KX-U6980S處理器 國內(nèi)工藝 生態(tài)繁榮 護(hù)航產(chǎn)業(yè)發(fā)展 開先KX-U6980S處理器是兆采用國內(nèi)制造工
    的頭像 發(fā)表于 03-25 16:46 ?2505次閱讀
    兆<b class='flag-5'>芯</b><b class='flag-5'>處理器</b>開先KX-U6980S<b class='flag-5'>處理器</b>榮獲工業(yè)<b class='flag-5'>芯</b>“新質(zhì)”獎(jiǎng)

    科技攜手芒科技發(fā)布RISC-V CPU系統(tǒng)仿真平臺(tái)

    專業(yè)RISC-V處理器IP及解決方案公司科技與杭州芒科技深入合作,共同研發(fā)推出
    的頭像 發(fā)表于 03-19 14:36 ?1725次閱讀