91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM AIU芯片揭秘:5nm 32核心、230億個(gè)晶體管!

廠商快訊 ? 來源:芯智訊 ? 作者:浪客劍 ? 2022-11-14 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年10月,IBM發(fā)布了旗下首款人工智能計(jì)算單元(Artificial Intelligent Unit,AIU)片上系統(tǒng)。

這是一種專用集成電路 (ASIC),旨在更快、更高效地訓(xùn)練和運(yùn)行需要大規(guī)模并行計(jì)算的深度學(xué)習(xí)模型。

AIU:專為現(xiàn)代AI計(jì)算打造

在過去多年來,業(yè)界主要是利用CPU、GPU來運(yùn)行深度學(xué)習(xí)模型,但是隨著人工智能模型的數(shù)量正呈指數(shù)級增長。

同時(shí)深度學(xué)習(xí)模型也越來越龐大,有數(shù)十億甚至數(shù)萬億的參數(shù),需要的算力也是越來越高,而CPU、GPU這類傳統(tǒng)架構(gòu)的芯片的AI算力增長已經(jīng)遇到了瓶頸。

IBM AIU芯片揭秘:5nm 32核心、230億個(gè)晶體管!
△深度神經(jīng)網(wǎng)絡(luò)對于算力的需求增長迅速

根據(jù) IBM 的說法,深度學(xué)習(xí)模型傳統(tǒng)上依賴于 CPU 和 GPU 協(xié)處理器的組合來訓(xùn)練和運(yùn)行模型。

CPU 的靈活性和高精度非常適合通用軟件應(yīng)用程序,但是,在訓(xùn)練和運(yùn)行需要大規(guī)模并行 AI 操作的深度學(xué)習(xí)模型時(shí),CPU卻處于劣勢。

GPU最初是為渲染圖形圖像而開發(fā)的,但后來該技術(shù)發(fā)現(xiàn)了在AI計(jì)算中使用的優(yōu)勢。

但是,CPU和GPU都是在深度學(xué)習(xí)革命之前設(shè)計(jì)的,現(xiàn)在他們的效率增長已經(jīng)落后于深度學(xué)習(xí)對于算力的指數(shù)級增長,業(yè)界真正需要的是針對矩陣和向量乘法運(yùn)算類型進(jìn)行優(yōu)化的通用芯片來進(jìn)行深度學(xué)習(xí)。

基于此,IBM Research AI Hardware Center在過去五年中一直專注于開發(fā)下一代芯片和人工智能系統(tǒng),希望以每年將人工智能硬件效率提高 2.5 倍,并能夠在 2029 年以比 2019 年快1000倍的速度訓(xùn)練和運(yùn)行人工智能模型。

最新AIU芯片則是IBM推出的首款針對現(xiàn)代 AI 統(tǒng)計(jì)數(shù)據(jù)定制的芯片。

IBM表示,AIU是專為加速深度學(xué)習(xí)模型使用的矩陣和向量計(jì)算而設(shè)計(jì)和優(yōu)化。AIU 可以解決計(jì)算復(fù)雜的問題,并以遠(yuǎn)遠(yuǎn)超過 CPU 能力的速度執(zhí)行數(shù)據(jù)分析。

那么IBM AIU是如何實(shí)現(xiàn)針對深度學(xué)習(xí)優(yōu)化的呢?答案是:“近似計(jì)算”+“簡化人工智能工作流程”。

擁抱低精度,采用近似計(jì)算

從歷史上看,很多AI計(jì)算依賴于高精度 64 位和 32 位浮點(diǎn)運(yùn)算。IBM 認(rèn)為AI計(jì)算并不總是需要這種精確度。

它有一個(gè)降低傳統(tǒng)計(jì)算精度的術(shù)語——“近似計(jì)算”。在其博客中,IBM 解釋了使用近似計(jì)算的基本原理:

“對于常見的深度學(xué)習(xí)任務(wù),我們是否需要這種準(zhǔn)確度?我們的大腦是否需要高分辨率圖像來識別家庭成員或貓?當(dāng)我們輸入一個(gè)文本線程進(jìn)行搜索時(shí),我們是否需要第 50,002 個(gè)最有用的回復(fù)與第 50,003 個(gè)最有用的回復(fù)的相對排名的精度?答案是,包括這些示例在內(nèi)的許多任務(wù)都可以通過近似計(jì)算來完成?!?/p>

基于此,IBM 首創(chuàng)了的一種稱為近似計(jì)算的技術(shù),可以從32位浮點(diǎn)運(yùn)算下降到包含四分之一信息的混合8位浮點(diǎn)(HFP8)計(jì)算格式。這種簡化的格式極大地減少了訓(xùn)練和運(yùn)行 AI 模型所需的數(shù)字運(yùn)算量,并且不會犧牲準(zhǔn)確性。

更精簡的位格式還減少了另一個(gè)對速度的拖累:只需將更少的數(shù)據(jù)移入和移出內(nèi)存,即運(yùn)行AI模型對于內(nèi)存的占用更少了。

IBM在其新的AIU芯片的設(shè)計(jì)當(dāng)中融入了近似計(jì)算技術(shù),使得AIU芯片的精度需求大幅低于 CPU 所需的精度。較低的精度對于在新的 AIU 硬件加速器中實(shí)現(xiàn)高計(jì)算密度至關(guān)重要。

AIU使用混合 8 位浮點(diǎn)(HFP8)計(jì)算,而不是通常用于 AI 訓(xùn)練的32位浮點(diǎn)或16位浮點(diǎn)運(yùn)算。較低精度的計(jì)算使芯片的運(yùn)行速度比 FP16 計(jì)算快 2 倍,同時(shí)提供類似的訓(xùn)練結(jié)果。

雖然低精度計(jì)算對于獲得更高的密度和更快的計(jì)算是必要的,但深度學(xué)習(xí) (DL) 模型的精度必須與高精度計(jì)算保持一致。

簡化人工智能工作流程

由于大多數(shù) AI 計(jì)算都涉及矩陣和向量乘法,因此IBM AIU芯片架構(gòu)具有比多用途 CPU 更簡單的布局。

IBM AIU還針對將數(shù)據(jù)直接從一個(gè)計(jì)算引擎發(fā)送到另一個(gè)計(jì)算引擎進(jìn)行設(shè)計(jì),從而節(jié)省大量能耗。

IBM AIU芯片揭秘:5nm 32核心、230億個(gè)晶體管!

據(jù)IBM介紹,其AIU芯片是一個(gè)完整的片上系統(tǒng),是基于IBM此前的Telum芯片(7nm工藝)中內(nèi)置的經(jīng)過驗(yàn)證的 AI 加速器的擴(kuò)展版本,并且采用了更先進(jìn)的5nm制程工藝,具有 32 個(gè)處理內(nèi)核并包含 230 億個(gè)晶體管。

IBM AIU 還被設(shè)計(jì)為像顯卡一樣易于使用。它可以插入任何帶有 PCIe 插槽的計(jì)算機(jī)或服務(wù)器。

IBM AIU芯片揭秘:5nm 32核心、230億個(gè)晶體管!

IBM表示:“部署 AI 對照片中的貓和狗進(jìn)行分類是一項(xiàng)有趣的學(xué)術(shù)活動(dòng)。但它不會解決我們今天面臨的緊迫問題。我們要讓 AI 解決現(xiàn)實(shí)世界的復(fù)雜性——比如預(yù)測下一個(gè)颶風(fēng)伊恩,或者我們是否正在走向衰退——我們需要企業(yè)級的工業(yè)級硬件。我們的 AIU 讓這一愿景更近了一步?!?/p>

IBM AIU表現(xiàn)如何?

IBM并未在其官網(wǎng)公布更多關(guān)其AIU芯片的技術(shù)信息。不過,我們可以通過回顧 IBM在 2021 年國際固態(tài)電路會議(ISSCC)上展示其早期 7nm 芯片設(shè)計(jì)的性能結(jié)果時(shí)的初始原型演示來對其性能有所了解。

IBM 用于會議演示的原型不是 32 個(gè)內(nèi)核,而是一個(gè)實(shí)驗(yàn)性的 4 核 7nm AI 芯片,支持 FP16 和混合FP8 格式,用于訓(xùn)練和推理深度學(xué)習(xí)模型。

它還支持用于擴(kuò)展推理的 int4 和 int2 格式。2021 年 Lindley Group通訊中包含了原型芯片性能的摘要,該通訊報(bào)道了 IBM 當(dāng)年的演示:

在峰值速度下,使用 HFP 8,該7nm芯片實(shí)現(xiàn)了每秒每瓦特 (TF/W) 1.9 teraflops。

使用INT4進(jìn)行推理,該實(shí)驗(yàn)芯片達(dá)到16.5 TOPS/W,優(yōu)于高通低功耗Cloud AI模組。

考慮到IBM AIU是該測試芯片的擴(kuò)展版本,并且制程工藝也升級到了5nm,因此預(yù)計(jì)其整體能效將進(jìn)一步提升,同時(shí)隨著核心數(shù)量由4核上升到32核,其整體的峰值算力有望提升超過8倍。

Forbes的分析師認(rèn)為,由于缺乏信息,無法將IBM的AIU與目前被用于AI計(jì)算的GPU相比較,但是,預(yù)計(jì)該芯片的價(jià)格將會在1500 美元到 2000 美元之間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1868

    瀏覽量

    77018
  • 5nm
    5nm
    +關(guān)注

    關(guān)注

    1

    文章

    342

    瀏覽量

    26648
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭秘芯片測試:如何驗(yàn)證數(shù)十億個(gè)晶體管

    微觀世界的“體檢”難題在一枚比指甲蓋還小的芯片中,集成了數(shù)十億甚至上百億個(gè)晶體管,例如NVIDIA的H100GPU包含800個(gè)
    的頭像 發(fā)表于 03-06 10:03 ?56次閱讀
    <b class='flag-5'>揭秘</b><b class='flag-5'>芯片</b>測試:如何驗(yàn)證數(shù)十億<b class='flag-5'>個(gè)</b><b class='flag-5'>晶體管</b>

    晶體管輸出特性曲線的構(gòu)成與核心區(qū)域

    晶體管的輸出特性曲線是半導(dǎo)體器件物理與芯片電路設(shè)計(jì)之間最關(guān)鍵的橋梁。這張圖表描繪了在固定柵極電壓下,晶體管的漏極電流如何隨漏源電壓變化,它本質(zhì)上是一張揭示晶體管作為電子開關(guān)或放大器工作
    的頭像 發(fā)表于 01-12 10:51 ?614次閱讀
    <b class='flag-5'>晶體管</b>輸出特性曲線的構(gòu)成與<b class='flag-5'>核心</b>區(qū)域

    漏致勢壘降低效應(yīng)如何影響晶體管性能

    隨著智能手機(jī)、電腦等電子設(shè)備不斷追求輕薄化,芯片中的晶體管尺寸已縮小至納米級(如3nm、2nm)。但尺寸縮小的同時(shí),一個(gè)名為“漏致勢壘降低效
    的頭像 發(fā)表于 12-26 15:17 ?720次閱讀
    漏致勢壘降低效應(yīng)如何影響<b class='flag-5'>晶體管</b>性能

    MUN5136數(shù)字晶體管技術(shù)解析與應(yīng)用指南

    onsemi MUN5136數(shù)字晶體管旨在取代單個(gè)器件及其外部電阻偏置網(wǎng)絡(luò)。這些數(shù)字晶體管包含一個(gè)晶體管和一個(gè)單片偏置網(wǎng)絡(luò),單片偏置網(wǎng)絡(luò)由兩
    的頭像 發(fā)表于 11-24 16:27 ?775次閱讀
    MUN5136數(shù)字<b class='flag-5'>晶體管</b>技術(shù)解析與應(yīng)用指南

    晶體管的定義,晶體管測量參數(shù)和參數(shù)測量儀器

    晶體管是一種以半導(dǎo)體材料為基礎(chǔ)的電子元件,具有檢波、整流、放大、開關(guān)、穩(wěn)壓和信號調(diào)制等多種功能?。其核心是通過控制輸入電流或電壓來調(diào)節(jié)輸出電流,實(shí)現(xiàn)信號放大或電路開關(guān)功能?。 基本定義 晶體管泛指
    的頭像 發(fā)表于 10-24 12:20 ?523次閱讀
    <b class='flag-5'>晶體管</b>的定義,<b class='flag-5'>晶體管</b>測量參數(shù)和參數(shù)測量儀器

    多值電場型電壓選擇晶體管結(jié)構(gòu)

    內(nèi)建電場來控制晶體管對電壓的選擇性通斷,如圖: 該晶體管由兩個(gè)PN結(jié)組成,第一個(gè)晶體管PN結(jié)在外加電場下正向偏置,減小了內(nèi)建電場,當(dāng)通入的
    發(fā)表于 09-15 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    為我們重點(diǎn)介紹了AI芯片在封裝、工藝、材料等領(lǐng)域的技術(shù)創(chuàng)新。 一、摩爾定律 摩爾定律是計(jì)算機(jī)科學(xué)和電子工程領(lǐng)域的一條經(jīng)驗(yàn)規(guī)律,指出集成電路上可容納的晶體管數(shù)量每18-24個(gè)月會增加一倍,同時(shí)
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+工藝創(chuàng)新將繼續(xù)維持著摩爾神話

    。 FinFET是在22nm之后的工藝中使用,而GAA納米片將會在3nm及下一代工藝中使用。 在叉形片中,先前獨(dú)立的兩個(gè)晶體管NFET和PFET被連接和集成在兩邊,從而進(jìn)一步提升了集成
    發(fā)表于 09-06 10:37

    今日看點(diǎn)丨蔚來自研全球首顆車規(guī)5nm芯片??;沃爾沃中國區(qū)啟動(dòng)裁員計(jì)劃

    低延時(shí),快速響應(yīng)?!贝送?,李斌還表示,這款芯片對全行業(yè)開放,誰想用都可以找我們,還可以降本。 ? 據(jù)悉,神璣NX9031芯片和底層軟件均實(shí)現(xiàn)自主設(shè)計(jì),擁有超過500晶體管。
    發(fā)表于 07-08 10:50 ?2153次閱讀

    晶體管光耦的工作原理

    器件的特性。工作原理概述1.發(fā)光器件:晶體管光耦通常包含一個(gè)發(fā)光二極(LED)作為光源。當(dāng)電流通過LED時(shí),它會發(fā)出特定波長的光。2.光敏器件:光耦的另一側(cè)是一個(gè)
    的頭像 發(fā)表于 06-20 15:15 ?933次閱讀
    <b class='flag-5'>晶體管</b>光耦的工作原理

    下一代高速芯片晶體管解制造問題解決了!

    晶體管的密度,同時(shí)減少了芯片的橫向面積。 相比傳統(tǒng)的FinFET和納米片晶體管,叉片晶體管能夠顯著減少nFET和pFET之間的間距,從而在相同的芯片
    發(fā)表于 06-20 10:40

    無結(jié)場效應(yīng)晶體管詳解

    當(dāng)代所有的集成電路芯片都是由PN結(jié)或肖特基勢壘結(jié)所構(gòu)成:雙極結(jié)型晶體管(BJT)包含兩個(gè)背靠背的PN 結(jié),MOSFET也是如此。結(jié)型場效應(yīng)晶體管(JFET) 垂直于溝道方向有一
    的頭像 發(fā)表于 05-16 17:32 ?1427次閱讀
    無結(jié)場效應(yīng)<b class='flag-5'>晶體管</b>詳解

    什么是晶體管?你了解多少?知道怎樣工作的嗎?

    晶體管(Transistor)是一種?半導(dǎo)體器件?,用于?放大電信號?、?控制電流?或作為?電子開關(guān)?。它是現(xiàn)代電子技術(shù)的核心元件,幾乎所有電子設(shè)備(從手機(jī)到超級計(jì)算機(jī))都依賴晶體管實(shí)現(xiàn)功能。以下
    的頭像 發(fā)表于 05-16 10:02 ?4575次閱讀

    多值電場型電壓選擇晶體管結(jié)構(gòu)

    內(nèi)建電場來控制晶體管對電壓的選擇性通斷,如圖: 該晶體管由兩個(gè)PN結(jié)組成,第一個(gè)晶體管PN結(jié)在外加電場下正向偏置,減小了內(nèi)建電場,當(dāng)通入的電
    發(fā)表于 04-15 10:24

    晶體管電路設(shè)計(jì)(下)

    晶體管,F(xiàn)ET和IC,F(xiàn)ET放大電路的工作原理,源極接地放大電路的設(shè)計(jì),源極跟隨器電路設(shè)計(jì),F(xiàn)ET低頻功率放大器的設(shè)計(jì)與制作,柵極接地放大電路的設(shè)計(jì),電流反饋型OP放大器的設(shè)計(jì)與制作,進(jìn)晶體管
    發(fā)表于 04-14 17:24