91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

寒武紀首顆AI訓練芯片:7納米制程且算力提升四倍

電子觀察說 ? 來源:時刻頭條 ? 作者:電子觀察說 ? 2021-01-21 13:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1月21日,寒武紀思元290智能芯片及加速卡、玄思1000智能加速器在官網低調亮相,寒武紀表示該系列產品已實現規(guī)?;鲐?。去年,寒武紀招股書曾簡單披露了一款訓練芯片的“彩蛋”,此后,寒武紀思元290芯片就一直被業(yè)界廣泛關注并引發(fā)行業(yè)諸多猜想。如今,隨著新一代訓練產品線集中亮相,寒武紀略顯“神秘”的訓練芯片及相應的業(yè)務布局逐漸清晰。

思元290智能芯片是寒武紀的首顆訓練芯片,采用臺積電7nm先進制程工藝,集成460億個晶體管,支持MLUv02擴展架構,全面支持AI訓練、推理或混合型人工智能計算加速任務。寒武紀MLU290-M5智能加速卡搭載思元290智能芯片,采用開放加速模塊OAM設計,具備64個MLU Core,1.23TB/s內存帶寬以及全新MLU-Link?多芯互聯技術,在350W的最大散熱功耗下提供AI算力高達1024 TOPS(INT4)。

寒武紀玄思1000智能加速器,在2U機箱內集成4顆思元290智能芯片,高速本地閃存、Mellanox InfiniBand網絡,對外提供高速MLU-Link?接口,打破智能芯片、服務器、POD與集群的傳統數據中心橫向擴展架構,實現AI算力在計算中心級縱向擴展,是AI算力的高集成度平臺。寒武紀訓練產品線采用自適應精度訓練方案,面向互聯網、金融、交通、能源、電力和制造等領域的復雜AI應用場景提供充裕算力,推動人工智能賦能產業(yè)升級。

思元290采用MLUv02擴展架構

MLUv02架構為寒武紀MLU200全產品線共享,滿足云、邊、端三個場景的算力需求。云端訓練對AI算力的要求更為苛刻,因此寒武紀對思元290的MLUv02架構進行了多項擴展,包括業(yè)內領先的MLU-Link?多芯互聯技術、高帶寬HBM2內存、高速片上總線NOC以及新一代PCIe 4.0接口。相比寒武紀思元270芯片,思元290芯片實現峰值算力提升4倍、內存帶寬提高12倍、芯片間通訊帶寬提高19倍。新架構結合7nm制程,思元290可提供更優(yōu)性能功耗比,以及多MLU系統的擴展能力。

MLU290的MLUv02架構進行了多項擴展

寒武紀MLU-Link?多芯互聯技術

近年來,AI算法模型的復雜程度高速增長,對算力和訓練速度提出了更高的要求。為了構建更強大的計算平臺,多芯片間的互聯技術已成為市場剛需。

寒武紀推出MLU-Link?多芯互聯技術,并首次搭載于寒武紀思元290芯片,每顆思元290的多芯互聯總帶寬高達600GB/s。MLU-Link?具備豐富的互聯特性,突破PCIe帶寬和互聯的瓶頸,相比思元270芯片通過PCIe并行的通訊方式,帶寬提高19倍。MLU-Link?多芯互聯技術支持多顆思元芯片無縫互聯,支持跨系統互聯,將縱向擴展能力整合到整個人工智能計算中心(AIDC),可以端到端加速大型AI模型訓練。

寒武紀vMLU解決方案

不同場景下的AI訓練對計算和存儲的要求千差萬別,如何提供更靈活也更穩(wěn)定的服務,但同時讓算力得到充分地利用,是AIDC面臨的持續(xù)挑戰(zhàn)。寒武紀虛擬化技術vMLU,支持在思元290上實現4個相互隔離的AI計算實例,每個實例獨占計算、內存和編解碼資源。實例之間的硬件資源互不干擾,即使在虛擬化環(huán)境下仍可保持90%以上的極高效率,幫助客戶充分利用硬件資源。

vMLU還可以幫助思元290芯片提供最佳的靈活性。通過熱遷移技術,云管理員可將正在運行的AI負載及其應用程序移動到另外一臺主機上,從而平衡整個AIDC的負載,并實現更好的容災功能。

寒武紀首款訓練智能加速卡MLU290-M5

寒武紀MLU290-M5智能加速卡搭載了思元290智能芯片,采用開放加速模塊OAM設計,具備64個MLU Core,1.23TB/s 內存帶寬以及全新MLU-Link?多芯互聯技術,在350w的最大散熱功耗下提供AI算力高達1024 TOPS(INT4)。

寒武紀首款智能加速器玄思1000

寒武紀首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超過4100萬億次每秒(4.1 PetaOPS INT4),一臺玄思1000計算單元就足以替代一個小型傳統超級計算中心。

玄思1000內置高帶寬低延時的MLU-Link?多芯互聯技術,實現內部4顆思元290進行高速互聯,同時打破服務器、緊耦合微集群(POD)與集群的傳統數據中心橫向擴展架構,將AIDC構建為節(jié)點、POD乃至超大規(guī)模混合擴展架構(Hybrid Scale-out),實現AI算力計算中心級縱向擴展,滿足高性能、高擴展性、靈活性、高魯棒性的要求。

重塑AIDC基礎架構

算力、算法、數據是人工智能發(fā)展的三大要素,隨著這幾年AI的逐步發(fā)展,算力的核心地位更為凸顯。人工智能技術落地于實際應用中需要芯片和硬件層面強大的算力支撐。算力已成為驅動AI產業(yè)化和產業(yè)AI化發(fā)展的關鍵要素。

下一代AIDC要求更多智能芯片無縫協同、并行運行的同時,還能保持高計算效率,從而提供超級巨大的算力,以應對超大規(guī)模訓練的需要。寒武紀玄思1000智能加速器重新思考了未來AIDC的基礎架構,在內部和外部采用統一的MLU-Link?多芯互聯技術進行通訊,使得思元290智能芯片的互聯范圍可以從單機擴展到POD乃至整個計算中心,重塑了基礎架構。

玄思1000配置8個對外互聯的MLU-Link?接口,支持跨系統互聯構建MLU POD。標準配置支持MLU POD 16、24、32。在POD內部,所有290芯片均可通過MLU-Link?多芯互聯技術進行通訊,在帶寬和延時方面實現了突破;POD外部通過玄思1000內置的網卡與其他系統進行通訊,實現了AI訓練集群性能、擴展性和魯棒性的協同提升。

o4YBAGAJFpWAC0W4AADP_k_qtac699.jpg

POD內所有思元芯片通過MLU-Link?全互聯

除了標準配置的POD之外,在計算中心條件允許的前提下,通過MLU-Link?多芯互聯技術,可實現1024顆或更多思元290互聯,不需要額外的網卡即可實現無縫加速。

寒武紀Neuware?訓練軟件棧

寒武紀Neuware?軟件棧為思元 290 芯片提供完善的軟件及應用生態(tài),支持業(yè)界主流的TensorFlow和PyTorch等深度學習框架,用戶不需要改變使用習慣,即可在思元290芯片上實現圖形圖像、語音、NLP、搜索推薦等多種應用的訓練和推理。其中,基于Horovod分布式訓練框架與MLU-Link?多芯互聯技術相互配合,讓思元290在單機多卡、多機多卡的場景下達到業(yè)界領先的訓練加速比。寒武紀Neuware?提供完善的開發(fā)工具包和社區(qū)支持,幫助用戶在思元290芯片進行方便、靈活的定制開發(fā)及部署工作。配合強大的BANG智能編程語言及配套調試工具,用戶可以為自定義的算法提供最佳性能調優(yōu)。

2021年1月,IDC發(fā)布了《2020-2021 中國人工智能計算力發(fā)展評估報告》,該報告預計,中國人工智能市場規(guī)模在2020年達到62.7億美元,2019-2024年的復合增長率為30.4%。IDC的調研還發(fā)現,超過九成的企業(yè)正在使用或者計劃在三年內使用人工智能,其中74.5%的企業(yè)期望在未來可以采取具備公用設施意義的人工智能基礎設施。

隨著AI算法突飛猛進的發(fā)展,越來越多的模型訓練需要巨量的算力支撐才能快速有效地實施,算力是未來人工智能應用取得突破的決定性因素。值得強調的是,在巨量的人工智能市場中,云服務市場表現更為突出。早前,2020年7月,IDC發(fā)布的另一份報告顯示,2018至2024年,中國AI云服務市場年復合增長率將達到93.6%。而目前人工智能芯片仍處于成長期,未來三年,人工智能芯片市場將呈現多元化發(fā)展趨勢。

寒武紀290產品線,有望在持續(xù)高速增長的人工智能市場尤其是云服務市場,搶占更多的市場份額,推動自身和AI行業(yè)的發(fā)展。據悉,寒武紀思元290芯片及加速卡已與部分硬件合作伙伴完成適配,并已實現規(guī)?;鲐?。

寒武紀最初布局終端IP場景,連續(xù)迭代推出讓其聲名鵲起的寒武紀1A、寒武紀1H、寒武紀1M系列處理器,而后迅速布局云端智能芯片及加速卡系列產品思元100和思元270,又于2019年推出基于思元220芯片的邊緣智能加速卡。由此建立起覆蓋云邊端、訓練、推理的完整產品矩陣,同時利用平臺級基礎系統軟件Cambricon Neuware,連接全線產品,由點及面,實現了“訓推一體、端云融合”。寒武紀也成為目前國際上少數幾家全面系統掌握了通用型智能芯片及其基礎系統軟件研發(fā)和產品化核心技術的企業(yè)之一。

以寒武紀一年迭代推出一到兩款新品的研發(fā)速度,我們有理由開始期待,寒武紀的下一個新品 “彩蛋” 了。

fqj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54004

    瀏覽量

    465791
  • 寒武紀
    +關注

    關注

    13

    文章

    216

    瀏覽量

    74942
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中國AI企業(yè)50強發(fā)布!寒武紀位居榜首,AI芯片公司包攬前三

    主營業(yè)務及商業(yè)化不足的企業(yè),上榜門檻高達95億元,較2024年提升了35億元;前十名門檻更是飆升至730億元,是2024年的3;企業(yè)平均價值達到540億元,同比增長140%。 ? 在眾多上榜企業(yè)中,AI
    的頭像 發(fā)表于 01-21 09:08 ?2870次閱讀
    中國<b class='flag-5'>AI</b>企業(yè)50強發(fā)布!<b class='flag-5'>寒武紀</b>位居榜首,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>公司包攬前三

    寒武紀“炸裂”財報!一季度營收增長40,積極備貨應對“爆單”?

    ,較上年同期收窄46.7%。 而最值得關注的是,在2025年第一季度,寒武紀營收就多達11.1億元,幾乎等同于去年全年的收入!同比一季度增長超過40! 另外,營收增長的同時,寒武紀在2024年第
    的頭像 發(fā)表于 04-22 09:07 ?2853次閱讀
    <b class='flag-5'>寒武紀</b>“炸裂”財報!一季度營收增長40<b class='flag-5'>倍</b>,積極備貨應對“爆單”?

    寒武紀實現對GLM-5的Day 0適配

    的技術積累,寒武紀得以快速實現對 GLM-5 的 Day 0 適配。? 寒武紀一直重視芯片和算法的聯合創(chuàng)新,致力于以軟硬件協同的方式,優(yōu)化大模型部署性能,降低部署成本。此前,我們對 GLM 系列模型進行了深入的軟硬件協同性能優(yōu)化
    的頭像 發(fā)表于 02-12 15:07 ?613次閱讀

    寒武紀產品與眾智FlagOS全面適配

    大模型的快速發(fā)展正推動AI需求進入爆發(fā)式增長階段。與此同時,不同應用場景又對AI芯片提出了多樣化的挑戰(zhàn):例如在大模型Prefill場景,
    的頭像 發(fā)表于 11-17 09:16 ?1059次閱讀
    <b class='flag-5'>寒武紀</b>產品與眾智FlagOS全面適配

    寒武紀引領AI芯片軟件新生態(tài)

    寒武紀成立的初衷是為“人工智能的大爆發(fā)”提供底層支持,不僅要硬件強大,更要軟件通用、易用。多年來,
    的頭像 發(fā)表于 11-06 11:23 ?1336次閱讀
    <b class='flag-5'>寒武紀</b>引領<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>軟件新生態(tài)

    國產AI芯片真能扛住“內卷”?海思昇騰的這波操作藏了多少細節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下
    發(fā)表于 10-27 13:12

    商湯科技與寒武紀達成戰(zhàn)略合作

    近日,商湯科技與中科寒武紀科技股份有限公司(以下簡稱“寒武紀”)簽署面向新發(fā)展階段的戰(zhàn)略合作協議,重點推進軟硬件的聯合優(yōu)化,并共同構建開放共贏的產業(yè)生態(tài)。
    的頭像 發(fā)表于 10-15 17:54 ?761次閱讀

    寒武紀成功適配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武紀已同步實現對深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開源大模型推理引擎vLLM-MLU源代碼。代碼地址和測試步驟見文末,開發(fā)者可以在寒武紀軟硬件平臺上第一時間體驗DeepSeek-V3.2-Exp的亮點。
    的頭像 發(fā)表于 10-11 17:14 ?1633次閱讀
    <b class='flag-5'>寒武紀</b>成功適配DeepSeek-V3.2-Exp模型

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升還是智力

    持續(xù)發(fā)展體現在: 1、收益遞減 大模型的基礎的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關的資源。 收益遞減體現在: ①模型大小 ②
    發(fā)表于 09-14 14:04

    寒武紀股價破1200大關創(chuàng)歷史新高 DeepSeek適配國產芯片成直接原因

    今日,寒武紀股價突破1200元!8月單月漲幅100%、市值站上5200億,成為繼貴州茅臺之后的A股史上第二只千元股。 01 半導體芯片股集體爆發(fā) 寒武紀是中國AI
    的頭像 發(fā)表于 08-26 13:54 ?1029次閱讀
    <b class='flag-5'>寒武紀</b>股價破1200大關創(chuàng)歷史新高 DeepSeek適配國產<b class='flag-5'>芯片</b>成直接原因

    寒武紀85后創(chuàng)始人陳天石身價超1500億

    芯片生產和DeepSeek適配國產芯片的利好刺激下,加之還有國外投行高盛宣布將寒武紀-U目標價上調50%至1835元,AI芯片龍頭
    的頭像 發(fā)表于 08-26 10:37 ?6681次閱讀

    商湯大裝置Mall重磅發(fā)布

    近日,商湯科技聯合華為、庫帕思、海光、寒武紀、曦望Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國產生態(tài)伙伴,共同發(fā)布“商湯大裝置Mall”。
    的頭像 發(fā)表于 08-05 10:05 ?1023次閱讀

    寒武紀基于思元370芯片的MLU370-X8 智能加速卡產品手冊詳解

    MLU370-X8智能加速卡是全面升級的數據中心訓推一體AI加速卡,基于寒武紀全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標準PCIe加速卡,適用于業(yè)內最新的CPU平臺
    的頭像 發(fā)表于 04-24 17:57 ?5337次閱讀
    <b class='flag-5'>寒武紀</b>基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能加速卡產品手冊詳解

    寒武紀思元370芯片參數特性詳解

    寒武紀首次采用chiplet技術將2AI計算芯粒封裝為一AI芯片,通過不同芯粒組合規(guī)格多樣化
    的頭像 發(fā)表于 04-24 17:49 ?5337次閱讀
    <b class='flag-5'>寒武紀</b>思元370<b class='flag-5'>芯片</b>參數特性詳解

    寒武紀一季度營收大漲4230% 凈利潤3.55億 扭虧為盈

    4月18日晚間,國產AI芯片龍頭寒武紀發(fā)布了財務報告,包括有2025年第一季度財務報告和2024年年度財務報告。 在2025年第一季度,寒武紀營收達到11.11億,同比增長高達4230
    的頭像 發(fā)表于 04-19 14:15 ?1801次閱讀