91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI爆款應用驅(qū)動需求增長,英偉達H100租賃費用飆升40%

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-04-05 07:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報道 近期,半導體研究機構(gòu)SemiAnalysis發(fā)布的“H100一年期租賃合約價格指數(shù)”顯示,英偉達四年前發(fā)布的H100芯片租賃費用近半年飆升近40%。這款“老芯片”租賃合約價格從2025年10月的每小時1.7美元,在今年3月漲至每小時每塊GPU 2.35美元。

H100租賃費用飆升的背后

SemiAnalysis的指數(shù)基于對100多家云服務提供商、算力資源買家和賣家的直接調(diào)查數(shù)據(jù)構(gòu)建,每月采集一次。最新報告指出,按需租用的GPU算力在所有類型中均已售罄,即便價格上漲,已鎖定按需實例的客戶也不愿釋放算力。該機構(gòu)比喻,2026年初尋找GPU算力,如同預訂“最后一班離開航班”的機票,價格高昂且資源稀缺。

研究人員補充,客戶正爭相以每塊GPU每小時14美元的價格搶購亞馬遜云服務的p6 - b200競價實例,一些新興云服務巨頭甚至不再提供單節(jié)點銷售。部分英偉達H100 GPU仍按2 - 3年前簽訂的原價續(xù)約,有些合同直接續(xù)簽到2028年。

至于架構(gòu)更先進的Blackwell芯片,由于對開放權(quán)重模型的強勁需求以及推理需求持續(xù)激增,新部署B(yǎng)lackwell的交付周期延長至6到7個月。2025年晚些時候,市場曾預期隨著性能更強、算力成本更低的Blackwell芯片加速部署,Hopper芯片(H100、H200)租賃價格會大幅下降,但實際情況相反,H100需求不僅堅挺,許多情況下還在增強。

H100芯片推理需求高漲的原因

首先是應用場景驅(qū)動,過去幾年,AI行業(yè)的主旋律是“大模型訓練”,各大科技公司競相投入,比拼誰能訓練出參數(shù)更多、能力更強的模型。然而,進入2026年,行業(yè)重心正以前所未有的速度從模型訓練大規(guī)模轉(zhuǎn)向?qū)嶋H應用和部署,這一轉(zhuǎn)變直接引爆了推理需求的“核聚變”。

AI原生應用的普及讓推理需求無處不在。以字節(jié)跳動的“即夢”(Seedance)、谷歌的“Nano Banana”為代表的AI視頻和圖像生成工具,正迅速成為普通用戶內(nèi)容創(chuàng)作的新寵。用戶不再滿足于簡單的濾鏡和模板,而是希望通過自然語言描述,實時生成高質(zhì)量的個性化視頻和圖像。每一次點擊“生成”按鈕,背后都是一次復雜的AI模型推理過程,需要消耗海量算力來理解用戶意圖、生成內(nèi)容并進行優(yōu)化。這些應用的病毒式傳播,使得推理請求量呈指數(shù)級增長。

多智能體(Multi - agent)工作負載的興起,成為算力消耗增長最快的領(lǐng)域。與傳統(tǒng)的單次問答不同,多智能體系統(tǒng)(如近期火熱的“龍蝦”模型)模擬了多個AI智能體協(xié)同工作的復雜場景。例如,一個智能體負責理解用戶指令,另一個負責規(guī)劃任務,還有一個負責調(diào)用工具執(zhí)行,最后再由一個智能體整合結(jié)果并反饋給用戶。這種“團隊協(xié)作”模式功能更強大,但也導致詞元(token)的消耗量呈拋物線式增長,對推理算力的要求遠超單一模型。

此外,爆款大模型應用的持續(xù)火爆,帶來了穩(wěn)定且高頻的推理需求。Anthropic的Claude系列、Kimi、GLM等熱門大模型,已經(jīng)深度融入了程序員、研究人員、內(nèi)容創(chuàng)作者等群體的實際工作流中。每天都有海量的日常推理請求涌入,這種需求是持續(xù)性的,而非像模型訓練那樣是一次性的投入。

其次是H100有它的技術(shù)優(yōu)勢,應用場景的爆發(fā)是需求側(cè)的“拉力”,而H100芯片自身在推理方面的顛覆性技術(shù)優(yōu)勢,則是供給側(cè)的“推力”,使其成為處理海量請求的理想選擇。

H100內(nèi)置的專用Transformer引擎,是其架構(gòu)的核心創(chuàng)新,堪稱“為推理而生”。大語言模型的計算瓶頸主要集中在注意力機制上,而Transformer引擎能夠智能地優(yōu)化這部分計算。它通過硬件級的動態(tài)稀疏計算,自動識別并跳過權(quán)重矩陣中大量的無效運算(即接近零值的計算),從而將千億參數(shù)模型的推理延遲從秒級壓縮到毫秒級,極大地提升了處理效率。

同時,H100是首批支持FP8(8位浮點)精度的芯片之一,這是其提速降本的關(guān)鍵。與傳統(tǒng)的FP16精度相比,F(xiàn)P8格式在幾乎不損失模型精度的前提下,能將數(shù)據(jù)帶寬需求降低一半,顯著提升推理速度并降低能耗。這意味著在相同的硬件成本和功耗預算下,企業(yè)可以部署更少的H100芯片來處理更多的用戶請求,實現(xiàn)經(jīng)濟效益的最大化。

最后,H100的動態(tài)批處理技術(shù),像一位高明的“交通指揮官”,最大化了GPU的吞吐量。面對高并發(fā)、大小不一的實時請求,該技術(shù)能夠智能地將多個請求合并成一個批次進行處理,將GPU算力資源的利用率提升至92%以上。這就像高效的拼車系統(tǒng),在保證每個乘客(請求)都能快速到達目的地(低延遲)的同時,讓車輛(GPU)始終保持滿載運行,避免了算力資源的浪費。

未來GPU租賃價格走勢觀察

展望未來,研究人員給出三個關(guān)鍵觀察點判斷GPU租賃價格是否維持高位。首先,隨著GB300集群在2026年逐步放量,市場關(guān)注新增供給能否緩解算力緊張局面。GB300是英偉達推出的新一代人工智能計算平臺,于2025年5月19日由首席執(zhí)行官黃仁勛宣布,計劃2025年第三季度量產(chǎn),2026年第二季度大規(guī)模交付。相比前代,GB300在算力、內(nèi)存和散熱能效方面有改進,算力為前代36倍,搭載288GB HBM3e內(nèi)存,單GPU容量從192GB增至288GB,可支持參數(shù)規(guī)模達1.2萬億的AI模型運行,采用全液冷散熱方案,可將數(shù)據(jù)中心能耗降低30%以上。

其次,需關(guān)注芯片短缺是否進一步惡化。最后,要觀察各大AI巨頭的年度經(jīng)常性收入擴張情況,以及AI應用的普及速度和詞元消耗規(guī)模的持續(xù)增長節(jié)奏。

總之,當前GPU市場在需求、供應、價格等方面都處于動態(tài)變化中,未來走向充滿不確定性,各方都在密切關(guān)注市場動態(tài),以應對可能出現(xiàn)的各種情況。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4110

    瀏覽量

    99548
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI推理需求井噴!英偉Q1營收大漲,H20禁售難擋增長步伐

    報告,在全球加大AI基礎設施的浪潮下,英偉第一季度總體營收達到440.6億美元,較去年同期增長69%,高于市場預期的431億美元;凈利潤187.75億美元,同比去年
    的頭像 發(fā)表于 05-31 01:13 ?8330次閱讀
    <b class='flag-5'>AI</b>推理<b class='flag-5'>需求</b>井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Q1營收大漲,<b class='flag-5'>H</b>20禁售難擋<b class='flag-5'>增長</b>步伐

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務增長75%——預期中的超預期。更值得關(guān)注的,是電話會中反復出現(xiàn)的幾個關(guān)鍵詞:Agentic
    的頭像 發(fā)表于 03-04 17:07 ?1199次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic <b class='flag-5'>AI</b>推理與FPGA價值

    羅姆強勢入局AI服務器800VDC電源方案 原創(chuàng)

    % 。 AI 訓練耗電量是網(wǎng)絡搜索的 10 倍以上 。 AI 服務器 GPU 性能增長的同時功率持續(xù)飆升。以 英偉
    的頭像 發(fā)表于 12-13 00:25 ?8580次閱讀

    羅姆強勢入局AI服務器800VDC電源方案

    的10倍以上。 ? AI服務器GPU性能增長的同時功率持續(xù)飆升。以英偉為例,其GPU的TDP熱設計功耗從
    的頭像 發(fā)表于 12-12 15:42 ?5284次閱讀
    羅姆強勢入局<b class='flag-5'>AI</b>服務器800VDC電源方案

    英偉 Q3 狂攬 308 億

    英偉 2025 財年第三季度交出亮眼成績單,數(shù)據(jù)中心業(yè)務營收飆至 308 億美元,同比增長 112%,占總銷售額的 88%。這一爆發(fā)式增長,核心源于全球
    的頭像 發(fā)表于 11-20 18:11 ?1322次閱讀

    黃仁勛:英偉AI芯片訂單排到2026年 英偉上季營收加速增長62%再超預期

    AI芯片總龍頭英偉的財報終于帶來了驚喜;英偉公司發(fā)布財報數(shù)據(jù)顯示,上季營收加速增長62%;再
    的頭像 發(fā)表于 11-20 11:36 ?1376次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的我我們講解了這幾種芯片的應用場景,設計流程、結(jié)構(gòu)等。 CPU: 還為我們講解了一種算法:哈希表算法 GPU: 介紹了英偉H100GPU芯片。使用了一下關(guān)鍵技術(shù): ①張量核
    發(fā)表于 09-12 16:07

    英偉 H100 GPU 掉卡?做好這五點,讓算力穩(wěn)如泰山!

    H100服務器停工一天損失的算力成本可能比維修費還高。今天,我們給大家總結(jié)一套“防掉卡秘籍”,從日常管理到環(huán)境把控,手把手教你把掉卡風險壓到最低。一、供電是“生命線”,這3點必須盯緊H100滿載功耗
    的頭像 發(fā)表于 09-05 11:03 ?1385次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>H100</b> GPU 掉卡?做好這五點,讓算力穩(wěn)如泰山!

    搞定英偉 H100 ECC 報錯:從原理到維修,一步到位解煩憂

    最近,捷智算GPU維修室收到了不少H100服務器需要維修,故障問題集中為ECC報錯。為了幫大家更好地認識和了解情況,下面就詳細分享一下ECC報錯系統(tǒng)化排查方法和維修流程。一、ECC報錯
    的頭像 發(fā)表于 08-14 18:05 ?2551次閱讀
    搞定<b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>H100</b> ECC 報錯:從原理到維修,一步到位解煩憂

    H20中國區(qū)賣!英偉緊急向臺積電加訂30萬塊

    ,性能上相當于英偉另一主流GPU芯片H100的20%左右。 ? 盡管如此,在美國解禁對H20芯片的出口后,
    的頭像 發(fā)表于 07-30 08:08 ?3457次閱讀

    施耐德電氣與英偉深化合作

    近日,施耐德電氣宣布與英偉深化合作,旨在滿足市場對可持續(xù)、AI就緒基礎設施日益增長需求。
    的頭像 發(fā)表于 06-24 15:02 ?1425次閱讀

    今日看點丨英偉將為中國市場推出新AI芯片 售價大幅低于H20;中科曙光與海光信息宣布戰(zhàn)略重組

    1. 英偉將為中國市場推出新AI 芯片 售價大幅低于H20 ? 近日,外媒報道稱,美國芯片巨頭英偉
    發(fā)表于 05-26 11:06 ?1681次閱讀

    GPU 維修干貨 | 英偉 GPU H100 常見故障有哪些?

    ABSTRACT摘要本文主要介紹英偉H100常見的故障類型和問題。JAEALOT2025年5月5日今年,國家政府報告提出要持續(xù)推進“人工智能+”行動,大力發(fā)展人工智能行業(yè),市場上對算力的需求
    的頭像 發(fā)表于 05-05 09:03 ?3240次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片在訓練AI模型方面不如英偉
    的頭像 發(fā)表于 04-16 16:59 ?2214次閱讀