91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢(shì)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-23 15:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)。

全球最大人工智能社區(qū)之一 Hugging Face 平臺(tái)上的 400 萬開發(fā)者在一些最熱門的 AI 模型上可輕松獲得 NVIDIA 加速推理。

借助新的推理即服務(wù)能力,開發(fā)者將能夠快速部署 Llama 3 系列和 Mistral AI 模型等領(lǐng)先的大語言模型,并使用運(yùn)行在NVIDIA DGX Cloud上的NVIDIA NIM微服務(wù)進(jìn)行優(yōu)化。

這項(xiàng)服務(wù)在 SIGGRAPH 大會(huì)上發(fā)布,它將幫助開發(fā)者利用托管在 Hugging Face Hub 上的開源 AI 模型快速建立原型并將其部署在生產(chǎn)中。Enterprise Hub 用戶可以利用 NVIDIA NIM 進(jìn)行無服務(wù)器推理,以提高靈活性,盡可能降低基礎(chǔ)設(shè)施用度并優(yōu)化性能。

推理服務(wù)補(bǔ)充了在 DGX Cloud 端的訓(xùn)練(Train on DGX Cloud),一種已在 Hugging Face 上提供的 AI 訓(xùn)練服務(wù)。

由于開發(fā)者面對(duì)著越來越多的開源模型,可供其輕松比較各種選項(xiàng)的資源中心會(huì)非常有幫助。這些訓(xùn)練和推理工具為 Hugging Face 開發(fā)者提供了在 NVIDIA 加速基礎(chǔ)設(shè)施上試驗(yàn)、測(cè)試和部署先進(jìn)模型的新方法。它們可以通過 Hugging Face 模型卡上的“訓(xùn)練”和“部署”下拉菜單輕松訪問,用戶只需點(diǎn)擊幾下就能輕松使用這些功能。

不僅限于 Token 層面的提升

— NVIDIA NIM 帶來巨大優(yōu)勢(shì)

NVIDIA NIM 是一系列 AI 微服務(wù)(包括 NVIDIA AI 基礎(chǔ)模型和開源社區(qū)模型)的集合,而且已使用行業(yè)標(biāo)準(zhǔn)應(yīng)用編程接口(API)針對(duì)推理進(jìn)行了優(yōu)化。

NIM 為用戶帶來更高的 token 處理效率 — token 是語言模型使用和生成的數(shù)據(jù)單位。經(jīng)優(yōu)化的微服務(wù)還能改善底層 NVIDIA DGX Cloud 基礎(chǔ)架構(gòu)的效率,從而提高關(guān)鍵 AI 應(yīng)用的速度。

這意味著,與模型的其他版本相比,開發(fā)者可以通過訪問 NIM AI 模型,更快、更可靠地得到結(jié)果。例如,與 NVIDIA Tensor Core GPU 驅(qū)動(dòng)系統(tǒng)上的現(xiàn)成部署相比,通過 NIM 訪問 Llama 3 的 700 億參數(shù)版本時(shí),可實(shí)現(xiàn)最高達(dá) 5 倍的吞吐量提升。

近乎即時(shí)的 DGX Cloud

訪問讓 AI 加速觸手可及

NVIDIA DGX Cloud 平臺(tái)專為生成式 AI 打造,為開發(fā)者提供輕松訪問可靠加速計(jì)算基礎(chǔ)設(shè)施的途徑,幫助他們更快地將生產(chǎn)就緒型應(yīng)用推向市場(chǎng)。

該平臺(tái)提供可擴(kuò)展的 GPU 資源,可為從原型設(shè)計(jì)到生產(chǎn)的每一步 AI 開發(fā)提供支持,同時(shí)無需開發(fā)者做出長期的 AI 基礎(chǔ)設(shè)施承諾。

借助由 NIM 微服務(wù)提供支持、在 NVIDIA DGX Cloud 上運(yùn)行的 Hugging Face 推理即服務(wù),用戶可輕松訪問針對(duì) AI 部署進(jìn)行優(yōu)化的計(jì)算資源,在企業(yè)級(jí)環(huán)境中實(shí)驗(yàn)最新的 AI 模型。

詳細(xì)了解在 SIGGRAPH 大會(huì)上

發(fā)布的 NVIDIA NIM 相關(guān)信息

在 SIGGRAPH 大會(huì)上,NVIDIA 還推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服務(wù),以加速開發(fā)者構(gòu)建高精度虛擬世界的能力,推動(dòng) AI 再次演進(jìn)。

體驗(yàn)超過 100 種 NVIDIA NIM 微服務(wù)在各行各業(yè)的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109702
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39705

    瀏覽量

    301298
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50090

    瀏覽量

    265199
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    150

    瀏覽量

    8102

原文標(biāo)題:SIGGRAPH 2024 | Hugging Face 為開發(fā)者帶來由 NVIDIA NIM 提供支持的推理即服務(wù)

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 A
    的頭像 發(fā)表于 11-03 14:48 ?967次閱讀

    華納云VPS容器服務(wù)網(wǎng)格流量管理:實(shí)現(xiàn)微服務(wù)高效路由

    在云計(jì)算和微服務(wù)架構(gòu)日益普及的今天,華納云香港VPS憑借其優(yōu)越的地緣優(yōu)勢(shì)和網(wǎng)絡(luò)自由,成為眾多企業(yè)部署容器化應(yīng)用的熱門選擇。復(fù)雜的微服務(wù)架構(gòu)帶來了流量管理的
    的頭像 發(fā)表于 10-16 17:09 ?527次閱讀

    如何基于Nginx構(gòu)建微服務(wù)網(wǎng)關(guān)

    今天,我將分享我們團(tuán)隊(duì)如何基于Nginx構(gòu)建了一個(gè)日均處理10億+請(qǐng)求的微服務(wù)網(wǎng)關(guān),以及踩過的那些坑。這套方案已經(jīng)穩(wěn)定運(yùn)行2年+,經(jīng)歷過多次大促考驗(yàn)。
    的頭像 發(fā)表于 09-02 16:29 ?816次閱讀

    Jtti海外VPS微服務(wù)架構(gòu)下的日志采集與分析優(yōu)化方案

    隨著跨境業(yè)務(wù)和分布式應(yīng)用的普及,越來越多的企業(yè)在海外VPS上構(gòu)建微服務(wù)架構(gòu),以提升系統(tǒng)擴(kuò)展性和靈活性。然而,微服務(wù)帶來了一個(gè)新的挑戰(zhàn):日志數(shù)據(jù)分散在多個(gè)服務(wù)和節(jié)點(diǎn)中,若缺乏統(tǒng)一采集與
    的頭像 發(fā)表于 08-27 17:13 ?566次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與
    的頭像 發(fā)表于 08-22 15:52 ?3713次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension開發(fā)秘籍

    電商API的微服務(wù)架構(gòu)優(yōu)化策略

    ? 隨著電子商務(wù)的快速發(fā)展,API(應(yīng)用程序編程接口)已成為電商平臺(tái)的核心組件,負(fù)責(zé)連接用戶、商家和后臺(tái)系統(tǒng)。微服務(wù)架構(gòu)通過將應(yīng)用拆分為獨(dú)立、可擴(kuò)展的服務(wù)單元,顯著提升了系統(tǒng)的靈活性和可維護(hù)性。然而
    的頭像 發(fā)表于 07-23 14:30 ?619次閱讀
    電商API的<b class='flag-5'>微服務(wù)</b>架構(gòu)優(yōu)化策略

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國和企業(yè)簡化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1338次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺(tái)集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1278次閱讀

    NVIDIA NIM微服務(wù)現(xiàn)已推出

    生成式 AI 為 PC 和工作站帶來了全新功能,包括游戲助手、增強(qiáng)的內(nèi)容創(chuàng)作和生產(chǎn)力工具等。
    的頭像 發(fā)表于 04-08 16:56 ?934次閱讀

    Altair One? 云端門戶與 NVIDIA Omniverse 實(shí)時(shí)數(shù)字孿生藍(lán)圖完成全面整合

    正式宣布其?Altair One?云端門戶與?NVIDIA Omniverse 實(shí)時(shí)數(shù)字孿生藍(lán)圖實(shí)現(xiàn)技術(shù)融合。通過整合?GPU 加速、NVIDIA NIM 微服務(wù)與?Omniverse
    的頭像 發(fā)表于 04-02 14:01 ?660次閱讀

    NVIDIA Omniverse Kit 107的安裝部署步驟

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與
    的頭像 發(fā)表于 03-28 10:37 ?1524次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Kit 107的安裝部署步驟

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級(jí) GPU 和 AI 賦能的開發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1294次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM 微服務(wù)通過 OCI 控制臺(tái)以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1424次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式AI推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM?
    發(fā)表于 03-19 15:24 ?575次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 AI 推理

    微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?

    SpringCloud、Dubbo、Dropwizard、Akka等是常見微服務(wù)框架。SpringCloud基于SpringBoot,生態(tài)豐富;Dropwizard輕量且繼承SpringBoot優(yōu)點(diǎn)
    的頭像 發(fā)表于 03-04 11:05 ?1028次閱讀