91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助NVIDIA NIM加速AI應(yīng)用部署

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-23 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語(yǔ)言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分高效,但需要花費(fèi)一定的精力才能將它們整合到生產(chǎn)就緒型環(huán)境中。NVIDIA NIM簡(jiǎn)化了這一過(guò)程,使企業(yè)能夠在數(shù)據(jù)中心、云、工作站和 PC 等任何位置運(yùn)行 AI 模型。

專(zhuān)為企業(yè)設(shè)計(jì)的 NIM 提供一整套預(yù)構(gòu)建云原生微服務(wù),這些微服務(wù)能夠被輕松地整合到現(xiàn)有基礎(chǔ)設(shè)施中。這些微服務(wù)經(jīng)過(guò)精心的維護(hù)和持續(xù)的更新,具有開(kāi)箱即用的性能,并確保您能夠獲得 AI 推理技術(shù)的最新進(jìn)展。

適用于大語(yǔ)言模型的全新 NVIDIA NIM

基礎(chǔ)模型的增長(zhǎng)源于其能夠滿(mǎn)足各種企業(yè)需求的能力,但沒(méi)有任何一個(gè)單一的模型能夠完全滿(mǎn)足企業(yè)的需求,企業(yè)通常會(huì)根據(jù)特定的數(shù)據(jù)需求和 AI 應(yīng)用工作流,在其用例中使用不同的基礎(chǔ)模型。

考慮到企業(yè)需求的多樣化,我們擴(kuò)大了 NIM 的陣容,涵蓋了Mistral-7B、Mixtral-8x7B和Mixtral-8x22B,這三個(gè)基礎(chǔ)模型在特定任務(wù)中的表現(xiàn)都十分出色。

wKgZombISu2ABnFsAAEKU7AeGQ4868.png

圖 1. 新的 Mixtral 8x7B Instruct NIM

可從 NVIDIA API 中獲取

Mistral 7B NIM

Mistral 7B Instruct 模型在文本生成和語(yǔ)言理解任務(wù)中表現(xiàn)出色。該模型可在單個(gè) GPU 上運(yùn)行,非常適合語(yǔ)言翻譯、內(nèi)容生成和聊天機(jī)器人等應(yīng)用。將 Mistral 7B NIM 部署至 NVIDIA 數(shù)據(jù)中心 GPU 后,開(kāi)發(fā)者在內(nèi)容生成任務(wù)中可實(shí)現(xiàn)的開(kāi)箱即用性能(token/秒),其性能最多可提升至沒(méi)有使用 NIM 時(shí)的 2.3 倍。

wKgaombISq-AccWAAAFYFUTuXLI634.png

圖 2. Mistral 7B NIM 提高了內(nèi)容生成的吞吐量

基于 1 個(gè) NVIDIA Tensor Core GPU,輸入 500 個(gè) token,輸出 2,000 個(gè) token。NIM 開(kāi)啟時(shí):FP8。吞吐量為 5,697 token/秒,TTFT 為 0.6 秒,ITL 為 26 毫秒。NIM 關(guān)閉時(shí):FP16。吞吐量為 2,529 token/秒,TTFT 為 1.4 秒,ITL 為 60 毫秒。

Mixtral-8x7B和

Mixtral-8x22B NIM

Mixtral-8x7B 和 Mixtral-8x22B 模型采用混合專(zhuān)家(MoE)架構(gòu)提供快速且經(jīng)濟(jì)高效的推理。這兩個(gè)模型在總結(jié)、問(wèn)題解答和代碼生成等任務(wù)中表現(xiàn)出色,非常適合需要實(shí)時(shí)響應(yīng)的應(yīng)用。

相較無(wú) NIM 運(yùn)行的情況,NIM 可以提高這兩種模型的開(kāi)箱即用性能。當(dāng)用于內(nèi)容生成且在 1 個(gè) NVIDIA Tensor Core GPU 上運(yùn)行時(shí),Mixtral-8x7B NIM 的吞吐量最多可提高 4.1 倍。在內(nèi)容生成和翻譯用例中,Mixtral-8x22B NIM 的吞吐量最多可提高 2.9 倍。

wKgZombISseAP6fwAAFZhOnmu9w134.png

圖 3. Mixtral 8x7B NIM

提高了內(nèi)容生成的吞吐量

輸入 500 個(gè) token,輸出 2,000 個(gè) token。200 個(gè)并發(fā)請(qǐng)求。NIM 開(kāi)啟時(shí):FP8。吞吐量為 9,410 token/秒。TTFT 為 740 毫秒,ITL 為 21 毫秒。NIM 關(guān)閉時(shí):FP16。吞吐量為 2,300 token/秒,TTFT 為 1,321 毫秒,ITL 為 86 毫秒。

wKgaombIStyAD9Y0AAGc-i0HOjU067.png

圖 4. Mixtral 8x22B NIM

提高了內(nèi)容生成和翻譯的吞吐量

輸入 1,000 個(gè) token,輸出 1,000 個(gè) token。250 個(gè)并發(fā)請(qǐng)求。NIM 開(kāi)啟時(shí):吞吐量為 6,070 token/秒,TTFT 為 3 秒,ITL 為 38 毫秒。NIM 關(guān)閉時(shí):吞吐量為 2,067 token/秒,TTFT 為 5 秒,ITL 為 116 毫秒。

借助 NVIDIA NIM 加速 AI 應(yīng)用部署

開(kāi)發(fā)者可以使用 NIM 縮短構(gòu)建適用于生產(chǎn)部署的 AI 應(yīng)用所需的時(shí)間,同時(shí)還能提高 AI 推理效率,并降低運(yùn)營(yíng)成本。借助 NIM,經(jīng)過(guò)優(yōu)化的 AI 模型實(shí)現(xiàn)了容器化,為開(kāi)發(fā)者帶來(lái)了以下優(yōu)勢(shì):

性能和規(guī)模

這些云驅(qū)動(dòng)的微服務(wù)可提供低延遲、高吞吐量并可以輕松擴(kuò)展的 AI 推理,使用 Llama 3 70B NIM,最多可將吞吐量提高 5 倍。NIM 還支持精確的微調(diào)模型,無(wú)需從頭開(kāi)始構(gòu)建即可實(shí)現(xiàn)超高的準(zhǔn)確性,進(jìn)一步提高了 AI 推理性能。

易于使用

通過(guò)簡(jiǎn)化與現(xiàn)有系統(tǒng)的整合來(lái)加快進(jìn)入市場(chǎng)的速度,并在 NVIDIA 加速基礎(chǔ)設(shè)施上提供最佳性能。借助專(zhuān)為企業(yè)使用而設(shè)計(jì)的 API 和工具,開(kāi)發(fā)者可以實(shí)現(xiàn)其 AI 能力的最大化。

安全性和易管理性

確保您的 AI 應(yīng)用和數(shù)據(jù)具有強(qiáng)大的可控性和安全性。通過(guò)NVIDIA AI Enterprise,NIM 支持在任何基礎(chǔ)設(shè)施上的靈活自托管部署,提供企業(yè)級(jí)軟件、嚴(yán)格的驗(yàn)證以及與 NVIDIA AI 專(zhuān)家的直接連線。

AI 推理的前景:

NVIDIA NIM 及其他延伸

NVIDIA NIM 代表了 AI 推理領(lǐng)域的重大進(jìn)步。隨著各行各業(yè)對(duì) AI 應(yīng)用需求的日益增長(zhǎng),高效部署這些應(yīng)用變得至關(guān)重要。想要利用 AI 變革力量的企業(yè)可以使用 NVIDIA NIM,將預(yù)構(gòu)建的云原生微服務(wù)輕松整合到現(xiàn)有系統(tǒng)中,以此加快產(chǎn)品推出速度,保持在創(chuàng)新領(lǐng)域的領(lǐng)先地位。

未來(lái)的 AI 推理將超越單個(gè) NVIDIA NIM。隨著對(duì)先進(jìn) AI 應(yīng)用的需求不斷增長(zhǎng),連接多個(gè) NVIDIA NIM 將變得至關(guān)重要。這種微服務(wù)網(wǎng)絡(luò)將帶來(lái)能夠協(xié)同工作和適應(yīng)各種任務(wù)的高度智能化應(yīng)用,從而深入改變我們使用技術(shù)的方式。如要在您的基礎(chǔ)設(shè)施上部署 NIM 推理微服務(wù),請(qǐng)查看“使用 NVIDIA NIM 部署生成式 AI 的簡(jiǎn)單指南”:

NVIDIA 定期發(fā)布新的 NIM,為企業(yè)提供最強(qiáng)大的 AI 模型,助企業(yè)應(yīng)用一臂之力。請(qǐng)?jiān)L問(wèn)API 目錄,查找適用于 LLM、視覺(jué)、檢索、3D 和數(shù)字生物學(xué)模型的最新 NVIDIA NIM。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109746
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301432
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52111
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    150

    瀏覽量

    8103

原文標(biāo)題:全新 NVIDIA NIM:可適用于 Mistral 和 Mixtral 模型并為您的 AI 項(xiàng)目賦能

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA AI微服務(wù)現(xiàn)已與AWS集成,加速藥物研發(fā)和數(shù)字醫(yī)療

    NVIDIA NIM 使數(shù)千家使用 AWS 的醫(yī)療和生命科學(xué)公司能夠快速、輕松開(kāi)發(fā)和部署生成式 AI。
    的頭像 發(fā)表于 05-09 09:21 ?2368次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬(wàn)開(kāi)發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開(kāi)發(fā)者

    部署在云、數(shù)據(jù)中心或工作站上。借助 NVIDIA NIM,開(kāi)發(fā)者能夠輕松地為 copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間
    發(fā)表于 06-03 09:12 ?604次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變模型<b class='flag-5'>部署</b>,將全球數(shù)百萬(wàn)開(kāi)發(fā)者轉(zhuǎn)變?yōu)樯墒?<b class='flag-5'>AI</b> 開(kāi)發(fā)者

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過(guò)程,為全球的2800萬(wàn)英偉達(dá)開(kāi)發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?1418次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1459次閱讀

    NVIDIA NIM:打造AI領(lǐng)域的AI-in-a-Box,提高AI開(kāi)發(fā)與部署的高效性

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計(jì)算機(jī)圖形學(xué)盛會(huì)——SIGGRAPH 2024上,NVIDIA公司對(duì)外展示了其在諸如渲染、仿真及生成式AI等前沿領(lǐng)域所取得的卓越成果,而其中最為引人注目的便是NVIDIA
    的頭像 發(fā)表于 07-30 16:27 ?1679次閱讀

    借助NVIDIA NIM微服務(wù)助力可口可樂(lè)公司擴(kuò)展生成式AI內(nèi)容

    借助 NVIDIA NIM 微服務(wù) USD Search 和 USD Code,市場(chǎng)營(yíng)銷(xiāo)領(lǐng)導(dǎo)者 WPP 幫助飲料公司在全球范圍內(nèi)加速創(chuàng)意活動(dòng)的迭代。
    的頭像 發(fā)表于 08-13 16:16 ?1258次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    可定制工作流目錄加快核心生成式 AI 用例的部署速度。首批用例包括客戶(hù)服務(wù)、藥物研發(fā)和 PDF 數(shù)據(jù)提取,未來(lái)將加入更多用例 企業(yè)可以使用 NIM Agent Blueprints 以及
    發(fā)表于 08-28 10:10 ?612次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,助力企業(yè)打造屬于自己的 <b class='flag-5'>AI</b>

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開(kāi)源 Kubernetes 平臺(tái)集成了 NVIDIA NIM,將允許用戶(hù)通過(guò) API 調(diào)用來(lái)大規(guī)模地部署大語(yǔ)言模型。
    的頭像 發(fā)表于 10-10 09:49 ?1342次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?1816次閱讀

    NVIDIA推出適用于網(wǎng)絡(luò)安全的NIM Blueprint

    德勤使用適用于容器安全的 NVIDIA NIM Agent Blueprint 幫助企業(yè)利用開(kāi)源軟件構(gòu)建安全的 AI。
    的頭像 發(fā)表于 11-20 09:58 ?1387次閱讀

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開(kāi)發(fā)和部署 AI 模型,實(shí)現(xiàn)對(duì)降雪、結(jié)冰和冰雹的預(yù)測(cè)。
    的頭像 發(fā)表于 11-21 10:07 ?1300次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的準(zhǔn)確性、安
    發(fā)表于 01-17 16:29 ?343次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè) NVIDIA NIM 微服務(wù)通過(guò) OCI 控制臺(tái)以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1439次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開(kāi)展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也將支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使
    的頭像 發(fā)表于 06-12 15:49 ?1273次閱讀

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴(kuò)展數(shù)字孿生平臺(tái)庫(kù),加速 AI 數(shù)據(jù)中心部署與運(yùn)營(yíng)

    [1]? 利用搭載 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD[2]?數(shù)字孿生系統(tǒng)實(shí)現(xiàn)了庫(kù)的重大擴(kuò)展 。借助 NVIDIA 高性能加速計(jì)算平臺(tái)的新模型,數(shù)據(jù)中
    的頭像 發(fā)表于 09-15 15:19 ?1511次閱讀