91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Microsoft使用NVIDIA Triton加速AI Transformer模型應(yīng)用

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-04-02 13:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Microsoft 的目標(biāo)是,通過(guò)結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件,率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

如果您的軟件能喚起人們喜悅的淚水,您就是在傳播歡樂(lè)。

Translator 是一項(xiàng) Microsoft Azure 認(rèn)知服務(wù),通過(guò)應(yīng)用一些規(guī)模龐大的 AI 模型來(lái)幫助更多人進(jìn)行交流。

“有太多精彩的故事可以講了!” Translator 開(kāi)發(fā)經(jīng)理 Vishal Chowdhary 表示。

比如,在 2010 年海地遭受 7.0 級(jí)地震后,在短短 5 天的沖刺期里為相關(guān)應(yīng)用緊急添加海地克里奧爾語(yǔ)支持,進(jìn)而為救援人員提供幫助。再比如,祖父母在使用這款軟件,與講著他們不懂的語(yǔ)言的遠(yuǎn)方孫輩進(jìn)行第一次實(shí)時(shí)交流時(shí),感動(dòng)到哽咽。

雄心勃勃的目標(biāo)

“我們的愿景是,讓成千上萬(wàn)的開(kāi)發(fā)者都已經(jīng)在使用的這個(gè) API,能打破不同語(yǔ)言、不同模式之間的阻礙?!?Chowdhary 說(shuō)。

考量全球現(xiàn)行的語(yǔ)言大約有 7000 種,這真的是個(gè)雄心勃勃的目標(biāo)。

因此,團(tuán)隊(duì)采用了一種強(qiáng)大而復(fù)雜的工具,即是混合專(zhuān)家系統(tǒng)(MoE)AI 方法。

在推動(dòng)自然語(yǔ)言處理快速發(fā)展進(jìn)步的 Transformer 模型中,這是非常先進(jìn)的一種。它具有 50 億個(gè)參數(shù),其規(guī)模比團(tuán)隊(duì)在生產(chǎn)過(guò)程中用于自然語(yǔ)言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計(jì)算量,很難找到能將其投入生產(chǎn)環(huán)境中使用的用戶(hù)。在初始測(cè)試中,基于 CPU 的服務(wù)器無(wú)法滿(mǎn)足團(tuán)隊(duì)要在一秒鐘內(nèi)完成翻譯一個(gè)文檔的要求。

27 倍的提速

隨后,該團(tuán)隊(duì)使用 NVIDIA Triton 推理服務(wù)器(本周 GTC 大會(huì)上宣布的 NVIDIA AI Enterprise 2.0 平臺(tái)的其中一部分)在加速系統(tǒng)上進(jìn)行了測(cè)試。

Chowdhary 說(shuō):“借助 NVIDIA GPU 和 Triton,我們得以實(shí)現(xiàn)這一目標(biāo),且非常高效?!?/p>

事實(shí)上,相較于未經(jīng)優(yōu)化的 GPU 運(yùn)行時(shí),該團(tuán)隊(duì)實(shí)現(xiàn)了高達(dá) 27 倍的提速。

“這讓我們可以構(gòu)建一個(gè)模型來(lái)執(zhí)行不同的語(yǔ)言理解任務(wù),例如匯總、生成文本和翻譯等,而不必為每個(gè)任務(wù)開(kāi)發(fā)單獨(dú)的模型?!?負(fù)責(zé)監(jiān)督測(cè)試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(wù)(如翻譯多個(gè)文檔)拆分為許多個(gè)小任務(wù),在每個(gè)小任務(wù)中翻譯幾百個(gè)句子。Triton 的動(dòng)態(tài)批處理功能將諸多此類(lèi)請(qǐng)求整合起來(lái),從而充分利用 GPU 的強(qiáng)大功能。

對(duì)于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運(yùn)行各種模型的能力,讓該團(tuán)隊(duì)贊不絕口。

Chowdhary 的團(tuán)隊(duì)十多年來(lái)一直在開(kāi)發(fā)大規(guī)模分布式系統(tǒng)。Chowdhary 表示:“這種解決方案周到地考慮了我的工作場(chǎng)景,提供了我想要的各種功能,就像是我給自己親手定制的解決方案一樣。

在幕后,有兩個(gè)軟件組件是 Triton 取得成功的關(guān)鍵。一個(gè)是 NVIDIA 擴(kuò)展型 FasterTransformer,這是一個(gè)處理推理計(jì)算的軟件層,可支持 MoE 模型。另一個(gè)是 CUTLASS,這是一個(gè) NVIDIA 數(shù)學(xué)庫(kù),有助于高效實(shí)現(xiàn)模型。

在四周內(nèi)提供已驗(yàn)證的原型

盡管測(cè)試十分復(fù)雜,但該團(tuán)隊(duì)通過(guò)與 NVIDIA 工程師合作并運(yùn)用 Triton 的強(qiáng)大力量,在不到一個(gè)月的時(shí)間內(nèi)就獲得了可投入正常運(yùn)轉(zhuǎn)的端到端原型。

“在如此之短的時(shí)間內(nèi)制作出一款達(dá)到可發(fā)布程度的產(chǎn)品,這樣的效率實(shí)在令人印象深刻,對(duì)此我真的非常感激?!?Awadalla 這樣說(shuō)道。

雖然這是該團(tuán)隊(duì)第一次使用 Triton,但 “我們使用它來(lái)發(fā)布 MoE 模型,不用花費(fèi)太多力氣就重新構(gòu)建了運(yùn)行時(shí)環(huán)境,現(xiàn)在我衷心希望在我們的長(zhǎng)期托管系統(tǒng)中納入這款解決方案?!?Chowdhary 補(bǔ)充表示。

采取后續(xù)措施

加速后的服務(wù)將采用審慎的步驟實(shí)施,初期會(huì)用于少數(shù)幾種主要語(yǔ)言的文檔翻譯。

Chowdhary 表示:“我們的最終目標(biāo)是,讓客戶(hù)能在所有場(chǎng)景中通過(guò)透明的方式獲享這些新模型的優(yōu)點(diǎn)?!?/p>

這項(xiàng)工作是 Microsoft 的一項(xiàng)涉獵更廣泛的計(jì)劃的一部分。其目的是推動(dòng) Office 和 Teams 等眾多產(chǎn)品的進(jìn)步,幫助各類(lèi)開(kāi)發(fā)者與客戶(hù)(從專(zhuān)注于打造一款應(yīng)用的小型公司到財(cái)富 500 強(qiáng)企業(yè))取得發(fā)展。

為了給這一計(jì)劃鋪平道路,Awadalla 的團(tuán)隊(duì)于去年 9 月發(fā)表了一項(xiàng)研究成果,介紹如何在 NVIDIA A100 Tensor Core GPU 上訓(xùn)練具有多達(dá) 2 千億個(gè)參數(shù)的 MoE 模型。自那之后,該團(tuán)隊(duì)還在具有超過(guò) 3 千億個(gè)參數(shù)的模型上使用 80G 版本的 A100 GPU,將性能提升了 8 倍。

Adawalla 表示:“為了更好地表示更多的語(yǔ)言,尤其是我們手頭沒(méi)有太多數(shù)據(jù)的語(yǔ)言,模型必定會(huì)越來(lái)越大?!?/p>

原文標(biāo)題:GTC22 | 促進(jìn)人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109704
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135409
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301304
  • Microsoft
    +關(guān)注

    關(guān)注

    0

    文章

    237

    瀏覽量

    7957

原文標(biāo)題:GTC22 | 促進(jìn)人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Transformer 入門(mén):從零理解 AI模型的核心原理

    ) × (4, 5) = 錯(cuò)誤!? (3 ≠ 4) 在 Transformer 中的應(yīng)用 scss 體驗(yàn)AI代碼助手 代碼解讀 復(fù)制代碼 Token 嵌入計(jì)算
    發(fā)表于 02-10 16:33

    NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語(yǔ)音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動(dòng)出行領(lǐng)域的行業(yè)級(jí)開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1328次閱讀

    NVIDIA擴(kuò)大與微軟合作推動(dòng)AI超級(jí)工廠建設(shè)

    Microsoft Ignite 大會(huì)上,NVIDIA 擴(kuò)大與微軟的合作,包括在由 NVIDIA Blackwell 平臺(tái)驅(qū)動(dòng)的全新 Microsoft Fairwater
    的頭像 發(fā)表于 12-01 09:52 ?789次閱讀

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開(kāi)放
    的頭像 發(fā)表于 12-01 09:31 ?788次閱讀
    使用<b class='flag-5'>NVIDIA</b> Nemotron RAG和<b class='flag-5'>Microsoft</b> SQL Server 2025構(gòu)建高性能<b class='flag-5'>AI</b>應(yīng)用

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI
    的頭像 發(fā)表于 12-01 09:25 ?1124次閱讀

    NVIDIA 利用全新開(kāi)源模型與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程

    。 ? 借助全新的 NVIDIA Cosmos 世界基礎(chǔ)模型,開(kāi)發(fā)者可以生成多樣化數(shù)據(jù),從而大規(guī)模加速物理 AI 模型的訓(xùn)練。 ? 來(lái)自斯
    的頭像 發(fā)表于 09-30 09:52 ?3063次閱讀
    <b class='flag-5'>NVIDIA</b> 利用全新開(kāi)源<b class='flag-5'>模型</b>與仿真庫(kù)<b class='flag-5'>加速</b>機(jī)器人研發(fā)進(jìn)程

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴(kuò)展數(shù)字孿生平臺(tái)庫(kù),加速 AI 數(shù)據(jù)中心部署與運(yùn)營(yíng)

    [1]? 利用搭載 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD[2]?數(shù)字孿生系統(tǒng)實(shí)現(xiàn)了庫(kù)的重大擴(kuò)展 。借助 NVIDIA 高性能加速計(jì)算平臺(tái)的新模型,數(shù)據(jù)中
    的頭像 發(fā)表于 09-15 15:19 ?1503次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開(kāi)源RISC-V的AI加速器 RISC-V是一種開(kāi)源、模
    發(fā)表于 09-12 17:30

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1771次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2推理<b class='flag-5'>模型</b>發(fā)布

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開(kāi)放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和
    的頭像 發(fā)表于 07-16 09:16 ?2042次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開(kāi)展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也將支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion
    的頭像 發(fā)表于 06-12 15:49 ?1261次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    針對(duì)基于 Diffusion 和 LLM 類(lèi)別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發(fā)表于 06-12 15:37 ?1864次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    NVIDIA Cosmos加速機(jī)器人和自動(dòng)駕駛汽車(chē)物理AI發(fā)展

    NVIDIA Cosmos 通過(guò)可預(yù)測(cè)未來(lái)世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?1258次閱讀
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>機(jī)器人和自動(dòng)駕駛汽車(chē)物理<b class='flag-5'>AI</b>發(fā)展

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型
    的頭像 發(fā)表于 03-20 15:03 ?1230次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首
    發(fā)表于 03-19 15:24 ?575次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理