91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-06-29 21:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例介紹

金山辦公與 NVIDIA 團(tuán)隊(duì)合作,通過(guò) NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識(shí)別與理解的推理效率;借助 NVIDIA Triton 推理服務(wù)器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。

客戶簡(jiǎn)介及應(yīng)用背景

金山辦公是一家辦公軟件和服務(wù)提供商,主要從事 WPS Office 辦公軟件產(chǎn)品及服務(wù)的設(shè)計(jì)研發(fā)及銷(xiāo)售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識(shí)別與理解業(yè)務(wù),可在 Windows、Linux、macOS、Android、iOSHarmony 等眾多主流操作平臺(tái)上應(yīng)?,于全球也有越來(lái)越多的用戶樂(lè)享金山辦公提供的產(chǎn)品和服務(wù)。

在辦公場(chǎng)景中,文檔類(lèi)型圖像被廣泛使用,比如證件、發(fā)票、合同、保險(xiǎn)單、掃描書(shū)籍、拍攝的表格等,這類(lèi)圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫(xiě)、公式等復(fù)雜的版面布局和結(jié)構(gòu)信息。早前這些信息均采用人工來(lái)處理,需要耗費(fèi)大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識(shí)別與內(nèi)容理解業(yè)務(wù)就是為了解決此類(lèi)用戶痛點(diǎn)。

自 2017 年以來(lái)的不斷耕耘,金山辦公在圖像文檔識(shí)別與理解領(lǐng)域已達(dá)到了國(guó)內(nèi)領(lǐng)先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺(jué)信息抽?。?等相關(guān)深度學(xué)習(xí)技術(shù),例如通過(guò) CV 技術(shù)識(shí)別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關(guān)系,其日請(qǐng)求次數(shù)已達(dá)上億次。

客戶挑戰(zhàn)

圖像識(shí)別與理解是一個(gè)很復(fù)雜的過(guò)程,一個(gè)任務(wù)的 pipeline 用到的深度學(xué)習(xí)模型多達(dá) 20+ 個(gè),且日請(qǐng)求量級(jí)較大(上億級(jí)別)需要大量的計(jì)算資源。當(dāng)業(yè)務(wù)落地時(shí),團(tuán)隊(duì)主要面臨以下兩個(gè)挑戰(zhàn):

1、任務(wù)的絕對(duì)耗時(shí)不能過(guò)長(zhǎng)。

2、成本問(wèn)題。

應(yīng)用方案

為了解決上訴的兩個(gè)挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。

長(zhǎng)鏈路(多達(dá) 20+ 個(gè)模型的 pipeline)意味著長(zhǎng)耗時(shí),若基于 CPU 推理的話,pipeline 耗時(shí)會(huì)長(zhǎng)達(dá) 15 秒左右,通過(guò) GPU 推理和 TensorRT 加速,成功將耗時(shí)降低到了 2.4 秒左右。

模型部署的時(shí)候,常見(jiàn)的做法是推理與業(yè)務(wù)代碼(前后處理)放在一個(gè)進(jìn)程空間里,每個(gè)模型需要在每個(gè)進(jìn)程中加載一次,由于顯存的限制,很多時(shí)候難以得到較高的單卡 GPU 使用率。就算采用了進(jìn)程池的方式提高了單卡的 GPU 利用率,也會(huì)因 CPU 的限制,出現(xiàn)機(jī)器整體的 GPU 利用率不高。而在引入了 Triton 推理服務(wù)器進(jìn)行推理部署后,將推理與業(yè)務(wù)代碼解耦,初步實(shí)現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務(wù)規(guī)模情況下,部署成本節(jié)省了 23%。

模型耗時(shí)

718fdc70-167e-11ee-962d-dac502259ad0.png

表1 模型耗時(shí)

模型吞吐量對(duì)比圖

71b7a9d0-167e-11ee-962d-dac502259ad0.png

71ea4c8c-167e-11ee-962d-dac502259ad0.png

721f1700-167e-11ee-962d-dac502259ad0.png

WPS 生成式 AI 的最新進(jìn)展

WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問(wèn)答、人機(jī)交互等方面。在 PPT 中,WPS AI 現(xiàn)已支持輸入主題,一鍵生成 PPT 演示文稿,并會(huì)根據(jù)用戶要求進(jìn)行細(xì)化調(diào)節(jié),如更改主題風(fēng)格、單頁(yè)美化、更改字體、更改配色、生成演講稿等等。

在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問(wèn)答方式則可以獲得關(guān)鍵信息。并且,問(wèn)答助手也會(huì)提供文檔溯源功能,確保用戶能夠得知信息來(lái)源。

用戶能夠通過(guò)手機(jī)等移動(dòng)設(shè)備拍攝相關(guān)文檔,而后 WPS 給出相關(guān)翻譯、概括、分析等功能。

圖 1. WPS-AI 隨手拍與文檔問(wèn)答

728779a8-167e-11ee-962d-dac502259ad0.jpg

圖 2. WPS-AI 大綱生成

圖 3. WPS-AI PPT 美化

圖 4. WPS-AI PPT 生成

使用效果及影響

金山辦公圖像文檔識(shí)別與理解業(yè)務(wù),通過(guò)采用 NVIDIA T4 Tensor Core GPU TensorRT加速,相比于 CPU 其 pipleline 耗時(shí)共下降 84%;而采用 NVIDIA Triton 推理服務(wù)器部署,其部署成本節(jié)省了 23% 。

金山辦公 CV 團(tuán)隊(duì)總監(jiān)熊龍飛表示:”我們有多個(gè)業(yè)務(wù)后邊的 AI 服務(wù)已經(jīng)通過(guò)采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應(yīng),提高了用戶體驗(yàn),也為公司節(jié)約了大量的服務(wù)端 GPU 資源,收獲了更高的效益。我們?cè)谖臋n識(shí)別與理解領(lǐng)域的應(yīng)用案例也可以啟發(fā)到 OCR 和版式識(shí)別領(lǐng)域的其他公司和學(xué)者,相信隨著更多客戶通過(guò)采用 TensorRT 加速會(huì)給行業(yè)帶來(lái)很大的收益。”

*本文中圖片均來(lái)源于金山辦公,如果您有任何疑問(wèn)或需要使用本文中的圖片,請(qǐng)聯(lián)系金山辦公

點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!


原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4090

    瀏覽量

    99235

原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)

    新聞?wù)?l 禮來(lái)與 NVIDIA 宣布成立 AI 聯(lián)合創(chuàng)新實(shí)驗(yàn)室以應(yīng)對(duì)藥物研發(fā)挑戰(zhàn)。 l NVIDIA 攜手賽默飛打造自主實(shí)驗(yàn)室基礎(chǔ)設(shè)施,加速
    的頭像 發(fā)表于 01-14 11:40 ?480次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺(tái)<b class='flag-5'>加速</b> <b class='flag-5'>AI</b> 驅(qū)動(dòng)的藥物研發(fā)

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的
    的頭像 發(fā)表于 01-06 09:51 ?2423次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評(píng)測(cè)

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?1155次閱讀

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來(lái)越多的應(yīng)用正在使用 AI 加速,而無(wú)論工作站的大小或形態(tài)如何,都有越來(lái)越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000
    的頭像 發(fā)表于 11-28 09:39 ?6355次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測(cè)試

    NVIDIA硅光技術(shù)助力邁向百萬(wàn)GPU AI工廠

    在全球范圍內(nèi),AI 工廠正在崛起 —— 大量的這些新型數(shù)據(jù)中心并非為提供網(wǎng)頁(yè)或電子郵件服務(wù)而建,而是用于訓(xùn)練和部署智能本身?;ヂ?lián)網(wǎng)巨頭們已經(jīng)為其客戶在 AI 云基礎(chǔ)設(shè)施上投資了數(shù)十億美元,現(xiàn)在正在
    的頭像 發(fā)表于 08-27 12:34 ?1221次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國(guó)峰會(huì)上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了代理式 AI (Agent
    的頭像 發(fā)表于 07-14 11:41 ?1330次閱讀

    NVIDIA助力歐洲金融服務(wù)行業(yè)智能化發(fā)展

    NVIDIA AI 與數(shù)據(jù)科學(xué)庫(kù)幫助歐洲大陸加速金融機(jī)構(gòu)欺詐檢測(cè)、實(shí)時(shí)風(fēng)險(xiǎn)建模及客戶服務(wù)應(yīng)用。
    的頭像 發(fā)表于 06-19 14:28 ?957次閱讀

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)
    的頭像 發(fā)表于 06-16 14:28 ?1359次閱讀

    NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個(gè)工業(yè) AI 云。這家總部位于德國(guó)的 AI 工廠將配備 1 萬(wàn)個(gè) GPU,包括通過(guò) NVIDIA
    的頭像 發(fā)表于 06-16 14:17 ?1446次閱讀

    NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾德開(kāi)展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也將支持諾和諾德與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion
    的頭像 發(fā)表于 06-12 15:49 ?1288次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)

    NVIDIA GTC 推出新一代專(zhuān)業(yè)級(jí) GPUAI 賦能的開(kāi)發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1311次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實(shí)現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrastructure (OCI) 與
    的頭像 發(fā)表于 03-21 12:01 ?1447次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作<b class='flag-5'>助力</b>企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的
    的頭像 發(fā)表于 03-20 15:03 ?1278次閱讀

    通用汽車(chē)和NVIDIA合作構(gòu)建定制化AI系統(tǒng)

    通用汽車(chē)和 NVIDIA 宣布正在借助 AI、仿真和加速計(jì)算技術(shù),合作打造下一代汽車(chē)、工廠和機(jī)器人。
    的頭像 發(fā)表于 03-20 14:40 ?1745次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI
    發(fā)表于 03-19 15:24 ?580次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作<b class='flag-5'>助力</b>企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理