案例介紹
金山辦公與 NVIDIA 團(tuán)隊(duì)合作,通過(guò) NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識(shí)別與理解的推理效率;借助 NVIDIA Triton 推理服務(wù)器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。
客戶簡(jiǎn)介及應(yīng)用背景
金山辦公是一家辦公軟件和服務(wù)提供商,主要從事 WPS Office 辦公軟件產(chǎn)品及服務(wù)的設(shè)計(jì)研發(fā)及銷(xiāo)售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識(shí)別與理解業(yè)務(wù),可在 Windows、Linux、macOS、Android、iOS 、Harmony 等眾多主流操作平臺(tái)上應(yīng)?,于全球也有越來(lái)越多的用戶樂(lè)享金山辦公提供的產(chǎn)品和服務(wù)。
在辦公場(chǎng)景中,文檔類(lèi)型圖像被廣泛使用,比如證件、發(fā)票、合同、保險(xiǎn)單、掃描書(shū)籍、拍攝的表格等,這類(lèi)圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫(xiě)、公式等復(fù)雜的版面布局和結(jié)構(gòu)信息。早前這些信息均采用人工來(lái)處理,需要耗費(fèi)大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識(shí)別與內(nèi)容理解業(yè)務(wù)就是為了解決此類(lèi)用戶痛點(diǎn)。
自 2017 年以來(lái)的不斷耕耘,金山辦公在圖像文檔識(shí)別與理解領(lǐng)域已達(dá)到了國(guó)內(nèi)領(lǐng)先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺(jué)信息抽?。?等相關(guān)深度學(xué)習(xí)技術(shù),例如通過(guò) CV 技術(shù)識(shí)別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關(guān)系,其日請(qǐng)求次數(shù)已達(dá)上億次。
客戶挑戰(zhàn)
圖像識(shí)別與理解是一個(gè)很復(fù)雜的過(guò)程,一個(gè)任務(wù)的 pipeline 用到的深度學(xué)習(xí)模型多達(dá) 20+ 個(gè),且日請(qǐng)求量級(jí)較大(上億級(jí)別)需要大量的計(jì)算資源。當(dāng)業(yè)務(wù)落地時(shí),團(tuán)隊(duì)主要面臨以下兩個(gè)挑戰(zhàn):
1、任務(wù)的絕對(duì)耗時(shí)不能過(guò)長(zhǎng)。
2、成本問(wèn)題。
應(yīng)用方案
為了解決上訴的兩個(gè)挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。
長(zhǎng)鏈路(多達(dá) 20+ 個(gè)模型的 pipeline)意味著長(zhǎng)耗時(shí),若基于 CPU 推理的話,pipeline 耗時(shí)會(huì)長(zhǎng)達(dá) 15 秒左右,通過(guò) GPU 推理和 TensorRT 加速,成功將耗時(shí)降低到了 2.4 秒左右。
模型部署的時(shí)候,常見(jiàn)的做法是推理與業(yè)務(wù)代碼(前后處理)放在一個(gè)進(jìn)程空間里,每個(gè)模型需要在每個(gè)進(jìn)程中加載一次,由于顯存的限制,很多時(shí)候難以得到較高的單卡 GPU 使用率。就算采用了進(jìn)程池的方式提高了單卡的 GPU 利用率,也會(huì)因 CPU 的限制,出現(xiàn)機(jī)器整體的 GPU 利用率不高。而在引入了 Triton 推理服務(wù)器進(jìn)行推理部署后,將推理與業(yè)務(wù)代碼解耦,初步實(shí)現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務(wù)規(guī)模情況下,部署成本節(jié)省了 23%。
模型耗時(shí)

表1 模型耗時(shí)
模型吞吐量對(duì)比圖



WPS 生成式 AI 的最新進(jìn)展
WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問(wèn)答、人機(jī)交互等方面。在 PPT 中,WPS AI 現(xiàn)已支持輸入主題,一鍵生成 PPT 演示文稿,并會(huì)根據(jù)用戶要求進(jìn)行細(xì)化調(diào)節(jié),如更改主題風(fēng)格、單頁(yè)美化、更改字體、更改配色、生成演講稿等等。
在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問(wèn)答方式則可以獲得關(guān)鍵信息。并且,問(wèn)答助手也會(huì)提供文檔溯源功能,確保用戶能夠得知信息來(lái)源。
用戶能夠通過(guò)手機(jī)等移動(dòng)設(shè)備拍攝相關(guān)文檔,而后 WPS 給出相關(guān)翻譯、概括、分析等功能。
圖 1. WPS-AI 隨手拍與文檔問(wèn)答

圖 2. WPS-AI 大綱生成
圖 3. WPS-AI PPT 美化
圖 4. WPS-AI PPT 生成
使用效果及影響
金山辦公圖像文檔識(shí)別與理解業(yè)務(wù),通過(guò)采用 NVIDIA T4 Tensor Core GPU 及 TensorRT加速,相比于 CPU 其 pipleline 耗時(shí)共下降 84%;而采用 NVIDIA Triton 推理服務(wù)器部署,其部署成本節(jié)省了 23% 。
金山辦公 CV 團(tuán)隊(duì)總監(jiān)熊龍飛表示:”我們有多個(gè)業(yè)務(wù)后邊的 AI 服務(wù)已經(jīng)通過(guò)采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應(yīng),提高了用戶體驗(yàn),也為公司節(jié)約了大量的服務(wù)端 GPU 資源,收獲了更高的效益。我們?cè)谖臋n識(shí)別與理解領(lǐng)域的應(yīng)用案例也可以啟發(fā)到 OCR 和版式識(shí)別領(lǐng)域的其他公司和學(xué)者,相信隨著更多客戶通過(guò)采用 TensorRT 加速會(huì)給行業(yè)帶來(lái)很大的收益。”
*本文中圖片均來(lái)源于金山辦公,如果您有任何疑問(wèn)或需要使用本文中的圖片,請(qǐng)聯(lián)系金山辦公。
點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!
原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4090瀏覽量
99235
原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
NVIDIA硅光技術(shù)助力邁向百萬(wàn)GPU AI工廠
NVIDIA全棧加速代理式AI應(yīng)用落地
NVIDIA助力歐洲金融服務(wù)行業(yè)智能化發(fā)展
NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體
NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)
NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)
英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理
英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型
通用汽車(chē)和NVIDIA合作構(gòu)建定制化AI系統(tǒng)
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗(yàn)
評(píng)論