91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorRT和Triton助力微信OCR降低耗時(shí)和成本

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡(jiǎn)介

? 本案例中通過(guò)NVIDIA T4 GPU,TensorRT和Triton, 幫助微信OCR降低整體耗時(shí)46%, 并將系統(tǒng)的失敗率降低81%,同時(shí)降低了高達(dá)78%的服務(wù)器數(shù)量。

? 本案例主要應(yīng)用到 NVIDIA GPU ,TensorRT和Triton。

客戶簡(jiǎn)介

騰訊微信是一款跨平臺(tái)的通訊工具。支持通過(guò)手機(jī)網(wǎng)絡(luò)發(fā)送語(yǔ)音、圖片、視頻和文字等。截至2021年6月,微信在全球擁有超過(guò)12億活躍用戶,是國(guó)內(nèi)活躍用戶最多的社交軟件。

微信識(shí)物是一款主打物品識(shí)別的 AI 產(chǎn)品,通過(guò)相機(jī)拍攝物品,更高效、更智能地獲取信息。2020 年,微信識(shí)物拓展了更多識(shí)別場(chǎng)景,上線了微信版的圖片搜索。打開微信掃一掃,左滑切換到“識(shí)物”功能,對(duì)準(zhǔn)想要了解的物品正面,可以獲取對(duì)應(yīng)的物品信息,包括物品百科、相關(guān)資訊、相關(guān)商品。

2021年1月, 微信發(fā)布的微信8.0,版本更新支持圖片文字提取的功能。用戶在聊天界面和朋友圈中長(zhǎng)按圖片就可以提取圖片中文字,然后一鍵轉(zhuǎn)發(fā)、復(fù)制或收藏。

挑戰(zhàn)

微信識(shí)物包含檢測(cè)、圖像召回、信息提煉等環(huán)節(jié),OCR主要包括識(shí)別和檢測(cè),這兩種應(yīng)用都有非常大的計(jì)算量,在用Pytorch進(jìn)行模型的推理時(shí),一方面時(shí)延特別大,導(dǎo)致用戶體驗(yàn)受損;另一方面,顯存占用很大,單張NVIDIA T4上部署的模型數(shù)比較少,導(dǎo)致推理請(qǐng)求的并發(fā)數(shù)上不去,請(qǐng)求失敗的概率太高,只能通過(guò)增加機(jī)器的方式來(lái)提高并發(fā)能力,業(yè)務(wù)部署成本較高。再次,使用的模型經(jīng)常變化,而業(yè)務(wù)需要更換后的模型能夠快速地加速和上線部署。

方案

基于以上挑戰(zhàn),騰訊微信選擇了采用NVIDIA 的TensorRT對(duì)模型進(jìn)行推理加速,并利用NVIDIA Triton推理服務(wù)器在T4 GPU上進(jìn)行在線部署,在提升用戶體驗(yàn)的同時(shí),大幅降低了服務(wù)成本。

1、 通過(guò)使用TensorRT對(duì)微信識(shí)物和OCR的模型進(jìn)行加速,在都使用FP32的情況下,與Pytorch相對(duì),時(shí)延降低50%左右。

2、 在OCR的識(shí)別和檢測(cè)階段,使用TensorRT結(jié)合NVIDIA T4 GPU 的FP16 Tensor Core,在保證精度的同時(shí),識(shí)別的時(shí)延進(jìn)一步降低了50%,檢測(cè)降低了20%。

3、 在微信識(shí)物的分類和檢測(cè)任務(wù)中,通過(guò)使用NVIDIA T4 GPU 的int8 Tensor Core,并結(jié)合QAT,在滿足精度要求的前提下,進(jìn)一步大幅提升了性能。

4、 通過(guò)使用FP16和int8 低精度模式,在大幅降低推理時(shí)延的同時(shí),大大減少了顯存的占用,在FP16模式下,單模型顯存占用僅占FP32模式的40%–50%, 而在int8模式下,單模型顯存占用僅占FP32模式的30%左右。在提高單張T4卡上部署的模型數(shù)量的同時(shí),大幅提高了單GPU的推理請(qǐng)求并發(fā)能力。

5、 Triton的dynamic batch和多實(shí)例等特性,幫助微信將在滿足時(shí)延要求的同時(shí),提高了系統(tǒng)整體的并發(fā)能力,將系統(tǒng)失敗降低了81%。

6、 TensorRT可以對(duì)模型進(jìn)行快速的加速,Triton則可以對(duì)加速后的模型進(jìn)行快速的部署,滿足了業(yè)務(wù)對(duì)修改后的模型進(jìn)行快速部署的需求,同時(shí)也大大減少了工程人員的工作量。

效果

通過(guò)使用NVIDIA的TensorRT對(duì)微信識(shí)物和OCR的模型進(jìn)行加速,在降低單次推理時(shí)延50%以上的同時(shí),節(jié)約了多達(dá)64%的顯存。結(jié)合Triton的dynamic batch和多實(shí)例的功能,OCR的整體時(shí)延降低了46%,系統(tǒng)失敗率降低了81%。大大提高了用戶的體驗(yàn),并且服務(wù)器的數(shù)量減少了多達(dá)78%,極大降低了服務(wù)的成本。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109756
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135474
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10253

    瀏覽量

    91500
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)級(jí)OCR手持終端怎么選?國(guó)產(chǎn)OCR智能識(shí)別pda實(shí)測(cè)

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時(shí)輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學(xué)設(shè)計(jì),讓高強(qiáng)度數(shù)據(jù)采集更輕松。點(diǎn)擊查看詳細(xì)防護(hù)測(cè)試與續(xù)航實(shí)測(cè)數(shù)據(jù)!
    的頭像 發(fā)表于 02-07 17:45 ?223次閱讀
    工業(yè)級(jí)<b class='flag-5'>OCR</b>手持終端怎么選?國(guó)產(chǎn)<b class='flag-5'>OCR</b>智能識(shí)別pda實(shí)測(cè)

    愛芯與工部電子第五研究所達(dá)成戰(zhàn)略合作

    近日,無(wú)錫中愛芯電子有限公司與工部電子第五研究所(中國(guó)賽寶實(shí)驗(yàn)室)正式簽署車規(guī)項(xiàng)目全面合作協(xié)議,標(biāo)志著國(guó)產(chǎn)芯片企業(yè)與權(quán)威技術(shù)機(jī)構(gòu)深度攜手,共同為車規(guī)級(jí)芯片產(chǎn)業(yè)筑牢質(zhì)量根基,助力汽車電子產(chǎn)業(yè)鏈自主可控。
    的頭像 發(fā)表于 02-06 14:16 ?413次閱讀

    HarmonyOS首登公開課,分享跨平臺(tái)適配與體驗(yàn)提升實(shí)踐經(jīng)驗(yàn)

    近日,2026公開課PRO在廣州舉行。值得關(guān)注的是,HarmonyOS開發(fā)專家首次以官方分享嘉賓身份亮相開發(fā)者專場(chǎng),并圍繞“跨平臺(tái)適配與體驗(yàn)提升”這一主題,深入剖析了小程序在跨
    的頭像 發(fā)表于 02-02 09:22 ?310次閱讀
    HarmonyOS首登<b class='flag-5'>微</b><b class='flag-5'>信</b>公開課,分享跨平臺(tái)適配與體驗(yàn)提升實(shí)踐經(jīng)驗(yàn)

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)?;母咝阅?OCR 能力

    落地過(guò)程中,企業(yè)逐漸意識(shí)到:** 制約 OCR 應(yīng)用進(jìn)一步擴(kuò)展的核心因素,已不再是模型準(zhǔn)確率本身,而是整體推理性能與部署成本。 具體來(lái)說(shuō),規(guī)?;?OCR 應(yīng)用主要面臨以下幾方面挑戰(zhàn): 吞吐量(FPS)不足 ,難以支撐高并發(fā)或多路
    的頭像 發(fā)表于 01-22 21:02 ?162次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)?;母咝阅?<b class='flag-5'>OCR</b> 能力

    瑞芯(EASY EAI)RV1126B OCR文字識(shí)別

    1.OCR文字識(shí)別簡(jiǎn)介文字識(shí)別也是圖像領(lǐng)域一個(gè)常見問(wèn)題。然而,對(duì)于自然場(chǎng)景圖像,首先要定位圖像中的文字位置,然后才能進(jìn)行文字的識(shí)別。所以一般包含兩個(gè)步驟:文字檢測(cè):解決的問(wèn)題是哪里有文字,文字的范圍
    的頭像 發(fā)表于 01-12 10:19 ?5761次閱讀
    瑞芯<b class='flag-5'>微</b>(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字識(shí)別

    TensorRT-LLM的大規(guī)模專家并行架構(gòu)設(shè)計(jì)

    之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專家并行架構(gòu)設(shè)計(jì)與創(chuàng)新實(shí)現(xiàn)。
    的頭像 發(fā)表于 09-23 14:42 ?1114次閱讀
    <b class='flag-5'>TensorRT</b>-LLM的大規(guī)模專家并行架構(gòu)設(shè)計(jì)

    小語(yǔ)種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)
    的頭像 發(fā)表于 08-29 11:26 ?3643次閱讀
    小語(yǔ)種<b class='flag-5'>OCR</b>標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    鴻蒙系統(tǒng)怎么安裝企業(yè)

    系統(tǒng)自帶的應(yīng)用市場(chǎng)中無(wú)法下載企業(yè),卓易通中的無(wú)法用登錄,使用不了
    發(fā)表于 08-26 15:43

    如何利用OCR技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)識(shí)別?

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準(zhǔn)確地識(shí)別集裝箱箱號(hào)是提升通關(guān)效率、降低運(yùn)營(yíng)成本的關(guān)鍵。OCR(光學(xué)字符識(shí)別)技術(shù)的應(yīng)用,為這一需求提供了智能化解決方案。通過(guò)結(jié)合高清成像設(shè)備和先進(jìn)的算法,OCR
    的頭像 發(fā)表于 08-12 10:48 ?864次閱讀
    如何利用<b class='flag-5'>OCR</b>技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)識(shí)別?

    小程序+淘寶API,無(wú)縫購(gòu)物體驗(yàn)提升復(fù)購(gòu)率!

    ? 在當(dāng)今電商競(jìng)爭(zhēng)激烈的時(shí)代,消費(fèi)者渴望更便捷、流暢的購(gòu)物體驗(yàn)。作為中國(guó)最大的社交平臺(tái),擁有龐大的用戶基礎(chǔ);淘寶則是電商巨頭,提供豐富的商品資源。通過(guò)將小程序與淘寶API無(wú)縫整
    的頭像 發(fā)表于 07-29 14:35 ?683次閱讀
    <b class='flag-5'>微</b><b class='flag-5'>信</b>小程序+淘寶API,無(wú)縫購(gòu)物體驗(yàn)提升復(fù)購(gòu)率!

    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐

    Triton是由OpenAI開發(fā)的一個(gè)開源編程語(yǔ)言和編譯器,旨在簡(jiǎn)化高性能GPU內(nèi)核的編寫。它提供了類似Python的語(yǔ)法,并通過(guò)高級(jí)抽象降低了GPU編程的復(fù)雜性,同時(shí)保持了高性能。目前
    的頭像 發(fā)表于 07-15 09:04 ?1880次閱讀
    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的<b class='flag-5'>Triton</b>算子編譯器實(shí)踐

    使用NVIDIA TritonTensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    針對(duì)基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA TritonTensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?1884次閱讀
    使用NVIDIA <b class='flag-5'>Triton</b>和<b class='flag-5'>TensorRT</b>-LLM部署TTS應(yīng)用的最佳實(shí)踐

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來(lái)后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr識(shí)別訓(xùn)練數(shù)據(jù)集 請(qǐng)問(wèn)訓(xùn)練id是?
    發(fā)表于 05-28 06:46

    高能耗時(shí)代,安科瑞能量管理系統(tǒng)如何化解電網(wǎng)能量管理難題?

    電網(wǎng)技術(shù)的提出,為高效利用這些新能源電力提供了重要的技術(shù)方向。? 一、高能耗時(shí)代,電網(wǎng)能量管理面臨哪些挑戰(zhàn)? 在當(dāng)今高能耗時(shí)代,電網(wǎng)能量管理正面臨著諸多嚴(yán)峻挑戰(zhàn),這些挑戰(zhàn)猶如一道道
    的頭像 發(fā)表于 04-01 16:12 ?780次閱讀
    高能<b class='flag-5'>耗時(shí)</b>代,安科瑞能量管理系統(tǒng)如何化解<b class='flag-5'>微</b>電網(wǎng)能量管理難題?