91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在dify中搭建OCR智能體

perfxlab ? 來源:澎峰科技 ? 2025-06-27 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OCR 智能體應(yīng)用背景

企業(yè)在日常運(yùn)營中面臨合同、票據(jù)、手寫筆記等多種文檔的處理需求,這些文檔常以圖片或掃描件形式存在,文字提取困難,嚴(yán)重制約數(shù)字化管理效率。

為解決上述問題,本文介紹一套簡單高效的解決方案:通過 dify 工作流快速搭建 OCR 智能體,進(jìn)行文字識別。

先來看一下搭建好的工作流使用流程:用戶上傳待識別的圖片或文檔,工作流會調(diào)用本地部署的 OCR 服務(wù)完成識別工作,并將提取的內(nèi)容轉(zhuǎn)換成 Markdown 文檔。

OCR 智能體搭建流程

step1:本地部署 dify

因?yàn)槲覀円ㄟ^工作流的方式使用 OCR 服務(wù),因此需要現(xiàn)在本地完成 dify 的部署,部署流程相對簡單,直接參考 dify 官方文檔(https://github.com/langgenius/dify)即可,推薦使用 docker 進(jìn)行部署。

step2:在 dify 插件市場中,安裝澎峰科技“OCR 識別服務(wù)”插件

本文中介紹的 OCR 工具,我們已發(fā)布到 dify 的插件市場,源代碼可在 github 項(xiàng)目主頁(https://github.com/PerfXLab/dify-plugin-ocr-service)找到,要在 dify 中使用該工具,只需在插件市場中搜索“OCR”并安裝該插件即可:

step3:在 dify 中搭建工作流,并引入 OCR 工具

1.在 dify 中“創(chuàng)建空白應(yīng)用”,選擇“工作流”

2.對工作流進(jìn)行編排:

開始節(jié)點(diǎn)中加入“file”字段

“OCR 轉(zhuǎn) Markdown 工具”節(jié)點(diǎn)中填入相關(guān)信息

其中,“上傳文件”中填入“開始”節(jié)點(diǎn)輸出的內(nèi)容,OCR 接口地址填入本地搭建的 OCR 服務(wù),OCR 服務(wù)本地搭建將在下一步驟中介紹- “結(jié)束”節(jié)點(diǎn)中填入上一節(jié)點(diǎn)輸出的文件

step4:在本地搭建 OCR 服務(wù)

目前 OCR 任務(wù)主流實(shí)現(xiàn)方案有兩種:使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型或多模態(tài)大模型進(jìn)行處理,前者識別速度快、消耗資源少,而后者識別精度和魯棒性更好,但對算力要求較高。本文介紹一種基于卷積神經(jīng)網(wǎng)絡(luò)的方案,利用第三方工具快速在本地運(yùn)行。

搭建流程:

1.安裝第三方OCR服務(wù):pip install marker-pdf[full]

2.安裝API服務(wù):pip install -U uvicorn fastapi python-multipart

3.啟動OCR服務(wù):marker_server --host 0.0.0.0 --port 8001

完成上述操作后,即可使用 dify 工作流進(jìn)行 OCR 識別服務(wù)。

私有化部署方案:澎峰科技大模型一體機(jī)

前述方案采用的輕量化模型,優(yōu)勢在于資源消耗低,在 CPU 環(huán)境下即可流暢運(yùn)行。然而,對于金融、法律等領(lǐng)域中,部分文檔的識別精準(zhǔn)度和版面還原度有更高要求的場景,采用多模態(tài)大模型進(jìn)行處理會是更優(yōu)選擇。多模態(tài)大模型雖然能帶來更高的識別精度與魯棒性,但其對算力資源的要求也相應(yīng)更高。

為滿足企業(yè)對高性能、數(shù)據(jù)私有化的需求,澎峰科技推出DeepFusion 系列 AI 一體機(jī),為企業(yè)智能化轉(zhuǎn)型提供一站式本地化部署解決方案。

該方案深度融合了業(yè)界領(lǐng)先的 DeepSeek、Qwen 等系列大模型,確保企業(yè)數(shù)據(jù)在本地處理,安全無虞,完美適配復(fù)雜的辦公自動化、數(shù)據(jù)分析與智能客服等場景。

旗艦性能,應(yīng)對復(fù)雜需求:目前已發(fā)布的 DeepFusion DF110、DF210 一體機(jī),支持部署 DeepSeek 滿血版、Qwen3-235B 等尖端大模型,推理性能強(qiáng)勁,能夠從容應(yīng)對最復(fù)雜的辦公需求。

高性價(jià)比,賦能中小企業(yè):我們深知,高效的AI應(yīng)用同樣可以在中小規(guī)模模型上實(shí)現(xiàn)。為此,澎峰科技推出了 DeepFusion DF50 一體機(jī)。該機(jī)型針對 30B 及以下規(guī)模的高效模型進(jìn)行了深度推理優(yōu)化,實(shí)現(xiàn)了卓越性能與高性價(jià)比的平衡,旨在助力更多中小企業(yè)輕松實(shí)現(xiàn) AI 轉(zhuǎn)型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    469

    瀏覽量

    11604
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    175

    瀏覽量

    17198
  • 澎峰科技
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    3696

原文標(biāo)題:使用澎峰科技OCR識別服務(wù)插件,在dify中搭建OCR智能體

文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    17|部署Dify-Dify 開發(fā):AI Agent 進(jìn)階實(shí)戰(zhàn)-極客時(shí)間

    從經(jīng)濟(jì)角度看,為什么 AI Agent 開發(fā)者必須學(xué)習(xí) Dify 在當(dāng)今快速發(fā)展的技術(shù)環(huán)境,人工智能(AI)技術(shù)已成為各行各業(yè)的核心驅(qū)動力。從自動化服務(wù)到智能數(shù)據(jù)分析,AI 正在改變
    的頭像 發(fā)表于 02-28 18:55 ?19次閱讀

    藝開放平臺鴻蒙智能版本管理

    智能的版本管理功能,包括查看、回退到歷史版本。版本記錄包括智能上下架及撤回審核時(shí)的版本。 查看歷史版本 點(diǎn)擊
    發(fā)表于 02-27 19:18

    歡迎使用中國香河英茂科工豆包智能

    中國香河英茂科工 - 豆包智能 創(chuàng)建分身,分兩種:AI智能分身(替你干活) 和數(shù)字人分身(替你出鏡),零基礎(chǔ)也能快速上手。 ? 一、AI智能分身(替你思考/干活) 適合:一人公司、客
    發(fā)表于 02-14 07:22

    鴻蒙智能上/下架、升級流程介紹

    先完成檢查清單待完成項(xiàng)后方可發(fā)起。 上下架操作&權(quán)限管控: 方式1:開發(fā)者可通過智能編排頁面內(nèi)右上角【上架】/【升級】按鈕發(fā)起審核。 方式2:開發(fā)者可通過【工作空間】-【智能
    發(fā)表于 02-10 10:38

    開發(fā)智能調(diào)試與預(yù)覽---真機(jī)測試

    重新啟動小藝,在對話列表中看到“開發(fā)”標(biāo)簽的智能。 4、發(fā)布真機(jī)測試后,智能的開發(fā)態(tài)15天內(nèi)有效(即端側(cè)可見“開發(fā)
    發(fā)表于 02-09 15:37

    工業(yè)級OCR手持終端怎么選?國產(chǎn)OCR智能識別pda實(shí)測

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時(shí)輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學(xué)設(shè)計(jì),讓高強(qiáng)度數(shù)據(jù)采集更
    的頭像 發(fā)表于 02-07 17:45 ?203次閱讀
    工業(yè)級<b class='flag-5'>OCR</b>手持終端怎么選?國產(chǎn)<b class='flag-5'>OCR</b><b class='flag-5'>智能</b>識別pda實(shí)測

    開發(fā)智能配置-內(nèi)容合規(guī)

    智能上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能【配置】-【內(nèi)容合規(guī)】
    發(fā)表于 02-07 11:44

    小藝開放平臺鴻蒙智能開發(fā)智能配置-基礎(chǔ)信息

    創(chuàng)建智能后,開發(fā)者可以進(jìn)入智能配置頁面對智能基礎(chǔ)信息進(jìn)行編輯。支持編輯
    發(fā)表于 02-02 16:47

    手把手教你用聆思CSK6大模型開發(fā)板接入Dify智能進(jìn)行語音交互

    Dify 是一個(gè)開源的LLM(大語言模型)應(yīng)用開發(fā)平臺,其定位是打造以可視化和低代碼/零代碼為核心的一站式AI應(yīng)用開發(fā)解決方案。它融合了后端即服務(wù)與LLMOps的理念,支持快速構(gòu)建、部署和管理基于大語言模型的應(yīng)用程序。
    的頭像 發(fā)表于 11-02 09:36 ?1928次閱讀
    手把手教你用聆思CSK6大模型開發(fā)板接入<b class='flag-5'>Dify</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>進(jìn)行語音交互

    從大模型到智能:企業(yè)級智能如何搭建

    企業(yè)智能的構(gòu)建是一個(gè)系統(tǒng)工程,需要從戰(zhàn)略規(guī)劃、技術(shù)選型到組織變革的全方位設(shè)計(jì)。古河云科技將從理論框架出發(fā),系統(tǒng)闡述企業(yè)構(gòu)建專屬智能的完整路徑。 一、
    的頭像 發(fā)表于 07-21 15:46 ?951次閱讀
    從大模型到<b class='flag-5'>智能</b><b class='flag-5'>體</b>:企業(yè)級<b class='flag-5'>智能</b><b class='flag-5'>體</b>如何<b class='flag-5'>搭建</b>

    何在MATLAB構(gòu)建智能語音助手

    具身智能是一種將智能與物理實(shí)體深度融合的人工智能形態(tài),強(qiáng)調(diào)智能行為既依賴智能自身算力,更離不開
    的頭像 發(fā)表于 06-30 14:30 ?3060次閱讀
    如<b class='flag-5'>何在</b>MATLAB<b class='flag-5'>中</b>構(gòu)建<b class='flag-5'>智能</b>語音助手

    告別“人工智障”:工業(yè)AI智能的進(jìn)化三定律

    文章主要講述了工業(yè)AI智能在工業(yè)生產(chǎn)中的應(yīng)用,如智能在焊接、生產(chǎn)過程的自動化,以及如何通過AI智能
    的頭像 發(fā)表于 06-09 10:47 ?640次閱讀
    告別“人工智障”:工業(yè)AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>的進(jìn)化三定律

    Dify攜手亞馬遜云科技加速全球企業(yè)生成式AI應(yīng)用規(guī)模化落地

    簡單易用的AI應(yīng)用開發(fā)平臺Dify通過深度集成亞馬遜云科技的生成式AI技術(shù)與云服務(wù),在保障性能、合規(guī)與全球交付的基礎(chǔ)上,顯著降低企業(yè)在生成式AI應(yīng)用開發(fā)的技術(shù)門檻和部署成本。此外,依托亞馬遜云
    的頭像 發(fā)表于 06-07 16:00 ?859次閱讀

    學(xué)習(xí)智能開發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí),這本書太及時(shí)了,非常想看看。
    發(fā)表于 03-27 15:48