91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

關于Halcon OCR識別

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2021-05-11 09:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OCR(Optical Character Recognition),光學字符識別的英文縮寫。

OCR主要步驟

圖像預處理

目標區(qū)域分割(ROI)

字符識別

結果處理

1. 圖像預處理

對原始圖像進行灰度化,二值化,模板匹配,降噪,增強等!

2.目標區(qū)域分割(ROI)

對預處理后的圖像進行ROI提取,分割出單個字符組成的區(qū)域

3.字符識別,即模式識別技術

訓練OCR,利用大量的模板圖片訓練出一個字符分類器

使用OCR,將訓練好的分類器用于字符分類,類似于手寫數(shù)字識別!

4.結果處理

將識別完的文字按特定的次序和規(guī)則組合輸出!

上述4個步驟中,OCR的核心部分自然是第3步,即模式識別技術

模式識別技術

訓練分類器

第一步:將分割好的字符區(qū)域加入訓練集,使用函數(shù)

append_ocr_trainf(Character,Image::Class,TrainingFile:)

參數(shù)解析:

Character:字符區(qū)域

Image:灰度圖像

Class:分類標簽

TrainingFile:訓練集文件名,一般后綴為.trf

功能說明:用于制作訓練集,使用與TrainingFile文件相同的訓練文件格式,將字符附加到現(xiàn)有文件。如果該文件不存在,則生成新文件。TrainingFile如果未指定擴展名,則默認添加擴展名.trf

第二步:創(chuàng)建分類器,使用函數(shù)

create_ocr_class_mlp(::WidthCharacter, HeightCharacter,Interpolation,F(xiàn)eatures,Characters,NumHidden,Preprocessing,NumComponents,RandSeed:OCRHandle)

參數(shù)解析:

WidthCharacter:輸入被分割的字符縮放到指定的寬度

HeightCharacter:輸入被分割的字符縮放到指定的高度

Interpolation:縮放的插值方式

Features:特征類型,一般選’default’

Characters:分類的特征向量

NumHidden: MLP(多層感知器-人工神經(jīng)網(wǎng)絡)中隱藏層神經(jīng)元的個數(shù)

Preprocessing:矢量特征轉(zhuǎn)換的預處理類型

NumComponents:匹配字符的數(shù)量

RandSeed:隨機種子

OCRHandle:OCR分類器的句柄

功能說明:創(chuàng)建一個MLP模型并初始化

第三步:訓練、保存、清除分類器,使用函數(shù)

trainf_ocr_class_mlp(::OCRHandle,TrainingFile,MaxIterations,WeightTolerance,ErrorTolerance:Error,ErrorLog) write_ocr_class_mlp(::OCRHandle,F(xiàn)ileName:) clear_ocr_class_mlp(:)

訓練MLP分類器參數(shù)解析:

OCRHandle:OCR分類器的句柄

TrainingFile:訓練集

MaxIterations:最大迭代次數(shù)

WeightTolerance:初始權重公差

ErrorTolerance:初始損失學習率

Error:整個訓練集上的均差

ErrorLog:每一次訓練的均差記錄

功能說明:使用訓練集訓練模型,

保存分類器模型參數(shù)解析:

FileName:輸出的模型文件名,不指定擴展名,則擴展名默認為.omc

功能說明:將訓練好的模型保存為文件

清除分類器模型功能說明:清除模型,釋放緩存

使用分類器

讀取、使用訓練好的模型分類的函數(shù)如下:

read_ocr_class_mlp(:OCRHandle) do_ocr_single_class_mlp(Character,Image::OCRHandle,Num:Class,Confidence) do_ocr_multi_class_mlp(Character,Image:Class,Confidence)

讀取模型函數(shù)參數(shù)解析:

FileName:模型文件名,如果未指定擴展名,則默認使用擴展名.omc

OCRHandle:成功讀取模型后生成的模型句柄

功能說明:從模型文件中讀出模型

模型單個字符識別參數(shù)解析:

Character:字符區(qū)域

Image:字符圖片

Num:輸出概率最大的前Num個分類類別

Class:輸出類別

Confidence:輸出分類的置信度

功能說明:對單個區(qū)域進行的字符識別

模型多個字符識別參數(shù)解析:

Class:輸出的分類數(shù)組

功能說明:輸出多個字符區(qū)域的類別

其它函數(shù)

獲取訓練集信息:

read_ocr_trainf_names (: CharacterNames, CharacterCount)

參數(shù)解析:

TrainingFile:訓練集

CharacterNames:輸出分類數(shù)組

CharacterCount:訓練集字符區(qū)域總數(shù)

完整示例代碼如下(僅作為代碼示例,無法運行):

WindowHandle:=3600 dev_open_window (0, 0, 512, 512, ‘black’, WindowHandle) gen_empty_obj (EmptyObject) read_image (Image, ‘test1.jpg’) rgb1_to_gray (Image, GrayImage) for Index := 1 to 4 by 1 disp_message (WindowHandle, ‘手動ROI’,‘window’, 12, 12, ‘yellow’, ‘false’) draw_rectangle1 (WindowHandle, Row1, Column1, Row2, Column2) gen_rectangle1 (Rectangle, Row1, Column1, Row2, Column2) reduce_domain (GrayImage, Rectangle, ImageReduced1) threshold (ImageReduced1, Region1, 128, 255) concat_obj (EmptyObject, Region1, EmptyObject) endfor words:=[‘1’,‘2’,‘3’,‘4’] *按列位置排序 sort_region (EmptyObject, SortedRegions1, ‘character’, ‘true’, ‘column’) FontName := ‘F:DataSetNum’ TrainingFileName := FontName+‘.trf’ for Index1:=1 to 4 by 1 select_obj (SortedRegions1, ObjectSelected1, Index1) append_ocr_trainf (ObjectSelected1, Image, words[Index1-1], TrainingFileName) endfor read_ocr_trainf_names (TrainingFileName, CharacterNames, CharacterCount) create_ocr_class_mlp (8, 10, ‘constant’, ‘default’, CharacterNames, 80, ‘none’, 10, 42, OCRHandle) trainf_ocr_class_mlp (OCRHandle, TrainingFileName, 200, 1, 0.01, Error, ErrorLog) write_ocr_class_mlp (OCRHandle, FontName) *導入另一張做測試的圖 read_image (Image1, ‘test2.jpg’) threshold (Image1, testwordregion, 125, 255) connection (testwordregion, ConnectedwordRegions) select_shape (ConnectedwordRegions, SelectedwordRegions, ‘height’, ‘a(chǎn)nd’, 50, 250) sort_region (SelectedwordRegions, SortedRegions2, ‘upper_left’, ‘true’, ‘column’) count_obj(SortedRegions2, Number) *開始識別 read_ocr_class_mlp (FontName, OCRHandle1) do_ocr_multi_class_mlp (SortedRegions2, Image1, OCRHandle1, Class, Confidence) *顯示結果 disp_message(WindowHandle, ‘識別結果:’, ‘image’, 30, 50, ‘white’, ‘false’) for i:=1 to Number by 1 disp_message(WindowHandle, Class[i-1], ‘image’, 30, 120+40*i, ‘yellow’, ‘false’) endfor

Halcon的OCR模型主要有多層神經(jīng)網(wǎng)絡MLP、支持向量機SVM、K最近鄰KNN、卷積神經(jīng)網(wǎng)絡CNN四種,以上關于MLP的各類函數(shù),其它模型也有對應的函數(shù),這里就不作詳細介紹了。在OCR領域,CNN和MLP應用比較廣泛,而SVM在打印體的識別上也可以使用,KNN的計算量和模型原理并不適合用于多屬性(點)的算法訓練!

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 光學
    +關注

    關注

    4

    文章

    867

    瀏覽量

    38119
  • OCR
    OCR
    +關注

    關注

    0

    文章

    175

    瀏覽量

    17203
  • 識別技術
    +關注

    關注

    0

    文章

    211

    瀏覽量

    20416

原文標題:Halcon OCR識別

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    工業(yè)級OCR手持終端怎么選?國產(chǎn)OCR智能識別pda實測

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學設計,讓高強度數(shù)據(jù)采集更輕松。點擊查看詳細防護測試與續(xù)航實測數(shù)據(jù)!
    的頭像 發(fā)表于 02-07 17:45 ?227次閱讀
    工業(yè)級<b class='flag-5'>OCR</b>手持終端怎么選?國產(chǎn)<b class='flag-5'>OCR</b>智能<b class='flag-5'>識別</b>pda實測

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規(guī)?;母咝阅?OCR 能力

    一、行業(yè)背景與核心挑戰(zhàn):OCR 規(guī)?;瘧玫年P鍵瓶頸 **隨著文檔識別技術的不斷成熟,OCR 技術已從實驗性階段逐步走向?qū)嶋H業(yè)務場景,在政務、金融、制造、物流等多個行業(yè)中得到廣泛應用。然而,在規(guī)?;?/div>
    的頭像 發(fā)表于 01-22 21:02 ?162次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規(guī)模化的高性能 <b class='flag-5'>OCR</b> 能力

    瑞芯微(EASY EAI)RV1126B OCR文字識別

    1.OCR文字識別簡介文字識別也是圖像領域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進行文字的識別。所以一般包含兩個步驟:文字檢測:解決的問題是哪里有文
    的頭像 發(fā)表于 01-12 10:19 ?5772次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字<b class='flag-5'>識別</b>

    識別身份證和護照OCR識別的手持終端設備

    鳥鳥科技N70S身份證護照識別手持終端設備,集成身份證、護照OCR識別及生物核驗功能,工業(yè)級IP67三防設計+高性能配置,支持多場景移動辦公,續(xù)航持久、掃碼精準,是執(zhí)法、海關、醫(yī)療等行業(yè)提升身份核驗效率的優(yōu)選神器。
    的頭像 發(fā)表于 01-06 11:57 ?245次閱讀
    能<b class='flag-5'>識別</b>身份證和護照<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>的手持終端設備

    【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)

    OCR OCR(Optical Character Recognition,光學字符識別)是一種將圖像中的文字內(nèi)容轉(zhuǎn)換為可編輯、可搜索文本的技術。其核心在于通過圖像預處理、字符分割、特征提取與模式
    發(fā)表于 08-23 18:53

    如何利用OCR技術實現(xiàn)高效集裝箱箱號識別?

    在現(xiàn)代物流和海關監(jiān)管領域,快速準確地識別集裝箱箱號是提升通關效率、降低運營成本的關鍵。OCR(光學字符識別)技術的應用,為這一需求提供了智能化解決方案。通過結合高清成像設備和先進的算法,OCR
    的頭像 發(fā)表于 08-12 10:48 ?864次閱讀
    如何利用<b class='flag-5'>OCR</b>技術實現(xiàn)高效集裝箱箱號<b class='flag-5'>識別</b>?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個url和token再發(fā)給百度的ocr接口獲取識別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請求的數(shù)據(jù)長度有限
    發(fā)表于 06-30 18:07

    OCR技術如何實現(xiàn)鐵路集裝箱號的自動識別

    在鐵路物流運輸中,集裝箱號的快速準確識別是提升效率的關鍵環(huán)節(jié)。通過先進的OCR(光學字符識別)技術,結合計算機視覺與深度學習方法,可以實現(xiàn)鐵路集裝箱號的高效、可靠識別。 一、
    的頭像 發(fā)表于 06-13 10:32 ?647次閱讀

    OCR技術vs傳統(tǒng)識別:哪種更適合火車集裝箱識別?

    在鐵路物流領域,集裝箱箱號識別是提升運輸效率的關鍵環(huán)節(jié)。隨著計算機視覺技術的發(fā)展,OCR識別與傳統(tǒng)識別技術在火車集裝箱場景中的應用差異日益明顯。 傳統(tǒng)
    的頭像 發(fā)表于 06-11 10:54 ?619次閱讀

    明治案例 | 150個/分鐘!電阻【OCR識別】+【尺寸測量】一步到位

    真實案例——看明治傳感如何用一個視覺傳感器,同時搞定電阻的尺寸測量和OCR識別,讓質(zhì)檢效率翻倍,成本直降!場景需求希望在同一工位完成尺寸測量與OCR識別,減少設備占
    的頭像 發(fā)表于 06-10 07:33 ?796次閱讀
    明治案例 | 150個/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】+【尺寸測量】一步到位

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr
    發(fā)表于 05-28 06:46

    大模型預標注和自動化標注在OCR標注場景的應用

    OCR,即光學字符識別,簡單來說就是利用光學設備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學字符
    的頭像 發(fā)表于 04-15 15:18 ?945次閱讀

    阿普奇視覺控制器AK7在OCR識別場景中的應用

    在實際工業(yè)生產(chǎn)中,OCR(光學字符識別)技術的應用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領域幫助企業(yè)完成產(chǎn)品編碼、生產(chǎn)日期、批號等字符信息自動識別,對于避免因出現(xiàn)瑕疵、錯漏等情況而
    的頭像 發(fā)表于 03-20 11:44 ?772次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>場景中的應用