91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用Python把圖片變成文字

Wildesbeast ? 來源:今日頭條 ? 作者:玩物有智 ? 2020-02-15 14:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為什么要讓孩子學(xué)編程?看了這篇文章,你就知道編程的強(qiáng)大之處了!

你遇到以下的情況嗎?

你負(fù)責(zé)整理一些文件,結(jié)果發(fā)現(xiàn)文件沒有word存檔,這又需要我們把圖片變成word。

或者是在今日頭條上看到了某片好文章,結(jié)果內(nèi)容卻是圖片,你特別想把他變成文字分享給朋友。

如果你遇到過這些問題,千萬不要錯過 pytesseract 這個好工具!它能夠用很簡單、基礎(chǔ)的方法將圖片轉(zhuǎn)換成文字(分辨圖片中的文字)。在我們開始介紹 pytesseract 這個 Python 模塊之前,先來認(rèn)識一下 Tesseract OCR 到底是什么吧!

OCR 與 Tesseract

OCR 為光學(xué)文字識別的縮寫(Optical Character Recognition,OCR),白話一點就是將圖片翻譯為文字。而 Tesseract 是一個 OCR 模組,目前由 Google 贊助。Tesseract 已經(jīng)有 30 年歷史,一開始它是惠普實驗室的一款專利軟體,于 2005 年開源,從 2006 年后由 Google 贊助進(jìn)行后續(xù)的開發(fā)和維護(hù), Tesseract 也是目前公認(rèn)最優(yōu)秀、最精準(zhǔn)的開源 OCR 系統(tǒng)。

除了極高的精準(zhǔn)度外,Tesseract 也有很高的靈活性,能夠通過訓(xùn)練識別出任何字體(只要這些字體的風(fēng)格不變就可以),也能識別出任何 Unicode 字符,是不是非常厲害呢?我們待會會用到的 pytesseract 模塊就像是Tesseract的 python 包。

下面讓我們來動手嘗試下:

第一步 安裝模塊

pip3 install pillowpip3 install pytesseract

第二步 編寫程序

from PIL import Imageimport pytesseractimg = Image.open('test1.png')text = pytesseract.image_to_string(img, lang='eng')print(text)

首先,第一行和第二行是將我們剛剛安裝的模塊導(dǎo)入到程序中。

PIL 包含在剛剛安裝的 pillow 模組,其中的 Image 模組能夠讀取圖片檔。

我們將想要轉(zhuǎn)成文字的圖片檔,放在和這支程式相同的目錄。

第四行的 'test1.png' 是相對于這個程序(.py文件)的路徑,也就是該圖片的文件名,因此必須放在同一個資料夾程序才找得到文件,而且文件名與路徑名都是不可省略的。

所有辨識文字、轉(zhuǎn)換的複雜過程全部都寫在 pytesseract 中了,我們只需要知道如何調(diào)用即可。接著看到第五行,image_to_string函式有一個關(guān)鍵字引數(shù) lang,默認(rèn)是英文,可以改變成你想要的語言字串。

結(jié)語

簡單暴力,5行代碼就可以將圖片轉(zhuǎn)化為文字,是不是很方便呢?除了生活中的一些小問題能用 pytesseract 解決,在開發(fā)爬蟲程序時,經(jīng)常會遇到需要驗證碼的情況,這時就能利用這個模塊輕松解決。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • word
    +關(guān)注

    關(guān)注

    1

    文章

    79

    瀏覽量

    22771
  • Unicode
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    12921
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90078
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    瑞芯微(EASY EAI)RV1126B OCR文字識別

    1.OCR文字識別簡介文字識別也是圖像領(lǐng)域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進(jìn)行文字的識別。所以一般包含兩個步驟:
    的頭像 發(fā)表于 01-12 10:19 ?5837次閱讀
    瑞芯微(EASY EAI)RV1126B OCR<b class='flag-5'>文字</b>識別

    釘釘正式開源HarmonyOS圖片編輯組件

    ArkTS語言開發(fā),提供了畫板、馬賽克、裁剪、文字四大核心圖像處理能力,助力開發(fā)者以低代碼成本、高集成效率,為應(yīng)用構(gòu)建功能完整、交互流暢的圖片編輯體驗。
    的頭像 發(fā)表于 01-05 09:58 ?511次閱讀

    1688拍立淘圖片搜索API概述

    圖片批量搜索。 數(shù)據(jù)維度:返回商品 ID、價格、銷量、供應(yīng)商資質(zhì)等全維度信息。 2.請求地址:c0b.cc/R4rbK2 。 3.Python 調(diào)用建議 雖然無法提供完整代碼,但調(diào)用流程通常包括: 圖片預(yù)處理(壓縮、格式轉(zhuǎn)換)。
    的頭像 發(fā)表于 12-17 14:56 ?385次閱讀

    沒有專利的opencv-python 版本

    費用于商業(yè)產(chǎn)品,僅需保留版權(quán)聲明); 包含所有核心功能:圖片讀取/處理、視頻讀寫、繪圖、形態(tài)學(xué)操作、邊緣檢測(Canny)、閾值分割、輪廓檢測等,滿足 90%+ 開發(fā)場景; 適配 Python 3.13,安裝
    發(fā)表于 12-13 12:37

    Termux中調(diào)試圣誕樹Python代碼

    在Termux中調(diào)試Python代碼(以圣誕樹立例)非常簡單,核心分為環(huán)境準(zhǔn)備、代碼編寫、運行調(diào)試三個步驟,下面一步步教你操作: 一、環(huán)境準(zhǔn)備(首次使用需做) Termux默認(rèn)可能沒有Python
    發(fā)表于 12-09 09:02

    商品圖片批量上傳接口設(shè)計與實現(xiàn)

    設(shè)計、實現(xiàn)步驟、代碼示例、錯誤處理和性能優(yōu)化。文章基于Python Flask框架,確保內(nèi)容真實可靠,適合開發(fā)者快速上手。 1. 接口設(shè)計概述 一個標(biāo)準(zhǔn)的商品圖片批量上傳接口應(yīng)遵循RESTful原則,使用HTTP POST方法。關(guān)鍵設(shè)計點包括: 端點定義:例
    的頭像 發(fā)表于 10-13 15:25 ?452次閱讀

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植

    參數(shù)中填上dec模型的路徑,在第三個參數(shù)中填上rec模型的路徑,在第四個參數(shù)中填上需要進(jìn)行文字識別的源圖片: 看看效果: RK3588s開發(fā)板上面成功運行,但是RK3576開發(fā)板上的librknnrt.so文件版本不匹配,因此無法正常運行...這個問題只能等待瑞芯微
    發(fā)表于 08-18 16:57

    python app不能運行怎么解決?

    ;python_agent[1241]: xmlrpc request method supervisor.stopProcess failed;python_agent[1241]: xmlrpc request method supervisor.stopProces
    發(fā)表于 08-06 06:27

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,這個url和token再發(fā)給百度的ocr接口獲取識別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后這個base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請求的
    發(fā)表于 06-30 18:07

    HarmonyOS實戰(zhàn):一招搞定保存圖片到相冊

    保存圖片功能幾乎是每個應(yīng)用程序必備的功能之一,當(dāng)用戶遇到喜歡的圖片時可以保存到手機(jī)相冊。那么在鴻蒙中保存圖片是否也需要申請用戶存儲權(quán)限以及如何將圖片保存到相冊,本文將詳細(xì)講述怎么保存網(wǎng)
    的頭像 發(fā)表于 06-24 17:04 ?1272次閱讀

    Hi3861 wifiiot_hispark_pegasus 按教程安裝python3 -m pip install build/lite 報錯

    問題1: 報錯: 問題2: 我安裝網(wǎng)上搜的方法執(zhí)行 python3 -m pip install --user ohos-build==0.4.3 hb -v [OHOS INFO] hb
    發(fā)表于 06-14 16:48

    現(xiàn)在有一個三維數(shù)組rgb,怎么通過k230他轉(zhuǎn)變成圖片顯示出來?

    現(xiàn)在有一個三維數(shù)組rgb,怎么通過k230他轉(zhuǎn)變成圖片顯示出來
    發(fā)表于 06-10 08:17

    labview語音轉(zhuǎn)文字

    labview語音轉(zhuǎn)文字怎么實現(xiàn),目前在論壇上找到了文字轉(zhuǎn)語音
    發(fā)表于 04-07 19:44

    如何在熱敏打印機(jī)中實現(xiàn)圖片的灰階打印效果嗎?

    誰知道如何在熱敏打印機(jī)中實現(xiàn)圖片的灰階打印效果。 現(xiàn)在基本上文字打印,圖片打印功能都已開發(fā)結(jié)束,圖片打印現(xiàn)在用的是點陣打印的方法。想增加灰階打印的效果。 有哪個大神做過相關(guān)方面開發(fā),知
    發(fā)表于 04-03 08:40

    零基礎(chǔ)入門:如何在樹莓派上編寫和運行Python程序?

    在這篇文章中,我將為你簡要介紹Python程序是什么、Python程序可以用來做什么,以及如何在RaspberryPi上編寫和運行一個簡單的Python程序。什么是Python程序?
    的頭像 發(fā)表于 03-25 09:27 ?2059次閱讀
    零基礎(chǔ)入門:如何在樹莓派上編寫和運行<b class='flag-5'>Python</b>程序?