91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分享一款批量將PDF文件轉(zhuǎn)換為Word的神器

工程師鄧生 ? 來(lái)源:Python愛好者集中營(yíng) ? 作者:欣一 ? 2022-09-01 17:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無(wú)論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問(wèn)題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,也就是說(shuō)從只讀轉(zhuǎn)換成可編輯的格式。網(wǎng)上絕大多數(shù)的工具也都是收費(fèi)的,今天小編就給大家制作了一款批量將PDF文件轉(zhuǎn)換為Word的神器,使用起來(lái)也是相當(dāng)?shù)姆奖恪?br />
實(shí)現(xiàn)效果

我們首先來(lái)看一下出來(lái)的效果,如下圖所示

6027737a-29d6-11ed-ba43-dac502259ad0.gif



618fe468-29d6-11ed-ba43-dac502259ad0.png

61c0cd08-29d6-11ed-ba43-dac502259ad0.png

環(huán)境準(zhǔn)備

用到的模塊叫做pdf2docx,我們通過(guò)pip命令進(jìn)行下載,如下

pip install pdf2docx

后續(xù)我們還可以為py文件打包,用到的庫(kù)是pyinstaller

pip install pyinstaller


代碼實(shí)現(xiàn)

我們先簡(jiǎn)單地實(shí)現(xiàn)將單個(gè)PDF文檔轉(zhuǎn)換成Word文檔,代碼如下

pYYBAGMQfMWAKCJIAAA5iyss-GA794.jpg

那么上面的是單個(gè)PDF文件,要是涉及到是多個(gè)PDF文件,則需要用到遍歷上傳過(guò)來(lái)的每一個(gè)文件,用到for循環(huán)遍歷

def startAction(self):
output_path_1 = Path.joinpath(Path.home(), "Desktop")
output_path_2 = str(output_path_1) + "\\output"
if not os.path.exists(output_path_2):
os.mkdir(output_path_2)

for path_list in pdfPath_list:
print("路徑: ", path_list)
name = path_list.split("/")[-1].split(".")[0]
cv = Converter(path_list)
cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
cv.close()

msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
msg_box.exec_()

上述的代碼,我們首先將指定好輸出的Word文檔的位置,這里小編設(shè)置的是在桌面,然后通過(guò)for循環(huán)去遍歷處理每一個(gè)PDF文檔,當(dāng)所有的步驟都完成的時(shí)候,提示我們已經(jīng)完成了。

當(dāng)然整個(gè)可視化界面當(dāng)中還有一個(gè)上傳文件的功能,代碼如下

# 選擇本地文件上傳
def uploadFiles(self):
global pdfPath_list # 這里為了方便別的地方引用文件路徑,將其設(shè)置為全局變量
pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)")
# 顯示所選文件的路徑
self.ui.lineEdit.setText(",".join(pdfPath_list))

整體的代碼如下所示

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
def __init__(self):
self.ui = QUiLoader().load('pdf2word.ui')
self.ui.pushButton.clicked.connect(self.uploadFiles)
self.ui.pushButton_2.clicked.connect(self.startAction)

def uploadFiles(self):
........
........

def startAction(self):
.......
.......

if __name__ == '__main__':
app = QApplication([])
# 顯示創(chuàng)建的界面
MainWindow = OCRQt() # 創(chuàng)建窗體對(duì)象
MainWindow.ui.show() # 顯示窗體
app.exit(app.exec_()) # 程序關(guān)閉時(shí)退出進(jìn)程


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • PDF
    PDF
    +關(guān)注

    關(guān)注

    1

    文章

    177

    瀏覽量

    36262
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90110

原文標(biāo)題:Python 如何實(shí)現(xiàn)一鍵批量將 PDF 文檔轉(zhuǎn) Word?

文章出處:【微信號(hào):AI科技大本營(yíng),微信公眾號(hào):AI科技大本營(yíng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    74AVC4T245:一款多功能的4位雙電源電平轉(zhuǎn)換

    多種電平轉(zhuǎn)換需求的優(yōu)秀產(chǎn)品。 文件下載: 74AVC4T245-Brief.pdf 、產(chǎn)品概述 74AVC4T245是一款具有三態(tài)輸出和雙
    的頭像 發(fā)表于 03-13 14:00 ?59次閱讀

    MAX16904:一款高性能2.1MHz高壓600mA迷你降壓轉(zhuǎn)換

    的MAX16904,就是一款性能卓越的2.1MHz高壓600mA迷你降壓轉(zhuǎn)換器,下面我們就來(lái)詳細(xì)了解下它的特點(diǎn)、應(yīng)用及設(shè)計(jì)要點(diǎn)。 文件下載: MAX16904.
    的頭像 發(fā)表于 03-11 09:10 ?237次閱讀

    深入剖析 LTM8029:一款高性能降壓 μModule 轉(zhuǎn)換

    深入剖析 LTM8029:一款高性能降壓 μModule 轉(zhuǎn)換器 在電子工程師的日常工作中,電源管理模塊的選擇至關(guān)重要。今天,我們深入探討一款備受關(guān)注的電源管理器件——LTM8029
    的頭像 發(fā)表于 03-10 16:40 ?352次閱讀

    深入剖析LTM8046:一款高性能隔離式μModule轉(zhuǎn)換

    )的LTM8046隔離式μModule轉(zhuǎn)換器,它在工業(yè)傳感器、工業(yè)開關(guān)等領(lǐng)域有著廣泛的應(yīng)用。 文件下載: LTM8046.pdf 、LTM8046概述 LTM8046是
    的頭像 發(fā)表于 03-09 14:45 ?46次閱讀

    ADPL54203:一款高性能的隔離式反激轉(zhuǎn)換

    ADPL54203:一款高性能的隔離式反激轉(zhuǎn)換器 在電子設(shè)計(jì)領(lǐng)域,電源管理直是至關(guān)重要的環(huán)節(jié)。今天,我們要深入探討一款名為ADPL54203的芯片,它是
    的頭像 發(fā)表于 03-02 10:30 ?160次閱讀

    一款模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的高靈敏度、高紅外抑制的環(huán)境光傳感器-WH4517V

    WH4517V是一款模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的設(shè)備,它集成了先進(jìn)的環(huán)境光傳感器、先進(jìn)的接近傳感器以及高效率的紅外線垂直腔面發(fā)射激光器。傳感器和VCSEL的間距僅為2.1毫米,因此非常適合用于小型紅外孔的設(shè)計(jì)。
    的頭像 發(fā)表于 01-08 09:39 ?336次閱讀
    <b class='flag-5'>一款</b><b class='flag-5'>將</b>模擬信號(hào)<b class='flag-5'>轉(zhuǎn)換為</b>數(shù)字信號(hào)的高靈敏度、高紅外抑制的環(huán)境光傳感器-WH4517V

    深入探究 SN65LVELT23:一款高性能的電平轉(zhuǎn)換

    這款 3.3 - V 雙差分 LVPECL/LVDS 到 LVTTL 緩沖轉(zhuǎn)換器,看看它有哪些出色的特性和應(yīng)用場(chǎng)景。 文件下載: sn65lvelt23.pdf 產(chǎn)品概述 SN65LVELT23 是
    的頭像 發(fā)表于 12-25 09:40 ?318次閱讀

    深入剖析AP1509:一款高效的PWM BUCK DC - DC轉(zhuǎn)換

    ,我們要深入探討的是AP1509,一款由Diodes Incorporated推出的150kHz、2A PWM BUCK DC - DC轉(zhuǎn)換器。 文件下載: AP1509.pdf
    的頭像 發(fā)表于 12-17 16:10 ?360次閱讀

    深入解析AP1501:一款高效的PWM BUCK DC/DC轉(zhuǎn)換

    ——一款150KHZ、3A PWM BUCK DC/DC轉(zhuǎn)換器。 文件下載: AP1501.pdf 產(chǎn)品概述 AP1501是一款完全集成的降
    的頭像 發(fā)表于 12-17 16:05 ?500次閱讀

    深入解析ADS8323:一款高性能16位模數(shù)轉(zhuǎn)換

    一款16位、500kSPS的模數(shù)轉(zhuǎn)換器,具有諸多出色的特性和廣泛的應(yīng)用場(chǎng)景。 文件下載: ads8323.pdf 、產(chǎn)品概述 ADS832
    的頭像 發(fā)表于 12-07 10:08 ?975次閱讀
    深入解析ADS8323:<b class='flag-5'>一款</b>高性能16位模數(shù)<b class='flag-5'>轉(zhuǎn)換</b>器

    DAC7573:一款高性能低功耗數(shù)模轉(zhuǎn)換器的深度解析

    低功耗、四通道、12位緩沖電壓輸出DAC。 文件下載: dac7573.pdf 、產(chǎn)品概述 DAC7573是一款專為滿足低功耗應(yīng)用需求而設(shè)計(jì)的數(shù)模
    的頭像 發(fā)表于 12-04 11:26 ?594次閱讀
    DAC7573:<b class='flag-5'>一款</b>高性能低功耗數(shù)模<b class='flag-5'>轉(zhuǎn)換</b>器的深度解析

    DAC8552:一款高性能16位雙通道數(shù)模轉(zhuǎn)換器的深度剖析

    、雙通道、超低毛刺、電壓輸出的數(shù)模轉(zhuǎn)換器。 文件下載: dac8552.pdf 、產(chǎn)品概述 DAC8552是一款具備低功耗特性和靈活串行主
    的頭像 發(fā)表于 11-29 09:39 ?1304次閱讀
    DAC8552:<b class='flag-5'>一款</b>高性能16位雙通道數(shù)模<b class='flag-5'>轉(zhuǎn)換</b>器的深度剖析

    pdf轉(zhuǎn)換word文檔格式亂了

    df轉(zhuǎn)換word文檔格式亂了 ? pdf 轉(zhuǎn)為 word 是常見的操作,但很多人發(fā)現(xiàn)結(jié)果很亂,文字會(huì)移位,字體變化,表格斷裂,圖片偏離
    的頭像 發(fā)表于 11-22 10:04 ?1124次閱讀

    如何圖像文件轉(zhuǎn)換為二進(jìn)制文件?

    如何圖像文件轉(zhuǎn)換為二進(jìn)制文件
    發(fā)表于 09-05 08:28

    N9H2x如何視頻轉(zhuǎn)換為 AVI 文件?

    N9H2x如何視頻轉(zhuǎn)換為 AVI 文件?
    發(fā)表于 09-01 08:05