91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TET PDF IFilter支持所有相關(guān)風(fēng)格的PDF輸入

工程師鄧生 ? 來源:哲想軟件 ? 作者:哲想軟件 ? 2022-08-22 16:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

接受的PDF輸入

TET PDF IFilter 支持所有相關(guān)風(fēng)格的PDF 輸入:

直到 AcrobatDC 的所有 PDF版本,包括 ISO32000-1 和 32000-2(PDF 2.0)

無需密碼即可打開文檔的受保護(hù)PDF

修復(fù)損壞的 PDF文檔

國際化

除了西文文本 TETPDF IFilter 完全支持中文、日文和韓文(CJK) 文本。識別所有CJK 編碼;支持水平和垂直書寫模式。自動檢測文本的區(qū)域設(shè)置ID(語言和區(qū)域標(biāo)識符)改進(jìn)了Microsoft 的分詞和詞干算法的結(jié)果,這對于東亞文本尤其重要。

還支持從右到左的語言,例如希伯來語和阿拉伯語。上下文字符形式被規(guī)范化,文本按邏輯順序傳遞。

PDF 不僅僅是一堆頁面

TET PDF IFilter 將 PDF文檔視為容器,其中可能包含比普通頁面更多的信息。TETPDF IFilter 索引 PDF文檔中的所有相關(guān)項(xiàng)目:

頁面內(nèi)容

書簽、注釋(評論)和表單域中的文本

元數(shù)據(jù)(見下文)

嵌入式 PDF 和PDF 包(組合)以遞歸方式處理,以便可以搜索所有嵌入式PDF 文檔中的文本。

XMP 文檔元數(shù)據(jù)和文檔信息

TET PDF IFilter 中的高級元數(shù)據(jù)實(shí)現(xiàn)支持元數(shù)據(jù)的Windows 屬性系統(tǒng)。它索引XMP 元數(shù)據(jù)以及標(biāo)準(zhǔn)或自定義文檔信息條目。元數(shù)據(jù)索引可以在多個級別上配置:

文檔信息條目、DublinCore 字段和其他常見XMP 屬性映射到Windows shell 屬性,例如標(biāo)題、主題、作者。

TET PDF IFilter 添加了有用的特定于PDF 的偽屬性,例如頁面大小、PDF/A一致性級別、字體名稱。

可以索引所有相關(guān)的預(yù)定義XMP 屬性。

可以搜索用戶定義的XMP 或基于PDF 的屬性,例如公司特定的分類屬性、數(shù)字簽名或ZUGFeRD/Factur-X 一致性。

TET PDF IFilter 可選擇將元數(shù)據(jù)集成到全文索引中。因此,即使是不支持元數(shù)據(jù)的全文搜索引擎(例如SQL Server)也可以搜索元數(shù)據(jù)。

Unicode 后處理

TET PDF IFilter 支持各種Unicode 后處理步驟,可用于改進(jìn)提取的文本:

折疊保留、刪除或替換字符,例如從不相關(guān)的腳本中刪除標(biāo)點(diǎn)符號或字符。

分解用一個或多個其他字符的等效序列替換一個字符,例如用它們各自的標(biāo)準(zhǔn)對應(yīng)物替換窄、寬或垂直的日文字符或拉丁上標(biāo)變體。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5200

    文章

    20495

    瀏覽量

    334695
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1039

    瀏覽量

    57016
  • PDF
    PDF
    +關(guān)注

    關(guān)注

    1

    文章

    177

    瀏覽量

    36279

原文標(biāo)題:?PDFlib TET PDF IFilter 5 功能

文章出處:【微信號:哲想軟件,微信公眾號:哲想軟件】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    請問誰有 RTL9210B RTL9210C 的sheet pdf 呀?

    請問誰有移動硬盤芯片 RTL9210B RTL9210C 的sheet pdf 呀? 找不到,急需。先謝了
    發(fā)表于 02-13 13:43

    公網(wǎng)訪問開源 Stirling-PDF 工具,提升辦公效率

    本文介紹了如何在Windows本地部署Stirling-PDF服務(wù)器,并通過內(nèi)網(wǎng)穿透實(shí)現(xiàn)外網(wǎng)訪問,提升PDF處理效率。
    的頭像 發(fā)表于 12-09 14:25 ?526次閱讀
    公網(wǎng)訪問開源 Stirling-<b class='flag-5'>PDF</b> 工具,提升辦公效率

    電能質(zhì)量在線監(jiān)測裝置能導(dǎo) PDF 報告嗎?

    電能質(zhì)量在線監(jiān)測裝置 支持導(dǎo)出 PDF 報告 ,這是現(xiàn)代設(shè)備的 標(biāo)準(zhǔn)功能 ,可通過裝置本地界面、配套分析軟件或 Web 平臺實(shí)現(xiàn),滿足數(shù)據(jù)存檔、合規(guī)報告與故障分析需求。 一、導(dǎo)出方式與操作流程 1.
    的頭像 發(fā)表于 12-05 16:34 ?715次閱讀
    電能質(zhì)量在線監(jiān)測裝置能導(dǎo) <b class='flag-5'>PDF</b> 報告嗎?

    發(fā)布元服務(wù)配置應(yīng)用分類、標(biāo)簽和資質(zhì)信息(僅分發(fā)手表設(shè)備)

    ;gt; 版本信息”下待發(fā)布的版本。 進(jìn)入“版權(quán)信息”區(qū)域,上傳版權(quán)資質(zhì)文件。如果您的版權(quán)資質(zhì)圖片超過了最大支持數(shù)量,建議您將圖片進(jìn)行拼接后再上傳。 電子版權(quán)證書:可選。僅支持PDF格式,大小不超過
    發(fā)表于 10-30 17:47

    求助CS32L010的相關(guān)資料(數(shù)據(jù)手冊、用戶手冊、Pack包和例程等)

    求助CS32L010的相關(guān)資料(數(shù)據(jù)手冊、用戶手冊、Pack包和例程等) 另外發(fā)現(xiàn)按照<應(yīng)用筆記:芯海通用MCUGCC編譯支持開發(fā)指南_1667977800.pdf>搭建
    發(fā)表于 09-26 09:59

    還在用PDF文檔查資料?飛凌嵌入式「產(chǎn)品在線文檔」讓您的開發(fā)效率狂飆

    Ctrl+J(或者點(diǎn)擊目錄左上角的搜索框)快捷搜索; ③輸入關(guān)鍵詞,如“命令行測試”。 完成以上操作,系統(tǒng)便能瞬間匹配標(biāo)題、正文、圖表甚至案例中的相關(guān)內(nèi)容,并按相關(guān)性排序呈現(xiàn),十分高效和便捷
    發(fā)表于 09-26 08:57

    這么地道的ADC資料被我找到了?400頁原創(chuàng)pdf原理到應(yīng)用全覆蓋!

    ,如寬帶通信中的高速ADC、精密測量中的高分辨率ADC以及未來發(fā)展趨勢。 全文太長,完整PDF可以直接點(diǎn)擊下方附件下載,資料包里還有內(nèi)容非常豐富,碼住慢慢看,滄海拾遺,學(xué)到賺到。如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下哦~
    發(fā)表于 08-22 13:52

    請問 sotAP(CYW55512)模式是否支持“b only”和“b/g”?

    請問 sotAP(CYW55512)模式是否支持“b only”和“b/g”? Infineon_Wi-Fi_Software_UserGuide.pdf 和 Infineon_5557x_Wi-Fi_6_6E_User_Guide.p
    發(fā)表于 07-17 06:35

    Altium智能導(dǎo)出PDF料單是空白

    大家用Altium有沒有遇到過智能導(dǎo)出PDF包含的料單是空白的情況? AD16沒有料單,AD25是空白.
    發(fā)表于 07-03 16:18

    漫畫圖解 電感器 抗干擾元器件指南(全彩PDF版)

    漫畫圖解電感基礎(chǔ)知識(高清PDF) 內(nèi)容:很形象的漫畫和語言圖解關(guān)于電感器的入門基礎(chǔ)知識,讓電子初學(xué)者也能輕松的看懂電子電路。 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下哦~)
    發(fā)表于 05-13 15:49

    CY7C68013A無PID和VID,如何制作PDF?

    我用 CY7C68013A MCU 設(shè)計了一個 PCB,所以這意味著我不是程序員之類的。 但是我嘗試上傳一些代碼,但沒有 PID 和 VID。 我找到了一些關(guān)于如何制作的 PDF,但那些對我來說很難。 有人可以幫我嗎?
    發(fā)表于 05-13 07:50

    PanDao:輸入透鏡參數(shù)

    pdf”功能生成) d) 載入系統(tǒng)預(yù)設(shè)的標(biāo)準(zhǔn)模板透鏡,并根據(jù)需求修改其參數(shù)值及公差范圍 e) 直接手動輸入光學(xué)元件的參數(shù)值及公差范圍 完成上述操作后,點(diǎn)擊“ask PanDao“即可啟動系統(tǒng),獲取兼顧最低成本與制造風(fēng)險的最優(yōu)光學(xué)元件制造鏈方案。
    發(fā)表于 05-06 08:47

    獲取OpenAI API KEY配置Zotero PDF Translate插件步驟詳解

    功能: 劃詞翻譯: 直接在 PDF 上選擇單詞或短語進(jìn)行翻譯。 段落翻譯: 支持選擇整個段落進(jìn)行翻譯。 多種翻
    的頭像 發(fā)表于 04-11 15:03 ?1.5w次閱讀
    獲取OpenAI API KEY配置Zotero <b class='flag-5'>PDF</b> Translate插件步驟詳解

    電子電路實(shí)用原理圖300例(PDF版)

    電子電路實(shí)用原理圖300例(PDF版),都是些常見的電路,從簡單到復(fù)雜,且元器件名稱大小都標(biāo)識清楚。非常適合電子愛好者參考使用。
    發(fā)表于 04-09 13:47

    典型模電電路應(yīng)用108例,附Protel DXP原理圖和pdf文件

    資料介紹 108個典型經(jīng)典應(yīng)用電路實(shí)例,內(nèi)附附Protel DXP原理圖和pdf文件,初學(xué)適用。 資料部分截圖展示: 純分享貼,有需要可以直接下載附件獲取資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下哦~)
    發(fā)表于 03-20 13:21