PDFlib pCOS 4 –PDF 信息檢索工具

什么是PDFlib pCOS?
PDFlib pCOS提供了一個簡單而優(yōu)雅的工具,用于從PDF文檔中檢索不屬于頁面內(nèi)容的任何信息。例如,可以使用pCOS輕松查詢PDF元數(shù)據(jù),交互式元素(鏈接,表單字段等)或頁面尺寸。
使用pCOS,您可以提取各種有趣的項目和創(chuàng)建輸出為不同的目的。通過單次調(diào)用處理多個PDF文檔,您可以輕松創(chuàng)建文檔信息條目,頁面格式,字體或任何其他屬性的摘要。結(jié)合表格輸出,這提供了一個強大的PDF管理工具。
在PDF工作流程中,PDF信息檢索工具PDFlib pCOS有許多應用場景,但您也可以使用PDFlib pCOS作為學習或調(diào)試PDF的工具。以下是一些典型情況:
檢查傳入文檔的預定義條件
識別大集合中的問題文件
創(chuàng)建文檔管理的元數(shù)據(jù)摘要
質(zhì)量保證在出版文件之前
文檔檢索和存儲庫工作流
總結(jié)書簽
提取PDF文檔的組件,例如ICC配置文件
檢查PDF的安全問題(JavaScript等)
pCOS檢索界面包含在其他PDFlib GmbH產(chǎn)品中:如果您使用PDFlib + PDI,PDFlib個性化服務器,TET或PLOP / PLOP DS,您還可以訪問pCOS界面。如果您需要訪問頁面上的文本或圖像,請使用我們的產(chǎn)品PDFlib TET進行PDF內(nèi)容提取。
pCOS Cookbook
pCOS Cookbook是一個編程示例的集合,演示了pCOS用于各種PDF檢索任務的用法。
PDFlib pCOS特性
支持的輸入
PDFlib pCOS支持所有風格的PDF輸入:
所有PDF版本到Acrobat XI,包括ISO 32000
加密文檔(可能需要密碼)
如果可能,損壞的PDF輸入文檔將被修復
信息檢索
PDFlib pCOS提供了一個簡單的查詢界面。使用PDFlib pCOS,您可以提取各種有趣的項目,如:
文檔信息字段和XMP元數(shù)據(jù)
一般信息:線性化和標記的PDF狀態(tài),加密詳細信息和權(quán)限設置,頁數(shù)和字體數(shù)
具有名稱,嵌入狀態(tài)等的字體
圖像數(shù)據(jù),如位深度,顏色空間,壓縮,XMP
顏色空間詳細信息
目標URL和Web鏈接的坐標
書簽和相應的頁碼,例如。創(chuàng)建一個目錄
表單字段數(shù)據(jù):完整字段名稱,內(nèi)容,位置等。
頁面大小,CropBox,頁面旋轉(zhuǎn)
ISO標準的狀態(tài):PDF / X,PDF / A,PDF / UA,PDF / E和PDF / VT
地理空間參考信息
列出或解壓縮文件附件
圖層名稱,頁面標簽,文章線程
注釋詳細信息
列出所有評論以及評論者姓名
數(shù)字簽名詳細信息:簽名字段的名稱,簽名/未簽名,簽名者姓名,簽名日期和原因
從PDF / X或PDF / A文檔提取ICC輸出意圖概要文件
PDFlib個性化服務器的塊屬性
文檔,頁面,注釋或字段級別的JavaScript
從ZUGFeRD文檔檢索XML發(fā)票數(shù)據(jù)
PDF包/投資組合的屬性
輸出格式
PDFlib pCOS可以創(chuàng)建不同用途的輸出:
純文本輸出
以UTF-8或UTF-16格式輸出的Unicode文本
使用電子表格/數(shù)據(jù)庫處理的表格輸出
二進制數(shù)據(jù),例如ICC配置文件或文件附件
自定義后處理的用戶定義輸出格式
pCOS路徑 - PDF對象的簡單語法
而不是被復雜的樹結(jié)構(gòu)所困擾。對于書簽或表單字段,可以使用簡單的pCOS路徑語法輕松訪問PDF對象。它提供方便的快捷方式,用于訪問常用的PDF對象,如頁面,字體,書簽,表單字段等。
pCOS 4中的增強
pCOS編程接口8包括用于檢索PDF信息的附加便利特征,包括以下:
- 在頁面或注釋中標識具有透明對象的頁面
- 加密文件附件
- 識別PDF / A,PDF / E,PDF / UA,PDF / X和PDF / VT的所有風格
通用Unicode字符串轉(zhuǎn)換器方法pCOS_convert_to_unicode()
更新語言綁定:
- Perl 5.8 - 5.18
- PHP 5.3,5.4和5.5
- 面向?qū)ο蟮慕涌跒?/font>Python 2.6,2.7,3.2和3.3
接受各種不合格的PDF結(jié)構(gòu)
損壞的PDF文檔的增強修復模式
各種錯誤修復
pCOS庫或命令行工具?
pCOS可用作各種開發(fā)環(huán)境的編程庫(組件),也可作為批處理操作的命令行工具。兩者都提供類似的功能,但適合于不同的部署任務。
使用pCOS編程庫...
...用于集成到桌面或服務器應用程序中。使用帶有所有支持的語言綁定的庫的示例包括在pCOS包中。
pCOS命令行工具適用...
...用于批處理PDF文檔。它不需要任何編程,但提供了強大的命令行選項,可用于將其集成到復雜的工作流程。 pCOS命令行工具擴展了庫的功能:
簡單檢索常見的PDF元素,例如書簽,注釋,元數(shù)據(jù),表單字段等。
擴展模式,用于查詢更復雜的對象和自定義輸出格式
提取數(shù)據(jù)項,例如文件附件,ICC配置文件等。
以逗號分隔值或用戶定義的格式發(fā)出信息,以便導入到電子表格或數(shù)據(jù)庫中
用于轉(zhuǎn)儲復合PDF對象(如字典和數(shù)組)的遞歸功能
支持的開發(fā)環(huán)境
PDFlib pCOS無處不在 - 它幾乎在所有計算平臺上運行。我們?yōu)樗谐R姷?/font>Windows,OS X / macOS,Linux和Unix提供32位和64位軟件包。
pCOS內(nèi)核采用高度優(yōu)化的C和C ++代碼,以實現(xiàn)最高性能和較小的開銷。通過簡單的API(應用程序編程接口),可以從各種開發(fā)環(huán)境訪問pCOS功能:
COM用于VB,ASP等
C和C ++
Java,包括servlet和JSP
.NET用于C#,VB.NET,ASP.NET等。
Perl
PHP
Python
京ICP備09015132號-996 | 違法和不良信息舉報電話:4006561155
© Copyright 2000-2026 北京哲想軟件有限公司版權(quán)所有 | 地址:北京市海淀區(qū)西三環(huán)北路50號豪柏大廈C2座11層1105室
北京哲想軟件集團旗下網(wǎng)站:哲想軟件 | 哲想動畫