GroupDocs.Parser for .NET

GroupDocs.Parser for .NET是一種非常好用的文檔文本提取API。它從Microsoft Word、Excel、PowerPoint、電子郵件消息、包含ZIP歸檔文件、純文本文件和HTML等文件的集裝箱文件中提取文本和元數(shù)據(jù),而無需安裝任何這些文檔閱讀器。文本提取器API以前所未有的精度和速度執(zhí)行操作。API還提供了方便的工具來檢測編碼,如UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE等
用于文檔的原始和格式化文本檢索.NET Text extraction API概述
功能
提取原始文本
提取格式化文本
提取元數(shù)據(jù)
編碼檢測
媒體類型檢測
可擴展和靈活的
API
得到輸入文件
獲取原始或格式化的文本
獲取元數(shù)據(jù)
高級文檔文本提取API功能
提取原始文本和格式化文本
提取元數(shù)據(jù)
提取結(jié)構(gòu)化文本
提取突出顯示的文本
在文檔中搜索文本
從包含其他文件(如zip存檔)的集裝箱文件中獲取文本
獲取來自TXT、Markdown和HTML文件的格式化文本
支持編碼檢測
支持媒體類型探測器
京ICP備09015132號-996 | 違法和不良信息舉報電話:4006561155
© Copyright 2000-2026 北京哲想軟件有限公司版權(quán)所有 | 地址:北京市海淀區(qū)西三環(huán)北路50號豪柏大廈C2座11層1105室
北京哲想軟件集團旗下網(wǎng)站:哲想軟件 | 哲想動畫