文檔金喜正規買球>>TX Text Control for Winform用戶指南>>導入Adobe PDF格式文檔
導入Adobe PDF格式文檔
TX Text Control .NET for WinForm - 導入Adobe PDF格式文檔
對于您過去存留的PDF文檔,即使沒有當時用于導出該PDF的原文件,您仍然可以將該PDF文件導入到TX Text Control .NET 中并自由地進行編輯,并將編輯過的文檔保存成控件支持的各類格式文件。
從導入的PDF文件中計算頁面布局是個技術活,PDF文件中包含大量的關于頁面外觀的信息,但不一定會有關于字體和嵌入其中的圖片的相關信息,這又是讓布局計算變得棘手。
另外,PDF文件中沒有關于文本順序,文本流的信息,連一段文字屬于標題還是表格元素都沒有進行標注。當然,最新的PDF規范中添加了這方面的內容(帶段落標記PDF),但是這種PDF文件還沒得到廣泛使用。
TX Text Control .NET把能夠查找的到的文本都進行提取和整理,添加缺失的空格和換行符并重排相應的文本與圖片的次序,以確保文檔排版符合其邏輯順序。
控件提供以下三個參數向負責導入PDF文件的相應過濾器傳遞命令:
GenerateLines:該參數表示被導入文檔是基于單行文本的,每行末尾有換行符。該參數適合大多數情況,除非您需要處理的PDF文檔的文本內容中包含更多信息需要進一步處理。
GenerateParagraphs:該參數表示文檔中由多個行組成各個段落。使用該參數可以免去導入后很多的細節調整工作,在導入像法律合同之類的大文件時尤其適用。
GenerateTextFrames:該參數表示將導入的文本及圖片保持其在PDF文件中的原排版效果。使用該參數能產生與原始PDF文件最接近的效果。
功能支持
以下 TX Text Control .NET for Windows Forms 控件產品中對該功能提供了支持:
- TX Text Control .NET for Windows Forms Professional
- TX Text Control .NET for Windows Forms Enterprise