LEADTOOLS教程:如何使用LEADTOOLS从PDF文档中提取嵌入图像
LEADTOOLS PDF Pro 具备浏览光栅图与编辑PDF文件所需的所有功能。该产品同时也包含了许多高级功能,例如提取文本、图片、超链接、元数据以及当前PDF文档的操作页面,将PDF/A转换为一个真正的文档,线性化,LEADTOOLS PDF优化器还能够减少PDF文件占用的空间。本文主要介绍了如何使用LEADTOOLS从PDF文档中提取嵌入图像。
使用LEADTOOLS从PDF文档中提取嵌入图像
数码影像无处不在。无法逃避他们。它们几乎可以在每封电子邮件中找到,遍布社交媒体,并且可以嵌入到整个PDF中。有些可能将图像嵌入PDF中,以使文档看起来更好或提供视觉效果。其他人可能出于法律原因(例如保险)这样做以显示图像。
让我们继续关注PDF中的嵌入式图像,以及如何使用LEADTOOLS PDF SDK提取它们。 在PDF内部,可以找到不同的对象,即“文本”、“矩形”和“图像”。 为了从PDF提取这些图像,LEADTOOLS有一个在PDFDcoument类中找到的方法,即DecodeImage方法。 此方法完全符合您的想法。 它将解码嵌入在此PDF文档中的指定PDF图像对象。
以下代码是从PDF提取所有图像对象的核心代码。
using (PDFDocument document = new PDFDocument(sourceFileNamePath))
{
document.Resolution = 200;
// Parse the objects in all pages
document.ParsePages(PDFParsePagesOptions.Objects, 1, -1);
using(RasterCodecs codecs = new RasterCodecs())
{
// Look through each page in the document
foreach (PDFDocumentPage page in document.Pages)
// Check the page for PDFObjects
if (page.Objects != null && page.Objects.Count > 0)
// If the object type is an image, save it
foreach (PDFObject obj in page.Objects)
if (obj.ObjectType == PDFObjectType.Image)
using (RasterImage image = document.DecodeImage(obj.ImageObjectNumber))
codecs.Save(image, destinationFileNamePath, RasterImageFormat.Png,
image.BitsPerPixel, 1, 1, -1, CodecsSavePageMode.Append);
}
}我还有一个完整的项目,它将扫描给定目录中的所有PDF并提取所有图像对象。然后,应用程序将根据初始文件名将每个图像保存到磁盘上自己的文件夹中。如前所述,创建带有嵌入式图像的PDF的保险索赔理算人可以使用它来提取事故,财产损失等图像。
想要购买该产品正版授权,或了解更多产品信息请点击


QQ交谈
在线咨询

渝公网安备
50010702500608号

客服热线