没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:何跃|2022-01-24 14:36:15.267|阅读 260 次
概述:PDF文件可以被用来存储文件、图像和其他数据。在过去,人们问是否有一个简单的方法从PDF文件中提取图形,如图表或照片。如果你想从一个PDF文件中获取所有的图像,或者有数百个或更多的PDF文件需要处理,那么答案就是使用LEADTOOLS。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
使用LEADTOOLS提取嵌入在PDF文件中的图像很容易。下面是使用LEADTOOLS从PDF文件中提取图像的C#、Java和PowerShell代码样本。
/// <summary>
/// 提取PDF文档为TIFF
/// </summary>
/// <param name="pdfPath"></param>
private static void ExtractImagesFromPdf(string pdfPath)
{
var destinationPath = Path.Combine(Path.GetDirectoryName(pdfPath), @"images\");
var documentName = Path.GetFileNameWithoutExtension(pdfPath);
using var pdfDocument = new PDFDocument(pdfPath);
pdfDocument.ParsePages(PDFParsePagesOptions.Objects, 1, -1);
foreach (var page in pdfDocument.Pages)
{
var embeddedImages = page.Objects.Where(o => o.ObjectType == PDFObjectType.Image).ToArray();
using var codecs = new RasterCodecs();
foreach (var imgObj in embeddedImages)
{
var destinationFilePath = destinationPath + documentName + "~page-" + page.PageNumber + "~" + imgObj.ImageObjectNumber + ".tif";
using var image = pdfDocument.DecodeImage(imgObj.ImageObjectNumber);
codecs.Save(image, destinationFilePath, RasterImageFormat.TifLzw, image.BitsPerPixel, 1, 1, -1, CodecsSavePageMode.Append);
}
}
}
/**
* 提取PDF文件并另存为到子目录
* e.g. getFileName("c:\\temp\\") will return "c:\\temp\\images\\"
*
*
* @param pdfPath
*/
private static void extractImagesFromPdf(String pdfPath) {
final String destinationFolder = getOutputFolder(pdfPath);
final String documentName = getBaseName(getFileName(pdfPath));
final PDFDocument pdfDocument = new PDFDocument(pdfPath);
pdfDocument.parsePages(PDFParsePagesOptions.OBJECTS.getValue(), 1, -1);
final RasterCodecs codecs = new RasterCodecs();
try {
final List<PDFDocumentPage> pages = pdfDocument.getPages();
for (PDFDocumentPage page : pages) {
final int pageNumber = page.getPageNumber();
for (final PDFObject object : page.getObjects()) {
if (object.getObjectType() == PDFObjectType.IMAGE) {
final String imageObjectNumber = object.getImageObjectNumber();
final String destinationFilePath = destinationFolder + documentName + "~page-" + pageNumber + "~"
+ imageObjectNumber + ".tif";
final RasterImage image = pdfDocument.decodeImage(imageObjectNumber);
try {
codecs.save(image, destinationFilePath, RasterImageFormat.TIFLZW, image.getBitsPerPixel(),
1, 1, -1, CodecsSavePageMode.OVERWRITE);
} finally {
image.dispose();
}
}
}
}
} finally {
codecs.dispose();
}
}
function Export-LtImagesFromPdf {
<#
.SYNOPSIS
Exports images embedded in a PDF file
.DESCRIPTION
Exports images embedded in a PDF file
.PARAMETER PdfPath
File path to the PDF file that has embedded images to be exported
.PARAMETER Path
Folder path to export the embedded images
.EXAMPLE
Export-LtImagesFromPdf -PdfPath "c:\temp\a.pdf" -Path "c:\temp\images\"
.INPUTS
String
.OUTPUTS
void
.NOTES
Author: LEAD Technologies, Inc.
Website: //www.leadtools.com
Twitter: @leadtools
#>
[CmdletBinding()]
param(
[Parameter(Mandatory)]
[string]$PdfPath,
[Parameter(Mandatory)]
[string]$Path
)
if( -not(Test-Path -Path $PdfPath -PathType Leaf) ) {
Write-Error "File does not exist."
return $false
}
if( -not(Test-Path -Path $Path -PathType Container) ) {
New-Item -Path $Path -ItemType Directory
}
$baseFileName = (Get-Item $PdfPath).Basename
$pdfDocument = New-Object -TypeName Leadtools.Pdf.PDFDocument -ArgumentList $PdfPath
$pdfDocument.ParsePages(1, 1, -1)
ForEach ($page in $pdfDocument.Pages){
ForEach($object in $page.Objects){
if( $object.ObjectType -eq [Leadtools.Pdf.PDFObjectType]::Image ){
$imageObjectNumber = $object.ImageObjectNumber
$pageNumber = $page.PageNumber
$image = $pdfDocument.DecodeImage($imageObjectNumber)
$outputFilePath = (Join-Path -Path $Path -ChildPath ($baseFileName + "~page#-" + $pageNumber + "~" + $imageObjectNumber + ".tif"))
Export-LTImage -RasterImage $image -Path $outputFilePath -Format ([Leadtools.RasterImageFormat]::Tif)
}
}
}
}
有了LEADTOOLS的工具包,就没有什么是你不能做的PDF文件了。点击这里可以下载Leadtools全套SDK。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@ke049m.cn




在使用Parasoft C/C++test执行BugDetective数据流分析时,可能会遇到用户自定义的资源API,那在这种情况下,若要判断是否存在资源问题,如资源泄露等,则需要手动配置测试配置。
大型SaaS系统的自动化测试常常受制于界面变化快、结构复杂、加载机制多变等因素。从元素识别到脚本管理,SmartBear TestComplete帮助Salesforce建了可靠的自动化测试体系。
BarTender 标签管理系统,正是帮助企业轻松实现 GS1 标准化标签设计、编码生成与信息联动的强大工具。
Parasoft C/C++test 是一款功能强大的 C/C++ 软件测试工具,集成了静态代码分析、单元测试、集成测试和覆盖率分析等功能,单元测试作为其关键功能之一,为了适配多样化的目标部署环境,C/C++test 设计了灵活的测试结果收集机制。通过Socket通讯方式来收集单元测试结果,从而扩展其测试覆盖范围与应用场景。
相关产品
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
最新文章 MORE
半岛外围网上直营相关的文章 MORE
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@ke049m.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
半岛外围网上直营