熟练使用PDF文件必须掌握五项技术

(整期优先)网络出版时间:2022-09-28
/ 2

熟练使用PDF文件必须掌握五项技术

姬鸿程

武警工程大学教研保障中心,陕西西安710086

摘要:PDF文件是大家日常阅读、学习、办公过程中经常会见到的一种文件格式,该格式深受数字发布行业的青睐,大量的图书资料、期刊报纸、档案文献、技术报告、学术论文、产品说明和营销方案等通常都用PDF文件进行数字化呈现。在使用PDF格式文件时,可以借助专业的软件工具对PDF文件进行增删、制作等功能。文章就熟练应用PDF文件需掌握的五项技术,做以深入探讨与分析。

关键词:PDF文件;五项技术;技术报告

PDF是继TXTWORD文档后常见的一种文件格式,在知网、万方等数据库文献下载中十分常见。然而,广大普通使用者只知阅读,不会制作、修改和转换的问题普遍存在,造成利用受限PDF文档的传播质量受到一定的影响。本文阐述熟练使用PDF文件必须掌握的五项技术,希望对大家有所裨益。

、新PDF文件制作技术

虽然PDF文件的制作方法有很多,但是最常见、最简便易行的只有两种,即Word“另存为”法和直接扫描法。

Word文字处理软件制作。这是目前最简单便捷的PDF文件制作方法,也是普通电脑使用者和文字工作人员最钟爱的制作方法。由于Word软件优秀的文字处理能力和PDF文件以文字为主的基本特点,使得二者之间的联系和互通成为必然。微软Office 2007版及其之后的Word软件都具有制作PDF文件的功能。具体操作是:当某份文件在Word中编辑完成后,点击“文件”“另存为”菜单,在弹出对话窗口的“保存类型”一栏中选择“PDF”,再点击“保存”,一份新的PDF文件即制作完成。

通过扫描设备直接制作。这里的扫描设备主要是指各种扫描仪和智能手机。扫描仪多用在图书馆数字资源库建设和档案馆文件资料数字化等任务量大和标准要求高的场合,使用时还可通过自带的扫描软件进行分辨率高低、尺寸大小等个性化设置。智能手机常见于个人掌上办公,制作时通过智能手机与扫描全能王等类似扫描软件配合进行,简单、方便、快捷,指尖搞定。

二、现有PDF文件增减页技术

在使用PDF文件过程中,有时会遇到补充增加页面或删除减少页面等需求,此时往往由于早已脱离了原来的制作环境或重新制作工作量太大等考虑,只能借助PDF编辑器来实现,Foxit PDF Editor就是能够实现这些功能的优秀PDF编辑器之一。

具体方法:启动Foxit PDF Editor软件,点击“文档”菜单,在下拉菜单的中下部有“插入页面”、“删除页面”、“导入页面”和“导出页面”四个功能不同的子菜单。“插入页面”子菜单,用于在当前打开的PDF文件特定位置插入空白页面并制作添加所需内容,还可按需设置所插空白页面的尺寸大小。“删除页面”子菜单,可以删除当前打开的PDF文件的当前页面,常用于删除多余的页面。“导入页面”子菜单,可导入另一PDF文件中的全部或指定页面到当前PDF文件的指定位置,多用于两个PDF文件合并或为当前PDF文件补充部分现成的PDF文件内容。“导出页面”,可选择当前PDF文件的部分页面,导出存储为另一个新的PDF文件。

三、PDF文件转图像文件技术

对于大量以PDF格式数字化存储的图书、期刊、报纸和档案资料,在阅读的同时,有时候还需要将其中的某些页面提出,作为图像素材来收藏或使用。使用专用的PDF文件转换器,就可以轻松地将其转换成图像格式。这里以奇好PDF转成图像工具3.6.1为例来讲述转换的基本方法。

奇好PDF转成图像工具是一款简单实用的转换软件,安装文件只有1.31M大小,占用硬盘和内存空间极小,绿色好用。该格式转换软件只有一项功能,就是PDF文件转图像,功能专一,操作方便,简单易学。

具体操作步骤为:第一步,运行该软件后,点击页面左上角的“添加文件”按钮,添加需要转换的PDF文件,待转换文件便显示在软件页面中部的“文件列表”栏中;第二步,在页面中下部的“设置”→“转换设置”“图片格式”选项中选择所需要转换成的图像文件格式,此处有BMPJPEGWMFEMFEPSTIFFGIFPNG8中目标图像格式可供选择;第三步,调整“图片输出比例”和输出文件的存储路径,默认的输出比例为100%即保持不变,默认的文件输出路径与原文件相同;第四步,点击页面右下角的“转换”按钮,转换完成。

四、图像文件转PDF文件技术

日常办公中,有时需要将大量图像文件作为佐证材料进行提供,此时往往需要将几十张甚至上百张图像文件按一定顺序编排存储于一个文件中,以方便文件的保存、传递和查阅。PDF文件正好可以满足以上要求。那么,如何将图像文件转换成PDF文件呢?

方法一:用PDF编辑器将图像文件制作成PDF文件。以Foxit PDF Editor为例,具体步骤为:第一步,启动PDF编辑器,点击“文件”“新建”,在弹出的“新建页面属性”对话框中,根据需要设置“页面大小”,点击“确定”即新建成一空白

PDF文件;第二步,点击页面左上角“载入现有的图像”按钮,选择要插入的图像文件,点击“打开”,调整图像的位置和大小;第三步,以此类推,完成其他图像文件的插入;第四步,保存,图像文件转PDF文件制作完毕。

方法二:用专用转换器转换。用图像转PDF工具进行转换,速度快,效率高,非常适合大量图像文件批量转PDF文件操作。该方法是上文中第三个大问题的逆操作,同样,用奇好的另一款软件——图片转PDF工具也能轻松实现。由于过程互逆,操作简单,此处不再做赘述。

此外,还可以通过Word软件新建空白文档,逐页插入所需转换的图像文件,另存为PDF格式文件的方法实现转换。

五、PDF文件文字提取技术

阅读和学习中,当遇到好的PDF文章后,对其进行文字识别、提取、编辑和再利用就显得很有必要。然而,不同方法制作的PDF文件其提取文字的难度和方法也不尽相同。

文字型PDF文件中文字的提取。通过Word等文字处理软件编辑制作的PDF文件属于文字型PDF文件,要提取该类文件中的文字,在任何一个PDF阅读器中打开后都可以选择、复制其中的文字信息,然后在文字处理软件中粘贴使用。

图像型PDF文件中文字的提取。顾名思义,此类PDF文件中的文字信息是以图像形式存在的,无法通过常用的PDF阅读器选择和提取,只能通过专用的格式转换工具进行提取。具体方法是:先用上文中第三个大问题介绍的方法将其转换为图像文件,然后通过尚书七号OCR等专用文字识别软件进行识别,再进行复制提取。

双层PDF文件文字的提取。所谓双层PDF文件,就是既具有图像型PDF文件的稳定性,又具有文字型PDF文件的文字可复制性。该型PDF文件是用具有双层PDF文件制作功能的扫描仪扫描制作和存储的一类特殊的PDF文件,多用于档案资料的数字化保存和信息化利用。从双层PDF文件中提取文字,与从文字型PDF文件中提取文字方法相同。

PDF文件使用中需要掌握的技术还有很多,如PDF文件转PPT文件、PDF文件转Excel文件、PDF文件标注等技术,篇幅有限,以后再论。

参考文献:

[1]王航.PDF技术在移动平台上的应用研究[J].计算机光盘软件与应用,201316):269+271.

[2]张勇.PDF文档转换及打印常见问题分析[J].印刷杂志,202204):41-42.

[3]王锦秀,康鲁豫,李育燕,李玮.网络首发下的学术期刊PDF文件处理方法[J].科技传播,202214):32-35.

1