OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。简单来说,就是通过这个功能让不可编辑或难以编辑的文档变成可编辑的。
下面,我就为大家介绍一下万兴PDF的OCR功能,想了解的小伙伴就继续往下看吧。
步骤一:在相应的网站上下载万兴PDF,然后双击打开该软件进入主界面。软件的界面是相当简洁的,关键是方便操作,对小白也很友好哦。
步骤二:打开万兴PDF之后,再单击下方的打开文件。然后软件就会弹出提示框,你只需要在文件列表里找到需要执行OCR功能的PDF文档选中,再单击打开就可以了。
小提示:如果您电脑上文件比较多,或者不小心忘记了PDF的存放位置,导致查找比较困难。那么你可以单击上方的搜索栏,只要输入您的PDF文档的名称,就可以马上进行文档的搜索,是不是很方便呢。
步骤三:OCR是万兴PDF专业版提供的一个插件,需要用户单独下载和安装。如果您还没有下载OCR插件,您可以点击界面顶部的“转换” 按钮,在下面的栏目里找到 “OCR”按钮并点击,您将收到一个提示消息来下载OCR。
请您选择“点击下载”按钮,该程序将帮助您自动下载并安装OCR插件。在安装完成后,您就可以使用OCR功能了。
步骤四: 鼠标左键双击上方的OCR功能,这个时候就会弹出一个对话框。
第一种模式是“可搜索文本的OCR”模式,它允许您搜索/选择/复制文本。这种模式方便您进行资料的拷贝,可以整合到其他的文档里进行修改编辑。您可以单击“更改选择”按钮,选择合适的语言来执行OCR。也可以点击“自定义页面”来选择单个页面或几个页面执行OCR。您选择“确定”后,新创建的PDF文件将可以被搜索,选择 Ctrl + F 键来搜索关键字。或者复制其中的文本,然后根据需要粘贴到另一个文档中,例如Word文件。
第二种模式是“可编辑文本的OCR”,它允许您编辑或者转换扫描的PDF文档或图片。同样的,请您单击“更改选择”按钮,选择合适的语言来执行OCR(默认为中文简体),以及可以点击“自定义页面”来选择您需要执行OCR的部分页面。开始执行后,您将看到一个进度条来显示已进行的状态,并知道它何时完成。执行OCR可能需要较长时间,请您耐心等待。
OCR执行完成时,万兴PDF将自动打开新创建的可编辑PDF文件。执行完成后,单击“编辑”按钮,即可修改PDF文件的文本。这时候您就可以随心所欲的对您的扫描版PDF文件进行编辑,复制以及其他您需要的操作。
小提示:文件越小、内容越简单,OCR的所需要的时间就越短。
刚才我们使用的是整个PDF文档的OCR功能,它将文档转换成一个新的可以编辑的副本,显然,这样的转换对大文件花费的时间较长,当您仅仅需要的编辑一部分内容的时候,就会带来时间和效率的浪费。下面将帮助您使用万兴PDF的区域OCR功能,对部分内容执行OCR文字识别功能。
小提示:因为区域OCR操作是不可逆的,在执行之后区域的图片格式会被修改为可编辑的格式,所以建议您先备份扫描版PDF文档。
步骤一:选择上方的文件功能区,然后鼠标左键单击另存为,再选择想要保存的文件夹就可以了。这样就可以备份PDF文件了。
步骤二:对备份的副本执行区域OCR功能 ,点击顶部“转换”栏目里的“区域OCR”按钮,您的鼠标指针将会变为一个准心,这时候您需要框选需要进行OCR的文档内容区域。
步骤三:然后在右侧的属性框里选择相应的语言,单击确定,就可以进行扫描了。执行OCR功能之后,之前框选的区域就可以进行编辑操作了。
以上操作都是万兴PDF提供的,万兴科技是一家全球领先的APP应用软件开发和服务商,秉承“让简单创意的科技无处不在”的使命,通过自主研发、自主品牌、自建渠道的模式与开放合作构建生态网络的思维,为用户提供高效、高质的数字创意、数据管理、办公效率等三大类消费类软件产品及服务。
使用万兴科技的产品,不仅能享受到行业顶尖的PDF软件设计带来的便利,更能进入整个万兴科技的软件生态中,享受HiPDF、Filmora、万兴恢复专家等优秀产品,它们之间的功能交互性、兼容性是极为优秀的。假如您单独使用某一个PDF软件,可能会遇到彼此之间不识别,没有良好的插件支持等问题,但是您使用万兴PDF,则可以享受到产品生态的特有优势。