OCR(optical character recognition)光学文字识别是用字符识别方法将图片、扫描件上的文字翻译成计算机文字的过程
当我们打开扫描生成的PDF文档,万兴PDF会提示您执行OCR。执行OCR之后,扫描文档上的文字就会转换为可编辑的文本。
如果我们仅需要对某一区域的文字进行编辑,我们可以执行“区域OCR”。
使用OCR功能,您可以简单地将扫描的PDF和基于图像的PDF转换为具有可编辑、可选择和可搜索内容的各种格式,例如Microsoft Office格式、PPT、页面或纯文本文档(TXT文件)。
手动数据输入将成为过去。万兴PDF使您能够从扫描的PDF和基于图像的PDF中提取数据,或者在执行OCR后仅从PDF中的表单字段提取数据。
万兴PDF还有批量OCR处理功能,如果你需要一次性处理大量文件,万兴PDF也可以帮到你。
万兴PDF的OCR功能支持超过20多种语言,包括简体中文、英语日语、繁体中文、韩语等语言,可以满足您编辑不同语言的PDF文档。