该方法已经过本人测试,效果还不错。尽管不是100%完全转换,但比起原来的只能看不能编辑(特别某些PDF文件中以图形格式表现的文本),还是有很大的进步。
操作方法
(01)打开PDF文件
(02)依次选择菜单栏上的“文件”——“打印”——“打印机”。在“打印机”下拉菜单中选择“Microsoft Office Document Image Writer”
(03)选择保存“Microsoft Office Document Image Writer”虚拟打印文件(*)的文件名和保存地址。
(04)“Microsoft Office Document Image Writer”将PDF文件打印成规定文件名的MDI文件,如下图所示。
(05)在菜单样上选择“工具”——使用OCR识别文本
(06)根据PDF的具体情况,选择对应的页面和语言。本例为“所有页面”和“英语”。
(07)语言选择见“选项”,可选择“中文”或“英文”。
(08)完成设置后,点击菜单样上的“工具”——“使用OCR”。“Microsoft Office Document Image Writer”开始识别MDI文件。
(09)完成OCR识别后,在菜单样上选择“工具”——“将文本发送到WORD”
(10)钩选“版式选项”,选择文件的保存地址。识别后的文件将自动送到WORD。
(11)根据文件大小,会有长短不一的传送时间。传送完成后,系统会自动打开WORD,用户需要将文件另存为WORD格式。
特别提示
PDF文件中的表格格式和某些单位符号将会丢失。<br/>视PDF的具体情况,某些文本需要重新校核。