楼主 chrisfang |
将PDF文档重新转化为WORD文档,实质上是一个文字识别的工作,因此要求PDF文档本身是来源于标准印刷字体的打印文稿,而非一般的扫描所形成的文件。 在PDF文档满足要求之后,可以有两个大的方向来完成这一转换工作。一是利用Office自带的OCR工具进行光学文字识别,另一种则是使用专门的软件。 对于第一种方法,可先将PDF文档另存为图片文档,再转化为TAG图片文件,再使用Office Document Image软件导入,并使用工具中的“OCR识别文本”功能进行识别和转化。 如下图所示: 而对于第二种软件转换的方法,则相对来说比较简单,例如e-PDF To Word Converter 就是一款专门针对此类问题的软件,可以尝试下载使用。 |
2楼 于晓庆 |