最新公告:
像一些直接网上下载来的PDF文件,譬如下图的这个PDF文档,它的原始格式就是word。
其实也就是跟图片差不多吧,无法复制不可编辑。
一般像这种文字居多的或者掺杂图片较少的PDF文档,要转换成可编辑的word文档还是比较容易也比较多方法可以实现的。
新版的office是支持直接打开并转换PDF的,不过往往会有这个提示。超出word支持的页面大小,无法打开。你可以先试试。
word打开不行,那用acrobat的文字识别功能。先识别一下文档。
基本上这种都能直接识别出文字,识别率还是蛮高(因为文档文字居多,也没啥难度)咱们直接复制到记事本去一下格式,再粘贴到word里面。效果还是蛮不错。
但就不要识别后直接用acrobat直接另存为word了,这样没有效果。
会出现一些识别错误的现象,这当然也在所难免的。还是需要对比原文档来修改更正一下。另外字体原格式和排版肯定是要牺牲了。
我们来将难度提高一下。扫描件PDF。
一样还是上面的识别文档再到word。然后是下图这样子。
文档复杂时acrobat便不行了,毕竟OCR文字识别并不是acrobat的强项。
这里我们可以用ABBYY这个软件来进行PDF转换,就目前来说它可算是OCR文字识别界中的佼佼者。
直接拖拽进来让它自动识别就可以了,有三百多页,过程有点久。它会直接扫描PDF文档的图片识别出文字。并且此工具还较大程度上保留原始格式的样式和编排。
识别完成后直接将它另存为word文档下。
效果还是非常的好。
版权所有 洛阳尚启护栏有限公司 网址:www.sxjmgd.cn 邮箱:y1qvmds@sxjmgd.cn
地址:洛阳