超级会员
请教高手,如何将PDF文件里的文字内容提取出来到WORD里
查看详细资料
TOP
超级版主
组织部
论坛版主
博览典藏版主
回复 #3 龙虎行 的帖子
初级会员
终极天王
白银长老
原帖由 lxdp 于 2006-12-27 17:54 发表 用office2003自带打印机打印到文件,然后运行OCR识别,再存为word文档就行了
青铜长老
黄金长老
原帖由 f600006 于 2006-12-27 21:40 发表 可以利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下: 用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。 然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。 注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。 以上仅在word2003中可用,其他版本没有Microsoft Office Document Image Writer。
拒绝任何人 以任何形式在本论坛发表与中华人民共和国法律相抵触的言论! 欢迎大家对不合法及不健康内容进行监督和举报。举报电话:0595-85555775