- ·上一篇:如何把word左右页变成上下页
- ·下一篇:怎样插入图标并添加标题,并有符号
如何把百度文库里已经下载的东西变成word文档
1.如何把百度文库里已经下载的东西变成word文档
一、怎样将PDF文档转换成Word文档 在adobe acrobat里将要转换的PDF文档打开,操作菜单“文件”→“另存为”,将保存类型选为“Microsoft word”就能转换成Word文档。
或者点击Adobe Acrobat里的“导出”工具按钮,导出文件类型选择“Word”,结果是一样的。 一款名字为e-PDF To Word Converter的软件专门用来将PDF文档转换成Word文档,网上有汉化特别版可供下载。
类似软件还很多,就不一一列举了。 /网站提供在线转换服务,只需要将待转换的PDF文档上传到这个网站,网站就会将载转换成的Word文档发到你的电子信箱里。
特别要说明的是,如果是通过扫描纸质文件生成的PDF文档,转换成Word文档以后得到的每一页都是插在Word文档里的图片,无法进行编辑。即便是由Word等其它可以编辑的电子文档生成的PDF文档,转换成Word文档以后,文字也是分布在一个个图文框里,如果版面稍复杂一些,文字还有可能重叠在一起,重新编辑的工作量还很大。
二、怎样从PDF文档里导出文字 假如PDF文档是由Word等其它可以编辑的电子文档生成的,用adobe reader或adobe acrobat的“选择工具”选中文字后按“Ctrl”+“C”键,就可以将文字复制到剪贴板里,随便你粘贴到那里。adobe reader在安装后的默认状态下,“选择工具”是看不见的,需要操作菜单“工具”→“自定义工具栏”,在“选择工具”前打上钩,将它显现出来。
若要将整篇PDF文档的文字都导出来,在adobe reader里只要操作菜单“文件”→“另存为文本”,导出的文字就存到了一个文本文件里了。在adobe acrobat里则是操作菜单“文件”→“另存为”,保存类型选择“纯文本”,或者点击“导出”工具按钮,导出文件类型选择“更多格式”→“纯文本”。
三、使用OCR文本识别技术导出文字 如果PDF文档是通过扫描纸质文件生成的,就不能够用上述简单的方法导出文字了,但也可以借助OCR文本识别技术来导出文字。 在adobe acrobat里可以操作菜单“文档”→“OCR文本识别”→“使用OCR识别文本”,经过识别以后,就可以用“选择工具”选中文字进行复制了。
adobe reader没有自带OCR文本识别功能,但可以这样操作,操作菜单“文件”→“打印”,打印机名称选择“Microsoft Office Document Image Writer”,这是一个随Microsoft Office 2003一起安装到计算机里的虚拟打印机,它将PDF文档打印到后缀为“mdi”的文件里,并自动打开,在打开的“mdi”文件里依次操作菜单“工具”→“使用OCR识别文本”和“工具”→“将文本发送到word”就可以将文字导出到一个Word文档里。 OCR文本识别技术的识别率取决于创建PDF文档时的扫描精度,那些字迹模糊不清的文档,能够正确识别出的文字也不会太多。
四、怎样复制出PDF文档里的插图 用adobe reader或adobe acrobat打开PDF以后用“选择工具”选中插图后按“Ctrl”+“C”键,就可以将插图复制到剪贴板里。在adobe acrobat里操作菜单“高级”→“文档处理”→“导出所有图像”,就能够一次将文档里的所有图片全部导出成一个个图像文件。
五、怎样复制PDF文挡里的表格 用adobe acrobat打开PDF以后用“选择工具”选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“复制为表”,在Excel里操作菜单“选择性粘贴”,在对话框里选择“csv”后点击“确定”,PDF文挡里的表格就复制到Excel里了。也可以选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“在Excel里打开”,表格就自动变成了Excel表。
如果需要将表格粘贴到Word文挡,应当采用“选择性粘贴”以“无格式文本”进行粘贴,粘贴之后选中这些数据,再操作菜单“表格”→“转换”→“文本转换表格”。 如果PDF文档是通过扫描纸质文件生成的,就不能复制成表格,只可以将表格复制成图片。
六、怎样从多页的PDF文档里抽取若干页成为JPG格式图片 最方便的要数使用Adobe Acrobat,点击Adobe Acrobat里的“导出”工具按钮,并选择“JPG”,PDF文档的所有页面就自动转换成一个个JPG格式文件。 如果你有Photoshop软件,可以这样操作,在Photoshop里打开PDF文档,Photoshop会让你选择打开那个页面,选定页面后打开,再另存为JPG格式图片文件。
这个方法的缺点是一次只能抽取一页,需要重复操作,效率比较低。 以上将PDF文档转换成Word文档以及从PDF文档里导出文字或图像的方法,取决于该文档没有加密对文档进行限制,如果文档已经加密进行了限制,只有在解密了以后才有可能进行。
七、怎样去除word等软件里的Adobe Acrobat菜单栏 安装了Adobe Acrobat以后,在Word、Excel、AutoCAD软件的菜单里会多出几个Adobe Acrobat的菜单栏,其实这是Adobe Acrobat和这些应用软件的无缝结合,利用这些菜单可以方便地将这些应用软件创建的文档转换成PDF格式的文档,并能对转换的有关参数进行控制和调整。但是由于这些菜单占据了位置,不少使用者希望将它们去除。
去除的方法很简单,在“控制面板”里进入“添加和删除程序”,找到 Adobe Acrobat后点击“更。
2.如何将文件转换成Word可编辑的文字档案
现在以HP ScanJet4400c/4470c或5400c/5470c为例:在安装好扫描软体HP Precisionscan Pro3.1以后,扫描图片都正常了,但文字辨识怎麽做呢?操作步骤:将要辨识的文稿放在扫描器的玻璃板上,对齐右上角,面朝下,请注意别放歪,否则会影响辨识效果。
启动HP Precisionscan Pro3.1,按"指导步骤"1,"开始新扫描",预览画面出来后按住滑鼠左键用游标拉出一个选择区域,最好按文字的边缘来选,空白区域不要。
请将"输出类型"改为"可编辑文字"或"文字和图像" 这样才可以将图像转化成文字,为什麽很多人扫描后发现在Word里还是一个不可更改的图像,原因就是因为输出类型没设成可编辑文字。
现在可以选择"扫描至"或"另存为",这两项的区别是扫描至可以将辨识后的文字输出至一个程式中(那当然要是可以编辑文字的,不能是图片编辑器),一般都设成Microsoft Word。如果点选"扫描", Word会自动打开,辨识好的文字即出现在Word中,可以对照原稿编辑。”
另存为”是将辨识后的文字储存成一个档案,副档名为txt或rtf均可编辑,储存后再启动相关的应用程式,如Word打开编辑。
打开Word对照原稿修改,辨识之后很可能有一些错字,没有100%正确,辨识率与原稿有关系,原稿效果越好辨识效果也越好,请注意文字辨识对原稿有以下三点要求:
列印的稿件,白底黑字
标准打字字体
不能是表格或有大量横竖线(如果有表格,请配合其他软体厂商的文字辨识软体使用)。
也可以辨识英文,请您要辨识英文时,要注意修改一项设定,在功能表"扫描--首选项--文字",将当前OCR语言改为英语即可
"文字"里还有一项"文字输出",有带框线文字和流动文字的选项,如果您想将扫描结果保持和原文的排版方式一致则设成带框线文字,扫描后的文字外会有一个文本框,在Word中选择文本框选项删除即可。设成流动文字时将按不保持原稿的格式,也不会有文本框了。