以前下载文库上面的内容,都是用冰点下载,因为很多都失效了,冰点是唯一能用的。不过我们常用的文库还是百度,虽然百度的口碑不好,但是文库上面的资源倒是挺多,搜索到的很多资源,也放在百度文库里面,所以我们经常和它打交道。以前我们只要有财富值就能下载文库的资源,后续升级了以后,还必须要下载券才能下载了,现在搞得连复多段文字都不准,实在是不爽。冰点文库能下载互联网几乎所有的文档网站,但是有一个弊端就是软件下载的文档是PDF不可编辑版本,因为软件是通过截图合成的,所以内容都不能编辑和复制,还得自己OCR识别。
今天给大家带来的软件不需要那么麻烦的操作,输入地址就能直接下载源格式文档!注意,是源格式,文档是可以随意编辑和修改的,非常方便。
软件是使用Python开发的,不过作者并没有美化,所以界面很丑,但我们只需要功能就行,就先不管了。
转存失败重新上传取消
使用起来很简单,输入地址,点击解析即可。
软件会判断文档格式,目前支持doc文档和PPT下载,然后你能看一大串地址,说明软件在开始下载了。
下载速度根据你文档页数而定,下载完成后,会保存在你选择的位置。
文档格式基本上和网页一致,并且是可以直接编辑的。如果这个文档的字体不一样,而你的电脑又没有这个字体,那么文档的字体显示就很奇怪,需要你自己去修改了。
怀着好奇心,我们去看看他是怎么下载的文档,为什么是可以编辑的呢?
在命令窗口复制一条软件下载的一个地址,打开查看,可以看到一堆代码,这一堆代码的格式为JSON,目前暂时看不出有什么东西。
将内容去掉开头的函数名,复制到解析工具里面,进行解析。这下就比较清晰了,显示该篇字体为宋体,还有每行的样式,文字大小等等。
转存失败重新上传取消
同时每行文字内容也被解析出来了。
那么,这个JSON数据,可以通过一个转换器将他转换成文档格式,这也解释得通为什么百度文库可以在网页显示文档内容,网页上也可以复制了,原来是将文档内容解析成了JSON数据。
那么Python配合相关的转换器,就能将内容转换成文档文件了。
至于这个地址是怎么来的,抓取网页的数据应该能解得到,这儿就不再和大家深入讨论了。
软件目前只支持需要下载券或者免费的文档下载,收钱的文档是不能下载的,这个比较遗憾,但是也还好,如果收钱的也能下载,那么作者就离进去不远了。这种工具还是且用且珍惜吧。
下载地址
BDWD_0.95_Single便捷版下载:
蓝奏云盘 密码:9o3u
移动和彩云 提取密码:oVE1
微信扫描下面右侧二维码关注公众号,发送"解压"二字获得解压密码。
原创文章,转载请注明: 转载自心语家园
本文链接地址: 居然有比冰点更好的文库下载神器,能下载文库源文档?