python解析html数据，获取到的链接是以/或 ./ 或 ../ 开头的相对链接，不是以http开头的，需要补全

news/2024/11/7 22:33:48/

一、实现的目标

在使用爬虫获取网页html数据时，解析到的链接是/或./ 开头的相对链接，不是以http开头的链接，如：/picture/0/cca65350643c441e80d390ded3975db0.png 。此时需要完成对该链接的补全,以得到正确的链接。此外，我们需要将解析到的html数据保存到起来，将来需要展示在网页端，如果链接不完整，则html中的图片、附件等链接将无法正常显示出来，比如一段html数据：

<p style="text-indent:2em;" align="center">&#13;<img alt="" src="/attached/image/20170123/20170123085007_663.jpg" width="800" height="533"/>&#13;
</p>&#13;
<p style="text-indent:2em;" align="center">&#13;<img alt="" src="/attached/image/20170123/20170123085027_727.jpg" width="800" height="533"/>&#13;
</p>&#13;
<p style="text-indent:2em;" align="center">&#13;<img alt=

http://www.ppmy.cn/news/77192.html

瑞芯微RGMII的配置

主要配置项除去复位等信号，我们主要关注两大块的配置： 时钟配置 MAC 采用125M时钟，PHY采用25M时钟。主要配置时钟源，这个和具体硬件连线强相关。例如125M时钟可以来源于soc内部的PLL，也可以由对端PHY 提供。由对端P…

vue2+wangeditor富文本域

vue2wangeditor富文本域效果图安装依赖初始化简约模式自定义模式图片设置只允许 base64 方式支持图片服务器更多配置项目依赖项目代码效果图安装依赖 npm i wangeditor/editor wangeditor/editor-for-vue初始化 <template><div class"editor-box">…

Docker代码环境打包进阶 - DockerHub分享镜像

1. Docker Hub介绍 Docker Hub是一个广泛使用的容器镜像注册中心，为开发人员提供了方便的平台来存储、共享和分发Docker容器镜像。它支持版本控制、访问控制和自动化构建，并提供了丰富的公共镜像库，方便开发人员快速获取和使用各种开源应用和…

【软件测试用例篇】

🎉🎉🎉点进来你就是我的人了博主主页：🙈🙈🙈戳一戳,欢迎大佬指点! 欢迎志同道合的朋友一起加油喔🤺🤺🤺 目录 1. 测试用例的概念 2. 设计测试用例的好处 3…

OptaPlanner 中的hello world项目实战

实际操作步骤： 1.代码下载下载下来的文件目录 2.使用编辑器打开hello-world项目 3.进行配置配置JDK ，File——》Settings File——》Project Structure 配置maven 说明：不用下载新的maven，用工具自带的，需要将sett…

Chapter8 :Physical Constraints（ug903）

8.1About Physical Constraints（关于物理约束） XilinxVivado集成设计环境（IDE）允许通过设置对象属性值对设计对象进行物理约束。示例包括： •I/O约束，如位置和I/O标准 •布局约束&…

XML配置文件

说明 XML配置文件是一种使用XML语言编写的文件，通常用于配置软件应用程序XML配置文件通常包含一组参数或设置，用于指定应用程序的行为或属性。这些设置可能包括数据库连接信息、服务器地址、应用程序功能等。XML配置文件通常作为应用程序的一部分提供&a…

【TCP/IP 网络模型】

文章目录 TCP/IP 网络模型OSI七层模型、TIP/IP四层模型应用层（报文）传输层（段）网络层（包）网络接口层（帧） TCP/IP 网络模型 OSI七层模型、TIP/IP四层模型 OSI七层模型应用层&#x…

python解析html数据，获取到的链接是以/或 ./ 或 ../ 开头的相对链接，不是以http开头的，需要补全

一、实现的目标

相关文章