更多内容请见: 爬虫和逆向教程-专栏介绍和目录
文章目录
- 一、网页基础
- 1.1 网页的基本概念
- 1.2 请求与响应
- 1.3 HTTP 协议
- 1.4 HTTP 状态码
- 1.5 动态网页与静态网页
- 二、 网页的基本结构
- 2.1 HTML(超文本标记语言)
- 2.2 CSS(层叠样式表)
- 2.3 JavaScript
- 三. 爬虫的基本原理
- 四、网页数据的提取方法
- 五、爬虫的注意事项
在编写爬虫之前,了解网页的基础结构和工作原理是非常重要的。网页是由 HTML、CSS 和 JavaScript 构成的,爬虫的主要任务是从网页中提取有用的信息。
关于前端:HTML、CSS、JavaScript,更详细版请参考:
1- 【前端】HTML 备忘清单(超级详细!)
2- 【前端】CSS 备忘清单(超级详细!))
3- 【前端】JavaScript 备忘清单(超级详细!))