第三阶段 数据采集
练习1:urllib 爬虫
第1关:urllib基础
任务描述
本关任务:掌握 urlopen 函数的使用,完成一个简易的爬取程序。
相关知识
为了完成本关任务,你需要掌握:urlopen 函数。
urlopen函数
urlopen 函数是 urllib 模块下的一个方法,用于实现对目标 url 的访问。函数原型如下:
import urllib # 导入urllib包
urllib.request.urlopen(url, data=None, cafile=None, capath=None,
cadefault=False, context=None)
参数说明:
url 参数:统一资源定位符,目标资源在网络中的位置(如:https://www.xxx.com/);
data 参数:data 用来指明发往服务器请求中的额外信息,data 必须是一个字节数据对象,默认为 None;
cafile、capath、cadefault 参数:用