第五章爬虫小程序-实例43-获取网页内容

第五章爬虫小程序-实例43-获取网页内容

news/2024/11/25 0:28:03/

1、准备工作

用Python编写的访问网页的程序中，有很多是调用 requests 库模块中的函数来进行操作，这个库模块把网页请求和操作等多项功能进行了高度封装，使其可以轻而易举完成浏览器的许多操作。

requests库是第三方模块，需要进行安装，安装命令如下所示。

pip install requests

2、网络爬虫基础知识

（1）robots 协议：网站往往通过授权，声明允许用户爬取哪部门数据、不允许爬取哪些数据，这些授权写在robots.txt 中，称为 robots 协议。

（2）HTTP协议

（3）HTTPS协议：该协议被称为是安全的HTTP协议，就是在HTTP协议增加了安全协议。HTTPS采取证书密钥加密方式，加密方式有对称密钥加密、非对称密钥和证书加密三种方式。

3、利用 get() 函数获取网页的内容

本节编程实例主要利用 Requests 库中的 get() 函数发送 GET 请求，获取网页的内容。样例代码如下所示。

import requests
if __name__=="__main__":vprotocol="https"url =vprotocol+"://www.baidu.com/s"headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.3.6(KHTML,like Gecko) Chrome/63.0.3239.132 Safari/537 QIHU 360SE'}queryword = input("请录入查询内容：")parm={'q':queryword}res=requests.get(url,params=parm,headers=headers)txt=res.textwith open("./test1.html","w",encoding="utf-8") as fs:fs.write(txt)print("程序运行完成")

4、运行结果

http://www.ppmy.cn/news/847978.html

相关文章

ASEMI-A7二极管可用什么代替，M7二极管正负极判断

ASEMI-A7二极管可用什么代替，M7二极管正负极判断

编辑-Z 在电子设备的世界中，二极管是最常见的组件之一。它们在各种设备中发挥着重要的作用，包括电源适配器、电源供应器、电池充电器等。在这篇文章中，我们将探讨A7二极管可用什么代替，以及M7二极管正负极判断。首先&#xff0c…

阅读更多...

按计算机应用领域分类,按计算机用途分类

按计算机应用领域分类,按计算机用途分类

语音内容： 大家好，我是时间财富网智能客服时间君，上述问题将由我为大家进行解答。计算机用途分类有很多类，常见的计算机用途分类的有： 1、数值计算。计算机广泛地应用于科学和工程技术方面的计算，这是计算…

阅读更多...

旧电脑千万不要扔掉！它的剩余价值多得超乎想象！

旧电脑千万不要扔掉！它的剩余价值多得超乎想象！

相信很多人家里都会有闲置的旧电脑，没法用，扔了又可惜。电脑硬件更新换代很快，一般电脑用三五年之后配置就不行了。大部分用户会直接卖掉，或者闲置在一边吃灰。既然是旧电脑，配置肯定不太高，很多游戏可能…

阅读更多...

计算机网卡作用,一台电脑使用两张网卡的用途是什么

计算机网卡作用,一台电脑使用两张网卡的用途是什么

一台电脑使用两张网卡的用途是什么双硬盘、双显卡、双声卡、双网卡大家都听得比较多，但实际使用的时候，它们有作用吗？今天广州电脑维修就“一台电脑使用两张网卡的用途是什么”的这个话题进行简单讨论。双网卡作用是什么？什么用…

阅读更多...

电脑android文件夹打开方式,电脑打开apk文件的方法步骤详解

电脑android文件夹打开方式,电脑打开apk文件的方法步骤详解

apk文件是可以安装到手机上面的程序，在安卓手机上只要用文件管理器打开这个文件就可以开始安装了。在这里主要说一下在电脑上怎么打开apk文件，提取apk文件的资源。下面是学习小编给大家整理的有关介绍电脑打开apk文件的技巧，希望对大家有帮助…

阅读更多...

windows7/10 预览窗口的用途及如何关闭

windows7/10 预览窗口的用途及如何关闭

概述我们在工作中几乎很少使用预览文件窗格栏，因为看起来不舒服，还占用文件布局空间，导致看文件不舒服，但这些只对某些人来说还是挺好用的功能，因为它存在有它存在的意义。下面介绍如何用windows7/10，如何…

阅读更多...

计算机主机硬件图片,电脑主机里的各个硬件名称图片用途和使用说明

计算机主机硬件图片,电脑主机里的各个硬件名称图片用途和使用说明

主机中每个硬件的名称图像用途主要计算机主机包括：电源，主板，CPU，内存，图形卡，硬盘和光盘驱动器。 1、电源： 计算机电源是一种将220V交流电转换为直流电并为计算机配件(例如主板，驱…

阅读更多...

Linux系统的用途

Linux系统的用途

如果您正在浏览新的台式机或笔记本电脑，它可能会包含最新版本的 Windows。哎呀，你甚至可以使用基于 Windows 的 PC 阅读这篇文章。当然，如果您是专门的 Apple 客户，您可能会使用基于 MacOS 的 PC。它们是目前主导台式机和笔记本电脑市场的两大主要操作系统。 Linux 是一个基…

阅读更多...

最新文章