Python与c语言的区别与联系

Python与c语言都是一种机器学习语言，进过长时间的学习和总结，我将Python与c语言的一些特点总结成以下几点，不全面还望多多指正。

1、因为C语言是编译型语言，python是解释型语言，所以python的执行速度没有C语言那么快。

2、基本元素的区别，python中的基本元素相比于C语言大大减少，比较特殊的就是python语言中的tuple（元组），一个类似于列表且内部元素不允许被改变的一个数据，这样可以使得程序的数据更加安全；其次是python中的dictionary（字典），利用它的键值对，可以实现数据之间的相互匹配，例如账号—密码，国家—首都的匹配等等；最后就是python中的set（集合），利用集合可以完成数值的去重，并、交集的运算等。

在这里插入图片描述

3、Python中的变量使用之前是不用先进行定义的，变量可以拿来就直接使用，所以在程序接受输入之前，如果没有进行明确数据类型，python就会把它默认为字符串类型，即你输入一个2赋给a，当你没有明确a是int类型的话，那么你如果后续对a进行运算就会出错，输出a*2的时候就会给你输出22。

4、运算符的区别，在python中的逻辑运算符改成and（&&）、or（||）和not（！），以及在python中没有自加、自减这两种运算。

5、C语言是通过{}来表示语句体，但是python是通过缩进来表示语句体的，因此在使用python的时候同样的语句可能由于缩进不一样得到不一样的结果。

6、Python的判断语句，提供了多一个elif，相当于C语言中的elseif语句；循环语句中也提供了else语句，在while语句中使用else语句，当while的条件判断为false是退出循环执行else语句。

7、Python中提供了很多模块，模块中很多的内置函数可以直接进行调用，只需要在导入该模块就可以直接通过.运算来进行调用模块内的函数，例如importmath，通过math.pi即可得到pi的值。

8、C语言是面向过程的一个语言，python是面向对象的一个语言。关于面向对象和面向过程的区别，我听到一个很有趣的说法是，面向过程是一碗蛋炒饭，而面向对象是一份盖浇饭。蛋炒饭的好处就是入味均匀，吃起来香。如果恰巧你不爱吃鸡蛋，只爱吃青菜的话，那么唯一的办法就是全部倒掉，重新做一份青菜炒饭了。盖浇饭就没这么多麻烦，你只需要把上面的盖菜拨掉，更换一份盖菜就可以了。盖浇饭的缺点是入味不均，可能没有蛋炒饭那么香。所以面向对象的好处在于更加多元化，更加易于维护。

精通Python爬虫框架Scrapy_php爬虫框架哪个好用

Scrapy框架原理

1、Scrapy特点

特点是一个用Python实现的为了爬取网站数据、提取数据的应用框架

Scrapy使用Twisted异步网络库来处理网络通讯

使用Scrapy框架可以高效（爬取效率和开发效率）完成数据爬取

Scrapy架构有几个组件？他们具体的工作流程是什么？

答：Scrapy架构有5个组件：分别为

引擎、爬虫文件（负责数据解析处理的）、调度器（负责维护请求队列的）、下载器（负责发请求得到响应对象的）、项目管道（负责数据处理的）

大致的工作流程是：爬虫项目启动，引擎找到爬虫索要第一批要抓取的URL地址，交给调度器入队列，再出队列，交给下载器去下载，下载器下载完成之后，拿到response。拿到的response通过引擎交给爬虫。爬虫文件负责具体的数据解析提取，提取出来的数据交给项目管道进行处理；如果是要继续跟进的URL地址，则再次交给调度器入队列，如此循环。

Scrapy五大组件及作用

引擎(Engine)：整个框架核心
调度器(Scheduler)：维护请求队列
下载器(Downloader)：获取响应对象
爬虫文件(Spider)：数据解析提取
项目管道(Pipeline)：数据入库处理

Scrapy工作流程

工作流程描述 – 爬虫项目正式启动

引擎向爬虫程序索要第一批要爬取的URL，交给调度器入队列

调度器处理请求后出队列，通过下载器中间件交给下载器去下载

下载器得到响应对象后，通过蜘蛛中间件交给爬虫程序

爬虫程序进行数据提取：数据交给管道文件去入库处理

对于需要跟进的URL，再次交给调度器入队列，如此循环。