1.入口
链接跳转: spider-flow
或者本地有git软件直接输入gittt中的链接地址,回车键梭哈即可
2.环境部署,必备jdk8+mysql
idea打开项目,重点修改如下
mysql用小皮软件(phpstudy)自带的mysql5,navicat软件导入sql文件
3 实践
这里随机选个受害者,菜鸟教程吧
https://www.runoob.com/
实践easy1
参考官方手册,新手调试可以这样如下
这里调试的话可以对照帮助文档一一找到自己需要的函数进行调试,如下这样添加一个输出项
实践 easy2 感觉基本上固定这样流程了(最常用的)
发现上面 xpaths()里面的内容都聚合到一个info_test1里面去了,这就要改进了
引入 var 和循环两节点
说明思路如下
这时候细细话过滤了,单个xpath,selector,细细化过滤确实selector好用,xpath太笼统
过滤取决于你自己的需要,这么舒服就怎么来
4.总结
确实对于0基础爬虫玩家来说,并不很容易懂,得模仿demo,不停调试,才成功的。给大家个参考,如果觉得有帮助,不妨点个赞哦,资料仅供学习参考,别把自己爬进去了哈。