Python爬虫爬取王者荣耀英雄信息并保存到图数据库

server/2024/10/16 0:24:25/

爬取信息说明

  1. 英雄名称
  2. 英雄类型
  3. 英雄包含的所有皮肤名称

创建英雄类型节点

王者荣耀官方给出的英雄类型是以下几种:
在这里插入图片描述
直接准备好英雄类型词典

python">hero_type_dict = ['战士', '法师', '坦克', '刺客', '射手', '辅助'
]

添加到图数据库

python">def create_hero_type_node():for hero_type in hero_type_dict:cypher = "MERGE (n:HeroType{label: '" + hero_type + "'})"graph.run(cypher).data()print('创建英雄类型节点成功')

创建英雄信息节点

获取英雄信息

python">def get_hero_info_list():# 英雄的全部信息的urlhero_info = 'https://pvp.qq.com/web201605/js/herolist.json'# 获取英雄的全部信息response = requests.get(hero_info)# 转为字典格式hero_info_dict = json.loads(response.text)return hero_info_dict

打印的内容如下:
在这里插入图片描述
这里需要注意的是,部分英雄包含两个英雄类别。

保存英雄信息

python">def create_hero_node():hero_info_dict = get_hero_info_list()# 1战士 2法师 3坦克 4刺客 5射手 6辅助for hero in hero_info_dict:# print(hero)# print(str(hero.get('cname')) + '===' + str(hero_type[hero.get('hero_type')-1]) + '===' + str(hero.get('skin_name')))hero_type_list = [str(hero_type_dict[hero.get('hero_type') - 1])]if '|' in str(hero.get('skin_name')):skin_name_list = hero.get('skin_name').split('|')else:skin_name_list = [hero.get('skin_name')]if 'hero_type2' in str(hero):hero_type_list.append(str(hero_type_dict[hero.get('hero_type2') - 1]))# 创建英雄信息节点hero_cypher = "MERGE (n:Hero{label: '" + str(hero.get('cname')) + "'})"graph.run(hero_cypher).data()# 创建英雄->类型关系for hero_type in hero_type_list:cypher_rel = "MATCH(h:Hero{label:'" + str(hero.get('cname')) + "'}),(t:HeroType{label:'" + hero_type + "'}) MERGE (h)-[r:类型]->(t) RETURN h,r,t"graph.run(cypher_rel).data()for skin_name in skin_name_list:# 创建英雄皮肤节点cypher = "MERGE (n:Skin{label:'" + skin_name + "'})"graph.run(cypher).data()# 创建英雄->皮肤关系cypher_rel = "MATCH(h:Hero{label:'" + str(hero.get('cname')) + "'}),(s:Skin{label:'" + skin_name + "'}) MERGE (h)-[r:皮肤]->(s) RETURN h,r,s"graph.run(cypher_rel).data()print(str(hero.get('cname')) + '===' + str(hero_type_list) + '===' + str(skin_name_list))

完整代码

python">import jsonimport requests
from bs4 import BeautifulSoup
from py2neo import Graph, RelationshipMatcher, NodeMatcherfrom dict import hero_type_dicturl = "bolt://localhost:7687"
username = "neo4j"
password = 'Suns3535'
graph = Graph(url, auth=(username, password), name="wzry")
node_matcher = NodeMatcher(graph=graph)
relationship_matcher = RelationshipMatcher(graph=graph)def get_hero_info_list():# 英雄的全部信息的urlhero_info = 'https://pvp.qq.com/web201605/js/herolist.json'# 获取英雄的全部信息response = requests.get(hero_info)# 转为字典格式hero_info_dict = json.loads(response.text)return hero_info_dictdef create_hero_type_node():for hero_type in hero_type_dict:cypher = "MERGE (n:HeroType{label: '" + hero_type + "'})"graph.run(cypher).data()print('创建英雄类型节点成功')def create_hero_node():hero_info_dict = get_hero_info_list()# 1战士 2法师 3坦克 4刺客 5射手 6辅助for hero in hero_info_dict:# print(hero)# print(str(hero.get('cname')) + '===' + str(hero_type[hero.get('hero_type')-1]) + '===' + str(hero.get('skin_name')))hero_type_list = [str(hero_type_dict[hero.get('hero_type') - 1])]if '|' in str(hero.get('skin_name')):skin_name_list = hero.get('skin_name').split('|')else:skin_name_list = [hero.get('skin_name')]if 'hero_type2' in str(hero):hero_type_list.append(str(hero_type_dict[hero.get('hero_type2') - 1]))# 创建英雄信息节点hero_cypher = "MERGE (n:Hero{label: '" + str(hero.get('cname')) + "'})"graph.run(hero_cypher).data()# 创建英雄->类型关系for hero_type in hero_type_list:cypher_rel = "MATCH(h:Hero{label:'" + str(hero.get('cname')) + "'}),(t:HeroType{label:'" + hero_type + "'}) MERGE (h)-[r:类型]->(t) RETURN h,r,t"graph.run(cypher_rel).data()for skin_name in skin_name_list:# 创建英雄皮肤节点cypher = "MERGE (n:Skin{label:'" + skin_name + "'})"graph.run(cypher).data()# 创建英雄->皮肤关系cypher_rel = "MATCH(h:Hero{label:'" + str(hero.get('cname')) + "'}),(s:Skin{label:'" + skin_name + "'}) MERGE (h)-[r:皮肤]->(s) RETURN h,r,s"graph.run(cypher_rel).data()print(str(hero.get('cname')) + '===' + str(hero_type_list) + '===' + str(skin_name_list))# 创建英雄类型节点
create_hero_type_node()
# 创建英雄信息
create_hero_node()

实现效果

在这里插入图片描述


http://www.ppmy.cn/server/124863.html

相关文章

Many2one(多对一)关联场景中,如何从模型(多)关联到模型(一)的某个字段

好的,让我们换一个更容易理解的例子,涉及到图书和作者之间的关系。假设我们有两个模型:library.book(图书)和 library.author(作者)。每本图书可以有一个作者,因此我们可以使用 Many…

「Qt Widget中文示例指南」如何实现一个平板电脑示例?(一)

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写,所有平台无差别运行,更提供了几乎所有开发过程中需要用到的工具。如今,Qt已被运用于超过70个行业、数千家企业,支持数百万设备及应用。 当您在平板电脑上使用…

Linux-TCP重传

问题描述: 应用系统进行切换,包含业务流量切换(即TongWeb主备切换)和MYSQL数据库主备切换。首先进行流量切换,然后进行数据库主备切换。切换后发现备机TongWeb上有两批次慢请求,第一批慢请求响应时间在133…

9.26-9.29学习

一.项目结构的建立 5个微服务模块 新建好各个模块后,在项目pom下引入各模块。各pom文件指定springboot版本2.1.8.RELEASE .gitignore #表示任意路径下的xx文件 **/mvnw **/mvnw.cmd**/.mvn **/target/.idea**/.gitignore 二.数据库初始化 一个微服务模块对应一个数…

Hi3536AV100 22AP20/SS626V100 芯片及开发板

22AP20 是针对多路高清/超高清(1080p/4M/5M/4K)智能 NVR 产品应用开发的新一代专业高端 SoC 芯 片。22AP20 集成了 ARM Cortex-A55 八核处理器和性能强大的图像分析工具处理器,支持多种智能算法 应用。22AP20 支持 24 路 1080p 多协议解码及 …

2024年配置YOLOX运行环境+windows+pycharm24.0.1+GPU

1.配置时间2024/9/25 2.Anaconda-python版本3.7,yolox版本0.2.0 YOLOX网址: https://github.com/Megvii-BaseDetection/YOLOX 本人下载的这个版本 1.创建虚拟环境 conda create -n yolox37 python37 激活 conda activate yolox37 2.安装Pytorch cuda等&…

正向代理与反向代理:原理、区别以及应用(Nginx 和 Tomcat)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言1. 实现原理正向代理工作流程: 反向代理工作流程: 区别 2. 使用案例Nginx作为正向代理Nginx作为反向代理Tomcat作为反向代理 3. 适用场景…

8月面试总结

面试总结 前言一、公司甲(一)技术面(二)HR面 二、公司乙三、公司丙(一)技术面HR面 四、公司丁五、公司戊六、公司己七、公司庚八、公司辛九、公司壬总结 前言 提示:这里可以添加本文要记录的大…