爬职业热度--兼职cat

embedded/2024/10/22 2:20:12/

免责声明:本文仅做技术交流与学习...请勿不正当使用...

循环页数爬取

import pandas as pd
import requests
from lxml import etree
# 初始化一个空的 DataFrame
df = pd.DataFrame()
data_list = []headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.5735.289 Safari/537.36"
}
for s in range(1, 12):url = f"https://nanchang.jianzhimao.com/index{s}.html"# 请求网页response = requests.get(url, headers=headers).text# 解析网页html = etree.HTML(response)print("\033[31;1m","*" * 20, "开始爬取", s, "页", "*" * 20,"\033[0m")for i in range(1, 16):name = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/a/text()')           # 名称quyu = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/div[1]/span/text()') # 限制地区rens = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/div[2]/span/text()') # 关注人数if name and quyu and rens:# 将单元格数据转换为字典row_data = {'岗位名称': name[0] if name else None,'限制地区': quyu[0] if quyu else None,'职位热度': rens[0] if rens else None,}data_list.append(row_data)# 将数据列表转换为 DataFrame 并追加到 dfdf = pd.concat([df, pd.DataFrame(data_list)], ignore_index=True)# 清空 data_list 以便下一次迭代data_list = []# 将 DataFrame 保存到 Excel 文件
df.to_excel('data.xlsx', index=False)

--->csv


http://www.ppmy.cn/embedded/86706.html

相关文章

(数据结构)二叉树

1.树型结构 1.1.概念 树是一种非线性的数据结构,它是由n(n>0)个有限节点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点: 有…

xLua | xLua Framework | 1 打包

0. 热更新做什么 1、资源 热更资源和热更步骤(Bundle) 2、代码 Lua与C#的交互(xLua) 3、框架开发流程第一阶段:Bundle处理 构建;加载;更新第二阶段:C#调用Lua Lua加载与管理 Lua绑…

JMeter接口测试:测试中奖概率!

介绍 Apache JMeter 是 Apache 组织基于 Java 开发的压力测试工具,用于对软件做压力测试。JMeter 最初被设计用于 Web 应用测试,但后来扩展到了其他测试领域,可用于测试静态和动态资源,如静态文件、Java 小服务程序、CGI 脚本、J…

linux mysql 添加环境变量

要在Linux上添加MySQL的环境变量,可以按照以下步骤进行操作:打开终端窗口。使用文本编辑器(如vi或nano)打开~/.bashrc文件:vi ~/.bashrc或nano ~/.bashrc在文件的末尾添加以下内容:export PATH$PATH:/path/…

Spring Boot 项目中使用事件发布和监听来实现消息推送和处理

对于在 Spring Boot 项目内部不同函数间或不同线程间的消息推送和处理机制,您可以使用 Spring 内置的事件发布/订阅机制。这种机制允许不同组件之间异步通信,而不需要它们彼此直接依赖。 以下是一个示例,展示了如何在 Spring Boot 项目中使用…

elementplus菜单组件的那些事

在使用 elementplus 的菜单组件时&#xff0c;我发现有很多东西是官方没有提到但是需要注意的点 1. 菜单组件右侧会有一个边框 设置css .el-menu {border: 0 !important; } 2. 使用其他的 icon 文字内容一定要写在 这个 名字为 title 的插槽中 <el-menu-itemv-for"it…

Common instructions of git(git常见指令)

git add . add your codes to computer staging area 提交你的代码到暂存区 git status view the status of added files in computer staging area 查看暂存区已提交文件状态 git commit -m "message" add your codes to your local branch 添加你的代码到你的本地…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 开源项目热度排行榜(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆Coding ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,支持题目在线评测,专栏文章质量平均 93 分 最新华为OD机试目录…