爬职业热度--兼职cat

爬职业热度--兼职cat

embedded/2024/10/22 2:20:12/

免责声明:本文仅做技术交流与学习...请勿不正当使用...

循环页数爬取

import pandas as pd
import requests
from lxml import etree
# 初始化一个空的 DataFrame
df = pd.DataFrame()
data_list = []headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.5735.289 Safari/537.36"
}
for s in range(1, 12):url = f"https://nanchang.jianzhimao.com/index{s}.html"# 请求网页response = requests.get(url, headers=headers).text# 解析网页html = etree.HTML(response)print("\033[31;1m","*" * 20, "开始爬取", s, "页", "*" * 20,"\033[0m")for i in range(1, 16):name = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/a/text()')           # 名称quyu = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/div[1]/span/text()') # 限制地区rens = html.xpath(f'//*[@id="content_list_wrap"]/li[{i}]/div[2]/span/text()') # 关注人数if name and quyu and rens:# 将单元格数据转换为字典row_data = {'岗位名称': name[0] if name else None,'限制地区': quyu[0] if quyu else None,'职位热度': rens[0] if rens else None,}data_list.append(row_data)# 将数据列表转换为 DataFrame 并追加到 dfdf = pd.concat([df, pd.DataFrame(data_list)], ignore_index=True)# 清空 data_list 以便下一次迭代data_list = []# 将 DataFrame 保存到 Excel 文件
df.to_excel('data.xlsx', index=False)

--->csv

http://www.ppmy.cn/embedded/86706.html

相关文章

（数据结构）二叉树

（数据结构）二叉树

1.树型结构 1.1.概念树是一种非线性的数据结构，它是由n（n>0）个有限节点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点： 有…

阅读更多...

xLua | xLua Framework | 1 打包

xLua | xLua Framework | 1 打包

0. 热更新做什么 1、资源热更资源和热更步骤（Bundle） 2、代码 Lua与C#的交互（xLua） 3、框架开发流程第一阶段：Bundle处理构建；加载；更新第二阶段：C#调用Lua Lua加载与管理 Lua绑…

阅读更多...

JMeter接口测试：测试中奖概率！

JMeter接口测试：测试中奖概率！

介绍 Apache JMeter 是 Apache 组织基于 Java 开发的压力测试工具，用于对软件做压力测试。JMeter 最初被设计用于 Web 应用测试，但后来扩展到了其他测试领域，可用于测试静态和动态资源，如静态文件、Java 小服务程序、CGI 脚本、J…

阅读更多...

linux mysql 添加环境变量

linux mysql 添加环境变量

要在Linux上添加MySQL的环境变量，可以按照以下步骤进行操作：打开终端窗口。使用文本编辑器（如vi或nano）打开~/.bashrc文件：vi ~/.bashrc或nano ~/.bashrc在文件的末尾添加以下内容：export PATH$PATH:/path/…

阅读更多...

Spring Boot 项目中使用事件发布和监听来实现消息推送和处理

Spring Boot 项目中使用事件发布和监听来实现消息推送和处理

对于在 Spring Boot 项目内部不同函数间或不同线程间的消息推送和处理机制，您可以使用 Spring 内置的事件发布/订阅机制。这种机制允许不同组件之间异步通信，而不需要它们彼此直接依赖。以下是一个示例，展示了如何在 Spring Boot 项目中使用…

阅读更多...

elementplus菜单组件的那些事

elementplus菜单组件的那些事

在使用 elementplus 的菜单组件时，我发现有很多东西是官方没有提到但是需要注意的点 1. 菜单组件右侧会有一个边框设置css .el-menu {border: 0 !important; } 2. 使用其他的 icon 文字内容一定要写在这个名字为 title 的插槽中 <el-menu-itemv-for"it…

阅读更多...

Common instructions of git(git常见指令)

Common instructions of git(git常见指令)

git add . add your codes to computer staging area 提交你的代码到暂存区 git status view the status of added files in computer staging area 查看暂存区已提交文件状态 git commit -m "message" add your codes to your local branch 添加你的代码到你的本地…

阅读更多...

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 开源项目热度排行榜(100分) - 三语言AC题解(Python/Java/Cpp)

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 开源项目热度排行榜(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆Coding ，一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 👏 感谢大家的订阅➕ 和喜欢💗 🍿 最新华为OD机试D卷目录，全、新、准，题目覆盖率达 95% 以上，支持题目在线评测，专栏文章质量平均 93 分最新华为OD机试目录…

阅读更多...

最新文章