Python:百度贴吧实现自动化签到

news/2024/9/29 3:28:19/

早知道,还是python

Github项目仓库在这。

相关API

签到+贴吧列表

签到分为两个接口,PC端签到一次经验+2,而移动端签到则是一次经验+6。该用哪个接口已经很明显了。不过这里还是列出PC端的签到API。

# PC端签到接口
# sign_url = "https://tieba.baidu.com/sign/add"# 移动端签到接口
# sign_url = "https://c.tieba.baidu.com/c/c/forum/sign"

贴吧列表如果是通过“爱逛的吧”去获取,很明显不全。所以我是通过爬取“关注的吧”页面来获取贴吧列表的。

https://tieba.baidu.com/i/i/forum?&pn=1
https://tieba.baidu.com/i/i/forum?&pn=2
...

 

实现思路

获取列表+发起签到请求

获取列表前,需要BDUSS+STOKEN拿到tbs。在发帖和签到的时候payload里头都会包含这个tbs,没有就发不出去,估计是用户标识符一类的东西。

tbs_url = "https://tieba.baidu.com/dc/common/tbs"
response = json.loads(requests.get(tbs_url, cookies={"BDUSS": BDUSS, "STOKEN": STOKEN}).text)
login_state = response["is_login"]
if login_state == 1:logger.debug("登录成功")
else:logger.debug(login_state)raise Exception("登录失败")
return response["tbs"], BDUSS, STOKEN

获取贴吧列表比较简单粗暴,Cookies带上BDUSS和STOKEN,再用get方法获取页面的html,再用正则表达式去拿出贴吧名和对应的贴吧链接。

<tr><td><a href="/f?kw=%C9%EE%DB%DA%BC%BC%CA%F5%B4%F3%D1%A7" title="深圳技术大学">深圳技术大学</a></td><td><a class="cur_exp" target="_blank"href="/f/like/level?kw=%C9%EE%DB%DA%BC%BC%CA%F5%B4%F3%D1%A7&lv_t=lv_nav_intro">17788</a></td><td><a style="display:block;" class="like_badge badge_lv3_1" title="13级会员" target="_blank"href="/f/like/level?kw=%C9%EE%DB%DA%BC%BC%CA%F5%B4%F3%D1%A7&lv_t=lv_nav_intro"><div class="like_badge_title">内牛满面</div><div class="like_badge_lv">13</div></a></td><td><spanonclick="ForumManager.undo_like(this.getAttribute('balvid'), this.getAttribute('balvname'), this.getAttribute('tbs'))"balvid="23311541" balvname="%C9%EE%DB%DA%BC%BC%CA%F5%B4%F3%D1%A7" tbs="a527b042d6559d351726813316"><imgclass="pt" src='//tb1.bdstatic.com/tb/static-member/img/close.gif' /></span></td>
</tr>

不过用PC端的“关注的吧”接口除了bduss之外,还必须得带上stoken才能拿到数据。拿到的贴吧列表存不存到本地,看个人需求。我是选择全部存到本地json。

# 从百度贴吧获取关注的贴吧列表
# 结果保存到tieba_dict.json文件中
def get_tieba_dict():tieba_dict = {}_, BDUSS, STOKEN = get_cookies()Cookies = {"BDUSS": BDUSS,"STOKEN": STOKEN,}page = 1tieba_sum = 0while True:mylike_url = "https://tieba.baidu.com/f/like/mylike?&pn=" + str(page)try:response = requests.get(mylike_url, cookies=Cookies)except Exception as e:raise Exception("请求失败:" + str(e))data = extract_data(response.text)if data == []:breakfor i in data:tieba_name = re.search(r"<a.*?>(.*?)</a>", i).group(1)tieba_url = prefix + re.search(r"href=\"(.*?)\"", i).group(1)if tieba_name is not None:tieba_sum += 1tieba_dict[tieba_name] = tieba_urlpage += 1with open("tieba_dict.json", "w", encoding="utf-8") as f:json.dump(tieba_dict, f, ensure_ascii=False)

发起签到请求分为两部分,payload需要带上贴吧名和tbs标识。如果用的移动端签到接口还需要带上它们md5加密后的十六进制结果。我调这接口的时候一直报“未知错误”,后面参考了其他repo才发现要带上这么个参数。

sign_str = f"kw={tieba_name}tbs={tbs}tiebaclient!!!"
sign = hashlib.md5(sign_str.encode("utf-8")).hexdigest()
payload = {"kw": tieba_name,"tbs": tbs,"sign": sign,
}

Cookies只需要bduss,stoken只有在获取贴吧列表时才用得到。

Cookies = {"BDUSS": BDUSS,
}
resp = requests.post(sign_url,cookies=Cookies,data=payload,
)

如果签到成功,返回的json会包含user_info。失败的话直接就是error_code,可以在这做个校验。比如GTA5吧,女权吧这种被关闭的吧,如果直接调接口签到,就会在这报错。

    if "user_info" in resp.json():logger.debug("签到成功:" + tieba_name + "吧")return Trueelif resp.json()["error_code"] == "160002":# 已签到logger.error("签到失败:" + tieba_name + "吧" + " 失败原因:" + resp.json()["error_msg"])else:logger.error("签到失败:" + tieba_name + "吧")logger.debug(str(resp.json()))logger.error("失败原因:" + resp.json()["error_msg"]

目前不知道签到过快会怎么样,总之我加了1~5秒的随机。貌似PC端才会检测签到过快,有时候我一个小时内连续签到98个贴吧就会触发机制,导致当天内的其他在PC端上签到,都需要带上captcha验证码。移动端签到不受影响。


http://www.ppmy.cn/news/1531291.html

相关文章

ZYNQ FPGA自学笔记~操作PLL

一 时钟缓冲器、管理和路由 垂直时钟中心&#xff08;clock backbone&#xff09;将设备分为相邻的左侧和右侧区域&#xff0c;水平中心线将设备分为顶部和底部两侧。clock backbone中的资源镜像到水平相邻区域的两侧&#xff0c;从而将某些时钟资源扩展到水平相邻区域。BUFG不…

跟着问题学12——GRU详解

1 GRU 1. 什么是GRU GRU&#xff08;Gate Recurrent Unit&#xff09;是循环神经网络&#xff08;Recurrent Neural Network, RNN&#xff09;的一种。和LSTM&#xff08;Long-Short Term Memory&#xff09;一样&#xff0c;也是为了解决长期记忆 和反向传播中的梯度等问题…

学习记录:js算法(四十六):平衡二叉树

文章目录 平衡二叉树我的思路网上思路 总结 平衡二叉树 给定一个二叉树&#xff0c;判断它是否是 平衡二叉树 图一 图二 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;true示例 2&#xff1a; 输入&#xff1a;root [1,2,2,3,3,null…

第五章 COMMIT新镜像到本地

目录 一、拉取并启动Tomcat镜像 二、更新tomcat的内容 三、提交容器生成新镜像 四、运行新镜像 本章节内容较为简单&#xff0c;通过commit命令用来将容器的当前变更状态保存为一个新镜像到本地作为后续使用&#xff0c;我们也可以将这个新commit的镜像从本地推送到阿里云或…

asp.net core日志与异常处理小结

asp.net core的webApplicationBuilder中自带了一个日志组件,无需手动注册服务就能直接在控制器中构造注入&#xff0c;本文主要介绍了net core日志与异常处理小结&#xff0c;需要的朋友可以参考下 ILogger简单使用 asp.net core的webApplicationBuilder中自带了一个日志组件…

4、FPGA特征简介

1、FPGA器件简介 FPGA是由存放在片内的RAM来设置其工作状态的&#xff0c;因此工作时需要对片内RAM进行编程。用户可根据不同的配置模式&#xff0c;采用不同的编程方式。FPGA有如下几种配置模式。 1&#xff09;并行模式&#xff1a;一片EPROM配置一片FPGA。 2&#xff09;主从…

Python知识点:如何使用Python进行卫星数据分析

开篇&#xff0c;先说一个好消息&#xff0c;截止到2025年1月1日前&#xff0c;翻到文末找到我&#xff0c;赠送定制版的开题报告和任务书&#xff0c;先到先得&#xff01;过期不候&#xff01; 如何使用Python进行卫星数据分析 卫星数据分析是地球观测领域的一项关键技术&a…

【Python-tkinter】实现简单的文本编辑器(附带教程源码)

如果你也是刚入门的小伙伴呢&#xff0c;小编为你们准备了入门Python学习籽料和Python入门实践&#xff0c;点击领取&#xff08;无偿获得&#xff09; 利用tkinter实现简单的文本编辑器。创建一个简单的文本编辑器。可以用读文件的方式在一个文本域里显示一些文字供用户编辑…