【Twitter爬虫】Twitter网络爬虫

news/2024/10/22 17:39:23/

利用selenium爬取Twitter

从2月9日起,Twitter不再支持免费访问Twitter API,继续使用Twitter API支付较高的费用。下面将介绍一种绕过Twitter API爬取推文的方式

Selenium Webdriver框架

首先介绍一下Selenium Webdriver,这是一款web自动化测试框架,可以利用它在web浏览器上模拟。下面演示下在python中如何引入selenium模块

from selenium import webdriver

实例化配置对象

options = webdriver.ChromeOptions()

配置对象开启无界面模式

options.add_argument("--headless")

实例化带有配置对象的driver对象

driver = webdriver.Chrome('chromedriver', options=options)

进入Twitter页面

Twitter首页 Twitter首页

driver.get('https://twitter.com/home')

登陆Twitter

先在网页上登陆自己的twitter账号,然后把cookies取出来并

cookies=[] #你的cookies
for cookie in cookies:driver.add_cookie(cookie)

接下来就可以自由访问twitter啦

爬取Twitter

url = f"https://twitter.com/search?q=hello&src=typed_query"
driver.get(url)

利用BeautifulSoup对网页进行分析

from bs4 import BeautifulSoup
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")

F12查看网页源码,可以看到每条推文的内容都写在红框标出来的区域里面
![在这里插入图片描述](https://img-blog.csdnimg.cn/f3e2d0857a0c40dc858f3c10b2f73b13.png
因此,我们先找出所有为这个属性的元素

tweets = soup.find_all("div", {'data-testid': "cellInnerDiv"})

然后我们再继续找推文内容的属性
在这里插入图片描述
提取推文内容

for tweet in tweets:content = container.find('div', {'data-testid': "tweetText"}).textprint(content)

http://www.ppmy.cn/news/555761.html

相关文章

HTML小说目录跳转

目录代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthde…

宏颜获水: 百度ceo 李彦宏惨槽泼水,懵了!

7 月 3 日上午&#xff0c;2019 年百度 AI 开发者大会&#xff0c;百度 CEO 李彦宏演讲过程中&#xff0c;有观众突然冲上演讲台&#xff0c;向李彦宏头部倒了一瓶水。李彦宏先是一愣&#xff0c;后来用英语问道&#xff1a;Whats your problem&#xff1f; 由于事发突然&#…

硬核拆台!宏彦获水,一脸懵逼:百度李彦宏遭当众泼水,一开始肇事者就在全程直播!!

7 月 3 日上午&#xff0c;2019 年百度 AI 开发者大会&#xff0c;百度 CEO 李彦宏演讲过程中&#xff0c;有观众突然冲上演讲台&#xff0c;向李彦宏头部倒了一瓶水。李彦宏先是一愣&#xff0c;后来用英语问道&#xff1a;What’s your problem&#xff1f; 由于事发突然&am…

海量算法高频面试题精编解析,赶快收藏备战金九银十!

前言 又到了面试求职高峰期&#xff0c;最近有很多网友都在求大厂面试题。正好我之前电脑里面有这方面的整理&#xff0c;于是就发上来分享给大家。 这些题目是网友去百度、小米、乐视、美团、58、猎豹、360、新浪、搜狐等一线互联网公司面试被问到的题目。熟悉本文中列出的知…

【MySQL】MySQL建表与常见类型设计陷阱(MySQL专栏启动)

&#x1f4eb;作者简介&#xff1a;小明java问道之路&#xff0c;专注于研究 Java/ Liunx内核/ C及汇编/计算机底层原理/源码&#xff0c;就职于大型金融公司后端高级工程师&#xff0c;擅长交易领域的高安全/可用/并发/性能的架构设计与演进、系统优化与稳定性建设。 &#x1…

[异能程序员]第四章 偶遇(第四更)

都郡城的夏日干燥酷热&#xff0c;在炎热的太阳下暴晒一会&#xff0c;哪怕再水润的脸也得褪层皮。这样的酷暑&#xff0c;自然很少有人在大街上溜达。 铭万商场总店&#xff0c;坐落在都郡城的东南方&#xff0c;属于华夏区的中心。作为一家世界知名的连锁企业&#xff0c;铭万…

[异能程序员]第三章 异能初现(第三更)

“欣玲&#xff0c;你怎么来了&#xff1f;”见到王欣玲&#xff0c;李林的气势猛的一滞。 王欣玲仿佛没有听到李林说话似的&#xff0c;一动不动的盯着李林。此时的李林已经换了一身住院服&#xff0c;尽管面容依旧如故&#xff0c;然而之前有些呆板的眼神此刻却变的炯炯有神&…

iOS体会篇 大学编程到公司的过程

原文作者&#xff1a;朱众 授权本技术博文转载。 刚进公司时&#xff0c;在你正式动手写代码前&#xff0c;很可能要理解code base。这一过程至少持续1个月&#xff0c;取决于你所在项目的规模。你会发现你不得不使用你浑身所学之能事&#xff0c;理解上古程序员是如何解决一个…