Python爬虫下载新闻,Flask展现新闻(2)

embedded/2024/11/20 8:30:02/

上篇讲了用Python从新闻网站上下载新闻,本篇讲用Flask展现新闻。关于Flask安装网上好多教程,不赘述。下面主要讲 HTML-Flask-数据 的关系。

简洁版

如图,页面简单,主要显示新闻标题。

分页,使用最简单的分页技术,不用ajax,在链接中增加页码参数 /txw/1 ,由flask根据参数返回新闻。

flask路由代码:

python">#今日头条
@app.route('/txw')
@app.route('/txw/<page>')def today_news(page=1):ua = request.headers.get('User-Agent')mb = from_mobile(ua)#移动端和PC端file = "day_news_m.html" if mb else "day_news.html"news = daily_news(page)return render_template(file,news = news)

每天下载的新闻用文件保存。注,每条新闻设置一个id,分页就是根据id返回。比如现在最新id是10000,每页显示100页, 链接/txw/1 表示 返回id 小于10000大于9900的新闻。

复杂版,按不同频道聚合新闻,包括标题、摘要、热点、收藏等功能,其它比如HTML+CSS设置导航栏后面再讲。

新闻频道划分如下

最新:最新下载的新闻;

关注:根据设置的新闻关键词聚合新闻,这是根据自己的设定来筛选新闻,不是推荐;

要闻:宏观、政策类新闻;

时事:国际政治、军事、局势新闻;

快讯:跟股市相关的突发新闻;

财经:财经类新闻;

科技:半导体、TMT、人工智能等科技类新闻;

英文:国外科技类新闻;

社会:社会、娱乐类新闻,满足偶尔看八卦的需求。

每条新闻下载时根据标题关键词确认频道。比如标题包含以下词语的就是科技:

['通信','5G','6G','AI','人工智能','算力','GPT','openAI','云计算','短剧','元宇宙','游戏','影视','电影','AR','VR','TMT','动漫','漫画', '5.5G','头戴式','微软','Google','苹果','生成式','机器人','公有云','大模型','大数据','英伟达','脑机']

HMTL页面-导航栏

        <thead><td><a href="#top">最新</a></td><td><a href="#关注">关注</a></td><td><a href="#要闻">要闻</a></td><td><a href="#快讯">快讯</a></td><td><a href="#时事">时事</a></td><td><a href="#经济">财经</a></td><td><a href="#TMT">科技</a></td><td><a href="#消费">消费</a></td><td><a href="#Tech">英文</a></td><td><a href="#社会">社会</a></td></thead>

新闻HTML页面主要结构:

    {% for i in news %}<tr><!-- 频道  体验见 http://101.35.10.13/xw --><th id ={{i[0][-2]}} style="text-align: left;border: 0;background-color: #FFFFF0">{{i[0][-2]}}</th><th style="text-align: left;border: 0;background-color: #FFFFF0"><a href="#top" >{{i[0][-1]}}</a></th><th colspan ="12" style="border: 0;background-color: #FFFFF0"></th></tr>{% for j in i %}<tr><th colspan ="14" style="font-size: 16px;text-align: left;padding: 5px"><!-- 标题和链接  --><a href="javascript:;" onclick="show_full_news('{{j[2]}}')"> {{j[0]}}</a></th></tr><tr><!-- 摘要 --><td colspan ="14" style="font-size: 14px;text-align: left;padding: 5px">{{j[1]}}&nbsp{{j[3]}}</td></tr>{% endfor %}{% endfor %}

Flask代码:

python">#新闻
@app.route('/xw')
def news():ua = request.headers.get('User-Agent')mb = from_mobile(ua)try:acct = session['acct']except:acct = ''file = 'news_mb.html' if mb else 'news.html'#返回新闻,acct用于加载关注新闻关键词,若空,则无关注新闻news = chs_news(acct,60,mb)return render_template(file,news = news)

这就是下载新闻、展现新闻的主要思路和技术。当然还有很多细节,如果大家有兴趣,后面详细说。若有疑问,尽管留言。


http://www.ppmy.cn/embedded/139025.html

相关文章

汽车资讯新篇章:Spring Boot技术启航

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式&#xff0c;是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示&#xff1a; 图4-1系统工作原理…

【Qt 蓝牙服务器实现】

在 Qt 中实现一个蓝牙服务器可以使用 Qt Bluetooth 模块。下面是一个基本的蓝牙服务器示例,它能够接受来自客户端的连接。 首先,请确保你已经安装了 Qt Bluetooth 模块并在项目文件中包含了相关库。 1. 项目文件 (.pro) 配置 在项目文件中添加以下行,以确保包含 Qt Bluet…

selenium元素定位---元素点击交互异常解决方法

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 1、异常原因 在编写ui自动化时&#xff0c;执行报错元素无法点击&#xff1a;ElementClickInterceptedException 具体报错&#xff1a;selenium.common.exc…

设计模式——模板方法模式

定义一个操作中的算法框架&#xff0c;而将一些步骤延迟到子类中&#xff0c;模版方法模式使得子类可以不改变算法结构即可重新定义算法的某些特定步骤 1.优点&#xff1a; 在父类中定义一个算法&#xff0c;而右它的子类来实现细节处理&#xff0c;在子类实现详细的处理算法并…

Ascend C算子性能优化实用技巧05——API使用优化

Ascend C是CANN针对算子开发场景推出的编程语言&#xff0c;原生支持C和C标准规范&#xff0c;兼具开发效率和运行性能。使用Ascend C&#xff0c;开发者可以基于昇腾AI硬件&#xff0c;高效的实现自定义的创新算法。 目前已经有越来越多的开发者使用Ascend C&#xff0c;我们…

梯度消失和梯度爆炸

梯度消失与梯度爆炸 这两个问题通常在深度神经网络中出现&#xff0c;特别是在反向传播过程中&#xff0c;会严重影响网络的训练效果。 1. 梯度消失&#xff08;Vanishing Gradient&#xff09; 现象 在反向传播时&#xff0c;梯度值逐层减小&#xff0c;导致靠近输入层的权…

用 Python 从零开始创建神经网络(五):损失函数(Loss Functions)计算网络误差

用损失函数&#xff08;Loss Functions&#xff09;计算网络误差 引言1. 分类交叉熵损失&#xff08;Categorical Cross-Entropy Loss&#xff09;2. 分类交叉熵损失类&#xff08;The Categorical Cross-Entropy Loss Class&#xff09;展示到目前为止的所有代码3. 准确率计算…

Android从Drawable资源Id直接生成Bitmap,Kotlin

Android从Drawable资源Id直接生成Bitmap,Kotlin val t1 System.currentTimeMillis()val bmp getBmpFromDrawId(this, R.mipmap.ic_launcher_round)Log.d("fly", "1 ${bmp?.byteCount} h${bmp?.height} w${bmp?.width} cost time${System.currentTimeMillis…