Python爬虫下载新闻,Flask展现新闻(2)

devtools/2024/11/17 20:28:30/

上篇讲了用Python从新闻网站上下载新闻,本篇讲用Flask展现新闻。关于Flask安装网上好多教程,不赘述。下面主要讲 HTML-Flask-数据 的关系。

简洁版

如图,页面简单,主要显示新闻标题。

分页,使用最简单的分页技术,不用ajax,在链接中增加页码参数 /txw/1 ,由flask根据参数返回新闻。

flask路由代码:

python">#今日头条
@app.route('/txw')
@app.route('/txw/<page>')def today_news(page=1):ua = request.headers.get('User-Agent')mb = from_mobile(ua)#移动端和PC端file = "day_news_m.html" if mb else "day_news.html"news = daily_news(page)return render_template(file,news = news)

每天下载的新闻用文件保存。注,每条新闻设置一个id,分页就是根据id返回。比如现在最新id是10000,每页显示100页, 链接/txw/1 表示 返回id 小于10000大于9900的新闻。

复杂版,按不同频道聚合新闻,包括标题、摘要、热点、收藏等功能,其它比如HTML+CSS设置导航栏后面再讲。

新闻频道划分如下

最新:最新下载的新闻;

关注:根据设置的新闻关键词聚合新闻,这是根据自己的设定来筛选新闻,不是推荐;

要闻:宏观、政策类新闻;

时事:国际政治、军事、局势新闻;

快讯:跟股市相关的突发新闻;

财经:财经类新闻;

科技:半导体、TMT、人工智能等科技类新闻;

英文:国外科技类新闻;

社会:社会、娱乐类新闻,满足偶尔看八卦的需求。

每条新闻下载时根据标题关键词确认频道。比如标题包含以下词语的就是科技:

['通信','5G','6G','AI','人工智能','算力','GPT','openAI','云计算','短剧','元宇宙','游戏','影视','电影','AR','VR','TMT','动漫','漫画', '5.5G','头戴式','微软','Google','苹果','生成式','机器人','公有云','大模型','大数据','英伟达','脑机']

HMTL页面-导航栏

        <thead><td><a href="#top">最新</a></td><td><a href="#关注">关注</a></td><td><a href="#要闻">要闻</a></td><td><a href="#快讯">快讯</a></td><td><a href="#时事">时事</a></td><td><a href="#经济">财经</a></td><td><a href="#TMT">科技</a></td><td><a href="#消费">消费</a></td><td><a href="#Tech">英文</a></td><td><a href="#社会">社会</a></td></thead>

新闻HTML页面主要结构:

    {% for i in news %}<tr><!-- 频道  体验见 http://101.35.10.13/xw --><th id ={{i[0][-2]}} style="text-align: left;border: 0;background-color: #FFFFF0">{{i[0][-2]}}</th><th style="text-align: left;border: 0;background-color: #FFFFF0"><a href="#top" >{{i[0][-1]}}</a></th><th colspan ="12" style="border: 0;background-color: #FFFFF0"></th></tr>{% for j in i %}<tr><th colspan ="14" style="font-size: 16px;text-align: left;padding: 5px"><!-- 标题和链接  --><a href="javascript:;" onclick="show_full_news('{{j[2]}}')"> {{j[0]}}</a></th></tr><tr><!-- 摘要 --><td colspan ="14" style="font-size: 14px;text-align: left;padding: 5px">{{j[1]}}&nbsp{{j[3]}}</td></tr>{% endfor %}{% endfor %}

Flask代码:

python">#新闻
@app.route('/xw')
def news():ua = request.headers.get('User-Agent')mb = from_mobile(ua)try:acct = session['acct']except:acct = ''file = 'news_mb.html' if mb else 'news.html'#返回新闻,acct用于加载关注新闻关键词,若空,则无关注新闻news = chs_news(acct,60,mb)return render_template(file,news = news)

这就是下载新闻、展现新闻的主要思路和技术。当然还有很多细节,如果大家有兴趣,后面详细说。若有疑问,尽管留言。


http://www.ppmy.cn/devtools/134782.html

相关文章

Flutter Getx状态管理

在 Flutter 开发中&#xff0c;状态管理是一个非常重要的话题。随着应用变得更加复杂&#xff0c;状态管理的方式也变得越来越多。Flutter 提供了多种状态管理的解决方案&#xff0c;如 Provider、Riverpod、BLoC 等&#xff0c;而在这些选项中&#xff0c;GetX 作为一个轻量级…

充电桩基础设施的时空大数据分析:以深圳市为例(二)

本篇文章我们将继续从整个深圳市的角度&#xff0c;深入探讨充电桩的使用率、供需关系及其对价格的影响。通过对2022年9月1日至2023年8月31日的充电桩累计充电量分布数据进行分析&#xff0c;结合充电桩的小时颗粒度使用量和春节期间的使用量变化&#xff0c;探究充电桩使用模式…

前端神经网络入门(三):深度学习与机器学习的关系、区别及核心理论支撑 - 以Brain.js示例

一、前言 随着人工智能的迅速发展&#xff0c;深度学习已经成为了机器学习领域中备受关注的分支。传统上&#xff0c;深度学习在后端和数据中心的高性能计算环境中广泛应用&#xff0c;但随着JavaScript和Web技术的进步&#xff0c;现在前端开发者也可以借助工具如 Brain.js 进…

Spring Boot 牛刀小试 org.springframework.boot:spring-boot-maven-plugin:找不到类错误

今天看了下书翻了下Spring Boot的用法&#xff0c;下载idea后&#xff0c; 反复出现org.springframework.boot:spring-boot-maven-plugin:找不到类错误&#xff0c;后来看了下调试窗口&#xff0c;发现是连不上maven的网站443错误&#xff0c;解决思路很简单&#xff0c;把ide连…

python贪心算法实现(纸币找零举例)

目录 问题描述 贪心策略 Python代码实现 代码解释 示例输出 注意事项 问题描述 给定一组纸币面值和一个目标金额&#xff0c;找出用最少数量的纸币来找零的方法。 贪心策略 每次选择面值最大的纸币&#xff0c;直到无法继续选择为止。 Python代码实现 def min_bills…

对称加密算法DES的实现

一、实验目的 1、了解对称密码体制基本原理 2、掌握编程语言实现对称加密、解密 二、实验原理 DES 使用一个 56 位的密钥以及附加的 8 位奇偶校验位&#xff0c;产生最大 64 位的分组大小。这是一个迭代的分组密码&#xff0c;使用称为 Feistel 的技术&#xff0c;其中将加密…

xcode-select: error: tool ‘xcodebuild‘ requires Xcode, but active developer

打开 .sh 文件所在的终端窗口&#xff0c;执行终端命令&#xff1a;sh 文件名.sh&#xff0c;出现如下错误&#xff1a; 解决办法&#xff1a;

【项目日记】仿mudou的高并发服务器 --- 整体框架搭建 ,实现时间轮模块

命运的局限尽可永在&#xff0c; 不屈的挑战却不可须臾或缺。 --- 史铁生 --- 项目地址在这里: https://gitee.com/penggli_2_0/TcpServer 仿mudou的高并发服务器 1 项目介绍2 模块组成3 实现时间轮模块3.1 设计思想3.2 定时任务类3.3 TimeWheel时间轮类 1 项目介绍 这是一…