Python | 数据可视化中常见的4种标注及示例

ops/2024/12/12 15:54:06/

在Python的数据可视化中,标注(Annotation)技术是一种非常有用的工具,它可以帮助用户更准确地解释图表中的数据和模式。在本文中,将带您了解使用Python实现数据可视化时应该了解的4种标注。

常见的标注方式

  • 文本标注
  • 箭头标注
  • 突出标注
  • 趋势线标注

让我们通过Python实现来了解所有这些用于数据可视化的标注技术。

文本标注

文本标注是直接添加到图表上的简短文本注释,以提供额外的上下文或突出显示重要的数据点。它们对于注意特定事件以解释趋势或注意数据中的异常情况特别有用。例如,在销售图表中,可以使用文本标注来标记新产品或营销活动的推出,以帮助查看者快速了解销售数据波动的原因。

下面是一个使用Python向图添加文本标注的示例:

python">import matplotlib.pyplot as pltmonths = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]
sales = [100, 120, 90, 150, 200, 230, 210, 190, 220, 240, 250, 270]plt.plot(months, sales, marker='o')
plt.title('Monthly Sales Data')
plt.xlabel('Month')
plt.ylabel('Sales')# adding text annotations
plt.text('May', 200, 'Product Launch', fontsize=9, ha='center', color='red')
plt.text('Nov', 250,

在这里插入图片描述

箭头标注

箭头标注使用箭头直接指向图表上的特定数据点或区域,以突出显示关键元素或趋势。它们在突出离群值、指示重大变化或注意数据中值得注意的模式方面特别有效。例如,在营销支出与销售额的散点图中,箭头可以指向投资回报率异常高或异常低的离群值,以明确哪些数据点需要进一步关注。

示例:

python">marketing_spend = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
sales = [12, 25, 27, 35, 50, 52, 60, 65, 78, 85]plt.scatter(marketing_spend, sales)
plt.xlabel('Marketing Spend (in $1000)')
plt.ylabel('Sales (in $1000)')# adding arrow annotations
plt.annotate('High ROI', xy=(20, 25), xytext=(30, 40), arrowprops=dict(facecolor='blue', shrink=0.05))
plt.annotate('Low ROI', xy=(60, 52), xytext=(60, 90), arrowprops=dict(facecolor='red', shrink=0.05))plt.show()

在这里插入图片描述

突出标注

突出显示区域涉及对图形的特定区域进行阴影或着色,以引起对特定时间段、范围或区域的注意。此技术用于突出显示数据中的关键部分,例如高活动期、重大事件或满足某些标准的区域。例如,在市场崩溃期间突出显示区域的股票价格的时间序列图可以使观众更容易在视觉上识别影响期。

下面是一个使用Python突出显示图形中区域的示例:

python">import numpy as npdates = np.arange('2023-01', '2024-01', dtype='datetime64[M]')
stock_prices = np.random.randn(len(dates)).cumsum() + 100plt.plot(dates, stock_prices)
plt.title('Stock Prices Over Time')
plt.xlabel('Date')
plt.ylabel('Price')# highlighting an area
plt.axvspan('2023-06', '2023-09', color='yellow', alpha=0.3, label='Summer Period')plt.legend()

在这里插入图片描述

趋势线标注

趋势线是添加到图形中的线,用于指示数据随时间或跨变量的一般方向或模式。它们用于可视化数据集中的趋势,平均值或关系,这有助于识别长期运动和趋势。例如,在显示学习时间和考试分数之间关系的散点图中,趋势线可以通过指示更多的学习时间通常导致更高的分数来说明是否存在正相关性。

下面是一个使用Python在图表中添加趋势线的示例:

python">study_hours = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
scores = np.array([50, 55, 60, 65, 70, 75, 80, 85, 90, 95])plt.scatter(study_hours, scores)
plt.title('Study Hours vs Exam Scores')
plt.xlabel('Study Hours')
plt.ylabel('Scores')# adding a trend line
m, b = np.polyfit(study_hours, scores, 1)
plt.plot(study_hours, m*study_hours + b, color='red', label='Trend Line')plt.legend()

在这里插入图片描述

总结

以上这些示例涵盖了Python数据可视化中常见的4种标注方式,它们可以单独使用或组合使用,以创建更具解释性和吸引力的图表。


http://www.ppmy.cn/ops/141276.html

相关文章

【Sentinel Go】新手指南、流量控制、熔断降级和并发隔离控制

随着微服务的流行,服务和服务之间的稳定性变得越来越重要。Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开…

蓝桥杯我来了

最近蓝桥杯报名快要截止了,我们学校开始收费了,我们学校没有校赛,一旦报名缴费就是省赛,虽然一早就在官网上报名了,但是一直在纠结,和家人沟通,和朋友交流,其实只是想寻求外界的支持…

过载与简单:理解感知

通常情况下,最好的设计是使用最少设计技巧的设计。这是为什么?这一切都是关于人类大脑是如何工作的,它决定了观众对媒体的反应、感受情绪和做出决定。 注意。我们被海量的信息轰炸。不间断地处理所有这些信号会降低我们大脑的注意力。根据微…

解决阿里云轻量级服务器 Ubuntu 24.04.1 LTS 没网也 ping 不通 8.8.8.8 以及 route -n 没有输出任何转发信息

事情发生在两天前,位于公网的阿里云轻量级服务器(Ubuntu 24.04.1 LTS)忽然没网。主要是上次上服务器进行配置已经是一个多月前,最近也没有做什么事情,就忽然没网了,让人纳闷。更主要的是,上次备…

【Linux】进程间通信——System V共享内存

🔥 个人主页:大耳朵土土垚 🔥 所属专栏:Linux系统编程 这里将会不定期更新有关Linux的内容,欢迎大家点赞,收藏,评论🥳🥳🎉🎉🎉 文章目…

Vue进阶之路由管理

一、概念 路由(Router):在Vue.js应用中,路由用于实现单页应用(SPA)的页面切换效果。它就像是一个“导航系统”,根据不同的URL路径,决定展示哪个组件。例如,在一个电商网…

【鸿蒙HarmonyOS|第1期】鸿蒙开发工具下载与安装

日期:2024年12月10日 作者:Commas(程序员阿康) 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉得有所帮助,帮忙点个赞,也可以关注我,我们一起成长&…

模拟KTV点歌系统的程序

欢迎来到点歌系统 0.添加歌曲 1.将歌曲置顶 2.将歌曲前移一位 3.退出 当前歌单为:【我是一个粉刷匠 卖报歌 拔萝卜 小兔子乖乖 小跳蛙】 请输入要执行的操作序号: 0 请输入要添加的歌曲名称: 快乐的一天 已添加歌曲:快乐的一天 当前歌单为&am…