欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/131384440
Matplotlib 是一个用于绘制二维图形的 Python 库,提供了一个 pyplot 模块,用于创建各种类型的图表。其中一种图表是散点图(Scatter Plots),用于展示两个变量之间的关系,以及数据的分布情况。要绘制散点图,使用 pyplot.scatter() 函数,接受以下参数:
- x, y:表示数据点的横纵坐标,可以是浮点数或者数组。
- s:表示数据点的大小,可以是一个常数或者一个数组,单位是点的平方(1 点 = 1/72 英寸)。
- c:表示数据点的颜色,可以是一个常数、一个数组、一个颜色序列或者一个颜色字符串。如果是一个数组,那么会根据 cmap 参数来映射颜色;如果是一个颜色序列,那么长度必须和数据点相同;如果是一个颜色字符串,那么所有数据点都使用该颜色。
- marker:表示数据点的形状,可以是一个 MarkerStyle 实例或者一个简写字符串。详细的形状列表可以参考 matplotlib.markers 文档。
- cmap:表示用于映射颜色的 Colormap 实例或者注册的颜色图名称。如果 c 是 RGB(A) 值,那么该参数会被忽略。
- norm:表示用于将数据标准化到 [0, 1] 区间的 Normalize 实例或者名称。默认情况下,使用线性标准化,将最小值映射到 0,最大值映射到 1。如果 c 是 RGB(A) 值,那么该参数会被忽略。
- vmin, vmax:当使用标量数据并且没有指定 norm 时,vmin 和 vmax 定义了颜色图覆盖的数据范围。默认情况下,颜色图覆盖了所有数据的值域。
主要:
- 设置主题:
sns.set_theme(style="white")
- 设置 Figure 尺寸:
fig.set_size_inches(10, 10)
- 绘制对角线:
ax.plot()
- 绘制散点图:
ax.scatter()
- 绘制标注:
ax.annotate()
源码如下:
#!/usr/bin/env python
# -- coding: utf-8 --
"""
Copyright (c) 2022. All rights reserved.
Created by C. L. Wang on 2023/6/25
"""
import osimport seaborn as snssns.set_theme(style="white")import matplotlib.pyplot as plt
import numpy as npfrom myutils.project_utils import read_excel_to_df
from root_dir import DATA_DIRdef draw_diagonal_scatter_plots(data_better, data_ref, label_list,min_scale=0.0, max_scale=1.05,x_label="", y_label="",save_name=""
):"""绘制对角线散点图:param data_better: 优质数据,数据位于右下方:param data_ref: 对比数据:param label_list: 标签:param min_scale: 最小范围:param max_scale: 最大范围:param x_label: x轴描述:param y_label: y轴描述:param save_name: 文件存储:return: 图"""assert len(data_ref) == len(data_better) == len(label_list)fig, ax = plt.subplots()fig.set_size_inches(10, 10)ax.grid(True)ax.plot([min_scale, max_scale], [min_scale, max_scale], ls="--", c=".3")ax.scatter(data_ref, data_better, s=100, edgecolors="black")plt.xlim(min_scale, max_scale)plt.ylim(min_scale, max_scale)plt.xticks(fontsize=15)plt.yticks(fontsize=15)plt.xlabel(x_label, fontsize=20)plt.ylabel(y_label, fontsize=20)for i, txt in enumerate(label_list):if data_ref[i] - data_better[i] > 0.025:ax.annotate(txt, (data_ref[i] * 1.03, data_better[i]), fontsize=10, fontweight='bold')if save_name:# transparent=Trueassert save_name.endswith("png") or save_name.endswith("jpg")plt.savefig(save_name, bbox_inches='tight', format='png')plt.show()def main():df = read_excel_to_df(os.path.join(DATA_DIR, "Strategy-v1v2v3v4-TMScore.xls"))data1 = df["m0-score"]data2 = df["max-score"]label_list = df["target"]print(f"data1 : {round(float(np.mean(data1)) * 100, 4)}±{round(float(np.std(data1)), 4)}")print(f"data2 : {round(float(np.mean(data2)) * 100, 4)}±{round(float(np.std(data2)), 4)}")draw_diagonal_scatter_plots(data1, data2, label_list, min_scale=0.35, max_scale=1.05,x_label="Our P.S.P. (TMScore)", y_label="CASP15 SOTA (TMScore)",save_name="img.png")if __name__ == '__main__':main()