【GAT】 代码详解 (1) 运行方法【pytorch】可运行版本

ops/2024/11/22 22:55:55/

请添加图片描述

GRAPH ATTENTION NETWORKS 代码详解

  • 前言
  • 0.引言
  • 1. 环境配置
  • 2. 代码的运行
    • 2.1 报错处理
    • 2.2 运行结果展示
  • 3.总结

前言

在前文中,我们已经深入探讨了图卷积神经网络和图注意力网络的理论基础。还没看的同学点这里补习下。接下来,将开启一个新的阶段,我们将借助强大的深度学习框架PyTorch,通过实战讲解来展示如何构建和训练一个GAT模型。这一过程不仅帮助读者巩固理论知识,更重要的是,它将引导读者从理论迈向实践,实现在处理具有图结构数据的问题上的质的飞跃。

在本章节中,我将主要介绍如何运行代码以获取计算结果。考虑到我的读者中有很多是初学者,我认为在深入探讨代码的各种细节之前,首先了解如何简单地运行模型并查看其结果是非常必要的。这不仅可以帮助读者迅速掌握操作,还能使他们对模型的工作流程有一个直观的认识。

这个原文的代码地址感兴趣的读者自行下载即可 https://github.com/2578562306/pyGAT

在这里插入图片描述

😃当然要是觉得还不错的话,烦请点赞,收藏➕关注👍

0.引言

这是 Veličković 等人在 2017 年提出的图注意力网络(GAT)模型的 PyTorch 实现(https://arxiv.org/abs/1710.10903)。该代码库最初从 https://github.com/tkipf/pygcn 分叉而来。GAT 的官方仓库(采用 TensorFlow 实现)可以在 https://github.com/PetarV-/GAT 找到。目前网络上的主流讲解基本都是以这些版本的代码为基础,因此,我们将依据这些代码深入探索 GAT,了解图神经网络中如何实现注意力机制的能力。

重要说明==此外,本 PyTorch 实现与原始的 TensorFlow 版本(见此链接)存在一些细微差异。当前的 PyTorch 版本主要旨在进行概念验证,并非旨在完全复现原论文中报告的结果。因此,复现出来的结果与原始论文中的结果存在一定的差距。在对当前代码进行讲解之后,作者将分析这些差异,并指导大家如何复原文中的实验结果。==该实现使用的是 Cora 数据集,其主要被分成了两个文件。具体细节将在下一章节的代码分析部分进行详细说明。

1. 环境配置

如果您已经配置好相关环境,可以跳过本部分。

对于计划在特定环境下运行图注意力网络(GAT)的开发者而言,了解并设置正确的系统要求是至关重要的初步步骤。以下详述了系统和软件环境的要求,以确保GAT可以被正确安装并顺利运行。

必需的软件和库:

  • PyTorch: 需要安装的版本为0.4.1。PyTorch是执行深度学习模型的核心库,尤其是在本实现中的图注意力网络(GAT)。
  • Python: 支持的版本为3.5。Python是运行这一图注意力网络代码的基本环境。由于使用了torch.sparse_coo_tensor,我们依赖特定版本的PyTorch和Python。

Python包依赖:
正确安装以下Python包是确保模型正常运行的前提条件。您可以通过运行下列命令来安装或检验这些依赖是否正确安装:

这里你可以插入具体安装依赖的命令,其中模型还是用到numpy和scipy的库,可以通过使用pip安装:

pip install numpy
pip install scipy

请确保所有的环境配置都符合要求,以便无障碍地运行和应用图注意力网络。

使用 Python 开发环境中需要使用外部库,如 numpy, torch, 和 scipy 等时,可以通过 pip 命令来安装这些库。pip 是 Python 的官方包管理系统,用于安装和管理软件包,这些包通常来自于 Python 包索引(PyPI),它是一个集中存放 Python 程序包的仓库。

如何使用 pip 在命令行中安装软件包???????:

  1. 打开命令行工具

    • 在 Windows 上,可以打开命令提示符或 PowerShell。
    • 在 macOS 或 Linux 上,可以打开终端。
  2. 输入安装命令

    • 在命令行中输入 pip install 包名 命令。例如,要安装 Numpy,就输入 pip install numpy
  3. 执行命令

    • 按回车键,pip 将自动从 PyPI 下载并安装该软件包及其依赖。

安装多个包

  • 如果要一次安装多个包,可以在同一命令行中列出所有包,用空格隔开。例如:pip install numpy torch scipy

此过程将在您的系统上安装指定的 Python 库,允许您在任何 Python 脚本或项目中导入并使用这些库。

注意事项:

  • 确保您的网络连接畅通,因为 pip 需要从互联网下载包。
  • 在某些情况下,如果默认的 pip 安装的不是针对您当前使用的 Python 版本,可能需要使用 pip3 替代 pip
  • 根据您的系统设置,可能需要管理员权限来安装包。在这种情况下,您可能需要在命令前加上 sudo(适用于 Linux 和 macOS),例如 sudo pip install numpy

通过以上步骤,您可以轻松地通过 pip 在任何支持的开发环境中安装和管理 Python 包,从而为开发工作提供必要的库支持。

大家很多同学都用 Jupyter Notebook 或 Visual Studio Code(VSCode)进行 Python 开发时,使用 pip 安装库同样是一个简单且有效的方式。以下是在这两种开发环境中安装 Python 库的详细步骤:

在 Jupyter Notebook 中安装库:

  1. 打开 Jupyter Notebook

    • 通常通过在终端中输入命令 jupyter notebook 来启动 Jupyter Notebook。
  2. 创建或打开一个笔记本

    • 在 Jupyter 的主界面,可以选择“New”(新建)然后选择“Python X”(X代表版本号)来创建一个新的笔记本。
  3. 安装库

    • 在笔记本的一个新单元中输入安装命令,例如:
      python">!pip install numpy
      
    • 执行单元格(按 Shift + Enter),这条命令将会在你的 Python 环境中安装 NumPy 库。

在 Visual Studio Code(VSCode)中安装库:

  1. 打开或创建一个 Python 文件

    • 在 VSCode 中打开你正在工作的项目或者新建一个 Python 文件。
  2. 打开终端

    • 在 VSCode 中,你可以通过点击顶部菜单的 “View”(视图) > “Terminal”(终端)来打开一个新的终端。或者使用快捷键 Ctrl+` (反引号)打开或切换终端。
  3. 执行安装命令

    • 在打开的终端中,输入如下的命令来安装所需的库,例如:
      pip install numpy
      
    • 按 Enter 执行,该命令将会为你的 Python 环境安装库。

在两种情况下,你都可以通过类似的方式安装任何需要的库。只需将 numpy 替换为你需要安装的库的名称即可。确保你已经配置好了 Python 和 pip。 在 VSCode 或 Jupyter Notebook 中,你可以通过这种方式方便地管理 Python 包,以满足开发需求。这使得使用这些工具进行科学计算和开发成为一件高效且愉快的事情。

2. 代码的运行

在这里我仅仅展示如何修改代码保证模型的正确运行,下面是代码的文件划分:

请添加图片描述

文件名称还是很直接的,模型使用的数据和上一节中GCN使用的一致,在这里不讨论。output输出文件仅仅是用来存放可视化结果的这里要执行代码仅仅需要修改utils.py文件。

请添加图片描述

细心的同学一定会发现这个内容和GCN中的代码一样,的确这个代码被作者重复用了。造轮子大家用,确实很很爽的一件事。

在这里插入图片描述

这个地址修改成你自己存储数据的目录地址即可。如果你不知道地址在哪里???怎么办???

在这里插入图片描述

都是些很基础的操作,同样在jupyter中打开数据的位置右键也会有复制地址的选项我在这里就不过的赘述了。然后点击train.py文件执行 文件即可。如果是说咱们的有些同学使用的是jupyter那么你还要将代码复制到一个ipynb文件中再执行文件。

请添加图片描述

2.1 报错处理

如果jupyter环境下运行的同学出现报错,那么就多半是这里出现了问题:
在这里插入图片描述
需要对代码修改如下:
在这里插入图片描述
代码我放在这里便于大家直接复制:

python">args = parser.parse_args(args=[]) 

2.2 运行结果展示

其输出结果与GCN相似,但值得注意的是,每次运行的epoch数量都有所不同。这是因为模型采用了早停机制,在训练过程中一旦满足特定条件即提前终止,以防止过拟合。在下一节的代码详解中,我将详细讲解早停机制的使用方法和它的工作原理。
请添加图片描述

这些数据展示了在训练图注意力网络(GAT)时的各个epoch(训练周期)的性能指标。下面是对这些数据的简单解释:

  • Epoch: 这表示当前的训练周期编号,从0001开始,每个周期均包括向前和向后传播过程。
  • loss_train: 这是训练集上的损失值,反映了模型在训练数据上的表现。损失值越低,表示模型在这组数据上的拟合越好。
  • acc_train: 这是训练集上的准确率,以百分比表示,显示了模型正确分类训练数据的能力。
  • loss_val: 这是验证集上的损失值,用于评估模型在未见过的数据上的泛化能力。在实际应用中,我们希望验证损失与训练损失相近,这表明模型没有过拟合。
  • acc_val: 这是验证集上的准确率,反映了模型在验证数据上的分类准确性。较高的验证准确率表明模型具有较好的泛化性能。
  • time: 这是完成该周期训练所需的时间,以秒为单位。这个时间包括了数据处理、模型计算和反向传播等所有步骤的时间。

从这些数据中可以观察到,随着训练周期的增加,训练和验证的损失通常会逐渐减小,而准确率则逐渐提高。这是模型学习过程的典型表现,表示模型在逐渐适应和理解训练数据。然而,重要的是要监控训练和验证损失之间的差异,以及相应的准确率,以便及时调整训练参数或提前停止训练,防止过拟合。

下面的最终运行结果是我在CPU中实验得到的给各位一个运行的参考:
请添加图片描述

至于这个准确率为和如何之高,[可以参考我这个博文的理解。]。(https://blog.csdn.net/weixin_47332746/article/details/143515332)

3.总结

现阶段,我们已经全面介绍了图注意力网络(GAT)的理论基础及模型的运行方式。在接下来的篇章中,我们将深入探讨该模型及相关论文中的核心架构和代码实现。
这一部分将为对这一主题感兴趣的读者提供一个详细的技术视角,帮助您从基本理论开始,逐步了解模型是如何通过精确的数学建模和编程实现来完成预期的机器学习任务。深入解析模型的主体架构对于理解其工作原理至关重要,对于那些希望在此基础上进行改进或希望自定义该模型以适应特定应用的研究者和开发者而言,尤其具有价值。

如果您对这些内容感兴趣,请不要忘记点赞、收藏并关注。这是对我的工作最大的支持和鼓励。非常感谢您!如果有任何疑问,欢迎随时与我联系。我期待与您的互动!
在这里插入图片描述


http://www.ppmy.cn/ops/135908.html

相关文章

国产三维CAD 2025新动向:推进MBD模式,联通企业设计-制造数据

本文为CAD芯智库原创整理,未经允许请勿复制、转载! 上一篇文章阿芯分享了影响企业数字化转型的「MBD」是什么、对企业优化产品设计流程有何价值——这也是国产三维CAD软件中望3D 2024发布会上,胡其登先生(中望软件产品规划与GTM中…

单片机进阶硬件部分_day2_项目实践

设计要求 从绘制原理图到画PCB板,完成智能云衣柜项目 STM32 (Modbus)云IOT衣物云端管理 华为PCB布线规范 基于IoT的智享家主控系统 步骤分析 需求分析 器件选型绘制原理图(器件连接)PCB布局、布线泪滴、铺铜、添加丝印…

Scala的Array和ArrayBuffer集合及多维数组

ArrayBuffer是一个可变的序列集合,它可以通过添加和删除元素来动态改变其大小。它可以用于代替传统的数组,提供更多的操作和灵活性特点: 动态大小:ArrayBuffer的大小可以根据需要进行自动调整,因此它可以包含任意数量…

跨平台WPF框架Avalonia教程 十四

DataGrid 数据表格 数据表格以自定义的网格形式展示重复的数据。该控件可以进行样式定制、模板化和绑定。 数据表格需要绑定到一个可观察的集合(Observable Collection),该集合可以在相关的数据上下文中找到。 信息 要了解数据上下文背后…

C# 面向对象的接口

接口,多态性,密封类 C# 接口 遥控器是观众和电视之间的接口。 它是此电子设备的接口。 外交礼仪指导外交领域的所有活动。 道路规则是驾车者,骑自行车者和行人必须遵守的规则。 编程中的接口类似于前面的示例。 接口是: APIsC…

资产管理运营系统mobilefront2前台文件上传漏洞

免责声明: 本文旨在提供有关特定漏洞的深入信息,帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步,未经授权访问系统、网络或应用程序,可能会导致法律责任或严重后果。因此,作者不对读者基于本文内容所采取的任何行为承担责任。读者在…

【Swift】运算符

文章目录 术语赋值运算符算数运算符基本四则算术运算符求余运算符一元负号运算符一元正号运算符 比较运算符三元运算符空合运算符区间运算符闭区间运算符半开区间运算符单侧区间运算符 逻辑运算符逻辑非运算符逻辑与运算符逻辑或运算符逻辑运算符组合计算 位运算符运算符优先级…

vue3的宏到底是什么东西?

前言 从vue3开始vue引入了宏,比如defineProps、defineEmits等。我们每天写vue代码时都会使用到这些宏,但是你有没有思考过vue中的宏到底是什么?为什么这些宏不需要手动从vue中import?为什么只能在setup顶层中使用这些宏&#xff…