Multi-Scale Heterogeneous Text-Attributed Graph Datasets From Diverse Domains

server/2025/2/5 6:20:37/

Multi-Scale Heterogeneous Text-Attributed Graph Datasets From Diverse Domains

WWW25

推荐指数:#paper/⭐⭐⭐#​

代码地址:https://github.com/Cloudy1225/HTAG

作者主页:Yunhui Liu's Homepage

一句话总结:提出了涵盖多个领域的异构图文本属性图

动机:

异构文本属性图在现实世界发挥着重要的作用。但是,已有的数据集大多是同构文本属性图。为此,我们引入了异构文本属性图。此外我们给出了现有常见方法的benchmark结果。

现有异构图数据集缺乏文本等信息:

在这里插入图片描述

优势

  1. 规模跨度大。节点从24K节点到5.6M nodes节点
  2. 领域跨度大。包含电影合作、社区问答、学术、书籍出版和专利申请等领域
  3. 真实且可重复的评估。作者为HTAG 提供了一个自动化评估pipeline,可简化数据处理、加载和模型评估。此外,作者对每个数据集采用基于时间的数据split,与传统的随机split相比,这提供了更真实、更有意义的评估方案。
  4. 提供用于数据集构建的开源代码。其他人可以使用相同的代码工具来构建自己领域的数据集

数据集详情:

在这里插入图片描述

未来研究展望

  1. 众所周知LLM在文本领域有着很大的优势。因此,将LLM用于该数据集,是一个可探索的方向
  2. 除了节点分类之外,未来的研究还可以通过探索其他任务来扩展工作,例如在提出数据集上进行节点聚类、链接预测和自我监督学习。
  3. 该数据集包含时间信息,可以用于时序图的研究。
  4. 该文章提供了数据集构造的开源工具,可以用该开源工具构造更多的数据集


http://www.ppmy.cn/server/165089.html

相关文章

仿真设计|基于51单片机的光照、温湿度及PM2.5检测报警系统

目录 具体实现功能 设计介绍 51单片机简介 资料内容 仿真实现(protues8.7) 程序(Keil5) 全部内容 资料获取 具体实现功能 (1)LCD1602液晶第一行显示当前的光照值及PM2.5值,第二行显示当…

PyTorch中的movedim、transpose与permute

在PyTorch中,movedim、transpose 和 permute这三个操作都可以用来重新排列张量(tensor)的维度,它们功能相似却又有所不同。 movedim 🔗 torch.movedim 用途:将张量的一个或多个维度移动到新的位置。参数&…

Next.js 14 TS 中使用jwt 和 App Router 进行管理

jwt是一个很基础的工作。但是因为架构不一样,就算是相同的架构,版本不一样,加jwt都会有一定的差别。现在我们的项目是Next.js 14 TS 的 App Router项目(就是没有pages那种),添加jwt的步骤: 1、…

PostgreSQL 插入、选择、更新、删除数据

(1)插入与选择操作 向表中插入数据主要是使用insert语句,结构如下所示: INSERT INTO 表名 (列名) VALUES (具体值);这里需要注意的是:要使用单引号,单引号在 SQL 中用于定义字符串字面量&…

git进阶--1---HEAD、工作树和索引之间的区别与联系

git进阶–1—HEAD、工作树和索引之间的区别与联系 1. HEAD git中可以有很多的分支,本质都是一个指向commit对象的可变指针,HEAD是一个特别的指针,始终指向正在工作中的本地分支的指针,一句话,你当前处在哪个分支&…

人工智能搜索的层级发展趋势:从信息检索到智能决策

##引言 随着信息爆炸时代的来临,人们对搜索的需求不再仅仅停留在简单的关键词匹配。 人工智能(AI)技术的进步为搜索领域带来了革命性的变革,基于AI的搜索方式能够更智能地理解用户意图,提供更精准、更高效的搜索结果…

ZK-ALU-在有限域上实现左移

先看在实数域上实现左移, 再看在有限域上的实现 左移-整数 计算机中的左移计算&#xff08;<< 操作&#xff09;通常由处理器的硬件电路直接支持&#xff0c;因此效率非常高。在编程语言中&#xff0c;左移操作可以通过位移运算符&#xff08;例如 C/C 中的 <<&a…

ros 创建Topic

1、确定话题名称和消息类型 自定义话题名称&#xff0c;消息类型根据发送消息需要从std_msgs中查找确定 2、在main函数中通过NodeHander发布话题 // 创建一个NodeHandle对象&#xff0c;用于与ROS系统进行交互ros::NodeHandle nh;// 创建一个Publisher对象&#xff0c;用于发…