Multi-Scale Heterogeneous Text-Attributed Graph Datasets From Diverse Domains

devtools/2025/2/5 8:00:40/

Multi-Scale Heterogeneous Text-Attributed Graph Datasets From Diverse Domains

WWW25

推荐指数:#paper/⭐⭐⭐#​

代码地址:https://github.com/Cloudy1225/HTAG

作者主页:Yunhui Liu's Homepage

一句话总结:提出了涵盖多个领域的异构图文本属性图

动机:

异构文本属性图在现实世界发挥着重要的作用。但是,已有的数据集大多是同构文本属性图。为此,我们引入了异构文本属性图。此外我们给出了现有常见方法的benchmark结果。

现有异构图数据集缺乏文本等信息:

在这里插入图片描述

优势

  1. 规模跨度大。节点从24K节点到5.6M nodes节点
  2. 领域跨度大。包含电影合作、社区问答、学术、书籍出版和专利申请等领域
  3. 真实且可重复的评估。作者为HTAG 提供了一个自动化评估pipeline,可简化数据处理、加载和模型评估。此外,作者对每个数据集采用基于时间的数据split,与传统的随机split相比,这提供了更真实、更有意义的评估方案。
  4. 提供用于数据集构建的开源代码。其他人可以使用相同的代码工具来构建自己领域的数据集

数据集详情:

在这里插入图片描述

未来研究展望

  1. 众所周知LLM在文本领域有着很大的优势。因此,将LLM用于该数据集,是一个可探索的方向
  2. 除了节点分类之外,未来的研究还可以通过探索其他任务来扩展工作,例如在提出数据集上进行节点聚类、链接预测和自我监督学习。
  3. 该数据集包含时间信息,可以用于时序图的研究。
  4. 该文章提供了数据集构造的开源工具,可以用该开源工具构造更多的数据集


http://www.ppmy.cn/devtools/156213.html

相关文章

工作总结:压测篇

前言 压测是测试需要会的一项技能,作为开发,有点时候也要会一点压测。也是被逼着现学现卖的。 一、压测是什么,以及压测工具的选择 压测,即压力测试,是一种性能测试手段,通过模拟大量用户同时访问系统&am…

PostgreSQL 数据库模式基础操作

查看数据库或者使用pgAdmin或者QGIS查看PG数据库时,可以看到数据库名下面有一个Public,然后才是具体的表,搜索了一下,按照PG官网:https://www.postgresql.org/docs/current/ddl-schemas.html 的说明,这个Pu…

php反序列化

php反序列化 声明:本人只是在学习反序列化 因此这篇文章大量参考了https://blog.csdn.net/Hardworking666/article/details/122373938 这位的博客 感谢他的详细文章让我可以详细学习反序列化 大家想看更详细的可以直接参考他的文章!!! 什么是序列化和反序列化 序…

swagger使用指引

1.swagger介绍 在前后端分离开发中通常由后端程序员设计接口,完成后需要编写接口文档,最后将文档交给前端工程师,前端工程师参考文档进行开发。 可以通过一些工具快速生成接口文档 ,本项目通过Swagger生成接口在线文档 。 什么…

数组排序算法

数组排序算法 用C语言实现的数组排序算法。 排序算法平均时间复杂度最坏时间复杂度最好时间复杂度空间复杂度是否稳定适用场景QuickO(n log n)O(n)O(n log n)O(log n)不稳定大规模数据,通用排序BubbleO(n)O(n)O(n)O(1)稳定小规模数据,教学用途InsertO(n)…

实际操作 检测缺陷刀片

号he 找到目标图像的缺陷位置,首先思路为对图像进行预处理,灰度-二值化-针对图像进行轮廓分析 //定义结构元素 Mat se getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1)); morphologyEx(thre, tc, MORPH_OPEN, se, Point(-1, -1), 1); …

分布式微服务系统架构第91集:系统性能指标总结

加群联系作者vx:xiaoda0423 仓库地址:https://webvueblog.github.io/JavaPlusDoc/ 系统性能指标总结 系统性能指标包括哪些? 业务指标、资源指标、中间件指标、数据库指标、前端指标、稳定性指标、批量处理指标、可扩展性指标、可靠性指标。 …

制作一款将黑白照片、视频变成彩色模型

将黑白照片或视频转换为彩色(Image/Video Colorization)的AI模型,通常涉及深度学习和计算机视觉技术。以下是完整的实现流程: 1. 任务定义 彩色化(Colorization)任务的目标是: 输入&#xff1…