科研学习|可视化——ggplot2版本的网络可视化

server/2024/10/21 10:03:11/

ggplot2R语言中一个非常流行的数据可视化包,它也可以用于网络可视化。以下是三个基于ggplot2并专门用于网络可视化的R包:

  • ggnet2: 这个包的使用方法与传统的plot函数相似,易于使用。更多信息可在其官方页面查看:ggnet2

  • geomnet: 这个包在ggplot2中增加了geom_net层,可以使用数据框作为输入,并且可以与Plotly交互,从而支持交互式图形。有关更多信息,请访问:geomnet on GitHub 和 geomnet on CRAN

  • ggnetwork(首选): 这个包是三者中最灵活的,特别适合动态网络的可视化。它结合了ggplot2的优雅语法和网络数据的处理能力。更多信息可在其官方页面查看:ggnetwork

一、三个R包的比较

这三个包虽然都基于ggplot2进行网络可视化,但各有侧重和特点。您可以通过以下链接查看这三个包的详细比较:Comparison among ggnet2, geomnet, and ggnetwork

  • ggnet2 以其简单的语法和易用性而受到欢迎。

  • geomnet 通过增加可与ggplot2兼容的图层以及支持交互式图形(如与Plotly的整合),提供了额外的灵活性和功能。

  • ggnetwork 由于其在处理动态网络方面的优势,是最灵活的选择,适合需要高度定制化网络图的用户。

二、示例数据分析

这段文本提供了在R语言环境中使用多个包来处理和可视化足球比赛数据的例子。以下是步骤的详细说明:

2.1 安装和加载必要的包

这部分代码涉及安装并加载处理网络数据的几个R包。GGallygeomnetggnetwork 和 statnet 都是处理图形和网络数据的强大工具。

# 安装包
#install.packages("GGally")
#install.packages("geomnet")
#install.packages("ggnetwork")# 加载包
library("GGally")
library("geomnet")
library("ggnetwork")
library("statnet")

2.2 加载数据

这里,数据集football来自geomnet包,包含足球队之间的比赛信息。

# 加载数据
data("football", package = "geomnet")
rownames(football$vertices) <- football$vertices$label

2.3 创建网络

使用边列表football$edges[,1:2]创建一个网络结构,这里用的是network::network()函数。

# 从边列表创建网络
fb.net = network::network(football$edges[,1:2])

2.4 添加顶点和边的属性

为网络中的顶点(足球队)添加属性,指明每个队伍所在的会议。此外,还为边添加属性,表示两个队伍是否属于同一会议。

# 添加顶点属性:队伍所在的会议
fb.net %v% "conf" <- football$vertices[network.vertex.names(fb.net), "value"]# 添加边属性:两队是否同属一个会议
set.edge.attribute(fb.net, "same.conf", football$edges$same.conf)
set.edge.attribute(fb.net, "lty", ifelse(fb.net %e% "same.conf" == 1, 1, 2))

三、ggnet2

ggnet2是一个用于网络可视化的R包,它的特点如下:

3.1 功能特点

  • 输入:网络对象

  • 提供详细教程:ggnet2 教程

  • 语法类似于plot:使用简单,语法与传统的绘图函数类似

  • 输出:输出底层的组织结构(节点的位置),便于添加geom_xx

3.2 问题

  • 不支持曲线边缘

  • 不支持自环

  • 不适用于复杂图形

  • 对于变化的图表,不能直接提供多个面板。需要固定放置坐标。

3.3 示例代码

设置种子,确保结果的可重现性,并使用ggnet2来创建一个网络图表的示例。

set.seed(3212019)
pggnet2 = ggnet2(fb.net,  # 输入 `network` 对象mode = "fruchtermanreingold",  # 来自 `network` 包的布局layout.par = list(cell.jitter=0.75),  # 可以传递布局参数# 节点属性node.color = "conf", palette = "Paired",  # 颜色板 palette="Set3",node.size = 5,# node.size = "degree",# size.cut = 3,  # 使用分位数将大小切割为三个类别# size = "conf",# 手动映射大小:size.palette = c("Atlantic Coast" = 1,...),# node.shape = "conf",node.alpha = 0.5,# node.label = TRUE,# 边缘edge.color = c("color", "grey50"),  # 第一个值:同一组的节点使用相同颜色,否则使用第二个参数edge.alpha = 0.5,edge.size = 0.3,edge.lty = "lty",# edge.label = 1,# edge.label.size = 1,# 图例color.legend = "Conference",# legend.size = 10,# legend.position = "bottom"
) + geom_point(aes(color = color), size = 3)  # 可以像ggplot对象一样处理并添加geom_xx层
pggnet2## 将其作为数据框处理以添加geom_xx层
pggnet2$data %>% names()
## [1] "label" "alpha" "color" "shape" "size"  "x"     "y"

此代码段展示了如何使用ggnet2包来构建并自定义网络图表的外观,通过控制节点和边的颜色、大小、透明度等属性,以及如何在ggplot2框架下增加额外的图形层。

四、geomnet

geomnet 是一个基于 ggplot2 的 R 包,用于网络可视化,特点如下:

4.1 功能特点

  • 输入:数据框

  • 支持自环

  • 支持面板(无法固定节点)

4.2 问题

  • 没有提供详细的教程

  • 底层结构不可用,被整体封装(例如:如果设置透明度,适用于节点和边缘;不提供点的位置)

  • 严格遵守 ggplot2 语法,灵活性较差

4.3 示例代码

以下是一个合并顶点和边缘数据,并使用 geomnet 创建网络图的例子:

# 合并顶点和边
ver.conf = football$vertices %>% mutate(from = label) %>% select(-label)
fb.df = left_join(football$edges, ver.conf, by = "from")# 创建数据图
set.seed(3212019)
pgeomnet =ggplot(data = fb.df,  # 输入:数据框aes(from_id = from, to_id = to)) +geom_net(layout.alg = 'fruchtermanreingold',aes(colour = value, group = value,linetype = factor(same.conf != 1)),linewidth = 0.5,size = 5, vjust = -0.75, alpha = 1) +theme_net() +# theme(legend.position = "bottom") +scale_colour_brewer("Conference", palette = "Paired") +guides(linetype = FALSE)
pgeomnet

五、ggnetwork

ggnetwork 是一个专门用于网络可视化的 R 包,具有以下特点:

5.1 特点

  • 提供详细教程:ggnetwork 教程

  • 输入:可以是 igraph(需要加载 intergraph 库)或 network 对象

  • 语法非常用户友好

  • ggnetwork 提供底层的数据框

  • 使用 geom_edges 和 geom_nodes 分别设置;可以在 geom_xx 内设置针对边/节点的特定映射

  • 对于标签,支持 geom_(node/edge)(text/label)[_repel]:如 geom_nodetextgeom_nodelabelgeom_nodetext_repelgeom_nodelabel_repelgeom_edgetextgeom_edgelabelgeom_edgetext_repelgeom_edgelabel_repel

  • 允许曲线边缘(且与 plotly 兼容)

  • 可以使用面板展示动态网络,并固定节点位置

5.2 问题

  • 不支持自环

5.3 示例代码

这是一个使用 ggnetwork 包和 ggplot2 语法创建网络图的示例:

## 需要先安装 intergraph 包用于处理 igraph 对象
#install.packages("intergraph")
library("intergraph")## 创建 igraph 对象
fb.igra = graph_from_data_frame(football$edges[,1:2], directed = FALSE)
V(fb.igra)$conf = football$vertices[V(fb.igra)$name, "value"]
E(fb.igra)$same.conf = football$edges$same.conf
E(fb.igra)$lty = ifelse(E(fb.igra)$same.conf == 1, 1, 2)## 设置种子
set.seed(3212019)## 使用 ggnetwork 和 ggplot 绘图
pggnetwork =ggplot(ggnetwork(  # 提供底层数据框fb.igra,  # 输入:网络对象layout = "fruchtermanreingold",  # 布局cell.jitter = 0.75),aes(x, y, xend = xend, yend = yend)) +geom_edges(aes(linetype = as.factor(same.conf)),color = "grey50",curvature = 0.2,alpha = 0.5) +geom_nodes(aes(color = conf),size = 5,alpha = 0.5) +scale_color_brewer("Conference", palette = "Paired") +scale_linetype_manual(values = c(2, 1)) +guides(linetype = FALSE) +theme_blank() + geom_nodes(aes(color = conf),size = 3)  # 可以像 ggplot 对象一样处理并添加 geom_xx 层
pggnetwork

六、ggnet2、geomnet、ggnetwork 的扩展

由于这些工具的输出是 ggplot2 对象,它们可以与其他库如 plotly 结合,实现交互式网络可视化或动态网络可视化

6.1 ggplot2 + plotly

使用 plotly 库,可以将 ggplot2 创建的静态图转换为交互式图表。以下是如何实现的:

6.2 加载 plotly 库

library("plotly")

6.3 将 ggplot2 对象转换为 plotly 对象

这里,pggnet2 和 pgeomnet 是使用 ggnet2 或 geomnet 创建的 ggplot2 图对象。通过使用 ggplotly() 函数,我们可以添加 coord_fixed() 来保持比例一致,并使用 hide_guides() 隐藏不必要的图例和指南。

ggplotly(pggnet2 + coord_fixed()) %>% hide_guides()
ggplotly(pgeomnet + coord_fixed()) %>% hide_guides()

注意,如果设置了边的 curvature 属性,plotly 可能无法正确显示这一属性。例如,下面的代码中暂时注释了对 pggnetwork 的转换:

# ggplotly(pggnetwork + coord_fixed()) %>% hide_guides()

6.4 创建新的网络图 pggnetwork2

下面的代码展示了如何使用 ggnetwork 创建一个网络对象,然后通过 ggplotly 转换为交互式图表。这里同样使用了 hide_guides() 来清洁图表的显示:

pggnetwork2 =ggplot(ggnetwork(  # 提供底层数据框fb.igra,  # 输入:网络对象layout = "fruchtermanreingold",  # 布局cell.jitter = 0.75),aes(x, y, xend = xend, yend = yend)) +  # 边的映射geom_edges(aes(linetype = as.factor(same.conf)),color = "grey50",alpha = 0.5) +geom_nodes(aes(color = conf), size = 5,alpha = 0.5) +scale_color_brewer("Conference", palette = "Paired") +scale_linetype_manual(values = c(2, 1)) +guides(linetype = FALSE) +theme_blank() + geom_nodes(aes(color = conf), size = 3)
ggplotly(pggnetwork2 + coord_fixed()) %>% hide_guides()

七、分面动态网络

推荐使用 ggnetwork 来创建分面动态网络。

7.1 创建网络

以下示例使用了一个电子邮件数据集,其中包括节点和边的相关属性。

# 查看电子邮件数据集的边和节点的属性名
names(email$edges)
## [1] "From"        "eID"         "Date"        "Subject"     "to"         
## [6] "month"       "day"         "year"        "nrecipients"
names(email$nodes)
##  [1] "label"                      "LastName"                  
##  [3] "FirstName"                  "BirthDate"                 
##  [5] "BirthCountry"               "Gender"                    
##  [7] "CitizenshipCountry"         "CitizenshipBasis"          
##  [9] "CitizenshipStartDate"       "PassportCountry"           
## [11] "PassportIssueDate"          "PassportExpirationDate"    
## [13] "CurrentEmploymentType"      "CurrentEmploymentTitle"    
## [15] "CurrentEmploymentStartDate" "MilitaryServiceBranch"     
## [17] "MilitaryDischargeType"      "MilitaryDischargeDate"# 从电子邮件数据集中提取边列表:移除发送给所有员工的电子邮件
edges = email$edges %>% filter(nrecipients < 54) %>% select(From, to, day)# 创建网络对象
em.net <- network(edges[, 1:2])# 分配边的属性(天)
set.edge.attribute(em.net, "day", edges[, 3])# 分配节点的属性(员工类型)
em.cet <- as.character(email$nodes$CurrentEmploymentType)
names(em.cet) = email$nodes$label
em.net %v% "curr_empl_type" <- em.cet[network.vertex.names(em.net)]# 设置种子以确保可重复性
set.seed(3212019)# 使用 ggnetwork 创建可视化
ggplot(ggnetwork(em.net,arrow.gap = 0.02,  # 箭头间隙by = "day",        # 按天分面layout = "kamadakawai"  # 布局算法),aes(x, y, xend = xend, yend = yend)
) +geom_edges(aes(color = curr_empl_type),alpha = 0.25,arrow = arrow(length = unit(5, "pt"), type = "closed")  # 定义箭头) +geom_nodes(aes(color = curr_empl_type), size = 1.5) +  # 定义节点scale_color_brewer("Employment Type", palette = "Set1") +  # 颜色映射facet_wrap(. ~ day, nrow = 2, labeller = "label_both") +  # 分面显示theme_facet(legend.position = "bottom")  # 调整主题

注意:在运行代码时,如果检测到重复的边,可能会出现警告信息。这需要在数据预处理阶段进行检查和处理。

参考资料

https://briatte.github.io/ggnet/ https://cran.r-project.org/web/packages/ndtv/vignettes/ndtv.pdf


http://www.ppmy.cn/server/37567.html

相关文章

C++学习笔记1

A. 求出那个数 题目描述 求出一个最小的正整数 x x x&#xff0c;使得 x x x 每位数字的和恰好为 n n n。 输入格式 第一行一个正整数 T T T&#xff0c;代表测试数据的组数。 接下来 T T T 行每行一个正整数 n n n。 1 ≤ T ≤ 1000 1\le T\le1000 1≤T≤1000 0 ≤…

geojson文件规格

geojson文件示例&#xff0c; {"type": "FeatureCollection","features": [{"type": "Feature","geometry": {"type": "Point","coordinates": [102.0, 0.5]},"properties&q…

传统汽车空调系统工作原理

1.首先讲一个概念 液体变成气体&#xff1a;吸热 气体变成液体&#xff1a;放热 2.在汽车空调系统中热量的传递的介质不是水&#xff0c;而是氟利昂&#xff0c;简称&#xff1a;“氟”。 3.传统式汽车空调结构如下 该三个部件位于车头进气口位置 该部位位于汽车驾驶车厢前方…

Git命令Gitee注册idea操作git超详细

文章目录 概述相关概念下载和安装常见命令远程仓库介绍与码云注册创建介绍码云注册远程仓库操作关联拉取推送克隆 在idea中使用git集成add和commit差异化比较&查看提交记录版本回退及撤销与远程仓库关联 push从远程仓库上拉取&#xff0c;克隆项目到本地创建分支切换分支将…

MySQL 高级 - 第七章 | 索引的数据结构

目录 一、为什么使用索引二、什么是索引2.1 索引的概述2.2 索引的优缺点 三、InnoDB 中索引的推演3.1 InnoDB 页简介3.2 没有索引的查找3.3 设计索引3.3.1 一个简单的索引设计方案3.3.2 InnoDB 中索引方案① 迭代 1 次&#xff1a;目录项记录的页② 迭代 2 次&#xff1a;多个目…

三色标记法详解

什么是三色标记法 三色标记法&#xff08;Three-color Marking&#xff09;是一种在垃圾回收&#xff08;Garbage Collection, GC&#xff09;领域广泛使用的算法&#xff0c;尤其是在Java虚拟机&#xff08;JVM&#xff09;中&#xff0c;与追踪式垃圾回收相关联。它的核心目的…

FileInputStream和Files.newInputStream?

前言 在上传文件的时候&#xff0c;发现还有一个新的东西叫做Files.newInputStream&#xff0c;就稍微看了一下下。主要应用示例在这篇文章中&#xff0c;也可以看这里。 FileInputStream 很久很久以前大家就在用这个库了&#xff0c;是一个文件流&#xff0c;可以读取文件。…

02-Fortran基础--Fortran操作符与控制结构

02-Fortran基础--Fortran操作符与控制结构 0 引言1 操作符1.1 数学运算符1.2 逻辑运算符1.3 关系运算符 2 控制流程2.1 条件结构2.2 循环结构2.3 分支结构 0 引言 运算符和控制流程对编程语言是必须的,Fortran的操作符和控制流程涉及到各种数学运算符、逻辑运算符以及控制结构。…