dist.init_process_group() 卡住超时导致报错

news/2025/2/14 0:04:38/

在跑模型是遇到一个问题:

import torch.distributed as dist
dist.init_process_group(backend="nccl", init_method='tcp://localhost:%d' % tcp_port, rank=local_rank, world_size=num_gpus)

程序卡在这一步一动不动。.

解决办法一:

我看网上有人说把 init_process_group 函数的参数 timeout 调大一些,笑出🐖叫。

解决办法二:

在命令行运行程序添加 -m 参数。

python  -m torch.distributed.launch test.py

http://www.ppmy.cn/news/1221172.html

相关文章

sklearn 笔记 BallTree/KD Tree

由NearestNeighbors类包装 1 主要使用方法 sklearn.neighbors.BallTree(X, leaf_size40, metricminkowski, **kwargs) X数据集中的点数leaf_size改变 leaf_size 不会影响查询的结果,但可以显著影响查询的速度和构建树所需的内存metric用于距离计算的度量。默认为…

大数据-之LibrA数据库系统告警处理(ALM-12047 网络读包错误率超过阈值)

告警解释 系统每30秒周期性检测网络读包错误率,并把实际错误率和阈值(系统默认阈值0.5%)进行比较,当检测到网络读包错误率连续多次(默认值为5)超过阈值时产生该告警。 用户可通过“系统设置 > 阈值配置…

LC349. 两个数组的交集

/*** 方法一* 创建set1和set2来装nums1和nums2中的元素* 创建set3来装交集数据* 我们遍历set1,取出每一个item,如果set2中含有该item,则该item就是set1和set2共有的元素,因此将item放入set3中* 最后将set3转换成数组返回* param nums1* param nums2* return*/public static int…

反序列化漏洞(2), 分析调用链, 编写POC

反序列化漏洞(2), 反序列化调用链分析 一, 编写php漏洞脚本 http://192.168.112.200/security/unserial/ustest.php <?php class Tiger{public $string;protected $var;public function __toString(){return $this->string;}public function boss($value){eval($valu…

R脚本进行长宽数据转换

1.R脚本进行长宽数据转换 library(tidyverse) df tibble(Class c("1班", "2班"),Name c("张三&#xff0c;李四&#xff0c;王五", "赵六&#xff0c;钱七")) df## # A tibble: 2 x 2 ## Class Name ## <chr> <chr&g…

DbUtils示例

DbUtils:JDBC实用程序组件示例 本页提供了一些示例&#xff0c;说明如何使用Dbutils。 基本用途 DbUtils是一个非常小的类库&#xff0c;因此不需要很长时间就可以遍历每个类的javadocs。DbUtils中的核心类/接口是QueryRunner和ResultSetHandler。您不需要了解任何其他DbUti…

虾皮之家数据分析插件:知虾数据分析工具提升销量的利器

在当今的电商市场中&#xff0c;虾皮Shopee成为了许多商家的首选平台。然而&#xff0c;随着竞争的加剧&#xff0c;店铺运营变得越来越具有挑战性。如何提升销量&#xff0c;优化标题和图片&#xff0c;合理设置SKU&#xff0c;并准确跟踪店铺活动数据和竞品数据&#xff0c;已…

ERROR: column “xxxx.id“ must appear in the GROUP BY

org.postgresql.util.PSQLException: ERROR: column “xxx.id” must appear in the GROUP BY clause or be used in an aggregate function 错误**&#xff1a;列“XXXX.id”必须出现在GROUP BY子句中或在聚合函数中使用** 出现这种错误的sql如下&#xff1a; select name,…