docker compose deploy fate cluster

news/2025/1/2 5:08:39/

官方文档 写的不清晰

KubeFATE,用于生成部署脚本,链接

部署机就是下载了 KubeFATE的主机;运行机就是要安装fate容器的主机(部署机和运行机可以相同

  • 两个主机:并非必须 centos7,Ubuntu也行
  • Docker 版本 : 19.03.0+;Docker Compose 版本: 1.27.0+;
  • 确保部署机可以ssh免密登录到两个运行节点主机上(如果部署机和运行机一样就不用管了)
$  vim docker-deploy/parties.conf
user=fate  # 改成 root 方便
dir=/data/projects/fate
party_list=(10000 9999) # 部署的 partyid,部署单边只填写一个
party_ip_list=(192.168.0.1 192.168.0.2) # 与partyid对应$  bash ./generate_config.sh
$  ls docker-deploy/outputs/
confs-10000.tar  confs-9999.tar  serving-10000.tar  serving-9999.tarbash ./docker_deploy.sh all --training  # 部署全部
bash ./docker_deploy.sh 9999 --training  # 部署单个

docker_deploy.sh 会将配置文件通过 scp 传到目标主机(所以需要免密登录),解压并执行容器创建运行

$  cd /data/projects/fate/confs-10000
$  docker compose ps
NAME                           IMAGE                                  COMMAND                  SERVICE             CREATED              STATUS                        PORTS
confs-10000-clustermanager-1   federatedai/eggroll:3.2.0-release     "/tini -- bash -c 'j…"   clustermanager      About a minute ago   Up About a minute             4670/tcp
confs-10000-fateflow-1         federatedai/fateflow:2.2.0-release    "/bin/bash -c 'set -…"   fateflow            About a minute ago   Up About a minute (healthy)   192.168.7.1:9360->9360/tcp, :::9360->9360/tcp, 192.168.7.1:9380->9380/tcp, :::9380->9380/tcp
confs-10000-mysql-1            mysql:8.0.28                          "docker-entrypoint.s…"   mysql               About a minute ago   Up About a minute             3306/tcp, 33060/tcp
confs-10000-nodemanager-1      federatedai/eggroll:3.2.0-release     "/tini -- bash -c 'j…"   nodemanager         About a minute ago   Up About a minute             4671/tcp
confs-10000-osx-1              federatedai/osx:2.2.0-release         "/tini -- bash -c 'j…"   osx                 About a minute ago   Up About a minute             192.168.7.1:9370->9370/tcp, :::9370->9370/tcp
confs-10000-fateboard-1        federatedai/fateboard:2.1.1-release   "sh -c 'java -Dsprin…"   fateboard           About a minute ago   Up About a minute             192.168.7.1:8080->8080/tcp$  docker compose exec fateflow bash

toy 验证(flow test toy --guest-party-id 10000 --host-party-id 9999), 无法找到命令 flow


http://www.ppmy.cn/news/1559416.html

相关文章

uniapp下拉选择组件

目录 背景 实现思路 代码实现 配置项 使用 尾巴 背景 最近遇到一个这样的需求,在输入框中输入关键字,通过接口查询到结果之后,以下拉框列表形式展现供用户选择。查询了下uni-app官网和项目中使用的uv-ui库,没找到符合条件的…

uniapp下载打开实现方案,支持安卓ios和h5,下载文件到指定目录,安卓文件管理内可查看到

uniapp下载&打开实现方案,支持安卓ios和h5 Android: 1、申请本地存储读写权限 2、创建文件夹(文件夹不存在即创建) 3、下载文件 ios: 1、下载文件 2、保存到本地,需要打开文件点击储存 使用方法&…

Java实现简单爬虫——爬取疫情数据

1.项目准备 在项目中使用到了jsoup和fastjson jsoup用于创建一个连接(绘画) 用于获取和解析HTML页面 而fastjson对数据进行一个格式化 在pom.xml导入坐标 <dependencies><dependency><groupId>com.alibaba</groupId><artifactId>fastjson</a…

ip-协议

文章目录 1. 网络层2. ip协议2.1 ip协议格式2.2 网段划分基本概念网段划分的两种方式为什么要网段划分&#xff1f;特殊的IP地址IP地址数量不足 2.3 私有IP与公网IP2.4 路由 3. IP的分片与组装为什么要分片与组装&#xff1f;如何分片&#xff1f;如何组装&#xff1f; 1. 网络…

594: Maximum Tape Utilization Ratio

解法&#xff1a; 对于该题有以下错误&#xff08;敬希评论区指正 1.dp定义在全局会wa struct node {int count; // 当前容量下能够存储的程序数量int sum; // 当前容量下所占用的磁带长度vector<int> path; // 当前容量下选择的程序的路径&#xff08;存放的程序…

输煤皮带智能巡检解决方案

输煤皮带系统作为煤炭运输的重要环节&#xff0c;是火力发电厂和煤炭化工等行业的重要基础设施。系统通常运行在高温、高湿、粉尘严重的环境中&#xff0c;机械故障、皮带磨损和跑偏等问题时有发生&#xff0c;严重影响生产效率和安全。传统的人工巡检方式存在频率不足、覆盖面…

Python的简单爬虫框架

爬虫为网络爬虫&#xff08;又称为网页蜘蛛&#xff0c;网络机器人&#xff0c;在FOAF社区中间&#xff0c;更经常的称为网页追逐者&#xff09;&#xff0c;是一种按照一定的规则&#xff0c;自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、…

golang LeetCode 热题 100(动态规划)-更新中

爬楼梯 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢&#xff1f; 示例 1&#xff1a;输入&#xff1a;n 2 输出&#xff1a;2 解释&#xff1a;有两种方法可以爬到楼顶。 1. 1 阶 1 阶 2. 2 阶 示例 2&…