Apache SeaTunnel k8s 集群模式 Zeta 引擎部署指南

devtools/2025/1/16 16:09:26/

file

SeaTunnel提供了一种运行Zeta引擎(cluster-mode)的方法,可以让Kubernetes在本地运行Zeta引擎,实现更高效的应用程序部署和管理。在本文中,我们将探索SeaTunnel k8s运行zeta引擎(cluster-mode模式)的更多信息,了解如何更好地利用Zeta引擎的优势。

  1. 将SeaTunnel上传至服务器上。我之前已经解压并执行过install-plugin.sh,这里为了方便,我直接用的执行过install-plugin.sh脚本之后的seatunnel做演示。

执行过install-plugin后的lib目录包含如下:

file

tar -zxvf apache-seatunnel-2.3.3-bin.tar.gz
sh apache-seatunnel-2.3.3/bin/install-plugin.sh
tar -czvf  apache-seatunnel-2.3.3-bin.tar.gz  apache-seatunnel-2.3.3
  1. 构建seatunnel镜像。在安装seatunnel的同级文件夹下创建Dockerfile。配置如下,可自行选择版本:
    FROM openjdk:8
    ENV SEATUNNEL_HOME="/opt/seatunnel"
    ENV SEATUNNEL_VERSION="2.3.3"
    COPY /apache-seatunnel-${SEATUNNEL_VERSION}-bin.tar.gz /opt/apache-seatunnel-${SEATUNNEL_VERSION}-bin.tar.gz
    WORKDIR /opt
    RUN tar -xzvf apache-seatunnel-${SEATUNNEL_VERSION}-bin.tar.gz
    RUN mv apache-seatunnel-${SEATUNNEL_VERSION} seatunnel
    RUN rm -f /opt/apache-seatunnel-${SEATUNNEL_VERSION}-bin.tar.gz
    WORKDIR /opt/seatunnel

执行命令

docker build -t seatunnel:2.3.3 -f Dockerfile.
  1. 查看镜像
docker images

如下所示镜像

file

  1. 将镜像load进k8s,这里用的minikube做演示

    minikube image load seatunnel:2.3.3

    上述可参考:手把手教你掌握SeaTunnel k8s运行Zeta引擎本地模式的技巧

  2. 创建configmap如下

    kubectl create configmap hazelcast-client  --from-file= config/hazelcast-client.yaml
    kubectl create configmap hazelcast  --from-file=config/hazelcast.yaml
    kubectl create configmap seatunnelmap  --from-file=config/seatunnel.yaml
  3. 使用Reloader实现更新configmap后自动重启pod

wget https://raw.githubusercontent.com/stakater/Reloader/master/deployments/kubernetes/reloader.yamlkubectl apply -f reloader.yaml

file

  1. 创建seatunnel-cluster.yml如下
apiVersion: v1
kind: Service
metadata:name: seatunnel
spec:selector:app: seatunnelports:- port: 5801name: seatunnelclusterIP: None
---
apiVersion: apps/v1
kind: StatefulSet
metadata:name: seatunnelannotations:configmap.reloader.stakater.com/reload: "hazelcast,hazelcast-client,seatunnelmap"
spec:serviceName: "seatunnel"replicas: 3selector:matchLabels:app: seatunneltemplate:metadata:labels:app: seatunnelspec:containers:- name: seatunnelimage: seatunnel:2.3.3imagePullPolicy: IfNotPresentports:- containerPort: 5801name: clientcommand: ["/bin/sh","-c","/opt/seatunnel/bin/seatunnel-cluster.sh -DJvmOption=-Xms2G -Xmx2G"]resources:limits:cpu: "1"memory: 4Grequests:cpu: "1"memory: 2GvolumeMounts:- mountPath: "/opt/seatunnel/config/hazelcast.yaml"name: hazelcastsubPath: hazelcast.yaml- mountPath: "/opt/seatunnel/config/hazelcast-client.yaml"name: hazelcast-clientsubPath: hazelcast-client.yaml- mountPath: "/opt/seatunnel/config/seatunnel.yaml"name: seatunnelmapsubPath: seatunnel.yamlvolumes:- name: hazelcastconfigMap:name: hazelcast- name: hazelcast-clientconfigMap:name: hazelcast-client- name: seatunnelmapconfigMap:name: seatunnelmap
  1. 执行
 kubectl apply -f seatunnel-cluster.yml

file

file

  1. 修改configmap中的配置
kubectl edit cm hazelcast
修改集群地址 
这里采用的是headless service访问模式
一般pod之间访问其格式为 <pod-name>.<service-name>.<namespace>.svc.cluster.local

如下示例

  • seatunnel-0.seatunnel.default.svc.cluster.local
  • seatunnel-1.seatunnel.default.svc.cluster.local
  • seatunnel-2.seatunnel.default.svc.cluster.local

友情提示:不要用tab,用空格 。不然会报错

file

kubectl edit cm hazelcast-client

file

kubectl edit cm seatunnelmap

file

此处改为自己的hdfs地址。

  1. 可以看到如下

file

  1. 待所有节点都更新完毕处于running状态后 可进入容器内查看路径是否已修改
kubectl exec -it seatunnel-0 /bin/bash
cat config/hazelcast.yaml

file

  1. 在容器内查看日志
tail -200f logs/seatunnel-engine-server.log

file

我们发现集群已经正常运行.

  1. 运行任务

我们可以再新打开一个连接,登录另一个pod节点执行任务来测试集群:

kubectl exec -it seatunnel-1 /bin/bash
bin/seatunnel.sh --config config/v2.streaming.conf.template

我们发现其他pod内也已经开始运行任务

file

原文链接:https://blog.csdn.net/weixin_41854429/article/details/132836402

本文由 白鲸开源科技 提供发布支持!


http://www.ppmy.cn/devtools/26481.html

相关文章

Hive安装部署

Apache Hive是一个基于Hadoop分布式文件系统、使用MapReduce算法执行大规模离线数据分析的数据仓库&#xff0c;本文主要描述Hive的安装部署。 如上所示&#xff0c;Hive总体应用架构图&#xff0c;其中&#xff0c;Hive基于HBase或者使用Hadoop分布式文件系统执行MapReduce的分…

HTTP协议 --中

http状态码 当浏览者访问一个网页时&#xff0c;浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前&#xff0c;此网页所在的服务器会返回一个包含HTTP 状态码的信息头&#xff08; server header &#xff09;用以响应浏览器的请求。 HTTP 状态码的英文为…

2023年蓝桥杯C++A组第三题:更小的数(双指针解法)

题目描述 小蓝有一个长度均为 n 且仅由数字字符 0 ∼ 9 组成的字符串&#xff0c;下标从 0 到 n − 1&#xff0c;你可以将其视作是一个具有 n 位的十进制数字 num&#xff0c;小蓝可以从 num 中选出一段连续的子串并将子串进行反转&#xff0c;最多反转一次。小蓝想要将选出的…

品牌百度百科词条需要什么资料?

品牌百度百科词条是一个品牌的数字化名片&#xff0c;更是品牌历史、文化、实力的全面展现。 作为一个相当拿得出手的镀金名片&#xff0c;品牌百度百科词条创建需要什么资料&#xff0c;今天伯乐网络传媒就来给大家讲解一下。 一、品牌基本信息&#xff1a;品牌身份的明确 品…

高校宿舍管理

在高等教育的迅猛发展浪潮中&#xff0c;大学校园正经历着前所未有的变革。随着招生规模的不断扩大&#xff0c;学生宿舍管理工作变得日益繁重和复杂。传统的管理方法&#xff0c;如使用Word和Excel进行数据记录和整理&#xff0c;已经无法满足现代高效、精准的管理需求。此外&…

设计模式第二次测试 | 数据库连接池设计(原型模式、创建者模式、适配器模式)

需求中文如下&#xff1a;原本是英文&#xff0c;用百度翻译转换而来 我们需要设计一个工具&#xff0c;它负责创建一个与数据库软件MySQL的连接池。 连接池中有数百个连接可供客户端使用。 所有连接对象都有相同的内容&#xff0c;但它们是不同的对象。 连接对象的创建是资源密…

516. 最长回文子序列

516. 最长回文子序列 题目链接&#xff1a;516. 最长回文子序列 代码如下&#xff1a; class Solution { public:int longestPalindromeSubseq(string s) {//dp[i][j]:字符串s在[i,j]范围内最长的回文子序列的长度为dp[i][j]vector<vector<int>> dp(s.size(),ve…

Linux:在线扩容

目录 项目场景 所需技术 操作步骤 Ⅰ&#xff1a;查看pv&#xff08;物理卷&#xff09;、vg&#xff08;卷组&#xff09;大小是否还够扩容 Ⅱ&#xff1a;vda磁盘新增分区vda3 Ⅲ&#xff1a;pv&#xff08;逻辑卷&#xff09;扩容 Ⅳ&#xff1a;vg&#xff08;卷组&…