Apache DolphinScheduler支持Flink吗?

server/2024/9/24 0:29:47/

随着大数据技术的快速发展,很多企业开始将Flink引入到生产环境中,以满足日益复杂的数据处理需求。而作为一款企业级的数据调度平台,Apache DolphinScheduler也跟上了时代步伐,推出了对Flink任务类型的支持。

Flink是一个开源的分布式流处理框架,具有高吞吐量、低延迟和准确性等特点,广泛应用于实时数据分析、机器学习等场景。通过DolphinScheduler的Flink任务类型,用户可以轻松地将Flink作业纳入到整个数据调度流程中,大大提高了数据处理的效率和可靠性。本文将介绍如何在DolphinScheduler中支持Flink节点,包括任务创建、设置等。

Flink节点

Flink 任务类型,用于执行 Flink 程序。对于 Flink 节点:

  • 当程序类型为 Java、Scala 或 Python 时,worker 使用 Flink 命令提交任务 flink run。
  • 当程序类型为 SQL 时,worker 使用sql-client.sh 提交任务。

创建任务

  • 点击项目管理-项目名称-工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
  • 拖动工具栏的 任务节点到画板中。

任务参数

file

任务样例

执行 WordCount 程序

本案例为大数据生态中常见的入门案例,常应用于 MapReduce、Flink、Spark 等计算框架。主要为统计输入的文本中,相同的单词的数量有多少。

若生产环境中要是使用到 flink 任务类型,则需要先配置好所需的环境。配置文件如下:bin/env/dolphinscheduler_env.sh。

file

2.任务流程

  • 上传主程序包

在使用 Flink 任务节点时,需要利用资源中心上传执行程序的 jar 包。

当配置完成资源中心之后,直接使用拖拽的方式,即可上传所需目标文件。

file

  • 配置 Flink 节点

根据上述参数说明,配置所需的内容即可。

file

  • 执行 FlinkSQL 程序

根据上述参数说明,配置所需的内容即可。

file

注意事项

  • Java 和 Scala 只是用来标识,没有区别,如果是 Python 开发的 Flink 则没有主函数的 class,其余的都一样。
  • 使用 SQL 执行 Flink SQL 任务,目前只支持 Flink 1.13及以上版本。

原文链接:https://blog.csdn.net/zhengzaifeidelushang/article/details/136687233

本文由 白鲸开源科技 提供发布支持!


http://www.ppmy.cn/server/30178.html

相关文章

如何在 Ubuntu 14.04 上使用 Heartbeat 和保留 IP 创建高可用性设置

简介 Heartbeat 是一个开源程序,为客户端服务器提供集群基础设施功能——集群成员资格和消息传递,这是高可用性(HA)服务器基础设施中的关键组件。通常,Heartbeat 与集群资源管理器(CRM)&#x…

android studio项目实战——备忘录(附源码)

成果展示&#xff1a; 1.前期准备 &#xff08;1&#xff09;在配置文件中添加权限及启动页面顺序 ①展开工程&#xff0c;打开app下方的AndroidManifest.xml,添加权限&#xff0c;如下&#xff1a; <uses-permission android:name"android.permission.CAMERA"…

服务器根据功能划分有哪几种?

服务器根据功能来进行划分的话有邮件服务器、代理服务器和FTP服务器等多种类型&#xff0c;接下来就主要来了解一下这些服务器的作用有哪些吧&#xff01; 一、邮件服务器 邮件服务器是电子邮件系统的核心组件&#xff0c;主要负责电子邮件的发送和接收&#xff0c;当用户创建…

31 OpenCV 距离变换和分水岭算法

文章目录 距离变换分水岭算法distanceTransform 距离变换watershed 分水岭算法示例 距离变换 分水岭算法 distanceTransform 距离变换 void cv::distanceTransform (InputArray src,OutputArray dst,int distanceType,int maskSize,int dstType CV_32F) src:输入图像&#xf…

msmpi 高性能计算实现文件读取输入

【高性能计算】完美解决Windows下安装mpi环境并应用到VSCode中报错问题的方法_c:\program files (x86)\microsoft sdks\mpi\include/-CSDN博客 环境配置 然后跑这个代码测试即可 // 命令行参数&#xff1a; //mpiexec -n 9 "C:\Users\ASUS\Desktop\testMPI\MPIv2.exe&qu…

IDEA中测试时的包名问题

报错&#xff1a;Unable to find a SpringBootConfiguration, you need to use ContextConfiguration or SpringBootTest(classes...) with your test 原因&#xff1a;&#xff08;图是别人那巴来的&#xff09;启动类所在的包名和测试类的包名不一致导致的&#xff0c;原因是…

spring bean的生命周期你了解么

Spring Bean的生命周期是指在Spring容器中创建、初始化、使用和销毁Bean实例的整个过程。理解Spring Bean的生命周期对于开发者来说非常重要&#xff0c;因为它涉及到在不同的生命周期阶段执行自定义逻辑的机会。下面是关于Spring Bean生命周期的详细解释&#xff0c;包括各个阶…

深度学习-自动求导

目录 向量链式法则标量链式法则 拓展到向量例题1例题2 符号求导数值求导自动求导计算图自动求导的两种模式链式法则正向累积&#xff08;从x出发&#xff09;反向累积&#xff08;反向传递--先计算最终的函数即y&#xff09;反向累积总结 自动求导计算y关于x的梯度&#xff0c;…