Flink 任务启动脚本-V2(包括ck启动)

embedded/2024/11/28 23:39:26/

#!/bin/bash#crontab时设置,如果依赖其他环境变量配置,可以在脚本执行一下环境变量脚本
source /etc/profile# 进入脚本目录
curdir=`dirname "$0"`
curdir=`cd "$curdir"; pwd`
echo "进入启动脚本目录 $curdir"# 定义应用程序名称
APP_NAME="orderTest"# 定义checkpoint路径
CHECKPOINT_BASE_PATH="hdfs:///jobs/flink/checkpoints/$APP_NAME/"MAIN_CLASS="com.test.mainTest"#绝对路径
JAR_PATH="/$curdir/flink-test-1.0.0.jar"# 默认从checkpoint启动
USE_CHECKPOINT=true# 显示使用说明
usage() {echo "用法: $0 [-n] [-h]"echo "选项:"echo "  -n    不从checkpoint启动任务(默认从最新的checkpoint启动)"echo "  -h    显示此帮助信息"echoecho "示例:"echo "  $0        # 从最新的checkpoint启动任务"echo "  $0 -n     # 不使用checkpoint启动任务"exit 1
}# 解析命令行参数
while getopts ":nh" opt; docase $opt inn)USE_CHECKPOINT=falseecho "已设置:不从checkpoint启动任务";;h)usage;;\?)echo "错误:无效的选项 -$OPTARG"echo "使用 -h 查看帮助信息"exit 1;;esac
done# 如果设置了无效参数,显示使用说明
if [ $OPTIND -gt 1 ]; thenshift $((OPTIND-1))if [ "$#" -gt 0 ]; thenecho "错误:存在额外的参数 $@"echo "使用 -h 查看帮助信息"exit 1fi
fi# 检查是否存在指定应用程序在运行中
is_running=$(yarn application -list | grep -w "$APP_NAME" | grep -c "RUNNING")if [ $is_running -gt 0 ]; thenecho "应用程序 $APP_NAME 在运行中,退出脚本"exit 1
elseecho "应用程序 $APP_NAME 不在运行中,准备拉起任务"
fi# 函数:获取最新成功的checkpoint地址
get_latest_checkpoint() {latest_checkpoint=$(hdfs dfs -ls -t -R $CHECKPOINT_BASE_PATH  | grep '_metadata' | sort -k6,7r | head -n 1 | awk '{print $8}'  )if [ -z "$latest_checkpoint" ]; thenreturn 1fi# 去掉文件名,只保留目录路径checkpoint_dir=$(dirname "$latest_checkpoint")echo $checkpoint_dirreturn 0
}# 构建基础命令
CMD="flink run \-t yarn-per-job \-d \-p 1 \-Dyarn.application.queue=realtime \-Dyarn.application.name=$APP_NAME \-Dtaskmanager.memory.process.size=4096mb \-Dtaskmanager.memory.network.max=64mb \-Dtaskmanager.memory.managed.size=1024mb \-Dtaskmanager.numberOfTaskSlots=1 \-c $MAIN_CLASS"if [ "$USE_CHECKPOINT" = true ]; then# 获取最新的checkpoint地址LATEST_CHECKPOINT=$(get_latest_checkpoint)if [ $? -ne 0 ]; thenecho "没有找到适合的ck,退出执行"exit 1fiecho "'$APP_NAME' 任务将从 '$LATEST_CHECKPOINT' 启动"CMD="$CMD \-s $LATEST_CHECKPOINT"
elseecho "'$APP_NAME' 任务将不从checkpoint启动"
fi# 添加最终的jar包和配置文件参数
CMD="$CMD \$JAR_PATH "# 执行命令
echo " 任务启动命令: '$CMD' "eval $CMD

本次新增一个不从 ck 启动的选择,默认从 最新 ck 启动,用法 sh start.sh -n 。

备注:由于Flink checkpoint 个别情况下,不一定能保证落地的checkpoint文件一定有效,所以需要人工介入支持。


http://www.ppmy.cn/embedded/141291.html

相关文章

【探寻密码的奥秘】-001:解开密码的神秘面纱

目录 1、密码学概述1.1、概念1.2、目的1.3、应用场景 2、密码学的历史2.1、第一时期:古代密码时代2.2、第二时期:机械密码时代2.3、第三时期:信息密码时代2.4、第四时期:现代密码时代 3、密码学的基本概念3.1、一般通信系统3.2、保…

应急响应靶机——Windows近源攻击

载入虚拟机,开启虚拟机,点击“解题.exe”: (账户密码:Administrator/zgsf2024) 1、攻击者的外网IP地址 2、攻击者的内网跳板IP地址 3、攻击者使用的限速软件的md5大写 4、攻击者的后门md5大写 5、攻击…

海信Java后端开发面试题及参考答案

TCP 的优点是什么? TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,它具有众多优点。 首先,TCP 提供可靠的传输服务。它通过序列号、确认应答、重传机制等确保数据的准确无误传输。例如,在发送数据时,发送方会…

C# 中使用 AutoMapper 进行对象映射的实用步骤

在C#中,AutoMapper 是一个功能强大的对象-对象映射器,它能够在不同类型的对象之间自动进行属性值的复制。这在层与层之间的数据传输对象(DTOs)和实体(Entities)之间的转换中特别有用。以下是如何在 C# 中使…

使用青果代理IP爬取豆瓣TOP250电影数据

本文目录 1.1 引言1.2 为什么需要代理IP?2.1 青果代理IP的优势2.2 获取青果代理IP2.3 实战爬取豆瓣TOP250电影3.总结 1.1 引言 电商平台、社交平台、自媒体等平台大数据爆炸的现在,采用爬虫采集数据已经是当下最高效、精准地获取数据方式,但…

记录下在html文件中如何直接使用npm依赖,以threejs为例

参考&#xff1a; https://www.cnblogs.com/shayloyuki/p/17191489.html 共三种方式 我的代码截图 方式一&#xff1a; threejsDemo_script.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name&…

深度学习之PSPNet

场景解析对于无限制的开放词汇和不同场景来说是具有挑战性的.本文使用文中的pyramid pooling module实现基于不同区域的上下文集成&#xff0c;提出了PSPNet&#xff0c;实现利用上下文信息的能力进行场景解析。    作者认为&#xff0c;FCN存在的主要问题是没有采取合适的策…

区块链游戏的新观察:自治世界能否成为未来链游的突破口?

区块链游戏&#xff08;链游&#xff09;作为加密领域的创新方向&#xff0c;一直被寄予厚望。然而&#xff0c;尽管各类链游层出不穷&#xff0c;大多只是靠代币激励一时爆火&#xff0c;缺乏持久吸引力。这种现象让人对链游未来的发展充满疑虑&#xff1a;是否有一种全新的设…