k8s控制器之job--第三弹处理Pod和容器的失败

news/2024/11/25 2:38:30/

Pod 中的容器可能会因为多种原因执行失败,例如:

  • 容器中的进程退出了,且退出码(exit code)不为 0
  • 容器因为超出内存限制而被 Kill
  • 其他原因

如果 Pod 中的容器执行失败,且 .spec.template.spec.restartPolicy = "OnFailure",则 Pod 将停留在该节点上,但是容器将被重新执行。此时,您的应用程序需要处理在原节点(失败之前的节点)上重启的情况。或者,您也可以设置为 .spec.template.spec.restartPolicy = "Never"

整个 Pod 也可能因为多种原因执行失败,例如:

  • Pod 从节点上被驱逐(节点升级、重启、被删除等)
  • Pod 的容器执行失败,且 .spec.template.spec.restartPolicy = "Never"

当 Pod 执行失败时,Job 控制器将创建一个新的 Pod。此时,您的应用程序需要处理在一个新 Pod 中重新启动的情况。具体来说,需要处理临时文件、锁、未完成的输出信息以及前一次执行可能遗留下来的其他东西。

  • 即使您指定 .spec.parallelism = 1.spec.completions = 1 以及 .spec.template.spec.restartPolicy = "Never",同一个应用程序仍然可能被启动多次
  • 如果指定 .spec.parallelism.spec.completions 的值都大于 1,则,将可能有多个 Pod 同时执行。此时,您的 Pod 还必须能够处理并发的情况

Pod失败重试

Pod backoff failure policy

某些情况下(例如,配置错误),您可能期望在 Job 多次重试仍然失败的情况下停止该 Job。此时,可通过 .spec.backoffLimit 来设定 Job 最大的重试次数。该字段的默认值为 6.

Job 中的 Pod 执行失败之后,Job 控制器将按照一个指数增大的时间延迟(10s,20s,40s … 最大为 6 分钟)来多次重新创建 Pod。如果没有新的 Pod 执行失败,则重试次数的计数将被重置。

Debug

如果 restartPolicy = "OnFailure",执行该 Job 的容器在 job 重试次数达到以后将被终止。这种情况使得 Job 程序的 debug 工作变得较为困难。建议在 debug 时,设置 restartPolicy = "Never",或者使用日志系统确保失败的 Job 的日志不会丢失。


http://www.ppmy.cn/news/537701.html

相关文章

Polycom RealPresence 3.10.1 安卓版,Polycom 是一款兼容 PC 、Mac、安卓、苹果系统的功能强大的企业级视频应用程序

如今,员工期望获得功能强大的通信工具,无论身在何处,无论使用哪种设备,只要有需求,随时随地都能进行视频通信。Polycom RealPresence 是一款兼容 PC 、Mac、安卓、苹果的功能强大的企业级视频应用程序。这款视频会议软…

【运维心得】关于视频会议(POLYCOM)

视频会议的几个概念 视频会议终端视频会议服务器 视频会议终端 终端是带有摄像头的一套设备,一般会最多内置4个MCU授权,即可以联入4方会议。终端上会有VGA口和HDMI口,可以接入电脑进行PPT播放,即常见的双流操作。终端会带有一个遥…

全球及中国视频会议系统市场应用状况与趋势展望分析报告2022版

全球及中国视频会议系统市场应用状况与趋势展望分析报告2022版 ------------------------------------- 《修订日期》:2022年2月 《出版单位》:鸿晟信合研究院 《对接人员》:周文文 【内容分析有删减了解详情可查看咨询鸿晟信合研究院专员&…

2021-2027年中国视频会议系统行业市场调研报告

【报告类型】产业研究 【报告价格】4500起 【出版时间】即时更新(交付时间约3个工作日) 【发布机构】智研瞻产业研究院 【报告格式】PDF版 本报告介绍了中国视频会议系统行业市场行业相关概述、中国视频会议系统行业市场行业运行环境、分析了中国视…

腾创秒会达Webrtc视频会议系统简介

1.远程会议和培训 公司员工数量较多,无法集合所有的员工参加会议,可以通过视频会议系统,把会议现场通过网络实时展现给外地的人员,全国各地所有营业网点,可以通过本地客户端远程连接主会场参加会议,让所有…

国产化趋势下的视频会议多维选择

我们生活在经济全球一体化的背景下,感受着全球化的合作、竞争与发展带来的生活工作的变化。然而,从2019年开始的新贸易摩擦,让我们深有感触关键技术自主可控的重要性。因此,大型政府、央企等单位率先加速国产化进程。聚焦疫情加持…

画面马赛克?从这三个方面来解决视频会议画面问题

在视频会议使用过程中,当网络环境出现延迟时,视频会议画面将会出现较大影响。画面变的不清晰,甚至出现马赛克等等,出现此类情况时,建议用户从以下三个方面考虑视频会议建设方案: (视频会议&…

视频会议压缩算法

视频压缩之—SVC H.264中还有一个SVC概念(Scalable Video Coding),可分层编码。先不管其具体的含义,来想象下视频通信中可能遇到的问题。 1.带宽问题,IP网络带宽是不稳定的,网络带宽降低是,视频流应该自动的降低码率&a…