设定 SLO 有哪些原则

news/2024/10/19 21:44:41/

针对核心和非核心应用,以及强弱依赖关系,我们在设定 SLO 时的要求也是不同的,具体来说,可以采取下面 4 个原则。

第一,核心应用的 SLO 要更严格,非核心应用可以放宽。 这么做,就是为了确保 SRE 的精力能够更多地关注在核心业务上。

第二,强依赖之间的核心应用,SLO 要一致。 比如下单的 Buy 应用要依赖 Coupon 这个促销应用,我们要求下单成功率的 SLO 要 99.95%,如果 Coupon 只有 99.9%,那很显然,下单成功率是达不成目标的,所以我们就会要求 Coupon 的成功率 SLO 也要达到 99.95% 。

第三,弱依赖中,核心应用对非核心的依赖,要有降级、熔断和限流等服务治理手段。 这样做是为了避免由非核心应用的异常而导致核心应用 SLO 不达标。

第四,Error Budget 策略,核心应用的错误预算要共享,就是如果某个核心应用错误预算消耗完,SLO 没有达成,那整条链路,原则上是要全部暂停操作的,因为对于用户来说,他不会判断是因为哪个应用有问题,导致的体验或感受不好。所以,单个应用的错误预算消耗完,都要停止变更,等问题完全解决再恢复变更。当然,也可以根据实际情况适当宽松,如果某个核心应用自身预算充足,且变更不影响核心链路功能,也可以按照自己的节奏继续做变更。这一点,你可以根据业务情况自行判断。

梳理出系统的核心链路并设定好 SLO 后,需要一些手段来进行验证。这里有两种手段,一种是容量压测,另一种就是 Chaos Engineering,也就是混沌工程。

总之,生产系统的稳定性在任何时候,都是最高优先级要保证的,决不能因为演练导致系统异常或故障,这也是不被允许的。所以,一定要选择合适的时机,在有充分准备和预案的情况下实施各类验证工作。

此文章为4月Day25 学习笔记,内容来源于极客时间《SRE 实战手册》,推荐该课程。


http://www.ppmy.cn/news/53889.html

相关文章

stp 相关配置

display stp [Huawei]display stp interface GigabitEthernet 0/0/1 display stp brief []stp mode {stp|rstp|mstp} 默认mstp undo stp enable 关闭交换机或某个接口stp协议 stp root primary 指定根桥,优先级0且不能更改 stp root secondary 指定备…

Linux shell命令行基础

shell简介 shell 与内核沟通的界面、应用程序等。用于将用户操作传递给内核执行。 shell是面向过程 的若类型的解释性语言,不需要编译即可直接执行,常用于作脚本 Linux中的shell 在/etc/shells文件中 存储Linux包含的shell。 最常用的是bash,…

什么牌子台灯好用不伤眼睛?盘点国内值得入手的护眼灯

选择一款不伤眼睛的台灯主要看光照柔和、光照范围广,符合标准照度国A或国AA、显色指数Ra90以上、无眩光、RG0无危害蓝光、无可视频闪等,对于现在许多青少年的近视率增加,一旦近视就无法恢复,保护好眼睛,在学习阅读时&a…

Direct3D 12——曲面细分阶段——外壳着色器

外壳着色器是由两种着色器(phase )组成的:1.常量外壳着色器;2.控制点外壳着色器。 常量外壳着色器 常量外壳着色器(constant hull shader )会针对每个面片逐一进行处理(即每处理一个面片就被调用一次),它的任务是输出网格的曲面细分因子&am…

IIS安装和配置

1.安装IIS 开始→控制面板→程序→启动或关闭Windows功能→Internet information services可承载的web核心,Internet information services(Internet信息服务)→确定; 2.基本配置 (1)打开,开…

生成对抗网络pix2pixGAN

1.介绍 论文:Image-to-Image Translation with Conditional Adversarial Networks 论文地址:https://arxiv.org/abs/1611.07004 图像处理的很多问题都是将一张输入的图片转变为一张对应的 输出图片,比如灰度图、彩色图之间的转换、图像自动…

计算机网络-如何寻找目标主机

视频参考链接:计算机网络-如何寻找目标计算机?_哔哩哔哩_bilibili 在互联网中如果使计算机A与计算机B如何进行通信,又是如何找到目标的计算机主机呢? 首先最简单的通信就是两台计算机中间加一根网线,那么这两台计算机…

软件测试项目去哪里找?我都给你整理好了【源码+操作视频】

目录 一、引言 二、测试任务 三、测试进度 四、测试资源 五、测试策略 六、测试完成标准 七、风险和约束 八、问题严重程度描述和响应时间规范 九、测试的主要角色和职责 ​有需要实战项目的评论区留言吧! 软件测试是使用人工或者自动的手段来运行或者测定…