1. SLO、SLI、SLA名词解释以及关系
2. Why SLO?
SLO的目的
SLO 量化客户对可靠性的期望,找到客户对服务的可靠性感到满意的点(额外的可靠性价值微乎其微,此时新功能更加重要)
SLO的好处、优势
- 对客户
- 服务质量可预期
- 可以简化客户端的系统设计
- 对于服务提供者而言
- 可预期的服务质量,保护服务商免受SLA 违规
- 更好的取舍成本/收益
- 更好的风险控制(当资源受限的时候)
- 故障时更快的反应,采取正确措施
该控制系统需要重复的执行以上动作,以形成一个标准的反馈环路,不断的衡量和改进SLO/服务本身。
我们讨论了目标以及目标是怎么测量的,还讨论了控制机制来达到设置的目标,但是如果因为某些原因,设置的目标达不到该怎么办呢?
也许是因为大量的新增负载;也许是因为底层依赖不能达到标称的SLO而影响上次服务的SLO。这就需要SLA出场了。
3. 智能运维产品Saas举例–观测云调研
新建SLO规则
- 目标:支持“目标”和“最低目标”
- 当 SLO百分比 < 目标百分比,且 >= 最低目标百分比时,被认定为 不健康SLA
- 当 SLO百分比 < 最低目标百分比时,被认定为 不达标 SLA
- 检测频率:支持5min和10min
SLO列表展示&详情
- 对于不健康和不达标的SLA给予颜色区分
- 支持查看详情
- 支持导出到仪表盘
- 监控/测量SLIs
- 对比检测到的SLIs值是否达到目标
- 如果需要,修证目标或者修正系统以满足目标需要
- 实施目标的修改或者系统的修改