运行 Rancher 的建议

embedded/2025/2/26 2:50:10/

运行在多个节点上的多个 Rancher 实例确保了单节点环境无法实现的高可用性,所以在生产环境或者一些很重要的环境中部署 Rancher 时,应该使用至少有三个节点的高可用 Kubernetes 集群,并在这个集群上面安装 Rancher。

在专用的集群上运行 Rancherrancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E5%9C%A8%E4%B8%93%E7%94%A8%E7%9A%84%E9%9B%86%E7%BE%A4%E4%B8%8A%E8%BF%90%E8%A1%8C-rancher" rel="nofollow" title="#">#

不要在安装 Rancher 的 Kubernetes 集群中运行其他工作负载或微服务。

不要在托管的 Kubernetes 环境中运行 Rancherrancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E4%B8%8D%E8%A6%81%E5%9C%A8%E6%89%98%E7%AE%A1%E7%9A%84-kubernetes-%E7%8E%AF%E5%A2%83%E4%B8%AD%E8%BF%90%E8%A1%8C-rancher" rel="nofollow" title="#">#

当 Rancher Server 安装在 Kubernetes 集群上时,它不应该在托管的 Kubernetes 环境中运行,比如谷歌的 GKE、Amazon 的 EKS 或 Microsoft 的 AKS。这些托管的 Kubernetes 解决方案没有将 etcd 开放到 Rancher 可以管理的程度,并且它们的自定义设置可能会干扰 Rancher 的操作。

建议使用托管的基础设施,如 Amazon 的 EC2 或谷歌的 GCE。在基础设施提供者上使用 RKE 创建集群时,您可以配置集群创建 etcd 快照作为备份。然后,您可以使用 RKE 或 Rancher 从这些快照之一恢复您的集群。在托管的 Kubernetes 环境中,不支持这种备份和恢复功能。

确保 Kubernetes 的节点配置正确rancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E7%A1%AE%E4%BF%9D-kubernetes-%E7%9A%84%E8%8A%82%E7%82%B9%E9%85%8D%E7%BD%AE%E6%AD%A3%E7%A1%AE" rel="nofollow" title="#">#

当您部署节点时需要遵循 Kubernetes 和 etcd 最佳实践,比如:禁用 swap、反复检查集群中的所有机器之间的网络连接、使用唯一的主机名、使用唯一的 MAC 地址、使用唯一的 product_uuids、检查所有需要的端口被打开,部署使用 ssd 的 etcd。更多的细节可以在 Kubernetes 文档 和 etcd 的性能操作指南 中找到。

使用 RKE 备份状态文件rancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E4%BD%BF%E7%94%A8-rke-%E5%A4%87%E4%BB%BD%E7%8A%B6%E6%80%81%E6%96%87%E4%BB%B6" rel="nofollow" title="#">#

对于RKE v0.2之前的版本,ETCD 备份会自动将/etc/kubernetes/ssl/目录下的所有证书打包为pki.bundle.tar.gz文件,然后保存在/opt/rke/etcd-snapshot目录中。

对于RKE v0.2之后的版本,RKE 将集群状态记录在一个名为cluster.rkestate的文件中,这个文件存放于与 RKE 配置文件相同目录。这个文件保存了集群的 SSL 证书信息,对于通过 RKE 恢复集群和/或集群的后期维护非常重要。由于该文件包含证书信息,我们强烈建议在备份之前对该文件进行加密,并且每次运行rke up之后,您都应该备份此状态文件。

集群中所有节点在同一个数据中心rancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E9%9B%86%E7%BE%A4%E4%B8%AD%E6%89%80%E6%9C%89%E8%8A%82%E7%82%B9%E5%9C%A8%E5%90%8C%E4%B8%80%E4%B8%AA%E6%95%B0%E6%8D%AE%E4%B8%AD%E5%BF%83" rel="nofollow" title="#">#

为了获得最佳性能,请在同一个的数据中心中运行所有集群节点。

如果您正在使用云中的节点,例如:AWS,请在单独的可用区域中运行每个节点。例如,启动 us-west-2a 中的节点,us-west-2b 中的节点 2,us-west-2c 中的节点 3。

开发和生产环境应该类似rancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E5%BC%80%E5%8F%91%E5%92%8C%E7%94%9F%E4%BA%A7%E7%8E%AF%E5%A2%83%E5%BA%94%E8%AF%A5%E7%B1%BB%E4%BC%BC" rel="nofollow" title="#">#

强烈建议使用 Rancher 创建stagingpre-production环境的 Kubernetes 集群,这个环境应该在软件和硬件配置方面尽可能的与生产环境相同。

监视集群以计划容量rancher.cn/docs/rancher2/best-practices/deployment-types/_index/#%E7%9B%91%E8%A7%86%E9%9B%86%E7%BE%A4%E4%BB%A5%E8%AE%A1%E5%88%92%E5%AE%B9%E9%87%8F" rel="nofollow" title="#">#

Rancher Server 的 Local Kubernetes 集群应该尽可能符合系统和硬件需求。您越偏离系统和硬件需求,您承担的风险就越大。

但是,基于指标的容量规划分析应该是扩展 Rancher 的最终指导,因为我们发布的需求建议考虑了各种工作负载类型。

使用 Rancher,您可以通过与领先的开源监控解决方案 Prometheus 和 Grafana 的集成来监控集群节点、Kubernetes 组件和软件部署的状态和过程,Grafana 可以可视化来自 Prometheus 的指标。

在集群中启用监控之后,您可以设置通知和告警,让您知道您的集群是否接近其容量。您还可以使用 Prometheus 和 Grafana 监控框架来建立适合您的规模的关键指标基准。


http://www.ppmy.cn/embedded/167174.html

相关文章

Prime_Series_Level-1靶场,wpscan爆破,LFI漏洞,wordpress更改文件getshell,ubuntu内核提权

泷羽Sec-尘宇安全 前言 oscp备考,oscp系列——Prime_Series_Level-1靶场,wpscan爆破,LFI漏洞,wordpress更改文件getshell,ubuntu内核提权 难度简单偏上 对于低权限shell获取涉及:wpscan爆破,…

Java虚拟机(JVM)深度解析

Java虚拟机(JVM)深度解析 JVM概述JVM内存结构堆内存详细分区类加载机制类加载流程类加载器层次执行引擎与运行时数据区执行引擎核心组件运行时数据区交互垃圾回收机制(GC)GC算法分类常见垃圾收集器JVM性能调优常用参数示例JVM概述 Java虚拟机(Java Virtual Machine, JVM)…

计算机视觉算法实战——产品分拣(主页有源码)

✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连✨ ​ 1. 领域简介✨✨ 产品分拣是工业自动化和物流领域的核心技术,旨在通过机器视觉系统对传送带上的物品进行快速识别、定位和分类&a…

instanceof和typeof的区别【JavaScript常见面试题】

typeof (一元操作符): 用于判断一个变量的类型。它可以用于任何数据类型,并返回一个表示该类型的字符串。 console.log(typeof 42); // "number" console.log(typeof Hello); // "string" conso…

Spring Boot + JSqlParser:全面解析数据隔离最佳实践

Spring Boot JSqlParser:全面解析数据隔离最佳实践 在构建多租户系统或需要进行数据权限控制的应用时,数据隔离是一个至关重要的课题。不同租户之间的数据隔离不仅能够确保数据的安全性,还能提高系统的灵活性和可维护性。随着业务的扩展和需…

python和pycharm 和Anaconda的关系

好的,下面我会详细说明 Python、PyCharm 和 Anaconda 三者的关系,并逐一解释它们的功能和作用。 1. Python(编程语言) 定义:Python 是一种高级编程语言,设计简洁,易于学习,且功能强…

LeetCode 贪心算法经典题目 (C++实现)

121. 买卖股票的最佳时机 题目描述 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返…

跟着柳叶刀数字健康,学习如何通过病理切片预测分子分类对预后的影响|项目复现

小罗碎碎念 项目复现 今天和大家分享一个非常具有参考价值的项目,手把手带着大家复现一篇发表在柳叶刀数字健康的文章。 花了六个小时才完成的这篇推送,信息量非常大,遇到了很多报错问题,但是解决以后的感觉是非常爽的,先给大家展示一下最终的成果——在同一张切片上,通…