CoreDNS 性能优化

news/2025/2/14 6:55:41/

CoreDNS 作为 Kubernetes 集群的域名解析组件,如果性能不够可能会影响业务,本文介绍几种 CoreDNS 的性能优化手段。

合理控制 CoreDNS 副本数

考虑以下几种方式:

  1. 根据集群规模预估 coredns 需要的副本数,直接调整 coredns deployment 的副本数:

kubectl -n kube-system scale --replicas=10 deployment/coredns
  1. 为 coredns 定义 HPA 自动扩缩容。

  1. 安装 cluster-proportional-autoscaler 以实现更精确的扩缩容(推荐)。

禁用 ipv6

如果 K8S 节点没有禁用 IPV6 的话,容器内进程请求 coredns 时的默认行为是同时发起 IPV4 和 IPV6 解析,而通常我们只需要用到 IPV4,当容器请求某个域名时,coredns 解析不到 IPV6 记录,就会 forward 到 upstream 去解析,如果到 upstream 需要经过较长时间(比如跨公网,跨机房专线),就会拖慢整个解析流程的速度,业务层面就会感知 DNS 解析慢。

CoreDNS 有一个 template 的插件,可以用它来禁用 IPV6 的解析,只需要给 CoreDNS 加上如下的配置:

template ANY AAAA {rcode NXDOMAIN
}
这个配置的含义是:给所有 IPV6 的解析请求都响应空记录,即无此域名的 IPV6 记录。

优化 ndots

默认情况下,Kubernetes 集群中的域名解析往往需要经过多次请求才能解析到。查看 pod 内 的 /etc/resolv.conf 可以知道 ndots 选项默认为 5:

意思是: 如果域名中 . 的数量小于 5,就依次遍历 search 中的后缀并拼接上进行 DNS 查询。

举个例子,在 debug 命名空间查询 kubernetes.default.svc.cluster.local 这个 service:

  1. 域名中有 4 个 .,小于 5,尝试拼接上第一个 search 进行查询,即 kubernetes.default.svc.cluster.local.debug.svc.cluster.local,查不到该域名。

  1. 继续尝试 kubernetes.default.svc.cluster.local.svc.cluster.local,查不到该域名。

  1. 继续尝试 kubernetes.default.svc.cluster.local.cluster.local,仍然查不到该域名。

  1. 尝试不加后缀,即 kubernetes.default.svc.cluster.local,查询成功,返回响应的 ClusterIP。

可以看到一个简单的 service 域名解析需要经过 4 轮解析才能成功,集群中充斥着大量无用的 DNS 请求。

怎么办呢?我们可以设置较小的 ndots,在 Pod 的 dnsConfig 中可以设置:

然后业务发请求时尽量将 service 域名拼完整,这样就不会经过 search 拼接造成大量多余的 DNS 请求。

不过这样会比较麻烦,有没有更好的办法呢?有的!请看下面的 autopath 方式。

启用 autopath

启用 CoreDNS 的 autopath 插件可以避免每次域名解析经过多次请求才能解析到,原理是 CoreDNS 智能识别拼接过 search 的 DNS 解析,直接响应 CNAME 并附上相应的 ClusterIP,一步到位,可以极大减少集群内 DNS 请求数量。

启用方法是修改 CoreDNS 配置:

kubectl -n kube-system edit configmap coredns

修改红框中圈出来的配置:

  • 加上 autopath @kubernetes。

  • 默认的 pods insecure 改成 pods verified。

需要注意的是,启用 autopath 后,由于 coredns 需要 watch 所有的 pod,会增加 coredns 的内存消耗,根据情况适当调节 coredns 的 memory request 和 limit。

部署 NodeLocal DNSCache

参考 k8s 官方文档 Using NodeLocal DNSCache in Kubernetes clusters

如果是使用 TKE 并且 kube-proxy 转发模式为 iptables,可以直接在扩展组件中安装此扩展组件,扩展组件说明请参考 TKE 官方文档;如果使用的 ipvs 模式,可以参考 TKE IPVS 模式安装 localdns。

使用 DNSAutoscaler

社区有开源的 cluster-proportional-autoscaler ,可以根据集群规模自动扩缩容,支持比较灵活的扩缩容算法。

如果使用的是 TKE,已经将其产品化成 DNSAutoscaler 扩展组件,在扩展组件中直接安装即可,组件说明请参考 TKE 官方文档。


http://www.ppmy.cn/news/41436.html

相关文章

OpenCV实战(17)——FAST特征点检测

OpenCV实战(17)——FAST特征点检测0. 前言1. FAST 特征点检测2. 自适应特征检测3. 完整代码小结系列链接0. 前言 Harris 算子根据两个垂直方向上的强度变化率给出了角点(或更一般地说,兴趣点)的数学定义。但使用这种定义需要计算图像导数&am…

多线程的使用与解释

多线程 文章目录多线程什么是多线程线程特点线程的使用线程的创建线程ID获得线程终止线程等待进程分离什么是多线程 是资源调用的最小单位。一个进程内部的控制序列。线程是调度的基本单位。 线程有共享进程的数据,也有自己 的一部分数据 线程特点 1&#xff0c…

Devops流程探究

1、DevOps面向对象 软件开发是由开发团队和运维团队共同协同配合才能完成一个软件的开发。 2、开发团队和运维团队 开发团队主要负责软件的开发和迭代更新,运维团队则是负责测试和部署上线。 3、解决问题 但是,这样会存在一个问题,只有当…

Java知识点学习(第2天)

为什么不建议使用Executors来创建线程池? FixedThreadPool 当我们使用Executors创建FixedThreadPool时,对应的构造方法为: public static ExecutorService newFixedThreadPool(int nThreads) {return new ThreadPoolExecutor(nThreads,nThr…

互联网摸鱼日报(2023-04-11)

互联网摸鱼日报(2023-04-11) InfoQ 热门话题 裁员潮过去、削减中层管理潮又来了:升管理保饭碗,不灵了 微博增值团队可观测性落地实践与回顾-上篇 CVPR 2023|两行代码高效缓解Vision Transformer过拟合,美…

JUnit5学习

以下学习内容基于JUnit5英文文档和中文文档 目录 JUnit 5是什么 注解说明 元注解和组合注解 标准测试类 显示名称(DisplayName) 断言(Assertions) 假设(Assumptions) 条件测试执行(Conditional Test Execution) 标签和过滤(Tagging and Filtering) 测试执行顺序 测试…

JavaScript 进阶 - 0基础第二天

JavaScript 进阶 - 第二天 了解面向对象编程的基础概念及构造函数的作用,体会 JavaScript 一切皆对象的语言特征,掌握常见的对象属性和方法的使用。 深入对象内置构造函数综合案例 深入对象 了解面向对象的基础概念,能够利用构造函数创建对象…

R语言实践——ggplot2+ggrepel绘制散点+优化注释文本位置

简介 书接adjustText实践——调整matplotlib散点图标签,避免重复 上文中,matplotlibadjustText对于我的实例来说并没有起到很好的效果。所以,博主决定在R中利用gglot2ggrepel绘制,期待效果。 操作过程 博主不常使用R&#xff…