【K8S问题系列 |1 】Kubernetes 中 NodePort 类型的 Service 无法访问【已解决】

ops/2024/11/14 0:28:17/

在这里插入图片描述

在 Kubernetes 中,NodePort 类型的 Service 允许用户通过每个节点的 IP 地址和指定的端口访问应用程序。如果
NodePort 类型的 Service 无法通过节点的 IP
地址和指定端口进行访问,可能会导致用户无法访问应用。本文将详细分析该问题的常见原因及其解决方案。

一、问题描述

NodePort 类型的 Service 允许用户通过以下方式访问服务:

  • http://<node-ip>:<node-port>

如果无法访问,可能会出现以下情况:

  • 请求超时。
  • 返回连接错误。
  • 404 或其他错误代码。

二、故障排查步骤

1. 检查 NodePort Service 的状态

命令
kubectl get svc <service-name>
执行结果分析

输出示例:

NAME          TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)         AGE
my-service    NodePort    10.96.0.1      <none>        80:30007/TCP    10m
  • PORT(S):显示 NodePort 的外部端口(如 30007)。

2. 查看 Service 详细信息

命令
kubectl describe svc <service-name>
执行结果分析

输出示例:

Name:              my-service
Namespace:         default
Selector:          app=my-app
Type:              NodePort
IP:                10.96.0.1
Port:              <unnamed>  80/TCP
NodePort:         30007/TCP
Endpoints:         10.244.1.2:8080,10.244.1.3:8080
  • NodePort:显示分配给 Service 的 NodePort。
  • Endpoints:显示与 Service 关联的 Pod 的 IP 地址和端口。如果此字段为空,则表示没有可用的 Pod。

3. 验证 Pod 状态和标签

命令
kubectl get pods -l app=my-app
执行结果分析

输出示例:

NAME            READY   STATUS    RESTARTS   AGE
my-app-1       1/1     Running   0          5m
my-app-2       1/1     Running   0          5m
  • 确保 Pod 处于 Running 状态,并且 READY 列显示为 1/1

4. 测试 Pod 之间的连接

在集群内部测试从 Pod 到 Service 的连接。

命令
kubectl exec -it <some-pod-name> -- curl http://my-service
执行结果分析
  • 如果返回正常响应,表示 Service 和 Pod 之间的连接正常。
  • 如果出现错误,需要进一步检查 Pod 的健康和配置。

三、常见原因及解决方案

1. NodePort 未正确配置

问题描述:Service 的 NodePort 配置可能存在问题。

解决方案

  • 确认 NodePort 在 30000 到 32767 的范围内(Kubernetes 默认范围)。
  • 如果需要手动设置 NodePort,确保配置正确。
apiVersion: v1
kind: Service
metadata:name: my-service
spec:type: NodePortselector:app: my-appports:- port: 80targetPort: 8080nodePort: 30007  # 确保在允许范围内

2. Pod 未处于 Running 状态

问题描述:与 Service 关联的 Pod 可能未处于正常状态。

解决方案

  • 使用以下命令检查 Pod 状态:
kubectl get pods -l app=my-app
  • 如果 Pod 处于 CrashLoopBackOff 或其他异常状态,查看其日志:
kubectl logs <pod-name>
  • 解决 Pod 的健康问题,确保它们能够正常运行。

3. 防火墙或安全组设置

问题描述:云环境中的防火墙或安全组可能阻止了对 NodePort 的访问。

解决方案

  • 检查云提供商控制台中的安全组设置,确保允许访问 NodePort 所在的端口。
  • 对于在本地环境(如 Minikube)中运行的集群,确保本地防火墙允许访问 NodePort。

4. 节点 IP 地址不正确

问题描述:使用了错误的节点 IP 地址。

解决方案

  • 使用以下命令获取节点的 IP 地址:
kubectl get nodes -o wide

输出示例:

NAME           STATUS   ROLES    AGE   VERSION   INTERNAL-IP      EXTERNAL-IP
kube-node-1    Ready    <none>   10m   v1.21.0   192.168.1.10     <none>
  • 确保使用的节点 IP 地址正确。

5. Network Policies 限制访问

问题描述:可能存在网络策略(Network Policies),限制了 Pod 之间的流量。

解决方案

  • 检查当前命名空间的网络策略:
kubectl get networkpolicy
  • 如果存在限制,更新网络策略以允许流量。

6. Service 的选择器未匹配到 Pod

问题描述:Service 的选择器未正确匹配到 Pod 的标签。

解决方案

  • 检查 Service 的选择器和 Pod 的标签:
kubectl get pods --show-labels
  • 确保选择器 app=my-app 正确匹配到相关的 Pod 标签。

7. Pod 的容器端口未正确暴露

问题描述:Pod 的容器未正确配置暴露端口。

解决方案

  • 确认 Pod 的容器定义中包含正确的 containerPort
containers:
- name: my-containerimage: my-imageports:- containerPort: 8080  # 必须与 Service 的 targetPort 一致

四、总结

NodePort 类型的 Service 无法通过节点的 IP 地址和指定端口访问的问题可能由多种原因引起,包括配置错误、Pod 状态异常、防火墙设置和网络策略等。通过逐步排查 Service 状态、Pod 状态、网络配置和安全组设置,可以有效定位问题并采取相应的解决方案。确保 Service 和 Pod 之间的配置一致性,以及网络的可用性,是确保服务正常运行的关键。

五、专栏介绍

《Kubernetes问题与解决方案》

本专栏深入剖析Kubernetes在实际应用中遇到的各种常见问题,包括但不限于集群部署、资源管理、服务发现、网络配置、安全策略、存储管理、故障排查等方面。针对每个问题,将提供详细的解决方案和最佳实践,快速定位问题根源,并采取有效的措施进行解决。

相信,通过本专栏的学习和实践,你将能够轻松驾驭Kubernetes,下个问题见~


http://www.ppmy.cn/ops/133118.html

相关文章

spring组件介绍

1. Spring Core&#xff08;Spring核心&#xff09;&#xff1a; • BeanFactory&#xff1a;Spring IoC容器的基础接口&#xff0c;提供了配置框架和基本的功能&#xff0c;用于管理任何类型的对象。 • ApplicationContext&#xff1a;BeanFactory的子接口&#xff0c;提供了…

uni-app选项卡制作 ⑥

文章目录 十、选项卡制作一 、组件创建二、scroll-view 组件使用三、点击设置按钮跳转到标签设置界面四、数据获取 十、选项卡制作 1.遇到错误&#xff1a; 2.解决问题&#xff1a; 3.this 指向问题 // 指向&#xff1a; get_label_list uniCloud.callFunction({name: "g…

SpringCloud框架学习(第二部分:Consul、LoadBalancer和openFeign)

目录 六、Consul服务注册和发现 1.基本介绍 2.下载运行 3.服务注册与发现 &#xff08;1&#xff09;支付服务provider8001注册进consul &#xff08;2&#xff09;修改订单服务cloud-consumer-order80 4.CAP &#xff08;1&#xff09;CAP理论 &#xff08;2&#x…

Hive 实现查询用户连续三天登录记录

标题&#xff1a;Hive 实现查询用户连续三天登录记录 在数据分析和处理中&#xff0c;经常会遇到需要查询特定条件数据的情况。本文将介绍如何使用 Hive 来查询用户连续三天登录的所有数据记录。 一、问题背景 我们有一个用户登录记录表&#xff0c;其中包含用户的登录日期信…

Kafka面试题(二)

1、Kafka的分区策略是什么&#xff1f; 1、假如指定了分区&#xff0c;就往这个分区发数据 2、如果没有指定分区&#xff0c;指定了Key值&#xff0c;那么对Key进行Hash&#xff0c;再对分区数取模后&#xff0c;得到哪个分区&#xff0c;就使用哪个分区 3、如果都没有指定&…

Elasticsearch日志收集成功但是展示不出来????

使用kibana查询日志的时候发现&#xff0c;怎么都查询不到日志&#xff0c;去服务器看了filebeat也正常运行&#xff0c;能收集到日志&#xff1b;重启kibana也没用。。。。。。。。。。 我擦。。。。。。。 看了眼索引&#xff0c;存储好大 然后就把一些不重要的索引删除后就…

丹摩征文活动|智谱AI引领是实现文本可视化 - CogVideoX-2b 部署与使用

文章目录 前言一、DAMODEL平台特性二、创建CPU云实例三、CogVedioX介绍四、DAMODEL一键部署CogVideoX1. 创建丹摩实例(参考上述介绍)2. 配置环境和依赖3. 模拟与配置文件4. 开始运行4.1 调试4.2 webUI4.3 端口映射 前言 DAMODEL&#xff08;丹摩智算&#xff09;是一款专为满足…

闯关leetcode——202. Happy Number

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/happy-number/description/ 内容 Write an algorithm to determine if a number n is happy. A happy number is a number defined by the following process: Starting with any positive inte…