linux服务器cpu过高满载问题

news/2024/11/15 4:42:39/

1. 使用top查看目前正在运行的进程使用系统资源情况

在这里插入图片描述

找出CPU占用过高的程序

2. 通过ps -mp pid -o THREAD,tid,time命令, 查看某个进程下的线程情况, time代表这个线程已运行时间,

在这里插入图片描述

3. 将10进制线程号用计算器, 转16进制

TID 号 10进制转换成 16进制,然后去下方生成的文件中查询是哪个线程出的问题

4. 导出指定进程pid所有线程信息——jstack pid > xxx.log

jstack 26968 >thread.log

5. 分析

1

线程状态介绍
  • 死锁,Deadlock(重点关注) :一般指多个线程调用间,进入相互资源占用,导致一直等待无法释放的情况。

  • 执行中,Runnable :一般指该线程正在执行状态中,该线程占用了资源,正在处理某个请求,有可能正在传递SQL到数据库执行,有可能在对某个文件操作,有可能进行数据类型等转换。

  • 等待资源,Waiting on condition(重点关注) :等待资源,或等待某个条件的发生。具体原因需结合 stacktrace来分析。
     1、如果堆栈信息明确是应用代码,则证明该线程正在等待资源。一般是大量读取某资源,且该资源采用了资源锁的情况下,线程进入等待状态,等待资源的读取。
    又或者,正在等待其他线程的执行等。
     2、如果发现有大量的线程都在处在 Wait on condition,从线程 stack看,正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。
       2.1、一种情况是网络非常忙,几乎消耗了所有的带宽,仍然有大量数据等待网络读写;
       2.2、另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。
     3、另外一种出现 Wait on condition的常见情况是该线程在 sleep,等待 sleep的时间到了时候,将被唤醒。

  • 等待获取监视器,Waiting on monitor entry(重点关注)

  • 对象等待中,Object.wait() 或 TIMED_WAITING
     Waiting for monitor entry 和 in Object.wait():
     Monitor(Monitor的深入理解传送门)是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 Class的锁。每一个对象都有,也仅有一个 monitor。
     从下图中可以看出,每个 Monitor在某个时刻,只能被一个线程拥有,该线程就是 “Active Thread”,而其它线程都是 “Waiting Thread”,分别在两个队列 “ Entry Set”和 “Wait Set”里面等候。
     在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”,而在 “Wait Set”中等待的线程状态是 “in Object.wait()”

    img

    Java Monitor

  • 暂停,Suspended

  • 阻塞,Blocked(重点关注) :是指当前线程执行过程中,所需要的资源长时间等待却一直未能获取到,被容器的线程管理器标识为阻塞状态,可以理解为等待资源超时的线程。

  • 停止,Parked

    stack trace实例分析
    "consumer_redirectUrl_topic_jmq206_1546013217302" daemon prio=10 tid=0x00007f1bf03f6800 nid=0x693e waiting on condition [0x00007f1b38388000]java.lang.Thread.State: TIMED_WAITING (parking)at sun.misc.Unsafe.park(Native Method)- parking to wait for  <0x00000000f76e21a0> (a java.util.concurrent.CountDownLatch$Sync)at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:226)at java.util.concurrent.locks.AbstractQueuedSynchronizer.doAcquireSharedNanos(AbstractQueuedSynchronizer.java:1033)at java.util.concurrent.locks.AbstractQueuedSynchronizer.tryAcquireSharedNanos(AbstractQueuedSynchronizer.java:1326)at java.util.concurrent.CountDownLatch.await(CountDownLatch.java:282)at com.jd.jmq.common.network.netty.ResponseFuture.await(ResponseFuture.java:133)at com.jd.jmq.common.network.netty.NettyTransport.sync(NettyTransport.java:241)at com.jd.jmq.common.network.netty.failover.FailoverNettyClient.sync(FailoverNettyClient.java:94)at com.jd.jmq.client.consumer.GroupConsumer.pull(GroupConsumer.java:246)at com.jd.jmq.client.consumer.GroupConsumer$QueueConsumer.run(GroupConsumer.java:445)at java.lang.Thread.run(Thread.java:745)Locked ownable synchronizers:- None
    
    • 线程名:consumer_redirectUrl_topic_jmq206_1546013217302
    • 线程优先级:prio=10
    • java线程的identifier:tid=0x00007f1bf03f6800
    • native线程的identifier:nid=0x693e
    • 线程的状态:waiting on condition [0x00007f1b38388000]
      java.lang.Thread.State: TIMED_WAITING (parking)
    • 线程栈起始地址:[0x00007f1b38388000]

6. 最后检查出问题的代码


http://www.ppmy.cn/news/491560.html

相关文章

cpu满载寿命_电脑寿命逐个谈:CPU、内存最长寿,反倒是这个配件最爱坏

电脑寿命逐个谈&#xff1a;CPU、内存最长寿&#xff0c;反倒是这个配件最爱坏 2020-02-15 14:33:44 162点赞 173收藏 196评论 你是AMD Yes党&#xff1f;还是intel和NVIDIA的忠实簇拥呢&#xff1f;最新一届#装机大师赛#开始啦&#xff01;本次装机阵营赛分为3A红组、intel NV…

cpu 满载测试软件程序

https://www.cnblogs.com/djiankuo/p/6110991.html for i in seq 1 $(cat /proc/cpuinfo |grep "physical id" |wc -l); do dd if/dev/zero of/dev/null & done 说明: cat /proc/cpuinfo |grep "physical id" | wc -l 可以获得CPU的个数, 我们将其表…

Linux ECS CPU满载100% TOP进程无法查看解决记录

一、阿里一台ECS测试服务器提示检查到挖矿程序运行。 文件名为/usr/lib/libiacpkmn.so.3 影响&#xff1a;CUP进程100%持续满载 二、处理方法 1、通过阿里云盾杀掉及隔离进程文件  无效 2、通过linux删除libiacpkmn.so.3 提示无权限! # lsattr libiacpkmn.so.3 查看文…

GC导致CPU满载

昨天现场突然说服务器CPU满载&#xff0c;导致无法对外提供服务&#xff0c;刚重启服务器&#xff0c;过一段时间又满载了。于是我这个菜鸡就开始跟着大佬查问题。 一开始&#xff0c;我像无头苍蝇一样&#xff0c;用top看进程状态&#xff0c;看了半天&#xff0c;找出一堆虽…

服务器cpu位置,服务器CPU满载,谁之过?

01 运维口水战 某天&#xff0c;突如其来的问题发生了&#xff0c;面向互联网用户的一套业务系统中的某台Web服务器出现的异常&#xff0c;CPU跑满了。大量的用户页面非常慢&#xff0c;有时甚至访问不了。对于运维人员来说&#xff0c;犹如晴天霹雳。 网络运维人员迅速检查到该…

ERROR日志打印导致CPU满载

描述 开发环境对一台测试节点进行压测时&#xff0c;由于参数配置错误导致请求没有业务处理直接报错。随即停止压测后登录测试机器排查日志&#xff0c;以外发现虽然已经没有请求到该节点&#xff0c;但应用依然在打印错误日志&#xff0c;并且看日志时间是在打印几分钟前请求…

用Python实现Linux系统占用指定内存,CPU满载

背景 提出两个需求 占满系统CPU占用大内存 通过上网查资料&#xff0c;做实验使用Python实现了上述两个需求。 先看效果 执行前 内存 CPU 执行后 内存 CPU 代码实现 环境说明&#xff1a;代码使用Python3实现 #! /user/bin/env python # -*- encoding: utf-8 -*- import…

如何模拟FullGC导致CPU满载问题

系列文章目录 第一章 如何保证多个线程的顺序执行&#xff1f; 第二章 如何排查线上环境内存使用过大&#xff1f; 第三章 如何模拟FullGC导致CPU满载问题&#xff1f; 文章目录 前言排查故障一、构建模拟环境二、Java VisualVM查看在命令行输入&#xff0c;启动VisualVM安装…