nogo,benlux,fc兵蜂
记一次服务器内核软死锁(soft lockup)解决方案 2020-08-02 05:34:28 程梦雨说娱乐
概述
简单记录下最近处理的一个内核软死锁(soft lockup)问题,仅供参考。
1、检查系统信息
grep -C 5 "NMI watchdog: BUG" /var/log/messages
服务器异常卡顿,但CPU、内存等资源都是正常的,观察系统日志提示NMI watchdog: BUG: soft lockup - CPU#4 stuck for 21s! [java:1782]
>2、内核软死锁(soft lockup)bug原因分析
Soft lockup名称解释:所谓,soft lockup就是说,这个bug没有让系统彻底死机,但是若干个进程(或者kernel thread)被锁死在了某个状态(一般在内核区域),很多情况下这个是由于内核锁的使用的问题。
Linux内核对于每一个cpu都有一个监控进程,在技术界这个叫做watchdog(看门狗)。通过ps ef | grep watchdog能够看见,进程名称大概是watchdog/X(数字:cpu逻辑编号1/2/3/4之类的)。这个进程或者线程每一秒钟运行一次,否则会睡眠和待机。这个进程运行会收集每一个cpu运行时使用数据的时间并且存放到属于每个cpu自己的内核数据结构。在内核中有很多特定的中断函数。这些中断函数会调用sof
本文发布于:2024-01-27 20:51:21,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17063598852564.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |