近期有同事反馈部分机器中kipmi0 占用cpu100%的情况,整理了以下相关资料共大家参考
ipmi是OS与BMC通讯的服务,kipmi0进程占用CPU 100% 是OS的驱动与BMC交互出现了问题,并且这个状态下ipmi的操作也没有响应。但是kipmi0进程优先级很低,当有系统应用需要CPU资源时,kipmi0会释放资源。案例:一台机器在看上周出现kipmi0占用CPU 100%的机器已经恢复正常,我这边没有对机器有任何操作,kipmi0自己释放出了资源。
解决方法:
尝试重启ipmi服务
service ipmi restart,如果重启无效或者命令hang住可以尝试以下方法。
1、 简单处理
echo 100 > /sys/module/ipmi_si/parameters/kipmid_max_busy_us
执行之后可临时降低使用率kipmi0的CPU使用率
2、 编辑/etc/modprobe.conf
添加options ipmi_si force_kipmid=0 (需要重启生效)
3、 编辑/etc/grub.conf
添加ipmi_si.kipmid_max_busy_us=<time in microseconds> (参考值 100 需要重启生效)
后续考虑将此操作加入初始化。