阿里云云服务器ECS常见故障处理二:实例CPU跑满或跑高

摘要: 使用云服务器 ECS 时,若出现服务的速度变慢,或 ECS 实例突然断开,可以考虑服务器带宽和 CPU 是否有跑满或跑高的问题。处理步骤1、定位问题。找到影响CPU 跑满或跑高的具体进程。2、分析处理。

使用云服务器ecs 时,若出现服务的速度变慢,或 ECS 实例突然断开,可以考虑服务器带宽和 CPU 是否有跑满或跑高的问题。

blob.png


处理步骤

  1. 1、定位问题。找到影响CPU 跑满或跑高的具体进程。

    2、分析处理。排查影响 CPU 跑满或跑高的进程是否正常,并分类进行处理。

    • 对于正常进程:您需要对程序进行优化或者升级服务器配置。

    • 对于异常进程:您可以手动对进程进行查杀,也可以使用第三方安全工具去查杀。


linux系统CPU跑满或跑高的问题定位


云服务器 ECS 的 CPU 持续跑高,会对系统的稳定性和业务运行造成影响。Linux 系统下,查看进程的常用命令如下:

ps -aux
ps -ef
top

Linux 系统中,通常使用 top 命令来查看系统的负载问题,并定位耗用较多 CPU 资源的进程。


top - 17:27:13 up 27 days,  3:13,  1 user,  load average: 0.02, 0.03, 0.05
Tasks:  94 total,   1 running,  93 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.3 us,  0.1 sy,  0.0 ni, 99.5 id,  0.0 wa,  0.0 hi,  0.0 si,  0.1 st
KiB Mem:   1016656 total,   946628 used,    70028 free,   169536 buffers
KiB Swap:        0 total,        0 used,        0 free.   448644 cached Mem
PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
1 root      20   0   41412   3824   2308 S  0.0  0.4   0:19.01 systemd
2 root      20   0       0      0      0 S  0.0  0.0   0:00.04 kthreadd

针对负载问题,您只需关注回显的第一行和第三行信息,详细说明如下。

top 命令的第一行显示的内容 

17:27:13 up 27 days, 3:13, 1 user, load average: 0.02, 0.03

, 0.05 依次为 系统当前时间 、系统到目前为止已运行的时间、当前登录系统的用户数量、系统负载,这与直接执行 uptime 命令查询结果一致。

top 命令的第三行会显示当前 CPU 资源的总体使用情况,下方会显示各个进程的资源占用情况。


linux系统CPU跑满或跑高的分析处理


CPU 的跑满或跑高,在确认具体的进程结果后,针对异常的进程,您需要通过 top 命令将其终止;而对于 kswapd0 进程导致的内存不足等问题,您需要对系统进行规格的升级或程序的优化。

使用 top 直接终止 CPU 消耗较大的进程

您可以直接在 top 运行界面快速终止相应的异常进程。操作步骤如下:

若您想要终止某个进程,只需按下小写的 k 键。

输入想要终止的进程 PID (top 输出结果的第一列)。例如,若您想要终止 PID 为 86 的进程,输入 86 后按回车即可。

操作成功后,界面会出现类似 Send pid 86 signal [15/sigterm] 的提示信息。按回车确认即可。

kswapd0 进程占用导致 CPU 较高

操作系统都用分页机制来管理物理内存,系统会把一部分硬盘空间虚拟成内存使用。由于内存的速度要比磁盘快得多,所以系统要按照某种换页机制将不需要的页面换到磁盘中,将需要的页面调到内存中。

kswapd0 是虚拟内存管理中负责换页的进程,当服务器内存不足的时候 kswapd0 会执行换页操作,这个换页操作是十分消耗主机 CPU 资源的。操作步骤如下:

1.通过 top 命令查看 kswapd0 进程。

2.检查该进程是否持续处于非睡眠状态,且运行时间较长。若是,可以初步判定系统在持续地进行换页操作,kswapd0 进程占用了系统大量 CPU 资源。

1


3.您可以通过 free 、ps 等指令进一步查询系统及系统内进程的内存占用情况,做进一步排查分析。

4.针对系统当前内存不足的问题,您可以重启 Apache,释放内存。

说明:从长远的角度来看,您需要对内存进行升级。




window系统CPU跑满或跑高的问题定位

微软有多个工具可以定位 CPU 和带宽跑满或跑高的问题,例如任务管理器,资源监视器(Resource Monitor),性能监视器(Performance Monitor), Process Explorer,Xperf (Windows server 2008 以后),抓取系统 Full Memory Dump 检查。在流量大的情况下,您还可以使用 Wireshark 抓取一段时间的网络包,分析流量使用情况。

注意: Windows 2008 版以上,通常使用系统自带的资源监视器监控 CPU 和带宽。

  1. 在桌面底部单击 开始 菜单,选择 运行。

  2. 打开运行框后,在框中输入 perfmon -res 并单击 确定。

    1

  3. 在 资源监视器 页面中,查看各进程是否有 CPU 或带宽跑满/跑高的现象。

    2

  4. 针对占用资源较高的进程,查看对应的进程 ID 和进程的程序名。

  5. 定位进程 ID 后,结合任务管理器判断程序是否异常并定位程序的具体位置。

  6. 定位异常进程前,需要在任务管理器中选择 查看(V) > 选择列(S)… 。

    3

  7. 在弹出的框中选择 PID(进程标识符),单击 确定。

    4

  8. 任务管理器的 进程 页面中,将会增加 PID 这一项。

  9. 单击 PID 项,通过排序,找到之前资源监视器查看到的异常进程。右击进程名称,选择 打开文件位置,定位进程是不是恶意程序。

    5



window系统CPU跑满或跑高的分析处理

正常跑满或跑高的分析处理

正常情况下,当客户频繁访问业务,或由于 Windows 自身服务(更新服务等)都可能会占用较高网络流量和 CPU 。针对正常进程导致的 CPU跑满或跑高的情况,请按照如下顺序逐一进行排查。

注意: Windows 2008 / Windows 2012 服务器建议内存配置在 2G 或者 2G 以上。

  1. CPU 飙高时,检查是否后台有执行 Windows Update 进程。

  2. 建议在服务器上安装杀毒软件,进行杀毒。如有安装杀毒软件,请检查 CPU 或带宽飙高时,杀毒软件是否在后台执行扫描操作。如果可能,请升级杀毒软件到最新版本,或者删除杀毒软件。

  3. 打开 运行 -> MSCONFIG 禁用所有非 Microsoft 自带服务驱动,然后检查问题是否再次发生。参考 Microsoft 文档 How to perform a clean boot in Windows

  4. 运行 Windows Update 安装最新 Microsoft 安全补丁。

  5. 检查该 ECS 内应用程序是否有大量的磁盘访问/网络访问行为/高计算需求。通过尝试增配实例规格的方式,使用更多核数/内存的规格来解决资源瓶颈问题,如升级带宽。

  6. 更多解决方法可参考 Microsoft 文档 How to troubleshoot high cpu in the System process

异常跑满或跑高的分析处理

对于 CPU 异常跑满或跑高的情况,可能是被恶意病毒、木马入侵导致的。有时三方恶意程序可能会利用操作系统的svchost.exe,或者 Tcpsvcs.exe来伪装,引起高带宽的占用。您需要手动对异常进程进行查杀。

注意:若您无法判断进程是否为病毒或木马,建议将进程名称在网上进行搜索后确认。另外,建议您进行进程删除操作前,提前创建快照完成备份。

  1. 使用商业版杀毒软件,或使用微软免费安全工具 Microsoft Safety Scanner,在安全模式下进行扫描杀毒,链接如下:https://www.microsoft.com/security/scanner/zh-cn/default.aspx 。

  2. 运行 Windows Update 来安装最新的微软安全补丁。

  3. 使用 MSconfig 禁用所有非微软自带服务驱动,检查问题是否再次发生

  4. 若服务器或站点遭受 DDOS 攻击或 CC 攻击等,短期内产生大量的访问需求。您可以登录阿里云管理控制台,查看云盾中的防护 DDOS 攻击是否调整好阈值,并核实是否开启 CC 防护。如果攻击没有触发到阈值,云盾没有清洗,可以联系售后协助开起清洗。


云主机优惠小铺为您推荐

  • 云服务器通用版2核4G

    • 带宽1M
    • 系统盘40G
    • CPU2核
    • 内存4G
    优惠价
    825元/年1260元/2年1650元/3年
    更多配置及优惠
  • 计算网络增强型 (sn1ne) 4核8G

    • CPU4核
    • 内存8G
    • 带宽1M
    • 系统盘40G
    优惠价
    5249.94元/年9698.22元/3年
    更多配置及优惠

猜你喜欢

微信QQ空间QQ好友新浪微博联系客服