香港云主机出现频繁的SWAP交换怎么排查？内存优化策略-华纳云

香港云主机出现频繁的SWAP交换怎么排查？内存优化策略

时间 : 2026-04-19 13:34:03

编辑 : 华纳云

阅读量 : 23

　　说实话，第一次遇到服务器频繁SWAP的时候，我整个人是懵的。那天网站响应突然变得特别慢，SSH敲个命令都要卡好几秒，top一看，CPU和内存看着都还行，但wa和si数值高得离谱。后来才反应过来，这是系统在疯狂读写交换分区，内存不够用了。香港云主机因为带宽和线路成本高，很多人初期会买配置偏低的套餐，1核1G、1核2G这种，跑着跑着内存就见底了。SWAP本身是个好东西，它是内存不足时的缓冲垫，但频繁的交换操作会让磁盘IO剧增，系统响应直线下降，用户体验跟着崩。

　　怎么判断是真的频繁SWAP?别靠感觉

　　很多人一觉得服务器慢了，就怀疑是SWAP的问题。其实不一定，可能是CPU满载、网络拥堵或者磁盘坏了。所以第一步不是急着优化，而是确认问题到底是不是出在交换上。登录到你的香港云主机，用几个命令看看情况。

　　先敲free -h，看Swap这一行的total、used和available。如果used那一项长期不是0，而且数值还不小，说明系统确实在用交换分区。再敲vmstat 1 5，这个命令每秒输出一次系统状态，连续看5次。重点关注si和so这两列——si是每秒从磁盘交换到内存的数据量，so是从内存交换到磁盘的数据量。如果这两个数字经常超过几十甚至上百KB，那就坐实了：你的服务器正在频繁地进行内存和磁盘之间的数据搬运，效率低得令人发指。

　　还有一个更直观的命令：sar -W 1 5，需要先安装sysstat包。它直接显示每秒的交换页面数。输出里如果有持续非零的数字，不用犹豫，内存已经扛不住了。

　　找到内存杀手：到底谁在吃内存

　　确认了SWAP频繁之后，下一步就是找出是哪个进程把内存吃光了。这是整个排查过程里最核心的一步，找错了方向，后面所有优化都是白费力气。

　　用top命令进入交互界面，按M键(大写M)让进程按内存占用率排序。你会看到最上面的几个进程，它们的%MEM列如果加起来占了总内存的一大半，那凶手就锁定在这几个身上了。如果进程看起来都比较正常，没有明显的内存黑洞，那问题可能出在缓存或者内核内存泄露上。

　　这个时候可以敲free -h仔细看available列。available表示系统里有多少内存是“可以给新程序用”的，它包括了真正的空闲内存加上可回收的缓存。如果available很少，但buff/cache那一项很大，说明系统把很多内存用作了缓存。缓存本身不是坏事，但在内存紧张的时候，大量缓存会导致SWAP被激活。可以手动释放一下缓存看看效果：sync && echo 3 > /proc/sys/vm/drop_caches，这条命令会清空pagecache、dentries和inodes。注意这只是临时测试手段，不建议做成定时任务。

　　另外一个容易忽视的地方是每个进程的RES(常驻内存)和VIRT(虚拟内存)。有些程序比如Java、Python，会申请远大于实际需要的虚拟内存，虽然物理内存没吃那么多，但会让系统内存管理变得混乱。ps aux --sort=-%mem | head -20能直接列出内存占用最高的20个进程，比top更直观。

　　为什么香港云主机特别容易内存不足?

　　在分析具体优化方法之前，得先明白香港云主机的特殊性。香港的机房资源紧张，带宽和硬件成本都高，轻量云服务器的套餐为了控制价格，普遍配置偏低。1核1G、1核2G是主流入门款，这些配置跑个LNMP或者WordPress，再挂一两个Python脚本，内存就已经很吃紧了。而且很多香港云主机默认分配了SWAP，但用的是系统盘上的普通SSD，甚至有的还是机械硬盘。SSD的随机读写延迟虽然比机械盘好很多，但和内存比差了几个数量级——内存纳秒级，SSD微秒到毫秒级。频繁的SWAP意味着每次内存换页都要经历一次磁盘IO，系统响应时间被拖长几十倍甚至上百倍。

　　还有一个不太友好的事实：部分香港云厂商会在母机上超卖内存。你看到的1GB内存，实际物理内存可能只有七八百MB可用，剩下的靠宿主机的内存气球技术或者KSM来凑。这种环境下的内存紧张程度，比正常情况要严重得多。

　　优化策略一：调整SWAP使用倾向

　　如果你暂时不能增加物理内存，那至少可以让系统不要那么积极地使用SWAP。Linux内核有一个参数叫vm.swappiness，取值范围0到100，默认是60。这个值越高，系统越倾向于把不常用的内存页交换到磁盘上去;值越低，系统越倾向于尽量使用物理内存。对于云主机来说，磁盘IO是瓶颈，我们应该让系统尽量别碰SWAP，除非内存真的快用光了。

　　查看当前值：cat /proc/sys/vm/swappiness。临时改低一点：sysctl -w vm.swappiness=10。永久生效的话，编辑/etc/sysctl.conf，加上vm.swappiness=10，然后sysctl -p。我一般建议把swappiness设置在10到20之间，既能保证内存充分利用，又不会因为过早的交换拖慢系统。

　　优化策略二：清理和限制不必要的服务

　　很多时候，内存被吃光是因为跑了一些根本用不上的东西。检查一下开机自启的服务：systemctl list-unit-files --type=service --state=enabled。你可能会发现sendmail、cups、avahi-daemon这些桌面环境才需要的服务，在一个纯服务器的系统上完全是浪费内存。禁用掉：systemctl disable --now 服务名。

　　还有一个经典的内存小偷是MySQL或者MariaDB。如果你用的是默认配置，InnoDB的缓冲池大小可能被设得很大，比如innodb_buffer_pool_size = 128M甚至更高，对于1GB内存的机器来说太高了。登录MySQL，运行SHOW VARIABLES LIKE 'innodb_buffer_pool_size';，看看单位是多少字节。一般建议这个值设为物理内存的50%到70%，但前提是你的服务器主要跑数据库。如果同时还跑Web服务，缓冲池大小控制在总内存的30%左右更安全。修改MySQL配置文件/etc/my.cnf或/etc/mysql/my.cnf，在[mysqld]段加入或修改innodb_buffer_pool_size = 256M(根据实际调整)，然后重启MySQL。

　　PHP-FPM也是内存大户。每个PHP子进程会占用一定内存，如果你的pm.max_children设得太高，进程数一多，内存瞬间就没了。检查/etc/php-fpm.d/www.conf或者/etc/php/版本/fpm/pool.d/www.conf，找到pm.max_children。对于1GB内存的机器，这个值建议设在5到10之间。同时使用ondemand进程管理方式，而不是static，可以在低负载时释放内存。

　　优化策略三：启用并使用ZRAM或压缩内存

　　这是一个比较进阶但效果很不错的优化。ZRAM是在内存里划出一块区域，以压缩的形式存储数据。本质上它还是用的物理内存，但因为压缩了，实际能存的数据量比物理内存大。比如你用256MB的物理内存做成ZRAM，压缩比一般能达到2:1到3:1，相当于多出了几百MB的“伪内存”。而且ZRAM的读写速度远快于磁盘SWAP，因为它根本不出内存。

　　在香港云主机上启用ZRAM的简单方法：先安装zram-config(Ubuntu/Debian)，或者手动加载模块并配置。创建一个脚本或者直接用systemd服务。核心命令：

modprobe zram
echo lz4 > /sys/block/zram0/comp_algorithm
echo 512M > /sys/block/zram0/disksize
mkswap /dev/zram0
swapon /dev/zram0 -p 100

　　上面这段代码创建了一个512MB的ZRAM设备，用lz4压缩算法，然后把它当作swap分区来用，并且优先级设为100(比普通磁盘swap高)。这样系统会优先使用ZRAM作为交换空间，只有ZRAM写满了才会用到磁盘SWAP。这个方法在我自己的1GB内存香港VPS上试过，高峰期内存压力明显减小，SWAP导致的卡顿基本消失。

　　优化策略四：给关键进程设置内存上限

　　如果你的服务器上跑了某个不太稳定的程序，比如一个爬虫脚本或者Node.js应用，它可能会无节制地吃掉所有可用内存。这时候可以用cgroup或者systemd的资源限制功能来给它戴上“紧箍咒”。

　　用systemd启动的服务，可以在service文件里加上MemoryMax限制。比如MemoryMax=256M，然后systemctl daemon-reload重启服务。对于自己写的脚本，可以用systemd-run临时启动：systemd-run --user --scope -p MemoryMax=256M python my_script.py。更简单粗暴的方式是用ulimit -v限制进程能使用的虚拟内存量，但这个方法在现代Linux发行版上效果不如cgroup稳定。

　　Docker容器是另一个常见的内存消耗来源。启动容器的时候加上-m 512m --memory-swap 512m，强制容器最多只能用512MB内存和512MB swap，超出就会触发OOM Killer。如果你用的是一键脚本搭的LNMP Docker版本，检查一下docker-compose.yml里有没有mem_limit配置。

　　优化策略五：升级物理内存或者使用swap文件代替分区

　　说实话，以上所有策略都是“治标不治本”的权宜之计。如果你的香港云主机的业务确实需要更多内存，最直接的办法就是升级套餐。香港云主机的内存升级价格不算便宜，但比起你花大量时间折腾优化，有时候多花几十块钱一个月反而更省心。

　　如果你暂时不能升级，但磁盘空间还有富余，可以考虑用swap文件代替原来的swap分区。swap文件的性能基本一样，但胜在可以动态调整大小。创建步骤：

fallocate -l 2G /swapfile
chmod 600 /swapfile
mkswap /swapfile
swapon /swapfile

　　然后/etc/fstab里加上/swapfile none swap sw 0 0。注意swap文件不要太大，2GB对于1GB内存的机器来说已经足够，太大的swap会让系统在内存耗尽时卡死而不是崩溃，反而不好。

　　优化策略六：定期监控和预警

　　解决了当前的内存问题之后，为了避免未来再次陷入频繁SWAP的困境，你需要一套监控预警机制。最简单的方案是写一个脚本，定时检查内存使用情况和swap使用量，超过阈值就发邮件或者调用webhook通知你。下面是一个基础版的监控脚本示例：

#!/bin/bash
SWAP_USED=$(free | grep Swap | awk '{print $3}')
SWAP_TOTAL=$(free | grep Swap | awk '{print $2}')
if [ $SWAP_TOTAL -gt 0 ]; then
    SWAP_PERCENT=$((SWAP_USED * 100 / SWAP_TOTAL))
    if [ $SWAP_PERCENT -gt 50 ]; then
        echo "Warning: Swap usage is above 50%" | mail -s "Server Swap Alert" your-email@example.com
    fi
fi

　　把这个脚本放进crontab里，每小时跑一次。更专业的方案是在服务器上部署node_exporter+Prometheus+Grafana，但这套组合对于轻量云主机来说有点重了。轻量级监控推荐Netdata，它装起来简单，一个命令就搞定，Web界面里内存和swap的使用趋势一目了然。

　　优化策略七：调整应用程序的内存使用模式

　　最后一条，也是最根本的一条——审视你的应用程序代码或者配置，看看有没有内存泄露或者不合理的内存使用。比如Python程序里有没有忘记关闭的数据库连接、大列表有没有及时释放、有没有用生成器代替列表推导式。PHP程序有没有启用opcache来减少重复编译带来的内存碎片。Node.js应用有没有设置最大内存限制(--max-old-space-size)。Redis有没有设置maxmemory和淘汰策略。每个应用的优化都能从源头上减少内存需求，比事后增加swap要有效得多。

　　总结一下，香港云主机出现频繁SWAP交换，本质上是内存容量和应用程序需求之间的矛盾。排查的时候先用free、vmstat、top定位问题，确认是swap导致卡顿还是别的瓶颈。优化的时候，先调整swappiness降低系统的交换倾向，清理不必要的服务和应用，配置ZRAM把交换压力转移到压缩内存上，给关键进程设置内存上限，最后实在不行就升级配置。同时别忘了建立监控，避免问题复发时措手不及。内存优化是一个持续的过程，没有一劳永逸的方案，但你每做一步，服务器的稳定性和响应速度都会实实在在地提升。