如何理解内核态与用户态切换的上下文开销

一、什么是“用户态”和“内核态”

CPU 有不同的 特权级（Privilege Level）：

“上下文”就是 CPU 当前正在执行的任务的所有状态，包括：

上下文切换指的是 CPU 从一个执行上下文切换到另一个（比如进程 A → 进程 B）。

这两种是不同层次的“切换”：

类型	示例	是否涉及调度	开销大小	备注
用户态 → 内核态	系统调用、I/O、中断	否	小（几十到几百纳秒）	同一线程，只是 CPU 特权级变化
进程上下文切换	从进程 A → 进程 B	是	大（微秒级）	不仅换栈，还要换虚拟内存上下文

内核态切换的代价来自几个部分：

切换时 CPU 会：

这些过程虽然不是“线程切换”，但都需要 CPU 做额外操作。

在切换时，可能触发：

这会让下一次访问内存时性能下降。尤其是跨页表切换（进程切换）时，TLB 必须刷新。

现代 CPU 使用深流水线和乱序执行，切换到内核态后，这些指令流需要被中断、清空、重新加载，浪费了几十个周期。

在 Spectre/Meltdown 漏洞后，Linux 内核加了 KPTI（Kernel Page Table Isolation），在用户态和内核态之间切换时需要切换页表来隔离内核地址空间，进一步增加了 TLB flush 和页表切换开销。

大致数量级（不同架构差异很大）：

比如：

1
2
$ strace -c ls
# 可以看到每个系统调用耗时几十到几百纳秒

当用户调用：

1
read(fd, buf, size);

实际发生的事：

这整个过程涉及 多次用户态 ↔ 内核态切换 + 潜在调度切换。

性能优化中，常见的做法是减少切换频率：

技术	思路
批处理系统调用	一次调用处理多个请求（如 `readv`, `writev`）
零拷贝 I/O	减少数据在内核与用户空间之间的复制
IO_uring / eBPF / XDP	通过内核接口减少 syscalls 次数或在内核内直接处理
epoll / io_uring	异步 I/O，减少阻塞导致的频繁切换
用户态网络栈（DPDK）	完全绕过内核态，直接用户态驱动网卡