目录 文章目录 目录前言NUMA 架构中的多线程性能开销1、跨 Node 的 Memory 访问开销2、跨 Core 的多线程 Cache 同步开销3、多线程上下文切换开销4、多线程模式切换开销5、中断处理的开销6、TLB 缓存失效的开销7、内存拷贝的开销 NUMA 架构中的性能优化:使用多核编程代替多线程NUMA 亲和性:避免 CPU 跨 NUMA 访问内存CPU 亲和性:避免跨 CPU 的 Kernel Thread 切换IRQ(中断请求)亲和性使用大页内存 前言 NOTE:本文中所指 “线程” 均为可执行调度单元 Kernel Thread。