王洪磊

Linux 内核 RAS 原理剖析与实践案例

本篇介绍 Linux 内核 RAS, MCE, AER 等硬件故障检查原理。HUATUO 华佗项目依赖该检测机制实现了通用硬件故障监控。

继续阅读

避坑!AMD 服务器指令集引发的故障分析

本篇重点分析了 AMD 服务器因指令集问题导致的业务容器 CPU 掉底,业务指标抖动问题。涉及 HUATUO 火焰图,libstdc++ 库等

继续阅读

避坑!AMD 服务器诡异的耗时毛刺问题

本篇分析解决 AMD 服务器诡异的毛刺问题,涉及 HUATUO 关键指标,内核选核策略,CPU 架构,内核调度,调度域等核心技术。

继续阅读