Blog

2025 国产服务器操作系统发展报告概要

本篇博客重点分析了中国智能计算产业联盟发布的《2025 国产服务器操作系统发展报告》,包括国产操作系统发展现状、发展趋势、面临问题、发展建议。通过硬件协同,资源管理,并行计算等支撑大规模计算, …

继续阅读

如何高效定位服务器概率性应用毛刺问题

本篇博客详细梳理了,近期公司某机房的一些机器出现偶发概率性的服务毛刺问题,并最终给出了解决方案,效果立竿见影。在整个定位过程中 HUATUO 发挥了关键作用,体现了其在故障定位中的强大价值。

继续阅读

这些年全面崩溃的互联网大厂系统故障,经验总结

本篇博客梳理了历年的全球IT基础设施故障案例,并尝试从中总结一系列经验,指导日常的生产实践。故障难以避免,重要的是如何快速的感知,止损,隔离,恢复。在稳定性保障体系中 HUATUO 能够发挥强大的价 …

继续阅读

2025 OC 操作系统生态大会,解锁 OS+ 多元行业落地场景实践方案

HUATUO 开源技术社区 将与腾讯、安谋科技、沐曦、绿盟、堡塔、达梦、嘉为等伙伴,分享一系列经过大规模实践检验的解决方案。这里有最真实的挑战、最实用的经验…

继续阅读

应用篇:如何使用 HUATUO 解决网卡硬件丢包

本文探讨了检测网卡硬件丢包遇到的问题,例如 ethtool 为什么不能应用于常态的硬件丢包检测,并最终给出了 HUATUO 网卡硬件丢包检测解决方案,并提供了一个实际生产环境故障案例 …

继续阅读

思考篇:关于双上联去堆叠网络架构的一点总结

本文探讨了双上联去堆叠网络架构的设计思路与生产环境中遇到的实际问题(如LACP协议状态与物理链路的监控难点),并引入 HUATUO 解决方案,以实现对物理链路可用性的有效观测 …

继续阅读

思考篇:如何构建一个稳健的系统

该文章介绍了在实际生产过程中,对设计稳健系统的一些思考,形成一些方法论。对基础软件,业务软件,集群软件都有适用性。希望HUATUO 能够为大家在设计稳健系统时提供一些帮助 …

继续阅读

应用篇:如何使用 HUATUO 解决应用程序卡住问题

该文章介绍了在实际生产环境中哪些因素可能导致进程“卡顿”,以及 HUATUO 如何观测这些卡顿行为,并附有实际指标看板。最后通过实际的一个案例说明如何定位到卡顿原因,和实际效果 …

继续阅读

应用篇:深入剖析网络收包延迟,从网卡到应用的精确追踪与优化

该文章主要介绍了 HUATUO 网络收方向延迟检测方案。论证了获取时间戳的位置,以及到用户态的接收延迟的检测。最后给出了在生产实践过程中具体问题案例 …

继续阅读

合作篇:打通操作系统可观测性最后一公里

即刻部署 HUATUO + 夜莺监控 工具组合,快速构建覆盖应用,中间件,数据库,操作系统内核的一体化可观测体系。HUATUO 开箱即用,从各维度全面观测内核,填补了操作系统可观测性领域的空白。

继续阅读