HUATUO

这些年全面崩溃的互联网大厂系统故障,经验总结

本篇博客梳理了历年的全球IT基础设施故障案例,并尝试从中总结一系列经验,指导日常的生产实践。故障难以避免,重要的是如何快速的感知,止损,隔离,恢复。在稳定性保障体系中 HUATUO 能够发挥强大的价 …

继续阅读

2025 OC 操作系统生态大会,解锁 OS+ 多元行业落地场景实践方案

HUATUO 开源技术社区 将与腾讯、安谋科技、沐曦、绿盟、堡塔、达梦、嘉为等伙伴,分享一系列经过大规模实践检验的解决方案。这里有最真实的挑战、最实用的经验…

继续阅读

腾讯操作系统 OC 和滴滴 HUATUO (华佗) 项目深度集成

滴滴 HUATUO(华佗) 和腾讯操作系统 OC 深度集成,进一步提升 OC 操作系统在云原生环境下内核级深度观测的能力,为云上用户提升内核问题排查效率,保障业务持续性.

继续阅读

HUATUO(华佗)荣获《OSCAR 尖峰开源项目及开源社区》称号

HUATUO(华佗) 凭借其在技术创新、社区建设等方面的卓越表现,荣获中国信息通信研究院、中国通信标准化协会颁发的《OSCAR 尖峰开源项目及开源社区》 奖项 …

继续阅读

应用篇:如何使用 HUATUO 解决网卡硬件丢包

本文探讨了检测网卡硬件丢包遇到的问题,例如 ethtool 为什么不能应用于常态的硬件丢包检测,并最终给出了 HUATUO 网卡硬件丢包检测解决方案,并提供了一个实际生产环境故障案例 …

继续阅读

思考篇:关于双上联去堆叠网络架构的一点总结

本文探讨了双上联去堆叠网络架构的设计思路与生产环境中遇到的实际问题(如LACP协议状态与物理链路的监控难点),并引入 HUATUO 解决方案,以实现对物理链路可用性的有效观测 …

继续阅读

思考篇:如何构建一个稳健的系统

该文章介绍了在实际生产过程中,对设计稳健系统的一些思考,形成一些方法论。对基础软件,业务软件,集群软件都有适用性。希望HUATUO 能够为大家在设计稳健系统时提供一些帮助 …

继续阅读

应用篇:如何使用 HUATUO 解决应用程序卡住问题

该文章介绍了在实际生产环境中哪些因素可能导致进程“卡顿”,以及 HUATUO 如何观测这些卡顿行为,并附有实际指标看板。最后通过实际的一个案例说明如何定位到卡顿原因,和实际效果 …

继续阅读

应用篇:深入剖析网络收包延迟,从网卡到应用的精确追踪与优化

该文章主要介绍了 HUATUO 网络收方向延迟检测方案。论证了获取时间戳的位置,以及到用户态的接收延迟的检测。最后给出了在生产实践过程中具体问题案例 …

继续阅读

合作篇:打通操作系统可观测性最后一公里

即刻部署 HUATUO + 夜莺监控 工具组合,快速构建覆盖应用,中间件,数据库,操作系统内核的一体化可观测体系。HUATUO 开箱即用,从各维度全面观测内核,填补了操作系统可观测性领域的空白。

继续阅读