logo
logo
DeepFlow 大模型智能体 3 分钟定位 Java 程序 Hang 故障
Java 程序 Hang 是应用运维中经常遇到的故障类型,由于此类故障与操作系统调度、应用代码逻辑等均有复杂的相互催化关系,故障触发条件极难确定,因此也是故障诊断中最难啃的骨头之一。在此篇案例中您将看到,某银行在分布式核心系统“认证网关 Hang” 故障的诊断过程中,如何使用 DeepFlow 大模型智能体快速分析 Java 程序 CPU 持续剖析数据,在故障发生后 3 分钟内迅速定位出 Hang 的原因。
DeepFlow 零侵扰数据能力构建 AIOps 的基石
用 AI 实现 Ops 来解决运维困境一直是 IT 界的梦想,大模型的出现让 AIOps 看起来近在咫尺,但深入分析历史我们会发现运维中的数据盲区、数据孤岛、数据关联、获取成本等问题是运维诊断难以模型化、AIOps 难以实现的根本原因。本篇文章总结了云杉网络 DeepFlow 解决方案负责人李飞在“智能可观测运维技术 MeetUp”的演讲内容,向您介绍 DeepFlow 可观测性平台如何通过 eBPF 技术带来的零侵扰、全栈采集能力消除数据盲区,通过 AutoTagging 技术带来的高性能数据统一标注能力消除数据孤岛,通过高质量的可观测性数据体系构建基于数据的运维能力,消灭运维中的猜测、直觉和灵感,打造 AIOps 落地应用的稳定基石,以及通过大模型智能体对 DeepFlow 可观测性数据分析取得的进展和效果。
AutoProfiling - 新增 Off-CPU 持续剖析并支持 AI 智能体分析
v6.5 新特性解读:企业版支持 Off-CPU 持续剖析,用于排查业务性能不达预期但 CPU 用量却不高的问题。另外,v6.5 中也增加了 Stella (DeepFlow 的 AI 智能体)对持续剖析数据的分析能力。