监测不同于可观测性的 3 个原因

red_and_teal_skylift.jpg

监测和可观测性经常被交替使用,但两者并不完全相同。监测是可观测性的重要组成部分,但可观测性远远超出了传统监测实践的范围。 

关键区别:监测从单个组件收集数据 — 时间和内容;可观测性提供分布式系统整体行为的见解 — 原因和方式

从混合云计算架构到无服务器技术和分布式环境,云计算领域正在以惊人的速度发展。因此,虽然监测对于较小的环境仍然有效(本质上数据和应用程序蔓延较少),但使用云原生技术的大型企业需要发展更先进的工具。这就是可观测性可以发挥作用的地方。(告别 FOMO,继续了解事实真相)。

什么是监测?

监测是收集、采集和分析应用程序、基础架构和/或云遥测数据以评估系统健康状况的过程。监测依赖于 CPU 或内存使用情况、网络流量、日志和跟踪等指标。这些数据使 IT 团队能够实时跟踪基础架构和应用程序的性能和可用性。监测工具和平台可提供仪表盘和警报,并具有报告功能,可帮助 IT 团队监测组件、识别预测问题并解决给定环境中出现的故障。 

然而,监测工具传统上是孤立的,因此并不总是适合现代云架构和更大的环境。

什么是“可观测性”?

可观测性是一套实践和工具,使 IT 用户能够通过其产生的遥测和运行数据来全面了解整个环境。在分布式系统中,可观察性使团队能够将数据(日志、指标、跟踪和分析等数据)相关联,从而提供统一的可视性。反过来,企业也能获得可操作的见解,从而提升服务性能和客户体验。可观测性工具提供可自定义的仪表盘、自动化功能、分析和警报,帮助团队更快、更有效地进行根本原因分析。  

换句话说,可观测性是一种不断发展的工具,可用于提高现代 IT 运营及其所管理服务的性能和弹性。毕竟,更好的弹性意味着更高的生产力 — 这对投资回报率有什么影响?

可观测性的演变

为了更好地理解现代可观测性及其价值,让我们来看看它与监测的三大不同之处。

1. 见解深度

检测异常和效率低下是一回事;理解它们又是另一回事。 

监测检测:监测依赖于预定义的指标集和日志来跟踪错误和使用模式,即已知的问题。根据这一标准,IT 团队只能发现他们已预料到的问题。简而言之,监测是一个必要的 IT 流程,可帮助团队确保一切正常运行。然而,虽然监测是不可或缺的检测工具,但监测本身并不能为检测到的异常情况提供背景信息。

可观测性理解:可观测性通过收集多种数据源,存储并对其进行统一处理,从而提供全面的可见性,以便进行映射和分析。这种深入的关联能力能让团队更好地了解其系统的整体情况。他们可以查看分析其系统的行为、性能和交互。改进的可视性和历史性能数据还允许在运营管理中采用更具探索性的方法来发现未知的未知因素。IT 团队获得的深入见解也使他们能够采取积极主动的措施来提高性能。

2. 灵活性和适应性

云计算和无服务器、容器化应用程序意味着更高的开发灵活性。因此,您的监测解决方案需要跟上步伐。

监测可能比较死板:由于监测依赖于由 IT 团队确定的数据集,因此它无法“查看”未为其编程的内容。换句话说,监测的范围有限:它可以跟踪已知问题,但单独使用时,无法满足通常依赖 Kubernetes 和微服务的动态云原生或混合环境的需求。

可观察性具有灵活性:可观测性具有跨云环境、本地软件和第三方应用程序映射交互的能力,因此它天生具有适应性和灵活性。这是一种专门为满足现代 IT 基础架构需求而设计的实践。通过自动化和 AIOps 功能,可观测性还可以随着生态系统的扩展而扩展,使团队能够更有效地扩展其基础架构。

3. 根本原因分析

无论采用何种工具和实践,技术生态系统中都会出现问题 — 有些事情不会改变。当这些问题出现时,IT 团队可以通过两种方式来应对: 

  • 修补问题——症状

  • 深入挖掘以解决问题 — 问题 

正确进行根本原因分析可确保更快的响应和恢复时间。

监测是被动的:监测警报根据配置通知团队实时发生的异常和问题。虽然监测会告诉 IT 专家“发生了什么”,但本质上并不能解释“为什么”。事实上,在分布式架构中,跨数据流实现可见性是一个常见的挑战。孤立的监测工具具有局限性:工程师需要额外的资源来手动执行根本原因分析,同时采取被动的系统管理方法。结果呢?检测、响应和解决时间变慢,这可能意味着严重的中断。

可观测性是主动的:可观测性通过历史数据提供更丰富的背景信息和对内部系统操作的可见性,有助于更深入地分析根本原因。通过关联不同的数据源并跟踪系统中的请求流或事件流,工程师可以全面了解其环境,从而更准确地找到问题的根本原因。这种分析可以在停机期间实时进行,也可以在停机后进行,以便主动了解问题所在。最终,更好的根本原因分析能力意味着更高效的整体运营。

当今对现代可观测性的需求

从孤立的日志监测工具转向统一的数据平台和可观测性,是对企业未来的投资,也是对企业开发人员、SRE 或 IT 运营专业人员的投资。从传统监测工具到现代可观测性的演变是当今云原生世界的必然要求。它还能帮助团队为未来的运营做好准备,并通过 AIOps 和 GAI 得到加强。现代可观测性使企业走上了一条提高效率、增强应用程序弹性和为业务提供卓越客户体验的道路。

本博文所描述的任何特性或功能的发布及上市时间均由 Elastic 自行决定。当前尚未发布的任何特性或功能可能无法按时提供或根本无法提供。