发布

Elastic 可观测性 7.11 版新增功能:APM 服务运行状况概述页面以及 ECS 日志库现已正式发布

我们非常高兴地宣布 Elastic 可观测性 7.11 版面世,推出多项新功能,针对所有可观测性用例加速调查性工作流并缩短平均洞察时间 (MTTI) 和平均问题解决时间 (MTTR)。Elastic APM 中的新服务概述页面将服务运行状况的关键方面聚合到一个视图中,让开发人员和可靠性工程师能够快速针对服务问题进行故障排除,并在尽可能减少上下文切换次数的情况下找到根本原因。同样地,Metrics 应用也添加了增强型视图,可在单一的便捷面板中呈现主机运行状况,从而简化基础架构监测工作流和故障排除工作流。最后,Elastic Common Schema (ECS) 日志库现已正式发布,该日志库可自动将跟踪上下文注入应用程序日志,从而实现日志与跟踪之间的关联。 

欢迎在 Elastic Cloud 上的 Elasticsearch Service 中体验 Elastic 可观测性最新版本(14 天免费试用)或安装 Elastic Stack 最新版本畅享自管型体验。 

闲言少叙,下面就介绍该版本的一些亮点。  

Elastic APM 中的新服务运行状况概述加快了根本原因分析和故障排除的速度 

现代云原生应用程序往往包含数十乃至数百个微服务。能够快速精准地掌握个别服务的状态,对于事件调查工作流至关重要,也有助于缩短 MTTI/MTTR。例如,服务映射也许能帮助您将应用程序问题锁定到特定服务,但是,随后您还需要找到该服务运行异常的原因。在 7.11 版本中,我们推出了全新服务概述页面,将服务运行状况的所有相关信息汇总在一个位置,让开发人员和 SRE 能够更方便地在一个页面上回答以下洞见分析问题: 

  • 新部署对性能有何影响? 
  • 对哪些事务的影响最大? 
  • 是否由下游服务或后端引入回归?
  • 性能如何与底层基础架构相关联?哪些实例(容器、VM)存在性能问题?

借助显示服务延迟、流量和错误率的时序图,可以大致了解服务 KPI 在一段时间内发生的变化。时序图上叠加的注释(部署标记、异常告警等)为可能导致行为改变的关键事件提供了丰富的上下文。这些注释有助于立即缩小调查范围,如此便可提供修复路径(例如,回滚)。  

服务概述页面上的迷你图 (sparkline) 提供了紧凑的视图,可查看各个子组件随时间的变化趋势,从而可以在调查期间很容易地发现行为中的异常变化(例如,当有关特定事务的错误率急剧上升时)并确定妥善的“后续步骤”。此外,服务概述页面还显示了按服务部署位置所在的底层基础架构实例(例如容器)划分的服务运行状况,从而可以很容易地将相关问题与底层基础架构的问题联系起来。 

7.11 版本引入了这个新服务运行状况视图第一阶段的内容,未来的版本将融合更多的上下文和视图,以进一步简化并加速故障排除工作流和根本原因分析工作流。 

借助增强的新主机详情视图,更快地针对基础架构问题进行故障排除 

借助 Metrics 应用中的资源热图,基础架构的状态便可一览无余,让您能够轻松快速地发现有问题的资源(例如,CPU 占用率飙升的主机)并通过精确地找到需要进一步检查的主机来缩小后续步骤的调查范围。我们在 Metrics 应用中推出了一个全新视图,您可以轻松地从这个概览视图缩小范围,了解个别主机关键指标的历史趋势。 

screenshots-infrastructure-quick-overview.png

就像 APM 中的新服务登陆页面能够呈现一目了然的趋势一样,通过在单一视图中合并您所需的所有主机相关信息(日志、指标、进程等),该增强型详情视图也有助于加快根本原因分析速度,让基础架构运维团队能够针对基础架构问题轻松进行监测和故障排除。 

单击热图中的磁贴,即可打开弹出式窗口,显示关于主机的关键信息,包括: 

  • 该主机关键指标(CPU、内存、网络等)随时间变化的图表 
  • 该主机或在该主机上运行的服务所产生的日志
  • 该主机上运行的主要进程(按占用的 CPU 或内存衡量)
  • 主机元数据(操作系统、云服务提供商详情)
  • 用于获得有关跟踪或运行时间数据的更详细信息的链接

7.11 版本首次推出这个针对主机或 VM 的增强型视图,未来的版本会将此功能扩展到 Metrics 应用中的其他资源类型(Pod、容器等)。 

请参阅 7.11 版新增功能文档,了解有关服务概述页面以及其他新 APM 功能的更多信息。

ECS 日志库利用应用程序日志与跟踪之间的链接增强应用程序可观测性

使应用程序日志与跟踪相互关联并在它们之间导航而不丢失上下文,这对于应用程序故障排除工作流至关重要。哪些日志属于某项特定跟踪,或者这些日志是由哪项跟踪所产生?哪项应用程序请求触发了这些日志?Elastic Common Schema (ECS) 日志库现已在 7.11 版本中正式发布;利用该日志库,应用程序开发人员能够轻松地将 APM 代理捕获的跟踪上下文自动注入它们的应用程序日志中,从而在日志与跟踪之间建立所需的关联来简化分析。 

animation-apm-ecs-logging.gif

ECS 日志库是您最常用的日志框架(例如 log4j)的插件,支持开发人员使用符合 ECS 规范的 JSON 格式轻松编写应用程序日志,而无需更改自己的原生工作流。ECS 记录器自动将 APM 代理捕获的相关跟踪上下文写入日志,帮助开发人员在无需进行额外工作的情况下创建可观测的应用程序。捕获的跟踪上下文通常包括 trace.idtransaction.idspan.id,视需要而定。  

以该数据级别的基本链接为基础,7.11 版本将嵌入式日志数据流直接引入跟踪视图,这就意味着在调查期间,用户不需要切换视觉上下文,便可直接查看与特定跟踪相关联的日志。 

除了日志与跟踪之间的这种关联之外,捕获 ECS 格式的日志还可以额外带来其他好处,其中包括自动解析、可人工读取的日志以及跨整个应用程序堆栈的标准化数据模型。 

请参阅 7.11 版新增功能,了解有关该增强功能以及其他增强功能的更多信息

其他显著亮点

页面加载瀑布图

在 7.10 版本中,我们推出了针对多步式用户旅程的综合监测功能。通过 7.11 版本,我们要发布页面加载瀑布图的第一个迭代,其可针对页面中的每个对象显示连接统计信息。利用加载时间瀑布视图,用户能够在综合测试期间,快速发现最终用户体验方面的性能瓶颈。 

screenshot-synthetics-waterfall-view.png

运行时字段是读时模式的基础

顾名思义,作为 Elastic 可观测性社区最常用的功能之一,运行时字段允许您通过从已编制索引的数据转换、充实或提取字段,在运行时动态创建新字段。这项基本功能支持新的可观测性工作流,其中包括始终最受欢迎的功能之一:读时模式。 

随着这项功能的推出,用户现在可以同时体验这两者的好处。通过在索引时对数据进行解析和结构化,充分利用写时模式并体验飞快的搜索和分析速度。或者,通过在运行时动态定义字段,充分利用读时模式,使分析工作流具有更大的灵活性。 

7.11 版本中的 Elasticsearch 支持运行时字段,Kibana 仅提供有限的 UI 支持。请阅读专门的帖子,了解有关我们的愿景的所有内容。

可搜索的快照以及 cold tier(冷层)现已正式发布

可搜索的快照现已正式发布,在 7.10 版本中作为公测版功能引入。借助可搜索的快照,允许能够在诸如 S3 之类的对象存储库中直接搜索和分析数据,让用户可以非常轻松地实现数据分层策略,从而在性能和成本之间取得平衡。新的 cold tier 功能由可搜索的快照提供支持,在对性能影响最小的情况下,最多可将存储成本降低 50%。 

可搜索的快照和数据层都是针对可观测性用例的具有革新意义的功能,在不增加运维复杂性、改变调查性工作流以及影响对数据的访问的前提下,为用户提供事半功倍的体验。 

即刻体验新版本!

请参阅版本亮点,更深入地全面了解这些新功能以及更多内容。

我们更建议您通过以下方式开始使用这些新功能:将部署升级到 7.11 版本,抓住机会体验 Elasticsearch Service 14 天免费试用,或者安装 Elastic Stack 的最新版本