更高的吞吐量和更低的延迟:AWS 上的 Elastic Cloud Serverless 性能显著提升

我们已将适用于 Elasticsearch Serverless 的 AWS 基础设施升级为更新、更快的硬件。了解这一巨大的性能提升如何提供更快的查询、更好的扩展和更低的成本。

通过 Elastic Cloud Serverless 摆脱运营负担。自动扩展,处理负载峰值,专注于构建——开始 14 天免费试用

您可以按照这些指南打造 AI 驱动的搜索体验在业务系统和软件中进行搜索

Elastic Cloud Serverless 已成为那些希望构建高效搜索和 AI 应用程序而无需管理基础设施的开发人员的首选解决方案。现在,我们将无服务器项目的性能提升到了一个全新的水平。

我们已为在 AWS 上运行的所有 Elastic Cloud Serverless 项目完成了一次重大基础设施升级,迁移到了更新、更快的硬件上。此更改已自动推广至所有无服务器项目。它为 AWS 上的 Elasticsearch、Elastic Observability 和 Elastic Security 无服务器项目提供了更高的吞吐量和更低的延迟

为开发人员带来的关键性能优势

新的 AWS 硬件基础设施支撑着您使用 Elastic Cloud Serverless 所做的一切,为您的应用程序的速度和响应能力带来切实的好处。

降低查询延迟……提高吞吐量

改进后的硬件显著提升了计算资源的速度,这意味着您的搜索查询处理速度比以往任何时候都要快。

  • 搜索和向量搜索:无论您是运行传统的全文本查询,还是在生成式 AI 和 Retrieval-Augmented Generation (RAG) 应用中使用尖端的向量搜索,您都会发现延迟明显减少。内部基准测试显示,搜索延迟平均减少了 35%。
  • 索引速度更快:数据摄取速率得到优化,使您能够以更高的吞吐量为海量数据和复杂文档建立索引。这对于需要近实时数据可见性的应用程序至关重要。内部基准测试显示,索引吞吐量平均提高了 26%。

在负载下保持稳定性能

无论您的工作负载如何,Elastic Cloud Serverless 都能实时动态地自动扩展,以满足需求,最大限度地减少延迟。通过这次硬件升级,这种扩展性现在变得性能更强且响应更迅速。

  • 轻松应对流量高峰:无论您面临的是用户流量的突然激增,还是大规模批量数据的摄取,新的基础设施都能确保您的搜索和索引资源更高效地扩展,从而保持一致的低延迟。
  • 优化的计算存储解耦:无服务器架构将计算与存储分离,使工作负载能够独立扩展,从而实现最佳性能和成本效益。速度更快的硬件增强了计算层,最大限度地提高了这种解耦设计的效率。

幕后揭秘:内部基准测试结果

为了量化 AWS 基础设施升级的影响,Elastic 工程团队针对一系列无服务器工作负载进行了全面的内部基准测试。这些工作负载为性能改进提供了经验证据,无论您的用例如何,您都可以期望在应用程序中获得性能提升。

基准测试方法

我们将测试重点放在直接影响开发者体验和应用程序响应速度的关键指标上:响应时间(即延迟)和搜索与索引操作的吞吐量。

  • 测试的工作负载:测试包括面向用户的应用程序中典型的高并发搜索操作、复杂的向量搜索查询以及用于可观测性和安全用例的大量数据摄取/索引。特别是,我们的测试方法使用了 Elastic 基准测试工具 Rally 的公开可用的数据集
    • wikipedia:一个从维基百科文本内容的快照中提取的数据集,用于衡量通用文本搜索性能。
    • MSMARCO-Passage-Ranking:一个源自 Microsoft 机器阅读理解 (MS MARCO) 的数据集,用于衡量稀疏向量字段上的搜索性能。
    • OpenAI_Vector:一个源自 BEIR 的 NQ 并通过 OpenAI 的 text-embedding-ada-002 模型生成的嵌入进行丰富的数据集,用于衡量密集向量字段上的搜索性能。
  • 测量:我们比较了新旧基础设施的性能,测量了第 99 百分位数 (P99) 的延迟,以捕捉最坏情况下的尾部延迟性能和每秒操作数。为确保结果的一致性,每个硬件配置文件的每条测试路径都运行了五次。
  • 目标:我们的目标是验证基础设施即使在快速自动扩展期间也能持续提供更快、更可预测的全面性能的能力。

性能数据摘要

结果证实,效率和速度都有了明显提高。由于能够使用更少的计算资源完成相同的工作量,这些收益直接转化为更短的用户响应时间和更低的运营成本。

下表详细列出了数量上的改进。数值越大,吞吐量越高;数值越小,延迟越低。

搜索基准测试结果:

基准对比旧版基础设施新的基础设施差别
`wikipedia` (纯文本)搜索操作吞吐量 (ops/s)7291107+52%
`wikipedia` (纯文本)搜索操作延迟(p99,毫秒)5635-37%
`MSMARCO-Passage-Ranking`(稀疏向量)搜索操作吞吐量 (ops/s)22031+40%
`MSMARCO-Passage-Ranking`(稀疏向量)搜索操作延迟(p99,毫秒)10867-38%
`OpenAI_Vector`(密集向量)搜索操作吞吐量 (ops/s)475624+31%
`OpenAI_Vector`(密集向量)搜索操作延迟(p99,毫秒)35220-37%

索引基准测试结果:

基准对比旧版基础设施新的基础设施差别
`wikipedia` (纯文本)搜索操作吞吐量 (ops/s)2,8453220+13%
`wikipedia` (纯文本)搜索操作延迟(p99,毫秒)1,7691,120-37%
`MSMARCO-Passage-Ranking`(稀疏向量)搜索操作吞吐量 (ops/s)7,0878900+26%
`MSMARCO-Passage-Ranking`(稀疏向量)搜索操作延迟(p99,毫秒)824677-18%
`OpenAI_Vector`(密集向量)搜索操作吞吐量 (ops/s)2,9723,187+7%
`OpenAI_Vector`(密集向量)搜索操作延迟(p99,毫秒)2,9462,9440%

额外收获:成本降低

虽然我们的重点是提供低延迟性能,但新硬件的效率也对 Elasticsearch 项目的成本产生直接的积极影响。

Elasticsearch Serverless 的定价是基于使用量的,这意味着您只需为您所使用的摄取和搜索资源付费。由于更新、更快的硬件效率更高,您的工作负载通常能用更少的资源完成任务,从而降低大多数项目的固有成本。您无需支付高昂的价格,就能获得卓越的性能提升——这就是优化效率的定义。

这对您,开发者来说意味着什么?

此次基础设施升级完全由 Elastic 管理,因此您无需亲自操作——无需迁移,也无需更改配置。改进效果立竿见影,并自动应用于您所有基于 AWS 的无服务器项目。

此升级赋予您以下能力:

  • 构建更快的应用程序:专注于功能开发速度,确保您的底层搜索平台能够提供用户所需的速度。
  • 自信创新:部署新的搜索、可观测性和安全功能(包括向量搜索和相关性排序等复杂的 AI 功能),并确保平台能够以最高性能处理负载。
  • 简化堆栈:使用完全托管的服务来处理基础设施管理、容量规划和扩展,这样您就可以专注于代码和数据。

相关内容

准备好打造最先进的搜索体验了吗?

足够先进的搜索不是一个人的努力就能实现的。Elasticsearch 由数据科学家、ML 操作员、工程师以及更多和您一样对搜索充满热情的人提供支持。让我们联系起来,共同打造神奇的搜索体验,让您获得想要的结果。

亲自试用