Aumento no desempenho do AWS Elastic Serverless

O Elastic Cloud Serverless já é a solução definitiva para desenvolvedores que querem criar aplicações eficientes de busca e IA sem o ônus operacional de gerenciar a infraestrutura. Agora, estamos levando o desempenho dos seus projetos sem servidor a um novo patamar.

Concluímos um grande upgrade na infraestrutura de todos os projetos Elastic Cloud Serverless executados na AWS, migrando para hardware mais novo e mais rápido. Essa mudança foi implementada automaticamente em todos os projetos sem servidor. Ele oferece maior taxa de transferência e menor latência em projetos sem servidor com Elasticsearch, Elastic Observability e Elastic Security na AWS.

Principais benefícios de desempenho para desenvolvedores

A nova infraestrutura de hardware da AWS sustenta tudo o que você faz com o Elastic Cloud Serverless, traduzindo-se em benefícios tangíveis para a velocidade e a capacidade de resposta das suas aplicações.

Latência reduzida nas consultas… aumento no rendimento

O hardware aprimorado aumenta drasticamente a velocidade dos recursos de computação, o que significa que suas consultas de busca são processadas mais rápido do que nunca.

Busca e busca vetorial: seja executando consultas de texto completo tradicionais ou usando a busca vetorial de ponta para suas aplicações de IA generativa e retrieval-augmented generation (RAG), você verá uma redução significativa na latência. O benchmarking interno mostrou uma redução média de 35% na latência de busca.
Indexação mais rápida: as taxas de ingestão de dados são otimizadas, permitindo que você indexe volumes massivos de dados e documentos complexos com maior taxa de throughput. Isso é crucial para aplicações que exigem visibilidade de dados em quase tempo real. Benchmarking interno mostrou um aumento médio de 26% na taxa de throughput de indexação.

Desempenho consistente sob carga

O Elastic Cloud Serverless foi projetado para escalar automaticamente de forma dinâmica em tempo real para atender à demanda, minimizando a latência, independentemente da sua carga de trabalho. Com esse upgrade no hardware, esse redimensionamento agora é mais eficiente e responsivo.

Lidando com picos com facilidade: seja enfrentando um aumento repentino no tráfego de usuários ou uma ingestão massiva de dados em lote, a nova infraestrutura garante que seus recursos de busca e indexação sejam redimensionados de forma mais eficiente para manter uma latência consistentemente baixa.
Desacoplamento otimizado de computação e armazenamento: a arquitetura sem servidor separa computação e armazenamento, permitindo que cargas de trabalho sejam redimensionadas de forma independente para desempenho ideal e eficiência de custos. O hardware mais rápido aprimora a camada de computação, maximizando a eficiência desse design desacoplado.

Por trás do capô: resultados internos de benchmarking

Para quantificar o impacto do nosso upgrade de infraestrutura da AWS, a equipe de engenharia da Elastic realizou um benchmarking interno abrangente em relação a uma variedade de cargas de trabalho sem servidor. Essas cargas de trabalho forneceram evidências empíricas de melhorias no desempenho que você pode esperar em todas as suas aplicações, independentemente do seu caso de uso.

A abordagem de benchmarking

Concentramos nossos testes nas principais métricas que afetam diretamente a experiência do desenvolvedor e a capacidade de resposta da aplicação: tempo de resposta (ou seja, latência) e taxa de transferência em operações de busca e indexação.

Cargas de trabalho testadas: os testes incluíram operações de busca de alta concorrência típicas de aplicações voltados para o usuário, consultas de busca vetorial complexas e ingestão/indexação de dados de alto volume para casos de uso de observabilidade e segurança. Em particular, nossa metodologia de teste usou publicamente conjuntos de dados disponíveis para o Rally, a ferramenta de benchmarking da Elastic.
- wikipedia: Um conjunto de dados derivado de um snapshot do conteúdo textual da Wikipédia, para medir o desempenho em busca de texto de uso geral.
- MSMARCO-Passage-Ranking: Um conjunto de dados derivado do Machine Reading Comprehension (MS MARCO) da Microsoft, para medir o desempenho da busca em campos vetoriais esparsos.
- OpenAI_Vector: Um conjunto de dados derivado do NQ do BEIR e enriquecido com embeddings gerados pelo modelo text-embedding-ada-002 da OpenAI, para medir o desempenho da busca em campos vetoriais densos.
Medição: comparamos o desempenho na infraestrutura antiga e na nova, medindo a latência no 99º percentil (P99) para capturar o pior caso, o desempenho da latência de cauda e as operações por segundo. Cada pista era executada cinco vezes em cada perfil de hardware para garantir consistência nos resultados.
A meta: nosso objetivo era validar a capacidade da infraestrutura de fornecer um desempenho consistentemente mais rápido e previsível em todos os aspectos, mesmo durante períodos de rápida expansão automática.

Resumo de dados de desempenho

Os resultados confirmam ganhos significativos em eficiência e velocidade. Essas melhorias se traduzem diretamente em tempos de resposta mais baixos para os seus usuários e custos operacionais mais baixos, como resultado da capacidade de concluir a mesma quantidade de trabalho com menos recursos computacionais.

As tabelas a seguir detalham as melhorias quantitativas. Valores mais altos são melhores para a throughput; valores mais baixos são melhores para a latência.

Procurando resultados de benchmarks:

Benchmark	Comparação	Infraestrutura antiga	Nova infraestrutura	Diferencial
`wikipedia` (texto simples)	Throughput da operação de buscar (ops/s)	729	1.107	+52%
`wikipedia` (texto simples)	Latência da operação de busca (p99, ms)	56	35	-37%
`MSMARCO-Passage-Ranking` (vetores esparsos)	Throughput da operação de buscar (ops/s)	22	31	+40%
`MSMARCO-Passage-Ranking` (vetores esparsos)	Latência da operação de busca (p99, ms)	108	67	-38%
`OpenAI_Vector` (vetores densos)	Throughput da operação de buscar (ops/s)	475	624	+31%
`OpenAI_Vector` (vetores densos)	Latência da operação de busca (p99, ms)	35	22	-37%

Resultados de benchmarks de indexação:

Benchmark	Comparação	Infraestrutura antiga	Nova infraestrutura	Diferencial
`wikipedia` (texto simples)	Throughput da operação de buscar (ops/s)	2845	3.220	+13%
`wikipedia` (texto simples)	Latência da operação de busca (p99, ms)	1769	1.120	-37%
`MSMARCO-Passage-Ranking` (vetores esparsos)	Throughput da operação de buscar (ops/s)	7.087	8.900	+26%
`MSMARCO-Passage-Ranking` (vetores esparsos)	Latência da operação de busca (p99, ms)	824	677	-18%
`OpenAI_Vector` (vetores densos)	Throughput da operação de buscar (ops/s)	2972	3187	+7%
`OpenAI_Vector` (vetores densos)	Latência da operação de busca (p99, ms)	2.946	2.944	0%

O bônus adicional: redução de custos

Embora nosso foco seja entregar desempenho de baixa latência, a eficiência do novo hardware também tem um impacto direto e positivo nos custos dos projetos Elasticsearch.

O preço do Elasticsearch Serverless é baseado no uso, o que significa que você paga apenas pelos recursos de ingestão e buscas que você consumir. Como o hardware mais novo e mais rápido é mais eficiente, suas cargas de trabalho geralmente concluem tarefas usando menos recursos, levando a uma redução de custo inerente à maioria dos projetos. Você recebe um aumento de desempenho premium sem o preço premium — a definição de eficiência otimizada.

O que isso significa para você, o desenvolvedor?

Esse upgrade na infraestrutura é totalmente gerenciado pela Elastic, então você não precisa mexer um dedo — sem migrações e sem mudanças de configuração. A melhoria é imediata e automática em todos os seus projetos sem servidor baseados na AWS.

Esse upgrade permite que você:

Construa aplicações mais rápidas: foque a agilidade no desenvolvimento de recursos, sabendo que sua plataforma de busca está entregando a velocidade que seus usuários exigem.
Inove com confiança: implante novos recursos de busca, observabilidade e segurança, incluindo recursos complexos de IA, como busca vetorial e classificação por relevância, com a garantia de que a plataforma possa lidar com a carga em desempenho máximo.
Simplifique sua pilha: use um serviço totalmente gerenciado que lide com o gerenciamento da infraestrutura, o planejamento da capacidade e o redimensionamento, para que você possa se concentrar no código e nos dados.

Quão útil foi este conteúdo?

Não útil

Um pouco útil

Muito útil

Reportar um problema

Conteúdo relacionado

Uma consulta, vários ilimitados do Elasticsearch Serverless: apresentamos a busca entre projetos

Elastic Cloud Serverless

18 de maio de 2026

Uma consulta, vários ilimitados do Elasticsearch Serverless: apresentamos a busca entre projetos

A busca entre projetos no Elastic Cloud Serverless permite consultar dados em projetos isolados em uma única solicitação do Elasticsearch ou do ES|QL: sem duplicação, sem peering de rede e sem custos de saída ao copiar logs.

MP NH

Por: Michael Peterson e Najwa Harif

Busca por IA agêntica com proteções determinísticas no Elasticsearch para execução segura de consultas

Operações

18 de maio de 2026

Busca por IA agêntica com proteções determinísticas no Elasticsearch para execução segura de consultas

Sistemas de busca por IA agêntica falham quando LLMs geram consultas diretamente. Aprenda como as proteções determinísticas e uma arquitetura de plano de controle permitem a execução de consultas seguras, confiáveis e governadas com o Elasticsearch.

AM HK TR

Por: Alexander Marquardt, Honza Král e Taylor Roy

Personalizando a busca de e-commerce: integrando o histórico de compras e de grupos de usuários

Operações

11 de maio de 2026

Personalizando a busca de e-commerce: integrando o histórico de compras e de grupos de usuários

Aprenda a criar uma experiência personalizada de busca em e-commerce no Elasticsearch sem comprometer a governança. Este post explica como destacar produtos que um cliente já comprou antes e como ativar políticas específicas de grupo com base nos perfis dos usuários.

AM HK TR

Por: Alexander Marquardt, Honza Král e Taylor Roy

Percolador do Elasticsearch para governança de busca em comércio eletrônico: traduzindo consultas ambíguas em estratégias de recuperação controladas

Operações

4 de maio de 2026

Percolador do Elasticsearch para governança de busca em comércio eletrônico: traduzindo consultas ambíguas em estratégias de recuperação controladas

Aprenda como usar o percolador do Elasticsearch para implementar a governança de busca. Neste blog, delineamos os padrões necessários para criar um motor de políticas governado em produção e criar uma estratégia de recuperação controlada.

AM HK TR

Por: Alexander Marquardt, Honza Král e Taylor Roy

Construindo um plano de controle para gerenciar a busca de comércio eletrônico

Operações

1 de maio de 2026

Construindo um plano de controle para gerenciar a busca de comércio eletrônico

Como criar um plano de controle com governança para e-commerce que integra políticas de busca conflitantes em um único plano de execução (sem alterações de código).

AM HK TR

Por: Alexander Marquardt, Honza Král e Taylor Roy

Maior taxa de transferência e menor latência: o Elastic Cloud Serverless na AWS recebe um aumento significativo de desempenho

Principais benefícios de desempenho para desenvolvedores

Latência reduzida nas consultas… aumento no rendimento

Desempenho consistente sob carga

Por trás do capô: resultados internos de benchmarking

A abordagem de benchmarking

Resumo de dados de desempenho

O bônus adicional: redução de custos

O que isso significa para você, o desenvolvedor?

Quão útil foi este conteúdo?

Conteúdo relacionado

Uma consulta, vários ilimitados do Elasticsearch Serverless: apresentamos a busca entre projetos

Busca por IA agêntica com proteções determinísticas no Elasticsearch para execução segura de consultas

Personalizando a busca de e-commerce: integrando o histórico de compras e de grupos de usuários

Percolador do Elasticsearch para governança de busca em comércio eletrônico: traduzindo consultas ambíguas em estratégias de recuperação controladas

Construindo um plano de controle para gerenciar a busca de comércio eletrônico

Pronto para criar buscas de última geração?