Maior taxa de transferência e menor latência: o Elastic Cloud Serverless na AWS recebe um aumento significativo de desempenho

Fizemos um upgrade na infraestrutura da AWS para o Elasticsearch Serverless para hardware mais novo e rápido. Saiba como esse enorme aumento no desempenho gera consultas mais rápidas, melhor redimensionamento e custos mais baixos.

Livre-se das operações com o Elastic Cloud Serverless. Redimensione automaticamente, lide com picos de carga e concentre-se na construção — comece uma avaliação gratuita de 14 dias para testá-lo você mesmo!

Você pode seguir estes guias para criar uma experiência de busca com IA ou buscar em sistemas e softwares empresariais.

O Elastic Cloud Serverless já é a solução definitiva para desenvolvedores que querem criar aplicações eficientes de busca e IA sem o ônus operacional de gerenciar a infraestrutura. Agora, estamos levando o desempenho dos seus projetos sem servidor a um novo patamar.

Concluímos um grande upgrade na infraestrutura de todos os projetos Elastic Cloud Serverless executados na AWS, migrando para hardware mais novo e mais rápido. Essa mudança foi implementada automaticamente em todos os projetos sem servidor. Ele oferece maior taxa de transferência e menor latência em projetos sem servidor com Elasticsearch, Elastic Observability e Elastic Security na AWS.

Principais benefícios de desempenho para desenvolvedores

A nova infraestrutura de hardware da AWS sustenta tudo o que você faz com o Elastic Cloud Serverless, traduzindo-se em benefícios tangíveis para a velocidade e a capacidade de resposta das suas aplicações.

Latência reduzida nas consultas… aumento no rendimento

O hardware aprimorado aumenta drasticamente a velocidade dos recursos de computação, o que significa que suas consultas de busca são processadas mais rápido do que nunca.

  • Busca e busca vetorial: seja executando consultas de texto completo tradicionais ou usando a busca vetorial de ponta para suas aplicações de IA generativa e retrieval-augmented generation (RAG), você verá uma redução significativa na latência. O benchmarking interno mostrou uma redução média de 35% na latência de busca.
  • Indexação mais rápida: as taxas de ingestão de dados são otimizadas, permitindo que você indexe volumes massivos de dados e documentos complexos com maior taxa de throughput. Isso é crucial para aplicações que exigem visibilidade de dados em quase tempo real. Benchmarking interno mostrou um aumento médio de 26% na taxa de throughput de indexação.

Desempenho consistente sob carga

O Elastic Cloud Serverless foi projetado para escalar automaticamente de forma dinâmica em tempo real para atender à demanda, minimizando a latência, independentemente da sua carga de trabalho. Com esse upgrade no hardware, esse redimensionamento agora é mais eficiente e responsivo.

  • Lidando com picos com facilidade: seja enfrentando um aumento repentino no tráfego de usuários ou uma ingestão massiva de dados em lote, a nova infraestrutura garante que seus recursos de busca e indexação sejam redimensionados de forma mais eficiente para manter uma latência consistentemente baixa.
  • Desacoplamento otimizado de computação e armazenamento: a arquitetura sem servidor separa computação e armazenamento, permitindo que cargas de trabalho sejam redimensionadas de forma independente para desempenho ideal e eficiência de custos. O hardware mais rápido aprimora a camada de computação, maximizando a eficiência desse design desacoplado.

Por trás do capô: resultados internos de benchmarking

Para quantificar o impacto do nosso upgrade de infraestrutura da AWS, a equipe de engenharia da Elastic realizou um benchmarking interno abrangente em relação a uma variedade de cargas de trabalho sem servidor. Essas cargas de trabalho forneceram evidências empíricas de melhorias no desempenho que você pode esperar em todas as suas aplicações, independentemente do seu caso de uso.

A abordagem de benchmarking

Concentramos nossos testes nas principais métricas que afetam diretamente a experiência do desenvolvedor e a capacidade de resposta da aplicação: tempo de resposta (ou seja, latência) e taxa de transferência em operações de busca e indexação.

  • Cargas de trabalho testadas: os testes incluíram operações de busca de alta concorrência típicas de aplicações voltados para o usuário, consultas de busca vetorial complexas e ingestão/indexação de dados de alto volume para casos de uso de observabilidade e segurança. Em particular, nossa metodologia de teste usou publicamente conjuntos de dados disponíveis para o Rally, a ferramenta de benchmarking da Elastic.
    • wikipedia: Um conjunto de dados derivado de um snapshot do conteúdo textual da Wikipédia, para medir o desempenho em busca de texto de uso geral.
    • MSMARCO-Passage-Ranking: Um conjunto de dados derivado do Machine Reading Comprehension (MS MARCO) da Microsoft, para medir o desempenho da busca em campos vetoriais esparsos.
    • OpenAI_Vector: Um conjunto de dados derivado do NQ do BEIR e enriquecido com embeddings gerados pelo modelo text-embedding-ada-002 da OpenAI, para medir o desempenho da busca em campos vetoriais densos.
  • Medição: comparamos o desempenho na infraestrutura antiga e na nova, medindo a latência no 99º percentil (P99) para capturar o pior caso, o desempenho da latência de cauda e as operações por segundo. Cada pista era executada cinco vezes em cada perfil de hardware para garantir consistência nos resultados.
  • A meta: nosso objetivo era validar a capacidade da infraestrutura de fornecer um desempenho consistentemente mais rápido e previsível em todos os aspectos, mesmo durante períodos de rápida expansão automática.

Resumo de dados de desempenho

Os resultados confirmam ganhos significativos em eficiência e velocidade. Essas melhorias se traduzem diretamente em tempos de resposta mais baixos para os seus usuários e custos operacionais mais baixos, como resultado da capacidade de concluir a mesma quantidade de trabalho com menos recursos computacionais.

As tabelas a seguir detalham as melhorias quantitativas. Valores mais altos são melhores para a throughput; valores mais baixos são melhores para a latência.

Procurando resultados de benchmarks:

BenchmarkComparaçãoInfraestrutura antigaNova infraestruturaDiferencial
`wikipedia` (texto simples)Throughput da operação de buscar (ops/s)7291.107+52%
`wikipedia` (texto simples)Latência da operação de busca (p99, ms)5635-37%
`MSMARCO-Passage-Ranking` (vetores esparsos)Throughput da operação de buscar (ops/s)2231+40%
`MSMARCO-Passage-Ranking` (vetores esparsos)Latência da operação de busca (p99, ms)10867-38%
`OpenAI_Vector` (vetores densos)Throughput da operação de buscar (ops/s)475624+31%
`OpenAI_Vector` (vetores densos)Latência da operação de busca (p99, ms)3522-37%

Resultados de benchmarks de indexação:

BenchmarkComparaçãoInfraestrutura antigaNova infraestruturaDiferencial
`wikipedia` (texto simples)Throughput da operação de buscar (ops/s)28453.220+13%
`wikipedia` (texto simples)Latência da operação de busca (p99, ms)17691.120-37%
`MSMARCO-Passage-Ranking` (vetores esparsos)Throughput da operação de buscar (ops/s)7.0878.900+26%
`MSMARCO-Passage-Ranking` (vetores esparsos)Latência da operação de busca (p99, ms)824677-18%
`OpenAI_Vector` (vetores densos)Throughput da operação de buscar (ops/s)29723187+7%
`OpenAI_Vector` (vetores densos)Latência da operação de busca (p99, ms)2.9462.9440%

O bônus adicional: redução de custos

Embora nosso foco seja entregar desempenho de baixa latência, a eficiência do novo hardware também tem um impacto direto e positivo nos custos dos projetos Elasticsearch.

O preço do Elasticsearch Serverless é baseado no uso, o que significa que você paga apenas pelos recursos de ingestão e buscas que você consumir. Como o hardware mais novo e mais rápido é mais eficiente, suas cargas de trabalho geralmente concluem tarefas usando menos recursos, levando a uma redução de custo inerente à maioria dos projetos. Você recebe um aumento de desempenho premium sem o preço premium — a definição de eficiência otimizada.

O que isso significa para você, o desenvolvedor?

Esse upgrade na infraestrutura é totalmente gerenciado pela Elastic, então você não precisa mexer um dedo — sem migrações e sem mudanças de configuração. A melhoria é imediata e automática em todos os seus projetos sem servidor baseados na AWS.

Esse upgrade permite que você:

  • Construa aplicações mais rápidas: foque a agilidade no desenvolvimento de recursos, sabendo que sua plataforma de busca está entregando a velocidade que seus usuários exigem.
  • Inove com confiança: implante novos recursos de busca, observabilidade e segurança, incluindo recursos complexos de IA, como busca vetorial e classificação por relevância, com a garantia de que a plataforma possa lidar com a carga em desempenho máximo.
  • Simplifique sua pilha: use um serviço totalmente gerenciado que lide com o gerenciamento da infraestrutura, o planejamento da capacidade e o redimensionamento, para que você possa se concentrar no código e nos dados.

Conteúdo relacionado

Pronto para criar buscas de última geração?

Uma pesquisa suficientemente avançada não se consegue apenas com o esforço de uma só pessoa. O Elasticsearch é impulsionado por cientistas de dados, especialistas em operações de aprendizado de máquina, engenheiros e muitos outros que são tão apaixonados por buscas quanto você. Vamos nos conectar e trabalhar juntos para construir a experiência de busca mágica que lhe trará os resultados desejados.

Experimente você mesmo(a)