Elasticsearch Serverless
Pague somente pelo que usar, sem complicações de infraestrutura. Descubra a arte do possível com pesquisa de IA, ferramentas prontas para RAG e recursos de análise de dados.
Detalhes dos preçosIngestão*
A partir de US$ 0,14
Por VCU/hora Busca*
A partir de US$ 0,09
Por VCU/hora Machine learning
A partir de US$0,07
Por VCU/hora Armazenamento e Retenção
A partir de US$ 0,047
Por GB retido por mês Egress
A partir de US$0.05 por GB
Por GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos
Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground e AI Assistant
US$ 4,50 por milhão de tokens de entradaUS$ 21 por milhão de tokens de saída Elastic Inference Service: ELSER em GPU
US$ 0,08
Por milhão de tokens |
|
| Ingestão*Por VCU-hora | A partir de US$ 0,14 |
| Search*Por VCU-hora | A partir de US$0,09 |
| Machine Learningpor VCU-hora | A partir de US$ 0,07 |
| Armazenamento e RetençãoPor GB retido por mês | A partir de US$ 0,047 |
| SaídaPor GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos |
A partir de $0,05
|
| Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground e AI Assistant |
US$ 4,50
por milhão de tokens de entrada
US$ 21
por milhão de tokens de saída
|
| Serviço de Inferência Elastic: ELSER em GPUpor milhão de tokens |
US$ 0,08
|
*Esses preços entram em vigor em 1º de dezembro de 2024. Visite nossa página de detalhes de preços na nuvem para obter mais informações sobre preços.
A medição de ingestão e retenção é baseada no volume de dados não compactados, normalizados e totalmente enriquecidos que você ingere no seu projeto serverless. Os volumes medidos serão muito maiores do que o tamanho dos dados "brutos" ou compactados "em trânsito."
Pacote de suporte
Suporte limitado está incluído na assinatura Standard; todos os outros preços de suporte são baseados na porcentagem do seu consumo. Para obter mais informações sobre o que está incluído em cada nível de suporte, acesse elastic.co/support.
| Nível de assinatura* do Elastic Cloud da organização | Padrão | Ouro | Platina | Empresarial |
|---|---|---|---|---|
| Suporte e faturamento total | ||||
| Nível de suporte | Limitado | Base | Aprimorado | Premium |
| % de cobrança | Incluso | 5% | 10% | 15% |
*O nível de assinatura é selecionado durante a inscrição
Componentes de precificação do Elasticsearch Serverless
O Elasticsearch Serverless cobra separadamente por computação (VCUs com 1 GB de RAM) e armazenamento (GB), oferecendo preços escaláveis e orientados ao desempenho para atender às suas metas de latência e taxa de transferência.
Unidade de Computação Virtual (VCU)
Há três tipos especializados de VCU disponíveis para executar tarefas específicas.
VCUs de ingestão: lidam com a indexação de dados no Search AI Lake.
Busca VCUs: lide com pesquisas orientadas pelo usuário, regras de alerta, agregações, transformações e consultas geoespaciais contra dados no Search AI Lake.
VCUs de machine learning: gerenciam a inferência, as cargas de trabalho do ELSER e os trabalhos de machine learning.
Uso de tokens
Uso de modelo de linguagem grande por milhão de tokens de entrada e saída gerenciado pela Elastic: aproveite a pesquisa com tecnologia de IA como um serviço sem implantar um modelo de linguagem grande (LLM) no seu projeto.
Uso do ELSER cobrado por milhão de tokens: aproveite o ELSER em GPU para casos de uso de busca semântica
Provisionamento adaptativo de recursos
Os recursos de ingestão e computação de ML são dimensionados automaticamente para atender às demandas de carga de trabalho.
Os recursos de computação Search se ajustam dinamicamente às cargas de trabalho, garantindo desempenho e capacidade de resposta consistentes. Com as configurações flexíveis do Search Power, você tem controle sobre as alocações de recursos para atender às suas necessidades de desempenho.
Armazenamento e retenção
O Elasticsearch Serverless usa armazenamentos de objetos para armazenamento persistente no Search AI Lake.
Todos os dados, independentemente do tipo, atualidade e frequência de uso, podem ser acessados no Search AI Lake. O tamanho do Search AI Lake pode ser controlado com políticas de retenção de dados manuais ou gerenciadas.
O armazenamento é medido em GB.
Configurações
Duas configurações de infraestrutura estão disponíveis para o Elasticsearch Serverless: de uso geral e vetorial (somente API).
A opção de uso geral é utilizada por padrão para todos os novos projetos e é adequada para a maioria dos casos de uso.
A opção vetorial aloca mais VCUs ao seu projeto para maior desempenho, mas também acarreta custos adicionais devido à maior alocação de VCU. Essa opção só é recomendada para projetos que usam mapeamentos de campo dense_vector com int4 ou int8, com alta dimensionalidade.
Perguntas frequentes
Os projetos serverless usam os principais componentes do Elastic Stack, como o Elasticsearch e o Kibana, e são baseados na arquitetura Search AI Lake da Elastic, que separa a computação do armazenamento. As operações de busca e indexação são separadas, o que oferece flexibilidade para redimensionar as cargas de trabalho e, ao mesmo tempo, garantir um alto nível de desempenho.
Aproveite os seguintes benefícios com o Elasticsearch Serverless:
- Gerenciamento gratuito. A Elastic gerencia o cluster Elastic subjacente, para que você possa se concentrar nos seus dados. Em projetos sem servidor, a Elastic é responsável por atualizações automáticas, backups de dados e continuidade dos negócios.
- Redimensionado automaticamente. Para atender aos seus requisitos de desempenho, o sistema se ajusta automaticamente às suas cargas de trabalho.
- Armazenamento de dados otimizado. Seus dados são armazenados no Search Lake do seu projeto, que serve como um armazenamento econômico e de alto desempenho. Uma camada de alto desempenho fica disponível no Search Lake para os dados mais consultados.
- Pague pelo desempenho que você precisa. Pague pelos recursos de ingestão, pesquisa e ML separadamente, conforme necessário para as cargas de trabalho que você executa.
O Elastic Cloud é uma plataforma poderosa que atende a muitas necessidades de computação. Projetos sem servidor são desenvolvidos especificamente para casos de uso, ao mesmo tempo em que oferecem uma experiência totalmente gerenciada e dimensionada automaticamente. Essa especialização e modelo operacional é o que diferencia o serverless hoje.
O Elasticsearch Serverless está atualmente disponível em regiões selecionadas de provedores de nuvem, com alguns recursos ainda a serem disponibilizados no futuro. Estamos totalmente comprometidos em expandir nossa oferta de serviços serverless para mais regiões e provedores de serviços de nuvem. Recomendamos que você consulte a documentação para verificar a compatibilidade técnica, como segurança, conformidade e disponibilidade.
É simples começar a usar o Elasticsearch Serverless:
- Crie projetos do Elasticsearch Serverless no Cloud Console.
- Escolha o tipo de projeto com otimização para caso de uso que melhor se adapta às suas necessidades.
- Comece com a experiência de projeto otimizada para o seu caso de uso.
Recomendamos enviar os dados diretamente do seu aplicativo ou usar clientes do Connector. Para enviar dados em uma instância existente do Elasticsearch, recomendamos usar o Logstash para migrar grandes volumes.
As configurações do Search Power permitem que você gerencie os recursos de computação para otimizar o desempenho da busca (taxa de transferência e latência) e gerenciar custos. Existem três configurações de Search Power para projetos Elasticsearch Serverless. A configuração Performant está ativada por padrão e oferece uma experiência de busca eficiente para dados de todos os tamanhos. É possível escolher qualquer uma das seguintes configurações:
Sob demanda: ajusta automaticamente com base em dados e carga de busca, com uma linha de base mínima reduzida para uso de recursos. Essa flexibilidade resulta em uma latência de consulta mais variável e em uma redução da taxa de transferência máxima.
Desempenho eficiente: oferece latência consistentemente baixa e fará redimensionamento automático para acomodar uma taxa de transferência de consultas moderadamente alta
Alta taxa de transferência: otimizado para cenários de alta taxa de transferência, com redimensionamento automático para manter a latência das consultas mesmo em volumes de consulta muito altos
No Elasticsearch Serverless, você paga pelos recursos usados para lidar com suas cargas de trabalho e necessidades de desempenho. Temos alguns exemplos para dar uma ideia sobre o que você poderia pagar e como pensar nos custos.
Exemplo 1 — ambiente de desenvolvimento com 2 GB de dados pesquisáveis, 1% de utilização de ingestão (15 minutos por dia), 8% de utilização de pesquisa (2 horas por dia)
- Sob demanda: US$ 24/mês
- Performant: R$ 27/mês
Exemplo 2 — ambiente de produção com 20 GB de dados pesquisáveis, 5% de utilização de ingestão (1 hora por dia), 33% de utilização de busca (8 horas por dia)
- Sob demanda: US$ 190/mês
- Performant: US$ 210 por mês
*As estimativas de preços fornecidas nos exemplos são apenas para fins ilustrativos. Os custos reais podem variar com base em fatores como tipo de dados, complexidade da consulta, padrões de tráfego, duração do uso e configurações específicas. Essas estimativas têm o objetivo de ajudar você a entender os cenários potenciais de preços, mas não devem ser consideradas como custo final. Para cálculos precisos de custos, recomendamos que você monitore seu uso.
O perfil de finalidade geral (General Purpose) oferece um ótimo desempenho pelo preço, especialmente para a maioria dos casos de uso de busca. É o perfil certo para busca de texto completo, busca semântica usando ELSER ou embeddings de vetores esparsos, vetores esparsos e vetores densos usando compactação, como BBQ (padrão em serverless). Recomendamos que você use a instância de finalidade geral para a maioria dos casos de uso de busca.
Recomendamos usar o perfil otimizado para vetor (Vector Optimized) somente para vetores densos não compactados quando você quiser um melhor desempenho. Embora o custo por VCU seja o mesmo para o perfil General Purpose e Vector Optimized, o perfil Vector Optimized fornece uma quantidade maior de RAM para dados pesquisáveis, o que leva a um consumo maior de VCUs e é mais caro, embora ofereça um desempenho significativamente melhor para dados vetoriais não compactados.
Descubra tudo o que você pode fazer com o Elastic Cloud Serverless



Avaliação gratuita
Comece com pelos simples, orientados por solução e baseados no uso.