Elasticsearch Serverless
Pague somente pelo que usar, sem complicações de infraestrutura. Descubra a arte do possível com pesquisa de IA, ferramentas prontas para RAG e recursos de análise de dados.
Detalhes dos preçosIngestão*
A partir de US$ 0,14
Por VCU/hora Busca*
A partir de US$ 0,09
Por VCU/hora Machine learning
A partir de US$0,07
Por VCU/hora Armazenamento e Retenção
A partir de US$ 0,047
Por GB retido por mês Egress
A partir de US$0.05 por GB
Por GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos
Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground e AI Assistant
US$ 4,50 por milhão de tokens de entradaUS$ 21 por milhão de tokens de saída Elastic Inference Service
A partir de US$ 0,08
Por milhão de tokens O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho.
Fluxos de trabalho
10.000 execuções grátis; depois, por apenas US$ 0,0108
Por execução Agent Builder
1.000 execuções grátis; depois, por apenas US$ 0,025
Por execução |
|
| Ingestão*Por VCU-hora | A partir de US$ 0,14 |
| Search*Por VCU-hora | A partir de US$0,09 |
| Machine Learningpor VCU-hora | A partir de US$ 0,07 |
| Armazenamento e RetençãoPor GB retido por mês | A partir de US$ 0,047 |
| SaídaPor GB transferido por mês *Os perfis vetoriais recebem 50 GB gratuitos |
A partir de $0,05
|
| Modelo de linguagem grande (LLM) gerenciado pela Elastic para AI Playground, Agent Builder e AI Assistant |
US$ 4,50
por milhão de tokens de entrada
US$ 21
por milhão de tokens de saída
|
| Elastic Inference ServicePor milhão de tokens O Elastic Inference Service oferece suporte a um catálogo crescente de modelos. Veja os preços detalhados por modelo aqui e veja o que está disponível hoje, com mais modelos a caminho. |
A partir de US$ 0,08
|
| Fluxo de trabalhoPor execução |
10.000 execuções grátis, depois por apenas $0,0108
|
| Agent BuilderPor execução |
1.000 execuções grátis, depois por apenas US$ 0,025
|
*Esses preços entram em vigor em 1º de dezembro de 2024. Os preços dos fluxos de trabalho e do Agent Builder entram em vigor em 1º de maio de 2026. Visite nossa página de detalhes de preços na nuvem para obter mais informações sobre preços.
A medição de ingestão e retenção é baseada no volume de dados não compactados, normalizados e totalmente enriquecidos que você ingere no seu projeto serverless. Os volumes medidos serão muito maiores do que o tamanho dos dados "brutos" ou compactados "em trânsito."
Pacote de suporte
Suporte limitado está incluído na assinatura Standard; todos os outros preços de suporte são baseados na porcentagem do seu consumo. Para obter mais informações sobre o que está incluído em cada nível de suporte, acesse elastic.co/support.
| Nível de assinatura* do Elastic Cloud da organização | Padrão | Ouro | Platina | Empresarial |
|---|---|---|---|---|
| Suporte e faturamento total | ||||
| Nível de suporte | Limitado | Base | Aprimorado | Premium |
| % de cobrança | Incluso | 5% | 10% | 15% |
*O nível de assinatura é selecionado durante a inscrição
Componentes de precificação do Elasticsearch Serverless
O Elasticsearch Serverless cobra separadamente por computação (VCUs com 1 GB de RAM) e armazenamento (GB), oferecendo preços escaláveis e orientados ao desempenho para atender às suas metas de latência e taxa de transferência.
Unidade de Computação Virtual (VCU)
Existem três tipos especializados de VCU disponíveis para realizar tarefas específicas.
Ingestão VCUs: gerenciar a indexação de dados no Search AI Lake.
VCUs de buscar: Gerenciam buscas conduzidas pelo usuário, regras de alertas, agregação, transformações e consultas geoespaciais contra dados no Search AI Lake.
VCUs de Machine Learning: gerenciar inferência, cargas de trabalho ELSER e trabalhos de Machine Learning.
Uso de tokens
Utilização do Elastic Managed Large Language Model por milhão de tokens de entrada e saída: acesse recursos de IA prontos para uso sem precisar implantar nem operar um modelo de linguagem de grande porte (LLM).
Utilização dos modelos de IA da Jina cobrada por milhão de tokens: Use os modelos de IA da Jina em GPUs para busca semântica e casos de uso de reclassificação.
Provisionamento adaptativo de recursos
Os recursos de ingestão e computação de ML são dimensionados automaticamente para atender às demandas de carga de trabalho.
Os recursos de computação Search se ajustam dinamicamente às cargas de trabalho, garantindo desempenho e capacidade de resposta consistentes. Com as configurações flexíveis do Search Power, você tem controle sobre as alocações de recursos para atender às suas necessidades de desempenho. Uma base de recursos de busca está sempre provisionada para manter seus dados imediatamente consultáveis; períodos ociosos são cobrados a uma taxa reduzida.
Armazenamento e retenção
O Elasticsearch Serverless usa armazenamentos de objetos para armazenamento persistente no Search AI Lake.
Todos os dados, independentemente do tipo, atualidade e frequência de uso, podem ser acessados no Search AI Lake. O tamanho do Search AI Lake pode ser controlado com políticas de retenção de dados manuais ou gerenciadas.
O armazenamento é medido em GB.
Busque projetos sem mover seus dados
Independentemente de seus dados estarem separados por locatário, unidade de negócios ou região geográfica, você pode consultar instantaneamente projetos do Elastic Cloud Serverless como se fossem um só.
A utilização de VCUs (Unidades de Controle de Voz) para pesquisa pode aumentar neste projeto para suportar consultas federadas. Durante a fase de pré-visualização técnica, a transferência de dados CPS entre projetos não será cobrada.
Pesquisa e automação inteligentes
Crie e interaja com agentes de IA que entendem seus dados para melhorar a precisão e o desempenho e tomar medidas usando fluxos de trabalho.
A utilização do agente de IA é medida por meio de execuções do Agent Builder e execuções de fluxo de trabalho.
Perguntas frequentes
O que é o Elasticsearch Serverless?
O que é o Elasticsearch Serverless?
Projetos serverless utilizam os componentes de núcleo da Elastic Stack, como Elasticsearch e Kibana, e são baseados na arquitetura Search AI Lake da Elastic, que separa computação e armazenamento. As operações de busca e indexação são separadas, o que oferece flexibilidade para redimensionar suas cargas de trabalho enquanto garante um alto nível de desempenho.
Aproveite os seguintes benefícios com o Elasticsearch Serverless:
- Sem gestão. A Elastic gerencia o cluster subjacente da Elastic, então você pode focar seus dados. Em projetos serverless, a Elastic é responsável por atualizações automáticas, backups de dados e continuidade do negócio.
- Autoescalável. Para atender aos seus requisitos de desempenho, o sistema se ajusta automaticamente às suas cargas de trabalho.
- Armazenamento de dados otimizado. Seus dados são armazenados no Search Lake do seu projeto, que serve como um armazenamento econômico e eficiente. Uma camada de alto desempenho está disponível sobre o Search Lake para os dados mais consultados.
- Pague pelo desempenho que você precisa. Pague pelos recursos de ingestão, busca e ML separadamente conforme necessário pelas cargas de trabalho que você executa.
Qual é a diferença entre o Elastic Cloud Serverless e o Elastic Cloud Hosted?
Qual é a diferença entre o Elastic Cloud Serverless e o Elastic Cloud Hosted?
O Elastic Cloud é uma plataforma poderosa que atende a muitas necessidades de computação. Projetos serverless são criados especificamente para casos de uso, ao mesmo tempo em que oferecem uma experiência totalmente gerenciada com redimensionamento automático. Essa especialização e esse modelo operacional são o que diferencia o serverless hoje.
Como devo decidir se devo escolher o Elasticsearch Serverless ou o Elastic Stack Hosted?
Como devo decidir se devo escolher o Elasticsearch Serverless ou o Elastic Stack Hosted?
O Elasticsearch Serverless está atualmente disponível em regiões selecionadas de provedores de serviços de nuvem, com alguns recursos ainda a serem disponibilizados no futuro. Estamos totalmente comprometidos em expandir nossos serviços serverless para mais regiões e provedores de serviços de nuvem. Recomendamos que você consulte a documentação para conferir a compatibilidade técnica, como segurança, conformidade e disponibilidade.
Como posso começar a usar o Elasticsearch Serverless?
Como posso começar a usar o Elasticsearch Serverless?
É fácil começar a usar o Elasticsearch Serverless:
- Crie projetos Elasticsearch Serverless no Console da Nuvem.
- Escolha o tipo de projeto otimizado para o seu caso de uso que melhor atenda às suas necessidades.
- Comece a aproveitar uma experiência de projeto otimizada para o seu caso de uso.
Posso migrar dados entre o Elasticsearch Serverless e o Elastic Cloud Hosted?
Posso migrar dados entre o Elasticsearch Serverless e o Elastic Cloud Hosted?
Recomendamos o envio de dados diretamente da sua aplicação ou usando clientes do Connector. Para o envio de dados em uma instância Elasticsearch existente, recomendamos o uso do Logstash para migrar grandes volumes.
Quais são as configurações do Search Power?
Quais são as configurações do Search Power?
As configurações do Search Power permitem gerenciar os recursos computacionais para otimizar o desempenho da busca (taxa de transferência e latência) e controlar os custos. Existem três configurações de Search Power para projetos Elasticsearch Serverless. A configuração Performant já vem ativada e proporciona uma experiência de busca eficiente para dados de todos os tamanhos. É possível escolher uma das seguintes configurações:
Sob demanda: dimensionamento automático com base na carga de dados e de busca, com uma linha de base mínima mais baixa para o uso de recursos. Essa flexibilidade resulta em latência de consulta mais variável e taxa de transferência máxima reduzida.
Performant: oferece latência consistentemente baixa e dimensiona automaticamente para acomodar volumes de consultas moderadamente altos.
Alta disponibilidade: otimizado para cenários de alta disponibilidade, com escalonamento automático para manter a latência das consultas mesmo em volumes muito altos de consultas.
Quanto vou pagar*?
Quanto vou pagar*?
No Elasticsearch Serverless, você paga pelos recursos usados para lidar com suas cargas de trabalho e necessidades de desempenho. Temos alguns exemplos para dar uma ideia do que você pode pagar e de como pensar nos custos.
Exemplo 1 - ambiente de desenvolvimento com 2 GB de dados buscáveis, 1% de utilização de ingestão (15 minutos por dia), 8% de utilização de busca (2 horas por dia)
- Sob demanda: US$ 24/mês
- Desempenho: US$ 27/mês
Exemplo 2 - ambiente de produção com 20 GB de dados buscáveis, 5% de utilização de ingestão (1 hora por dia), 33% de utilização de busca (8 horas por dia)
- Sob demanda: US$ 190/mês
- Desempenho: US$ 210/mês
*As estimativas de preços fornecidas nos exemplos são apenas para fins ilustrativos. Os custos reais podem variar com base em fatores como tipo de dado, complexidade de consulta, padrões de tráfego, duração de uso e configurações específicas. Essas estimativas têm como objetivo ajudar você a entender possíveis cenários de preços, mas não devem ser usadas como custo final. Para cálculos precisos de custos, recomendamos monitorar seu uso.
Por que sou cobrado por VCUs do Search mesmo quando não estou rodando consultas?
Por que sou cobrado por VCUs do Search mesmo quando não estou rodando consultas?
O Elasticsearch Serverless mantém uma linha de base dos recursos de busca provisionados para seu projeto, para que seus dados permaneçam pesquisáveis sem atrasos desnecessários na primeira consulta após um período ocioso. Durante a busca ativa, você é cobrado pelos recursos completos utilizados; durante períodos ociosos, a cobrança cai para uma taxa reduzida, vinculada ao tamanho do seu conjunto de dados pronto para busca e à sua configuração do Search Power.
Para reduzir custos ociosos, você pode mudar o Search Power de Desempenho (padrão) para Sob demanda, o que reduz a linha de base ao custo de mais latência variável de consulta. As VCUs de ingestão, por outro lado, escalam totalmente para zero quando não há atividade de ingestão ocorrendo.
Como o Elastic Inference Service é cobrado?
Como o Elastic Inference Service é cobrado?
A utilização é cobrada estritamente com base no volume de dados processados, medido em milhões de tokens. Este modelo baseado no uso permite que você redimensione os custos linearmente com sua capacidade de processamento, garantindo que você pague apenas pelos tokens efetivamente processados, e não por infraestrutura ou capacidade ociosa.
Como é feita a cobrança do Agent Builder?
Como é feita a cobrança do Agent Builder?
O Agent Builder é cobrado com base nas execuções do Agent Builder. Uma execução é medida por cada interação concluída com um agente de IA (por exemplo, uma entrada e saída de chat). Interações mais complexas, medidas pelo número de tokens de entrada usados, serão contabilizadas como execuções adicionais (cada unidade de 50.000 tokens de entrada conta como uma execução adicional).
Exemplo 1: mensagem enviada ao agente de IA e o agente retorna uma resposta com sucesso. A interação usa 42.000 tokens de entrada, então isso equivale a 1 execução do agente.
Exemplo 2: mensagem enviada ao agente de IA e o agente retorna uma resposta com sucesso. A interação usa 325.000 tokens de entrada, então isso equivale a 7 execuções.
Exemplo 3: mensagem enviada ao agente de IA e o agente encontra um erro e não retorna uma resposta. Nenhuma execução é contabilizada.
Descubra tudo o que você pode fazer com o Elastic Cloud Serverless



Avaliação gratuita
Comece com pelos simples, orientados por solução e baseados no uso.