Google Vertex AI

A Vertex AI oferece uma suíte diversificada de modelos de IA generativa via várias APIs, permitindo a criação de aplicações inteligentes para uma ampla gama de casos de uso. Esses modelos, baseados na pesquisa avançada do Google, permitem gerar texto, traduzir idiomas, criar diferentes tipos de conteúdo criativo e responder suas perguntas de maneira informativa.

API Gemini

Modelos Google Gemini são projetados para aplicações multimodais. Modelos Gemini aceitam instruções que incluem, por exemplo, texto e imagens, e então retornam uma resposta em texto. Gemini também aceita chamada de função, permitindo que os desenvolvedores passem uma descrição de uma função e, em seguida, o modelo retorna uma função e os parâmetros que melhor correspondem à descrição. Desenvolvedores podem então chamar essa função em APIs e serviços externos.

Gemini 1.5 Pro: Este modelo avançado possui uma ampla janela de contexto, capaz de processar até 1 milhão de tokens, permitindo uma compreensão sutil de solicitações complexas e a geração de respostas abrangentes.

Gemini 1.0 Pro & Gemini 1.0 Pro Vision: Esses modelos são perfeitos para tarefas de linguagem natural, conversas de múltiplas interações e geração de código. Eles também oferecem a capacidade de incorporar imagens, PDFs e vídeos nas instruções, sendo versáteis para aplicações multimodais.

Gemini 1.0 Ultra & Gemini 1.0 Ultra Vision: Como os modelos multimodais mais avançados do Google, eles são otimizados para tarefas complexas que envolvem compreensão de instruções, geração de código e raciocínio. Eles cobrem vários idiomas e atualmente estão disponíveis para um grupo seleto de clientes.

Embeddings de texto

Incorporações de texto (textembedding-gecko) é o nome do modelo que aceita incorporações de texto. As incorporações de texto são uma técnica de PNL que converte dados textuais em vetores numéricos que podem ser processados por algoritmos de machine learning, principalmente modelos grandes. Essas representações vetoriais capturam o significado semântico e o contexto das palavras que representam.

Existem algumas versões disponíveis para embeddings. textembedding-gecko@003 é o modelo de embedding estável mais recente com qualidade de IA aprimorada, e textembedding-gecko-multilingual@001 é um modelo otimizado para uma ampla variedade de idiomas não ingleses.

Embeddings multimodais

O modelo de embeddings para multimodal (multimodalembedding) gera vetores de dimensão (128, 256, 512 ou 1408 dimensões) com base na entrada que você fornece. Essa entrada pode incluir qualquer combinação de texto, imagem ou vídeo. Os vetores de incorporação podem então ser usados para outras tarefas subsequentes, como classificação de imagens ou moderação de conteúdo.

Os vetores de incorporação de texto, imagem e vídeo estão no mesmo espaço semântico e têm a mesma dimensionalidade. Portanto, esses vetores podem ser usados de forma intercambiável em casos de uso como a busca de imagens por texto ou busca de vídeos por imagem.

Começar

Notebooks

Exemplo de aplicação de chatbot

Pronto para criar buscas de última geração?

Uma pesquisa suficientemente avançada não se consegue apenas com o esforço de uma só pessoa. O Elasticsearch é impulsionado por cientistas de dados, especialistas em operações de aprendizado de máquina, engenheiros e muitos outros que são tão apaixonados por buscas quanto você. Vamos nos conectar e trabalhar juntos para construir a experiência de busca mágica que lhe trará os resultados desejados.

Experimente você mesmo(a)