A Vertex AI oferece uma suíte diversificada de modelos de IA generativa via várias APIs, permitindo a criação de aplicações inteligentes para uma ampla gama de casos de uso. Esses modelos, baseados na pesquisa avançada do Google, permitem gerar texto, traduzir idiomas, criar diferentes tipos de conteúdo criativo e responder suas perguntas de maneira informativa.
API Gemini
Modelos Google Gemini são projetados para aplicações multimodais. Modelos Gemini aceitam instruções que incluem, por exemplo, texto e imagens, e então retornam uma resposta em texto. Gemini também aceita chamada de função, permitindo que os desenvolvedores passem uma descrição de uma função e, em seguida, o modelo retorna uma função e os parâmetros que melhor correspondem à descrição. Desenvolvedores podem então chamar essa função em APIs e serviços externos.
Gemini 1.5 Pro: Este modelo avançado possui uma ampla janela de contexto, capaz de processar até 1 milhão de tokens, permitindo uma compreensão sutil de solicitações complexas e a geração de respostas abrangentes.
Gemini 1.0 Pro & Gemini 1.0 Pro Vision: Esses modelos são perfeitos para tarefas de linguagem natural, conversas de múltiplas interações e geração de código. Eles também oferecem a capacidade de incorporar imagens, PDFs e vídeos nas instruções, sendo versáteis para aplicações multimodais.
Gemini 1.0 Ultra & Gemini 1.0 Ultra Vision: Como os modelos multimodais mais avançados do Google, eles são otimizados para tarefas complexas que envolvem compreensão de instruções, geração de código e raciocínio. Eles cobrem vários idiomas e atualmente estão disponíveis para um grupo seleto de clientes.
Embeddings de texto
Incorporações de texto (textembedding-gecko) é o nome do modelo que aceita incorporações de texto. As incorporações de texto são uma técnica de PNL que converte dados textuais em vetores numéricos que podem ser processados por algoritmos de machine learning, principalmente modelos grandes. Essas representações vetoriais capturam o significado semântico e o contexto das palavras que representam.
Existem algumas versões disponíveis para embeddings. textembedding-gecko@003 é o modelo de embedding estável mais recente com qualidade de IA aprimorada, e textembedding-gecko-multilingual@001 é um modelo otimizado para uma ampla variedade de idiomas não ingleses.
Embeddings multimodais
O modelo de embeddings para multimodal (multimodalembedding) gera vetores de dimensão (128, 256, 512 ou 1408 dimensões) com base na entrada que você fornece. Essa entrada pode incluir qualquer combinação de texto, imagem ou vídeo. Os vetores de incorporação podem então ser usados para outras tarefas subsequentes, como classificação de imagens ou moderação de conteúdo.
Os vetores de incorporação de texto, imagem e vídeo estão no mesmo espaço semântico e têm a mesma dimensionalidade. Portanto, esses vetores podem ser usados de forma intercambiável em casos de uso como a busca de imagens por texto ou busca de vídeos por imagem.
Começar
- Integração da Vertex AI com a API de inferência aberta do Elasticsearch para reclassificação
- Itere e crie aplicações RAG em minutos com o Gemini
- Melhore os seus dados no Elasticsearch com o Vertex AI
Notebooks
- Busca vetorial usando Gemini Embeddings e Elasticsearch
- Resposta a perguntas usando o Gemini, Langchain e Elasticsearch
- RAG com Gemma em dados privados