Vertex AI 通过多种 API 提供多样化的生成式 AI 模型,使您能够为广泛的用例构建智能应用。这些模型由 Google 的先进研究提供支持,使您能够生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答您的问题。
Gemini API
Google Gemini 模型 专为多模态应用而设计。Gemini 模型接受包含例如文本和图像的提示,然后返回文本响应。Gemini 还支持函数调用,允许开发人员传递函数描述,然后模型会返回与描述最匹配的函数和参数。然后,开发人员可以在外部 API 和服务中调用该函数。
Gemini 1.5 Pro:这款先进模型具备超长上下文窗口,可处理多达 100 万词元的输入,能精准理解复杂指令的细微差别,并生成内容详实的回复。
Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision:这些模型非常适合自然语言任务、多轮对话和代码生成。它们还提供将图像、PDF 和视频嵌入提示的功能,适用于多模态应用的多样化场景。
Gemini 1.0 Ultra & Gemini 1.0 Ultra Vision:作为 Google 最强大的多模态模型,这些模型经过优化,可处理涉及指令理解、代码生成和推理的复杂任务。它们支持多种语言,目前仅对部分客户开放。
文本嵌入
文本嵌入(textembedding-gecko)是支持文本嵌入的模型的名称。文本嵌入是一种 NLP 技术,可将文本数据转换为数值向量,供 machine learning 算法(尤其是大型模型)处理。这些向量表示旨在捕获它们所代表的单词的语义含义和上下文。
有几个版本可用于嵌入。textembedding-gecko@003 是最新的稳定嵌入模型,AI 质量更高,textembedding-gecko-multilingual@001 是针对多种非英语语言优化的模型。
多模态嵌入
多模态(multimodalembedding)模型的嵌入会根据您提供的输入生成维度向量(128、256、512 或 1408 维)。这种输入可以包括文本、图像或视频的任意组合。接下来,嵌入向量可以用于其他后续任务,例如图像分类或内容审核。
文本、图像和视频嵌入向量在同一语义空间中,具有相同的维度。因此,这些向量可以互换使用,用于按文本搜索图像或按图像搜索视频等用例。
开始使用
- Vertex AI 与 Elasticsearch Open Inference API 集成,用于重排序
- 使用 Gemini 在几分钟内迭代并创建 RAG 应用程序
- 利用 Vertex AI 在 Elasticsearch 中发挥数据的潜力