Google Vertex AI

Vertex AI 通过多种 API 提供多样化的生成式 AI 模型,使您能够为广泛的用例构建智能应用。这些模型由 Google 的先进研究提供支持,使您能够生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答您的问题。

Gemini API

Google Gemini 模型 专为多模态应用而设计。Gemini 模型接受包含例如文本和图像的提示,然后返回文本响应。Gemini 还支持函数调用,允许开发人员传递函数描述,然后模型会返回与描述最匹配的函数和参数。然后,开发人员可以在外部 API 和服务中调用该函数。

Gemini 1.5 Pro:这款先进模型具备超长上下文窗口,可处理多达 100 万词元的输入,能精准理解复杂指令的细微差别,并生成内容详实的回复。

Gemini 1.0 ProGemini 1.0 Pro Vision:这些模型非常适合自然语言任务、多轮对话和代码生成。它们还提供将图像、PDF 和视频嵌入提示的功能,适用于多模态应用的多样化场景。

Gemini 1.0 Ultra & Gemini 1.0 Ultra Vision:作为 Google 最强大的多模态模型,这些模型经过优化,可处理涉及指令理解、代码生成和推理的复杂任务。它们支持多种语言,目前仅对部分客户开放。

文本嵌入

文本嵌入(textembedding-gecko)是支持文本嵌入的模型的名称。文本嵌入是一种 NLP 技术,可将文本数据转换为数值向量,供 machine learning 算法(尤其是大型模型)处理。这些向量表示旨在捕获它们所代表的单词的语义含义和上下文。

有几个版本可用于嵌入。textembedding-gecko@003 是最新的稳定嵌入模型,AI 质量更高,textembedding-gecko-multilingual@001 是针对多种非英语语言优化的模型。

多模态嵌入

多模态(multimodalembedding)模型的嵌入会根据您提供的输入生成维度向量(128、256、512 或 1408 维)。这种输入可以包括文本、图像或视频的任意组合。接下来,嵌入向量可以用于其他后续任务,例如图像分类或内容审核。

文本、图像和视频嵌入向量在同一语义空间中,具有相同的维度。因此,这些向量可以互换使用,用于按文本搜索图像或按图像搜索视频等用例。

开始使用

笔记本

聊天机器人应用示例

准备好打造最先进的搜索体验了吗?

足够先进的搜索不是一个人的努力就能实现的。Elasticsearch 由数据科学家、ML 操作员、工程师以及更多和您一样对搜索充满热情的人提供支持。让我们联系起来,共同打造神奇的搜索体验,让您获得想要的结果。

亲自试用