Vertex AI는 다양한 API를 통해 생성형 AI 모델을 폭넓게 제공하며, 광범위한 사용 사례를 위한 지능형 애플리케이션을 구축할 수 있도록 지원합니다. Google의 첨단 연구를 기반으로 한 이 모델들은 텍스트 생성, 언어 번역, 다양한 창의적 콘텐츠 작성 그리고 정보 제공형 질문 응답 기능을 지원합니다.
Gemini API
Google Gemini 모델은 멀티모달 애플리케이션을 위해 설계되었습니다. Gemini 모델은 텍스트와 이미지 등을 포함한 프롬프트를 받아 텍스트 응답을 반환합니다. Gemini는 또한 함수 호출을 지원하여 개발자가 함수 설명을 전달하면 모델이 해당 설명에 가장 적합한 함수와 매개변수를 반환합니다. 개발자는 그 후 외부 API와 서비스에서 해당 함수를 호출할 수 있습니다.
Gemini 1.5 Pro: 이 고급 모델은 최대 100만 개의 토큰을 처리할 수 있는 대형 문맥 창을 갖추고 있어, 복잡한 프롬프트를 세밀하게 이해하고 포괄적인 응답을 생성할 수 있습니다.
Gemini 1.0 Pro & Gemini 1.0 Pro Vision: 이러한 모델은 자연어 처리 작업, 다중 회차 대화 및 코드 생성에 최적화되어 있습니다. 또한 프롬프트에 이미지, PDF, 동영상을 통합할 수 있어 멀티모달 애플리케이션에 유연하게 활용할 수 있습니다.
Gemini 1.0 Ultra & Gemini 1.0 Ultra Vision: Google의 가장 강력한 멀티모달 모델로서, 명령어 이해, 코드 생성, 추론을 포함한 복잡한 작업에 최적화되어 있습니다. 다국어를 지원하며 현재 선별된 고객 그룹에게 제공되고 있습니다.
텍스트 임베딩
텍스트 임베딩(textembedding-gecko)은 텍스트 임베딩을 지원하는 모델의 명칭입니다. 텍스트 임베딩은 텍스트 데이터를 머신러닝 알고리즘, 특히 대규모 모델에서 처리할 수 있는 수치 벡터로 변환하는 NLP 기법입니다. 이러한 벡터 표현은 표현하는 단어의 의미와 맥락을 포착하도록 설계되었습니다.
임베딩에는 여러 가지 버전이 있습니다. textembedding-gecko@003은 향상된 AI 품질을 갖춘 최신 안정 버전 임베딩 모델이며, textembedding-gecko-multilingual@001은 다양한 비영어권 언어에 특화된 모델입니다.
멀티모달 임베딩
멀티모달(multimodalembedding) 모델을 위한 임베딩은 사용자가 제공하는 입력을 기반으로 차원 벡터(128, 256, 512 또는 1408차원)를 생성합니다. 이 입력은 텍스트, 이미지 또는 동영상의 모든 조합을 포함할 수 있습니다. 생성된 임베딩 벡터는 이미지 분류나 콘텐츠 조정과 같은 후속 작업에 활용할 수 있습니다.
텍스트, 이미지, 동영상 임베딩 벡터는 동일한 차원의 의미 공간에 위치합니다. 따라서 이러한 벡터는 텍스트로 이미지를 검색하거나, 이미지로 동영상을 검색하는 등의 사용 사례에 활용할 수 있습니다.
시작하기
- Vertex AI와 Elasticsearch 개방형 추론 API 통합을 통한 재순위 지정 지원
- Gemini로 단시간에 RAG 애플리케이션 반복 개발 및 생성
- Vertex AI로 Elasticsearch 데이터 잠재력 극대화
노트북
- Gemini 임베딩과 Elasticsearch를 활용한 벡터 검색
- Gemini, LangChain 및 Elasticsearch를 활용한 질문 응답
- 프라이빗 데이터에서 Gemma를 활용한 RAG