Jina AI 모델

검색 파이프라인의 각 단계를 위한 최신 모델

검색용으로 특별히 제작된 Jina AI 모델은 크기가 5배에 달하는 모델을 능가하는 정확도와 속도를 제공합니다. 다국어, 멀티모달을 지원하며 이제 Elasticsearch에서 기본적으로 제공됩니다.

Jina AI 모델을 만나보세요

당사의 최첨단 모델은 고품질 엔터프라이즈 검색 및 Retrieval-Augmented Generation(RAG) 시스템을 위한 검색 기반을 형성합니다.

  • 리더

    복잡한 문서, 웹 페이지 및 PDF를 검색 및 대규모 언어 모델(LLM)에 적합한 깔끔하고 구조화된 입력으로 변환하세요.

  • 임베딩

    텍스트, 이미지 및 코드에 대한 멀티모달 및 다국어 임베딩을 통해 검색 및 RAG 시스템을 개선하세요.

  • 리랭커

    RAG, AI 어시스턴트, 에이전트와 같은 중요한 애플리케이션에 정밀함을 제공하는 세계적 수준의 리랭커로 관련성을 극대화하세요.

컴팩트한 설계, 정확한 결과

하나의 API를 통해 원시 데이터에서 높은 정밀도의 결과를 얻으세요.

  • 멀티모달 검색, 30개 언어 지원

    Jina 모델은 텍스트, 이미지, 코드 전반에서 작동합니다. Jina-vlm은 텍스트 및 문서와 함께 시각적 콘텐츠를 검색할 수 있도록 지원합니다. 30개 이상의 언어를 기본적으로 지원하며, 언어 간 검색이 즉시 가능합니다.

  • 가장 가까운 결과가 아닌, 가장 적합한 결과

    Jina의 순위 재지정 모델은 검증된 선도적 모델입니다. 리랭커를 통해 모든 후보를 원본 쿼리와 비교하여 점수를 다시 매기고, 심층 분석을 통해 가장 관련성 높은 답변을 상위에 표시하여 추가적인 정밀도를 확보하세요.

  • 스마트한 학습, 더 작은 모델

    Jina 모델은 검색에 중요한 작업을 기반으로 학습했습니다. 즉, 복잡한 소스에서 올바른 문서와 최상의 답변을 찾는 것입니다. 그래서 훨씬 더 큰 규모의 모델과 비교하여 동등하거나 더 나은 성능을 훨씬 적은 비용으로 제공합니다.

  • 제로 구성 시맨틱 검색

    모든 필드를 semantic_text로 매핑하면 Elasticsearch가 자동으로 임베딩을 생성합니다. EIS에서 Jina 모델은 기본적으로 구성없이 즉시 사용할 수 있는 다국어 및 멀티모달 시맨틱 검색을 제공합니다.

  • API 호출 한 번이면 끝

    전통적인 키워드 검색을 단일 쿼리에서 Jina의 시맨틱 매칭과 결합하세요. 상호 순위 결합(RRF)으로 하나의 API 호출을 사용하여 각 접근 방식의 최상의 요소를 병합하세요.

  • 어떤 규모로든 효율적으로 확장

    Jina의 가변 크기 임베딩과 Elastic의 벡터 양자화(BBQ)를 결합하여 저장 용량을 최대 95% 줄이면서 정확도 손실을 최소화할 수 있습니다. 정확도가 가장 중요할 때는 정밀도를 최대로 높이세요.

우리의 연구

Jina 모델은 CVPR, NeurIPS, EMNLP 등 주요 머신 러닝(ML) 컨퍼런스에서 발표된 연구를 기반으로 합니다. 당사의 최신 논문을 통해 최첨단 검색 모델이 처음부터 학습한 방식을 살펴보세요.
  • Jina-embeddings-v5-text: 작업 특화 임베딩 증류

    모델 증류 기술과 작업 특화 대조 손실을 결합하여 컴팩트한 고성능의 임베딩 모델을 생성할 수 있는 새로운 학습 방식을 소개합니다.

  • 조건부 마스크 확산 언어 모델을 통한 임베딩 인버전

    임베딩 인버전을 조건부 마스크 확산으로 구성하여, 순차적 자동 회귀 생성 대신 반복적인 노이즈 제거를 통해 모든 토큰을 병렬로 복구할 수 있습니다.

  • 구면 좌표계를 통한 임베딩 압축

    단위 노름 임베딩에 대해 1.5배의 압축을 달성하는 압축 방법을 제시합니다. 이는 기존 최고의 무손실 방법보다 25% 더 우수합니다.

오픈 소스 커뮤니티 참여

Jina 모델은 가중치 공개 모델로 Hugging Face에서 자유롭게 이용할 수 있으며, 매월 수백만 건의 다운로드를 기록하고 있습니다. 코드베이스는 GitHub에서 공개되어 있습니다. 커뮤니티는 개발자와 직접 소통할 수 있습니다.

자주 묻는 질문

Jina 검색 모델이란 무엇인가요?

Jina 모델은 검색을 위한 오픈 소스 기반의 최첨단 AI 모델입니다. 여기에는 벡터 임베딩 모델, 정확도 향상을 위한 리랭커, URL 및 문서에서 콘텐츠를 추출하고 구조화하는 리더 등이 포함됩니다.

이 도구들을 사용하려면 AI나 머신 러닝 전문 지식이 필요한가요?

아니요. Elasticsearch의 semantic_text 필드를 사용하면 AI 처리가 자동으로 이루어집니다. Jina 모델은 모델 구성이나 ML 전문 지식이 없어도 콘텐츠를 의미론적으로 검색할 수 있게 해줍니다.

어떻게 시작하나요?

Jina 모델은 모든 체험판에 포함된 Elastic Cloud의 Elastic Inference Service에서 사용할 수 있습니다. semantic_text로 시작하거나 모델 하위 페이지에서 코드 예제, API 참조 및 자습서를 확인하세요.

현재 사용 가능한 Jina 모델은 무엇인가요?

최신 v5-text(나노/소형)는 32K 컨텍스트, Matryoshka 차원, 최신 아키텍처를 제공하며 이와 함께 Jina-embeddings-v3, Reranker v2 및 v3가 있습니다. 모두 Elastic Inference Service에서 사용할 수 있습니다.

지원되는 언어는 몇 개입니까?

Jina-embeddings-v5-text는 30개 이상의 언어를 지원합니다. 한 언어로 쿼리하면 번역 파이프라인이 없어도 다른 언어로 작성된 관련 콘텐츠를 찾을 수 있습니다.

이것이 ELSER와 어떤 관련이 있습니까?

ELSER는 영어 시맨틱 검색을 지원합니다. Jina는 30개 이상의 언어에 걸쳐 뛰어난 정확도로 다국어 검색 기능을 제공합니다. 두 가지 모두 Elasticsearch의 하이브리드 검색 프레임워크 내에서 작동합니다.

이것은 별도의 제품입니까?

아니요. Elastic Inference Service의 Jina 검색 모델은 사용량 기반 요금제를 통해 모든 Elastic Cloud 사용자가 이용할 수 있습니다. 별도의 라이선스, 구독, API 키가 필요하지 않습니다.

이것이 Elastic의 벡터 데이터베이스 페이지와 어떤 관련이 있습니까?

벡터 데이터베이스 페이지는 벡터가 대규모로 저장되고 검색되는 방법을 다룹니다. 이 페이지는 벡터를 생성하고 순위를 재지정하는 AI 모델과 저장 공간, 계산, 애플리케이션을 다룹니다.