머신러닝에서 임베딩은 단어, 문장, 이미지 또는 동영상과 같은 실제 객체를 나타내는 벡터(숫자 배열)입니다. 이러한 임베딩의 흥미로운 속성은 유사하거나 관련된 실제 엔티티를 나타내는 두 임베딩이 일부 유사성을 공유하므로 임베딩을 비교하고 둘 사이의 거리를 계산할 수 있다는 것입니다.

검색을 위한 애플리케이션 측면에서 구체적으로 생각해 보면, 벡터 공간에서 임베딩을 검색하면 검색 프롬프트에 입력한 정확한 키워드가 아닌 개념과 더 연관성이 높은 결과를 찾는 경향이 있습니다.

이 튜토리얼의 이 섹션에서는 무료로 제공되는 머신 러닝 모델을 사용해 임베딩을 생성하는 방법을 배운 다음, Elasticsearch의 벡터 데이터베이스 지원을 사용해 이러한 임베딩을 저장하고 검색하는 방법을 알아봅니다. 또한 마지막에는 벡터 검색 결과와 전체 텍스트 검색 결과를 결합하여 두 가지 접근 방식의 장점을 모두 제공하는 강력한 하이브리드 검색 솔루션을 만들 수 있습니다.

최첨단 검색 환경을 구축할 준비가 되셨나요?

충분히 고급화된 검색은 한 사람의 노력만으로는 달성할 수 없습니다. Elasticsearch는 여러분과 마찬가지로 검색에 대한 열정을 가진 데이터 과학자, ML 운영팀, 엔지니어 등 많은 사람들이 지원합니다. 서로 연결하고 협력하여 원하는 결과를 얻을 수 있는 마법 같은 검색 환경을 구축해 보세요.

직접 사용해 보세요