임베딩 소개

머신러닝에서 임베딩은 단어, 문장, 이미지 또는 동영상과 같은 실제 객체를 나타내는 벡터(숫자 배열)입니다. 이러한 임베딩의 흥미로운 속성은 유사하거나 관련된 실제 엔티티를 나타내는 두 임베딩이 일부 유사성을 공유하므로 임베딩을 비교하고 둘 사이의 거리를 계산할 수 있다는 것입니다.

검색을 위한 애플리케이션 측면에서 구체적으로 생각해 보면, 벡터 공간에서 임베딩을 검색하면 검색 프롬프트에 입력한 정확한 키워드가 아닌 개념과 더 연관성이 높은 결과를 찾는 경향이 있습니다.

이 튜토리얼의 이 섹션에서는 무료로 제공되는 머신 러닝 모델을 사용해 임베딩을 생성하는 방법을 배운 다음, Elasticsearch의 벡터 데이터베이스 지원을 사용해 이러한 임베딩을 저장하고 검색하는 방법을 알아봅니다. 또한 마지막에는 벡터 검색 결과와 전체 텍스트 검색 결과를 결합하여 두 가지 접근 방식의 장점을 모두 제공하는 강력한 하이브리드 검색 솔루션을 만들 수 있습니다.