벡터 검색 필터링: 관련성 유지
쿼리와 가장 유사한 결과를 찾기 위해 벡터 검색을 수행하는 것만으로는 충분하지 않습니다. 검색 결과의 범위를 좁히기 위해 필터링이 필요한 경우가 많습니다. 이 문서에서는 Elasticsearch와 Apache Lucene에서 벡터 검색을 위한 필터링이 어떻게 작동하는지 설명합니다.


2025년 2월 7일
Lucene의 동시성 버그: 낙관적인 동시성 실패를 수정하는 방법
CMU 파스타 연구소의 결정론적 동시성 테스트 프레임워크인 Fray 덕분에 까다로운 루씬 버그를 추적하여 해결했습니다.


2024년 12월 27일
루씬 버그 모험: 손상된 인덱스 예외 수정
때로는 한 줄의 코드를 작성하는 데 며칠이 걸리기도 합니다. 여기에서는 잠재적인 Apache Lucene 인덱스 손상을 해결하기 위해 며칠에 걸쳐 디버깅을 진행했던 엔지니어의 고군분투를 엿볼 수 있습니다.

Elasticsearch와 OpenSearch: 벡터 검색 성능 비교
Elasticsearch는 벡터 검색에서 별도 설정 없이 OpenSearch보다 2~12배 더 빠릅니다.

루씬의 스칼라 양자화 이해하기
자동 바이트 양자화, 세그먼트별 양자화, & 성능 인사이트를 포함하여 Elastic이 어떻게 Lucene에 스칼라 양자화를 도입했는지 살펴보세요.

학술 논문 구현하기: Elasticsearch와 Lucene에서 배운 교훈
연구 논문을 소프트웨어 애플리케이션에 통합하는 전략에 대해 알아보고, Elasticsearch와 Lucene에 대한 경험을 바탕으로 살펴보세요.