LlamaIndex é o principal framework para criar apps conectando seus dados a LLMs, conhecidos como aplicações aumentadas por contexto. Essas aplicações variam de sistemas de retrieval-augmented generation ("RAG") por meio da extração de dados estruturados a sistemas complexos e semiautônomos de agentes que recuperam dados e executam ações. O LlamaIndex fornece abstrações simples e flexíveis para facilitar a ingestão, estruturação e acesso a dados privados ou específicos de domínio, a fim de injetá-los de forma segura e confiável em LLMs para uma geração de texto mais precisa. Está disponível em Python e Typescript. Você pode usar o LlamaIndex com o Elastic de seis maneiras:
- Como fonte de dados: usando o Elasticsearch Reader, você pode obter documentos do seu banco de dados Elasticsearch para serem usados no seu app
- Como um modelo de incorporação: embeddings do Elasticsearch podem codificar seus dados como vetores para buscar semântica
- Como armazenamento de vetores: usar Elasticsearch como um armazenar de vetores permitirá que você execute buscar semânticas nos seus documentos incorporados
- Como armazenamento de índices, armazenamento de KV e armazenamento de documentos para criar estruturas de recuperação mais avançadas, como um resumo de documento ou um gráfico de conhecimento