Elasticsearch tiene integraciones nativas con las herramientas y proveedores líderes en la industria de IA generativa. Echa un vistazo a nuestros webinars sobre cómo ir más allá de los conceptos básicos de RAG o crear apps listas para la producción con la base de datos vectorial de Elastic.
Para crear las mejores soluciones de búsqueda para tu caso de uso, inicia una prueba gratuita en el cloud o prueba Elastic en tu máquina local ahora mismo.
En este artículo, exploraremos cómo la Inteligencia Artificial (IA), específicamente empleando modelos de lenguaje avanzados como GPT-4, puede ayudar a crear facetas más contextuales, haciéndolas aún más relevantes y útiles para los usuarios.
La búsqueda por facetas es una herramienta poderosa en las plataformas de comercio electrónico. Ayuda a organizar y refinar los resultados de búsqueda en función de las características de los elementos mostrados. Aunque a menudo se confunden con filtros, los aspectos funcionan de forma diferente. Los filtros son atributos fijos, definidos por la información siempre presente en el índice, como la categoría o formato de un producto. Las facetas, en cambio, son dinámicas y se generan a partir de los resultados devueltos por la búsqueda ejecutada.
Imagina un catálogo de ropa: campos como "categoría" (por ejemplo, camisetas, pantalones) o "género" (por ejemplo, hombre, mujer) son filtros que ayudan a reducir los resultados. Sin embargo, los aspectos reflejan características específicas de los productos que aparecen en los resultados, como colores comunes, tamaños disponibles o materiales. Esto permite una experiencia de búsqueda más adaptable y contextual.
A continuación hay una imagen donde interactuamos con una faceta y podemos ver los resultados de búsqueda filtrados por ella.

Cómo la IA puede mejorar la generación de facetas
La inteligencia artificial suele asociar con la búsqueda semántica y las incrustaciones, pero ¿qué pasa con los aspectos? ¿Cómo se puede aprovechar la IA para que los aspectos sean más útiles y específicos del contexto para cada búsqueda?
Una posibilidad intrigante es emplear la IA para crear nuevas categorizaciones que vayan más allá de las clasificaciones tradicionales del índice. Al analizar características específicas del contenido, estas nuevas categorías pueden proporcionar una contextualización más rica y precisa, haciendo que los aspectos sean más relevantes y alineados con las necesidades de los usuarios. Esto permite un refinamiento más significativo de los resultados en comparación con las categorías originales de documentos.
Cómo la IA puede refinar las clasificaciones de películas para obtener mejores búsquedas
Analicemos las siguientes películas, todas actualmente clasificadas dentro del género Drama:
- Réquiem por un sueño
Resumen: Las utopías inducidas por las drogas de cuatro personas de Coney Island se rompen cuando sus adicciones son profundas. - Belleza americana
Currículum: Un padre suburbano sexualmente frustrado sufre una crisis de la mediana edad tras enamorar de la mejor colega de su hija. - Búsqueda de Buena Voluntad
Currículum: Will Hunting, conserje en el M.I.T., tiene un don para las matemáticas, pero necesita ayuda de un psicólogo para encontrar un rumbo en su vida.
Esta clasificación de género no capta las diferencias sutiles ni los contextos únicos de cada película. Aprovechando la IA para analizar resumen y temas centrales, podemos crear nuevas categorías que reflejen mejor el contexto real de cada película. Por ejemplo:
- Réquiem por un sueño - Nueva categoría: "Adicción y dependencia"
- American Beauty - Nueva categoría: "Crisis de la mediana edad"
- Búsqueda de Buena Voluntad - Nueva categoría: "Lucha Intelectual"
Estas nuevas categorías hacen que las búsquedas sean mucho más precisas y ofrecen a los usuarios filtros más significativos para refinar sus resultados. Este enfoque es especialmente efectivo cuando las categorías originales son demasiado genéricas, permitiendo a los usuarios encontrar exactamente lo que buscan con mayor facilidad.
Creación de nuevas categorías con GPT-4: Ejemplo de búsqueda facetada
En este ejemplo, mostraremos cómo un modelo de IA puede emplear para crear nuevas categorías de películas que sean más precisas y alineadas con el contexto de cada obra. Para demostrar este proceso, emplearemos la cadena de simulación Elastic junto con el servicio de inferencia OpenAI. Se creará una tubería con varios procesadores, incluido el Script Processor, que será responsable de crear el prompt que se ejecutará en el Inference Processor, capaz de determinar las nuevas categorías. Los otros procesadores se emplearán para manipular los datos y los campos auxiliares generados durante la ejecución de la pipeline. Cabe mencionar que esta lógica también puede aplicar con otras herramientas o modelos similares.
Primero, necesitamos crear el endpoint de inferencia, donde definimos el servicio como OpenAI, el token necesario para acceder al servicio y el modelo. En este ejemplo, estoy usando gpt-4o-mini. Para más detalles sobre el servicio de inferencia OpenAI haz clic aquí.
Con el endpoint creado, ya estamos listos para usarlo y crear las nuevas categorías. A continuación se muestra una pipeline que gestiona todo el proceso de manipulación de datos documentales y generación de prompts. Voy a explicar la función de cada procesador en detalle.
El primer procesador será responsable de construir el prompt. Es muy importante detallar claramente las instrucciones para que la IA pueda analizar e identificar correctamente los temas. En este prompt, aplicar 2 temas basándome en el análisis del título, la descripción y los géneros de las películas.
La siguiente tubería es la de inferencia, recibirá el prompt y lo enviará a nuestro punto final generate_topics_ia . La respuesta generada por el modelo se almacenará en el campo de resultados.
A continuación, tenemos 3 procesadores que manipulan la respuesta y la configuran en el campo de temas, además de eliminar campos temporales que creé.
Al ejecutar esta canalización, veremos los resultados a continuación:
Cabe destacar que tenemos nuevas categorías más relacionadas con el contexto de las películas, aunque algunas son inicialmente del mismo género.
Ahora podemos usar estas nuevas categorías e indexarlas junto con el documento. De este modo, al generar las facetas, además de la categoría principal, tenemos subcategorías más específicas alineadas con el contexto de las películas.
Además, es posible vectorizar estas nuevas categorías y usarlas en búsquedas vectoriales. Esto significa que las nuevas categorías no solo sirven como filtros, sino que también pueden usar para calcular similitudes semánticas con los términos de búsqueda, aumentando aún más la relevancia de los resultados presentados.
Pipeline completo:
Conclusión
Emplear IA para mejorar aspectos puede transformar la experiencia de búsqueda al hacer que los resultados sean más específicos y contextuales. A diferencia de las categorías fijas, que suelen ser amplias, las categorías generadas por IA pueden reflejar mejor el contexto. Por ejemplo, al reclasificar películas, podemos captar el contexto que las categorías principales no mencionan, proporcionando agrupaciones mucho más relevantes.
Estas nuevas categorías pueden agregar al índice no solo para mejorar el facetado, sino también para habilitar búsquedas vectoriales. El resultado es una experiencia de búsqueda más eficiente, con filtros más alineados con el contexto.
Referencias
https://www.elastic.co/guide/en/elasticsearch/reference/current/infer-service-openai.html
https://www.elastic.co/guide/en/elasticsearch/reference/current/simulate-pipeline-api.html
https://www.elastic.co/guide/en/elasticsearch/reference/current/script-processor.html
Preguntas frecuentes
¿Qué es la búsqueda facetada?
La búsqueda facetada es una herramienta en plataformas de comercio electrónico. Ayuda a organizar y refinar los resultados de búsqueda en función de las características de los elementos mostrados.
¿Cómo puede la IA mejorar la búsqueda facetada?
La IA puede mejorar la generación de facetas en la búsqueda creando nuevas categorizaciones que van más allá de las clasificaciones tradicionales del índice, haciendo que los resultados sean más específicos y contextuales.




