Cómo desplegar el procesamiento del lenguaje natural (NLP): Primeros pasos

blog-thumb-community-discussion.png

El lanzamiento del Elastic Stack 8.0 introdujo la capacidad de cargar modelos de machine learning de PyTorch en Elasticsearch para proporcionar procesamiento de lenguaje natural (NLP) moderno en el Elastic Stack. NLP abre oportunidades para extraer información, clasificar texto y proporcionar una mejor relevancia de búsqueda a través de vectores densos y búsqueda aproximada del vecino más cercano.

En esta serie de blog de varias partes, veremos ejemplos completos utilizando una variedad de modelos PyTorch NLP.

Parte 1: Cómo desplegar incrustaciones de texto y búsqueda vectorial
Parte 2: Reconocimiento de entidades con nombre (NER)
Parte 3: Análisis de sentimiento

En cada ejemplo, usaremos un modelo de PNL prediseñado del centro de modelos Hugging Face. Luego, seguiremos las instrucciones documentadas de Elastic para desplegar un modelo de NLP y agregar la inferencia de NLP a un pipeline de ingesta.  Debido a que siempre es una buena idea comenzar con un caso de uso definido y una comprensión de los datos de texto para procesar en el modelo, comenzaremos definiendo el objetivo para usar NLP y un conjunto de datos compartidos para que cualquiera pueda probar.

Para prepararnos para el ejemplo de NLP, necesitaremos un cluster de Elasticsearch que ejecute al menos la versión 8.0, un nodo de ML con al menos 2 GB de RAM y, para el ejemplo de reconocimiento de entidades con nombre (NER), usaremos el plugin de texto anotado del mapeador requerido. Una de las formas más fáciles de comenzar es siguiendo estos ejemplos de NLP con tu propio cluster de prueba gratuito de 14 días en Elastic Cloud. Las pruebas en el cloud pueden escalar a un máximo de dos nodos de ML de 2 GB, lo que te permitirá desplegar uno o dos ejemplos en cualquier momento en esta serie de blogs de varias partes.