如何部署自然语言处理 (NLP)：开始使用

2022年5月20日

随着 Elastic Stack 8.0 的发布，您能够将 PyTorch Machine Learning 模型上传到 Elasticsearch，从而在 Elastic Stack 中实现现代自然语言处理 (NLP)。NLP 开启了新机遇，让您能够通过密集矢量和近似最近邻搜索完成信息提取和文本分类，并打造更好的搜索体验。

在这个包含多篇博文的系列中，我们将会使用各种 PyTorch NLP 模型带您从头到尾完成几个示例。

第 1 部分：如何部署文本嵌入和矢量搜索
 第 2 部分：命名实体识别 (NER)
第 3 部分：情感分析

在每个示例中，我们都会使用来自 Hugging Face 模型中心的预构建 NLP 模型。然后，我们会按照 Elastic 书面说明来部署 NLP 模型并向采集管道中添加 NLP 推理。因为先定义用例并理解将要在模型中处理的文本始终都是一个好办法，所以我们开始时会定义使用 NLP 要实现的目标，还会定义一个共享数据集以便所有人都可以尝试。

完成 NLP 示例的准备工作包括：我们需要一个最低为 8.0 版本的 Elasticsearch 集群，一个至少 2GB 内存的 ML 节点；对于命名实体识别 (NER) 示例，我们必须使用 mapper-annotated-text 插件。入门的最简单方法之一就是在 Elastic Cloud 上通过您自己的免费 14 天试用集群逐步照做，完成这些 NLP 示例。云试用服务可扩展至最大为 2 GB 的 ML 节点，所以您可以随时部署此系列博文中的一到两个示例。

上下文工程

向量数据库

Search AI 驱动的应用程序

日志

威胁防护

工作流

Elasticsearch

Kibana（Discover、仪表板）

Elastic 智能体生成器

自动操作

管道化查询语言

Jina AI 搜索模型

Elastic Cloud Serverless

Elastic Cloud 托管

自管型 Elasticsearch

电子商务搜索

客户服务搜索

搜索驱动型应用程序

日志分析

基础架构监测

数字体验监测

应用性能监控

AIOps

LLM 可观测性

新一代 SIEM

安全工作流

XDR 和终端安全

面向安全的 AI

实现数据价值十倍跃升

云服务提供商

Elastic AI 生态系统

Search AI 合作伙伴计划

AV-Comparatives

Forrester Wave™ XDR

Gartner 魔力象限领导者

IDC MarketScape

Search

安全性

可观测性

开始使用

演示库

下载

集成

文档

Elasticsearch Labs

Elastic 安全实验室

Elastic 可观测性实验室

博客

社区

活动

网络研讨会

讨论

培训

支持

咨询

如何部署自然语言处理 (NLP)：开始使用

分享

注册 Elastic Cloud 免费试用版