Elasticsearch Agent Builder 黑客马拉松
以下是社区构建的成果

今年早些时候,Elastic 举办了 Elasticsearch 智能体构建黑客松,面向开发者发起挑战,使用 Elastic Agent Builder 打造有实际价值、可运行的 AI 智能体。比赛目标是将推理模型与 Elastic Agent Builder 工具(如 Elastic Workflows、Elasticsearch 或 Elasticsearch 查询语言 ES|QL)相结合,实现繁琐内部工作流的自动化、打通互不连通的系统,并构建面向特定领域、具有实际影响力的智能体。反响极为热烈,来自全球各地的开发者提交了涵盖医疗健康、安全、合规监管等多个领域的项目。
每位参与者都锁定了各自领域的真实痛点,深入思考了智能体、搜索与编排三者如何协同发力来解决问题,并最终打造出能够切实解决实际问题的作品。这些成果充分展示了大型语言模型(LLM)推理能力与智能体的高效和结构化相结合后所能释放的巨大潜力,包括能在 60 秒内完成药物安全信号检测的流水线、能随时间推移越来越聪明的对抗性测试系统,以及能为医护人员节省数天手工劳动的重复检测工具。
以下是排名前三的获奖团队撰写的博客文章,内容涵盖他们所选择的问题、智能体架构的设计思路,以及一路走来的经验教训。无论是 Agent Builder 的新手,还是已在搭建生产级系统的老手,这些文章都值得一读。
获奖者
PHAROS:四个智能体,60 秒,错过一个药物安全信号就会酿成大祸
Prajwal Sutar 打造了 PHAROS,一款由四个智能体组成的药物警戒系统,能够接入 FDA 不良事件报告,完全在 ES|QL 内部运行 WHO 标准统计分析,自动生成监管文书,并在不到一分钟内向 Slack、Jira 和电子邮件发送告警。他的博文详细介绍了精心设计的智能体架构、将统计计算保留在 Elasticsearch 内部的决策,以及流水线中的 JSON 解析方案。
Gauntlet:当智能体的工具反戈一击,会发生什么
Kavish Sathia 打造了 Gauntlet,一款对抗性测试框架,其中一个模拟智能体会拦截主智能体的工具调用,并利用具备长期记忆的机制自动尝试攻破它,且每次运行都会变得更具创造性。在截止日期前 48 小时经历方向调整后从零开始重建,Gauntlet 有力地证明了:对于拥有真实世界工具访问权限的智能体而言,仅靠"快乐路径"测试远远不够。他的博文详解了双记忆架构,以及 ES|QL 的补全函数如何给他带来了惊喜。
揪出隐形错误:一款服务于肯尼亚 HIV 防治项目的重复检测智能体
Fredrick Kioko 是内罗毕的一名解决方案架构师,负责在肯尼亚全部 47 个县搭建健康信息系统。他带来了一个自己观察了数月、眼看着不断恶化的问题:肯尼亚 HIV 检测基础设施中的重复患者记录正在悄悄虚高数据看板、浪费检测试剂。他的三智能体系统在不到 10 秒内扫描了 1,010 条真实匿名记录,检出 131 条重复记录,其中包括同日在多家机构检测的病例。这类病例如果靠人工排查,需要数周才能发现。他的博文阐明了在临床 AI 中,可解释性绝非可有可无。
了解有关获奖者的更多信息
这三个项目横跨截然不同的领域,却有着共同的主题:每位开发者都从一个具体且代价高昂的真实问题出发,借助 Agent Builder 打造出能对问题进行深度推理、而非简单查询的解决方案。这正是本次黑客马拉松活动的目的所在。
阅读下方每位获奖者的博文,看看智能体技术究竟能带来怎样的可能。
本文中描述的任何功能或功能性的发布和时间均由 Elastic 自行决定。当前尚未发布的任何功能或功能性可能无法按时提供或根本无法提供。
在本博文中,我们可能使用或提到了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 对第三方工具没有任何控制权,对其内容、操作或使用不承担任何责任或义务,对您使用此类工具可能造成的任何损失或损害也不承担任何责任或义务。请谨慎使用 AI 工具处理个人、敏感或机密信息。您提交的任何数据都可能用于 AI 训练或其他目的。Elastic 不保证您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您都应自行熟悉其隐私惯例和使用条款。
Elastic、Elasticsearch 及相关标志是 Elasticsearch B.V. 在美国及其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其相应所有者的商标、徽标或注册商标。