Aaron Ricadela | 资深撰稿人 | 2025 年 3 月 20 日
如今,很多企业将生成式 AI 引入日常业务流程,希望进一步挖掘生成式 AI 的价值。他们开始在各种应用中部署 AI 智能体 (AI Agent) 软件,用于处理书面和口头对话、查询数据库以及执行多步骤工作 — 在所有情况下都无需提前通过编程来确定如何进行下一步。
代理型人工智能 (Agentic AI) 应用可被部署用于逐步收集所需信息:与计算机用户及其日程表交互;利用本地和云端系统中的信息;以及使用搜索引擎或其他网站来查找问题答案/执行操作。它们依靠底层 AI 大语言模型 (LLM) 获得预测能力,能够以自然语言与人类用户互动。
很多生产力应用提供商、客户管理应用提供商和后台应用提供商已经推出了相应的设计工具来帮助客户定制、指导和激活 AI 智能体,或者创建自己的 AI 智能体。本文将就如何搭建一个 AI 智能体(包括 7 步构建一个智能体并将其投入运行)提供一些有益的指导。
AI 智能体软件利用经由海量数据训练的 LLM 来查找概念间关系,构建概念间关联,进而对计算机用户的意图做出预测,并以对话方式与其进行沟通。智能体旨在消除用户与语言模型之间的隔阂,能够主动采取行动来解决众多领域的问题。
智能体还可以帮助企业将重复性流程实现自动化,例如协助进行财务预测;帮助 HR 团队执行招聘流程中的多个步骤;或者总结客户信息,供销售代表识别追加销售机会。
AI 智能体旨在理解用户的职能角色,从企业文档中提取适当数据(以避免工作流偏离上下文情境),以及响应自然语言提示(而不是预编写的指令)。为确保 AI 智能体灵活应对不断变化的各种情况,企业需要做一些准备工作。
1. 选择智能体构建策略。企业需要提前决策,是对软件供应商本来用于实现流程自动化的预构建智能体进行定制,还是从零开始构建自己的智能体。考虑到各行各业 AI 智能体的测试和部署仍处于发展早期阶段,大多数企业可能会选择对预构建智能体进行定制,以便更好地创造价值。在做决策时,企业应考虑以下问题:
2. 自行选择一个 LLM 还是使用供应商指定的 LLM。支持客户在设计工具中改进智能体的 SaaS 应用供应商可能会预先指定将与其软件交互的 LLM,或者让管理员在有限的范围中进行选择。从零开始构建 AI 智能体的企业需要从 Anthropic、Cohere、Google、IBM、Meta(流行 Llama 模型的开发商)、Microsoft、Mistral、OpenAI 等供应商的产品中选择自己的 LLM。这种方法有助于企业控制智能体软件体系的所有层,包括底层模型。但这也意味着,与定制现成的智能体相比,企业要负责维护更多的软件组件。
3. 设计工作流并定义所需工具。对预构建的智能体进行定制属于应用管理员的工作,而非一般业务用户。对此,管理员可以从预先设计的工作流模板(即,目录视图中的使用场景及其代码)入手,也可以构建新的定制化工作流。要定义预构建智能体的工作流,管理员需要在智能体设计工具的各个字段中输入明确的自然语言指令,或者从列表中选择所需操作,指定智能体应如何与用户交互、展示数据或安排预约。管理员还可以选择智能体应使用哪些工具回答问题,并为其提供员工可能提出的问题样本。
这一过程将定义智能体的角色,以简明的语言描述智能体应如何执行一项工作以及需要访问哪些信息。例如,部署在 HR 应用内帮助向员工解释健康福利的智能体,将需要访问医疗、视力、口腔以及其他医疗保健政策文档;与经济利益有关的智能体则可能需要访问由雇主赞助的退休计划和股票计划等信息(详见下文)。
4. 为 RAG 上传文档。至此,管理员已为智能体指定了相应的指令和工具,可以使用文档上传工具为检索增强生成(RAG,一种 AI 技术,为运行中的 LLM 提供业务文档和数据,以增强 LLM 训练的学习效果)准备企业文档。接下来,管理员将就智能体如何使用这些文档给出自然语言指令。智能体构建软件会将向量数据库抽象化,这有助于在运行时根据用户意图提供高度相关的结果。
5. 点击按钮进行创建。在完成指令、主题和文档工作后,管理员只需给出名称并点击 UI 按钮即可在设计工具中创建智能体。随后,通过自然语言指令使工作流(或其它智能体)了解自己的功能。AI 智能体在运行时将学习如何通过精确的试错和奖励(称为“强化学习”)提升自身性能。
从零开始构建智能体但没有使用设计工具的企业,可能需要向财务、HR、客户管理等应用以及用户数据库和文档添加集成。一些 AI 智能体框架提供软件架构、通信协议、云端和本地数据源连接器、监视工具来帮助企业构建新的智能体,无需企业从零编写代码。目前流行的开源框架包括 LangChain、LlamaIndex 和 Microsoft Research 的 AutoGen。
一些智能体设计环境内部可能也包含框架,管理员无需直接访问。
6. 设置边界。这一步是设置“围栏”,以确保智能体保持准确性并能够判断何时应在执行操作前寻求许可。例如,搭建智能体的管理员可以要求智能体在获得工作人员批准后才能发送电子邮件或更新业务记录。
管理员还可以设置条件,设定智能体在何等条件下可以回答问题;可以添加指令,要求底层 LLM 从企业 IT 系统查询信息或向用户求证,而不是编造一个答案(这是生成式 AI 的一个缺陷,称作“AI 幻觉”)。例如,管理员可以输入:无论是询问用户还是查询系统,请确保掌握有关被抚养人数量的正确信息。如果不知道答案,切勿编造。
管理员还可以将智能体设计为继承其运行所在云技术服务上的内容审核功能。
7.测试、部署和监视。通过设计工具的测试区,管理员可以运行样本互动测试,以衡量智能体的响应的有效性和相关性,并检查其引用的数据源。他们还可以了解,当企业更改了智能体的指令或底层 LLM 时,用户互动将如何变化。随后,管理员可以直接在设计工具中部署智能体。
AI 智能体可以通过衡量哪些 RAG 数据与用户提示组合可以激发出最佳结果来逐步提升自身性能。企业管理人员可以对智能体进行性能评级,并将反馈融入与用户的未来交互中。
了解情境感知型 AI 智能体如何在业务应用中执行多步骤工作。
Oracle AI Agent Studio 可帮助 IT 管理员在 Oracle Fusion Cloud Applications 中搭建旨在协助用户完成各种工作的 AI 智能体。这些工作包括:查询带薪假期余额、获取客户的购买历史记录、处理产品退货、分析制造设备图片以评估维修成本等。
Oracle Fusion Applications 管理员可以从预构建模板开始入手(这些模板在工作区中以磁贴形式展现,包含必要的代码)。随后,智能体设计人员指定要部署的智能体的职能范围和边界,定义可供其查询信息的文档和其他数据源。当然,他们也可以从零开始构建新的智能体。不过 Oracle Fusion Applications 订阅中已包含 AI 智能体,客户无需额外付费。
AI 智能体可以做些什么?
AI 智能体是在企业应用或个人生产力软件中部署的虚拟助手,可帮助解答计算机用户的问题或帮助他们完成工作。与早先依赖预编写规则和工作流的软件助手不同,AI 智能体可以理解自然语言提示和上下文,能够适应新情况。
AI 智能体是未来发展方向吗?
AI 智能体能够以较少的人工干预部署到各种业务应用中,并在与更多业务用户和消费者的互动过程中持续学习,因此会变得越来越有用。
注:为免疑义,本网页所用以下术语专指以下含义: