OpenAI《智能体构建实用手册》(PDF下载) - 全面AI学习资料与教程
《构建Agents实用指南》阐述了基于大语言模型(LLM)的Agents开发框架。Agents作为能独立执行多步骤工作流的AI系统,基于动态决策、工具调用和错误恢复能力,特别适用于客服审批、欺诈检测等传统规则难以处理的复杂场景。核心架构包含三大要素,根据任务复杂度选择的LLM模型、分类为数据/操作/编排的工具系统及结构化指令设计。指南提出渐进式开发策略,从单agent模式起步,必要时扩展至管理者模式(中心协调)或去中心化模式(任务交接)的多agents系统。安全机制基于分层防护体系,结合PII过滤、内容审核和人工干预,确保系统安全可控。实施层面强调基于小规模验证和持续迭代,最终实现智能工作流的自动化部署。指南为团队提供从理论到实践的完整开发路径。


获取OpenAI《构建 Agents 实用指南》 PDF原文件,扫码关注回复: 20250421
引言
大语言模型(LLM)正日益擅长处理复杂的多步骤任务。推理能力、多模态和工具使用的进步催生一类新型的LLM驱动系统——agents。
本指南专为探索如何构建首个agents的产品和工程团队设计,汇集众多客户部署经验,提炼出实用且可操作的最佳实践。内容包括识别潜在用例的框架、设计agents逻辑与编排的清晰模式,及确保agents安全、可预测且高效运行的实践方法。
阅读本指南后,您将掌握构建首个agents所需的基础知识。
什么是agents?
传统软件帮助用户简化和自动化工作流,而agents能够用高度独立性代表用户执行相同的工作流。
agents是能独立完成任务目标的系统。工作流是为实现用户目标必须执行的一系列步骤,例如解决客户服务问题、预订餐厅、提交代码变更或生成报告。
仅集成LLM但未用其控制工作流执行的应用程序(如简单聊天机器人、单轮LLM或情感分类器)不属于agents。
具体而言,agents具备以下核心特性,使其能可靠且一致地代表用户行动:
- 01 基于LLM管理工作流执行并做出决策。它能识别工作流何时完成,并在需要时主动纠正行为。若失败,可停止执行并将控制权交还用户。
- 02 通过工具与外部系统交互(获取上下文或执行操作),根据工作流当前状态动态选择合适工具,始终在明确定义的防护机制下运行。
何时应构建agents?
构建agents需重新思考系统如何决策和处理复杂性。与传统自动化不同,agents特别适合传统基于规则的方法难以应对的工作流。
以支付欺诈分析为例:传统规则引擎像检查清单,根据预设条件标记交易;而LLM agents更像经验丰富的调查员,评估上下文、识别微妙模式,即使规则未明确违反也能发现可疑活动。这种细致推理能力使agents能有效处理复杂模糊的场景。
评估agents价值时,优先考虑以下场景:
- 01 复杂决策:涉及微妙判断、例外或上下文敏感决策的工作流,如客服中的退款审批。
- 02 难以维护的规则:因规则复杂导致更新成本高或易出错的系统,如供应商安全审查。
- 03 依赖非结构化数据:需理解自然语言、从文档提取信息或对话交互的场景,如家庭保险索赔处理。
在决定构建agents前,请确认用例明确符合这些标准。
agents设计基础
agents最基本形式包含三个核心组件:
- 01 模型:驱动agents推理和决策的LLM。
- 02 工具:agents执行操作的外部函数或API 。
- 03 指令 :定义agents行为的明确指南和防护机制 。
以下是使用OpenAIAgents SDK时的代码示例(其他库或从头实现同理):

模型选择
不同模型在任务复杂度、延迟和成本上各有优劣。如后续“编排”章节所述,可针对工作流中不同任务使用多种模型。
并非所有任务都需要最强大的模型——简单检索或意图分类任务可由更小更快的模型处理,而退款审批等复杂任务可能需要更强模型。
推荐先用最强模型建立性能基线,再尝试替换为小模型观察效果。这样既不会过早限制agents能力,也能诊断小模型的适用性。
模型选择原则总结:
- 建立评估基准。
- 优先用最佳模型满足准确率目标。
- 在可能处用小模型优化成本和延迟。
完整模型选择参见OpenAI模型选择文档。
工具定义
工具基于底层系统API扩展agents能力。对无API的遗留系统,agents可通过计算机使用模型直接与Web/应用UI交互(仿人类操作)。
每个工具应有标准化定义,支持工具与agents间的灵活多对多关系。文档完善、测试充分的可复用工具能提升可发现性,简化版本管理,避免重复定义。
agents需要三类工具:
类型 | 描述 | 示例 |
---|---|---|
数据工具 | 获取工作流所需的上下文和信息 | 查询交易数据库/CRM、读取PDF、网络搜索 |
行动工具 | 在系统中执行操作 | 发送邮件/短信、更新CRM记录、转接人工客服 |
编排工具 | agents本身可作为其他agents的工具(见“编排”章节的管理者模式) | 退款agents、研究agents、写作agents |
发表评论