OpenAI《智能体构建实用手册》（PDF下载） - 全面AI学习资料与教程

《构建Agents实用指南》阐述了基于大语言模型（LLM）的Agents开发框架。Agents作为能独立执行多步骤工作流的AI系统，基于动态决策、工具调用和错误恢复能力，特别适用于客服审批、欺诈检测等传统规则难以处理的复杂场景。核心架构包含三大要素，根据任务复杂度选择的LLM模型、分类为数据/操作/编排的工具系统及结构化指令设计。指南提出渐进式开发策略，从单agent模式起步，必要时扩展至管理者模式（中心协调）或去中心化模式（任务交接）的多agents系统。安全机制基于分层防护体系，结合PII过滤、内容审核和人工干预，确保系统安全可控。实施层面强调基于小规模验证和持续迭代，最终实现智能工作流的自动化部署。指南为团队提供从理论到实践的完整开发路径。

获取OpenAI《构建 Agents 实用指南》 PDF原文件，扫码关注回复： 20250421

引言

大语言模型（LLM）正日益擅长处理复杂的多步骤任务。推理能力、多模态和工具使用的进步催生一类新型的LLM驱动系统——agents。

本指南专为探索如何构建首个agents的产品和工程团队设计，汇集众多客户部署经验，提炼出实用且可操作的最佳实践。内容包括识别潜在用例的框架、设计agents逻辑与编排的清晰模式，及确保agents安全、可预测且高效运行的实践方法。

阅读本指南后，您将掌握构建首个agents所需的基础知识。

什么是agents？

传统软件帮助用户简化和自动化工作流，而agents能够用高度独立性代表用户执行相同的工作流。

agents是能独立完成任务目标的系统。工作流是为实现用户目标必须执行的一系列步骤，例如解决客户服务问题、预订餐厅、提交代码变更或生成报告。

仅集成LLM但未用其控制工作流执行的应用程序（如简单聊天机器人、单轮LLM或情感分类器）不属于agents。

具体而言，agents具备以下核心特性，使其能可靠且一致地代表用户行动：

01 基于LLM管理工作流执行并做出决策。它能识别工作流何时完成，并在需要时主动纠正行为。若失败，可停止执行并将控制权交还用户。
02 通过工具与外部系统交互（获取上下文或执行操作），根据工作流当前状态动态选择合适工具，始终在明确定义的防护机制下运行。

何时应构建agents？

构建agents需重新思考系统如何决策和处理复杂性。与传统自动化不同，agents特别适合传统基于规则的方法难以应对的工作流。

以支付欺诈分析为例：传统规则引擎像检查清单，根据预设条件标记交易；而LLM agents更像经验丰富的调查员，评估上下文、识别微妙模式，即使规则未明确违反也能发现可疑活动。这种细致推理能力使agents能有效处理复杂模糊的场景。

评估agents价值时，优先考虑以下场景：

01 复杂决策：涉及微妙判断、例外或上下文敏感决策的工作流，如客服中的退款审批。
02 难以维护的规则：因规则复杂导致更新成本高或易出错的系统，如供应商安全审查。
03 依赖非结构化数据：需理解自然语言、从文档提取信息或对话交互的场景，如家庭保险索赔处理。

在决定构建agents前，请确认用例明确符合这些标准。

agents设计基础

agents最基本形式包含三个核心组件：

01 模型：驱动agents推理和决策的LLM。
02 工具：agents执行操作的外部函数或API 。
03 指令 ：定义agents行为的明确指南和防护机制。

以下是使用OpenAIAgents SDK时的代码示例（其他库或从头实现同理）：

模型选择

不同模型在任务复杂度、延迟和成本上各有优劣。如后续“编排”章节所述，可针对工作流中不同任务使用多种模型。

并非所有任务都需要最强大的模型——简单检索或意图分类任务可由更小更快的模型处理，而退款审批等复杂任务可能需要更强模型。

推荐先用最强模型建立性能基线，再尝试替换为小模型观察效果。这样既不会过早限制agents能力，也能诊断小模型的适用性。

模型选择原则总结：

建立评估基准。
优先用最佳模型满足准确率目标。
在可能处用小模型优化成本和延迟。

完整模型选择参见OpenAI模型选择文档。

工具定义

工具基于底层系统API扩展agents能力。对无API的遗留系统，agents可通过计算机使用模型直接与Web/应用UI交互（仿人类操作）。

每个工具应有标准化定义，支持工具与agents间的灵活多对多关系。文档完善、测试充分的可复用工具能提升可发现性，简化版本管理，避免重复定义。

agents需要三类工具：

类型	描述	示例
数据工具	获取工作流所需的上下文和信息	查询交易数据库/CRM、读取PDF、网络搜索
行动工具	在系统中执行操作	发送邮件/短信、更新CRM记录、转接人工客服
编排工具	agents本身可作为其他agents的工具（见“编排”章节的管理者模式）	退款agents、研究agents、写作agents