OpenAI《智能体构建实用手册》(PDF下载) - 全面AI学习资料与教程

《构建Agents实用指南》阐述了基于大语言模型(LLM)的Agents开发框架。Agents作为能独立执行多步骤工作流的AI系统,基于动态决策、工具调用和错误恢复能力,特别适用于客服审批、欺诈检测等传统规则难以处理的复杂场景。核心架构包含三大要素,根据任务复杂度选择的LLM模型、分类为数据/操作/编排的工具系统及结构化指令设计。指南提出渐进式开发策略,从单agent模式起步,必要时扩展至管理者模式(中心协调)或去中心化模式(任务交接)的多agents系统。安全机制基于分层防护体系,结合PII过滤、内容审核和人工干预,确保系统安全可控。实施层面强调基于小规模验证和持续迭代,最终实现智能工作流的自动化部署。指南为团队提供从理论到实践的完整开发路径。

构建agents实用指南

 

获取OpenAI《构建 Agents 实用指南》  PDF原文件,扫码关注回复: 20250421

引言

大语言模型(LLM)正日益擅长处理复杂的多步骤任务。推理能力、多模态和工具使用的进步催生一类新型的LLM驱动系统——agents。

本指南专为探索如何构建首个agents的产品和工程团队设计,汇集众多客户部署经验,提炼出实用且可操作的最佳实践。内容包括识别潜在用例的框架、设计agents逻辑与编排的清晰模式,及确保agents安全、可预测且高效运行的实践方法。

阅读本指南后,您将掌握构建首个agents所需的基础知识。

什么是agents?

传统软件帮助用户简化和自动化工作流,而agents能够用高度独立性代表用户执行相同的工作流。

agents是能独立完成任务目标的系统。工作流是为实现用户目标必须执行的一系列步骤,例如解决客户服务问题、预订餐厅、提交代码变更或生成报告。

仅集成LLM但未用其控制工作流执行的应用程序(如简单聊天机器人、单轮LLM或情感分类器)不属于agents。

具体而言,agents具备以下核心特性,使其能可靠且一致地代表用户行动:

  • 01 基于LLM管理工作流执行并做出决策。它能识别工作流何时完成,并在需要时主动纠正行为。若失败,可停止执行并将控制权交还用户。
  • 02 通过工具与外部系统交互(获取上下文或执行操作),根据工作流当前状态动态选择合适工具,始终在明确定义的防护机制下运行。

何时应构建agents?

构建agents需重新思考系统如何决策和处理复杂性。与传统自动化不同,agents特别适合传统基于规则的方法难以应对的工作流。

以支付欺诈分析为例:传统规则引擎像检查清单,根据预设条件标记交易;而LLM agents更像经验丰富的调查员,评估上下文、识别微妙模式,即使规则未明确违反也能发现可疑活动。这种细致推理能力使agents能有效处理复杂模糊的场景。

评估agents价值时,优先考虑以下场景:

  • 01 复杂决策:涉及微妙判断、例外或上下文敏感决策的工作流,如客服中的退款审批。
  • 02 难以维护的规则:因规则复杂导致更新成本高或易出错的系统,如供应商安全审查。
  • 03 依赖非结构化数据:需理解自然语言、从文档提取信息或对话交互的场景,如家庭保险索赔处理。

在决定构建agents前,请确认用例明确符合这些标准。

agents设计基础

agents最基本形式包含三个核心组件:

  • 01 模型:驱动agents推理和决策的LLM。
  • 02 工具:agents执行操作的外部函数或API 。
  • 03 指令 :定义agents行为的明确指南和防护机制 。

以下是使用OpenAIAgents SDK时的代码示例(其他库或从头实现同理):

a-practical-guide-to-building-agents

模型选择

不同模型在任务复杂度、延迟和成本上各有优劣。如后续“编排”章节所述,可针对工作流中不同任务使用多种模型。

并非所有任务都需要最强大的模型——简单检索或意图分类任务可由更小更快的模型处理,而退款审批等复杂任务可能需要更强模型。

推荐先用最强模型建立性能基线,再尝试替换为小模型观察效果。这样既不会过早限制agents能力,也能诊断小模型的适用性。

模型选择原则总结:

  • 建立评估基准。
  • 优先用最佳模型满足准确率目标。
  • 在可能处用小模型优化成本和延迟。

完整模型选择参见OpenAI模型选择文档。

工具定义

工具基于底层系统API扩展agents能力。对无API的遗留系统,agents可通过计算机使用模型直接与Web/应用UI交互(仿人类操作)。

每个工具应有标准化定义,支持工具与agents间的灵活多对多关系。文档完善、测试充分的可复用工具能提升可发现性,简化版本管理,避免重复定义。

agents需要三类工具:

类型描述示例
数据工具获取工作流所需的上下文和信息查询交易数据库/CRM、读取PDF、网络搜索
行动工具在系统中执行操作发送邮件/短信、更新CRM记录、转接人工客服
编排工具agents本身可作为其他agents的工具(见“编排”章节的管理者模式)退款agents、研究agents、写作agents

发表评论