有关具备查询执行、错误纠正和验证功能的完整SQL智能体示例,请参阅我们的SQL智能体教程。本教程重点介绍渐进式披露模式,该模式可应用于任何领域。
工作原理
以下是用户请求SQL查询时的流程: 为什么使用渐进式披露:- 减少上下文使用 - 仅加载任务所需的2-3个技能,而非所有可用技能
- 实现团队自主性 - 不同团队可以独立开发专门技能(类似于其他多智能体架构)
- 高效扩展 - 添加数十或数百个技能而不会使上下文不堪重负
- 简化对话历史 - 单个智能体,单一对话线程
- 延迟:按需加载技能需要额外的工具调用,这会增加每个技能首次请求的延迟
- 工作流控制:基本实现依赖提示来指导技能使用 - 无法在没有自定义逻辑的情况下强制执行硬约束,如“始终先尝试技能A再尝试技能B”
设置
安装
本教程需要langchain 包:
LangSmith
设置 LangSmith 以检查智能体内部发生的情况。然后设置以下环境变量:选择LLM
从LangChain的集成套件中选择一个聊天模型:- OpenAI
- Anthropic
- Azure
- Google Gemini
- Bedrock Converse
1. 定义技能
首先,定义技能的结构。每个技能都有一个名称、一个简短描述(显示在系统提示中)和完整内容(按需加载):查看完整技能定义
查看完整技能定义
2. 创建技能加载工具
创建一个工具,用于按需加载完整的技能内容:load_skill 工具将完整的技能内容作为字符串返回,该字符串成为对话的一部分(作为ToolMessage)。有关创建和使用工具的更多详情,请参阅工具指南。
3. 构建技能中间件
创建自定义中间件,将技能描述注入系统提示。此中间件使技能可被发现,而无需预先加载其完整内容。本指南演示了如何创建自定义中间件。有关中间件概念和模式的全面指南,请参阅自定义中间件文档。
load_skill 工具注册为类变量,使其可供智能体使用。
生产环境考虑:本教程为简单起见在
__init__ 中加载技能列表。在生产系统中,您可能希望在 before_agent 钩子中加载技能,以便定期刷新以反映最新更改(例如,添加新技能或修改现有技能时)。详情请参阅before_agent钩子文档。4. 创建支持技能的智能体
现在创建具备技能中间件和用于状态持久化的检查点的智能体:load_skill 来检索完整的技能内容。检查点维护跨轮次的对话历史。
5. 测试渐进式披露
使用需要特定技能知识的问题测试智能体:load_skill("sales_analytics") 获取完整的模式和业务逻辑,然后使用该信息编写了一个遵循数据库规范的正确查询。
6. 高级:使用自定义状态添加约束
可选:跟踪已加载的技能并强制工具约束
可选:跟踪已加载的技能并强制工具约束
您可以添加约束,以确保某些工具仅在特定技能加载后才可用。这需要跟踪自定义智能体状态中已加载的技能。创建注册了受约束工具的智能体:现在,如果智能体在加载所需技能之前尝试使用
定义自定义状态
首先,扩展智能体状态以跟踪已加载的技能:更新 load_skill 以修改状态
修改load_skill 工具,以便在技能加载时更新状态:创建受约束的工具
创建一个仅在特定技能加载后才可用的工具:更新中间件和智能体
更新中间件以使用自定义状态模式:write_sql_query,它将收到一条错误消息,提示它先加载相应的技能(例如 sales_analytics 或 inventory_management)。这确保了智能体在尝试验证查询之前具备必要的模式知识。完整示例
查看完整可运行脚本
查看完整可运行脚本
以下是结合本教程所有部分的完整、可运行的实现:此完整示例包括:
- 包含完整数据库模式的技能定义
- 用于按需加载的
load_skill工具 - 将技能描述注入系统提示的
SkillMiddleware - 使用中间件和检查点创建智能体
- 展示智能体如何加载技能和编写SQL查询的示例用法
- 安装所需包:
pip install langchain langchain-openai langgraph - 设置您的API密钥(例如,
export OPENAI_API_KEY=...) - 将模型初始化替换为您首选的LLM提供商
实现变体
查看实现选项和权衡
查看实现选项和权衡
本教程将技能实现为通过工具调用加载的内存Python字典。但是,有几种方法可以使用技能实现渐进式披露:存储后端:
- 内存(本教程):技能定义为Python数据结构,访问速度快,无I/O开销
- 文件系统(Claude Code方法):技能作为目录和文件,通过
read_file等文件操作发现 - 远程存储:技能存储在S3、数据库、Notion或API中,按需获取
- 系统提示列表:系统提示中的技能描述(本教程使用)
- 基于文件:通过扫描目录发现技能(Claude Code方法)
- 基于注册表:查询技能注册服务或API以获取可用技能
- 动态查找:通过工具调用列出可用技能
- 单次加载:在一次工具调用中加载整个技能内容(本教程使用)
- 分页:对于大型技能,分多个页面/块加载技能内容
- 基于搜索:在特定技能内容中搜索相关部分(例如,使用grep/read操作技能文件)
- 分层:首先加载技能概览,然后深入特定子部分
- 小型技能(< 1K tokens / ~750词):可以直接包含在系统提示中,并通过提示缓存进行缓存以节省成本并加快响应速度
- 中型技能(1-10K tokens / ~750-7.5K词):受益于按需加载以避免上下文开销(本教程)
- 大型技能(> 10K tokens / ~7.5K词,或 > 上下文窗口的5-10%):应使用渐进式披露技术,如分页、基于搜索的加载或分层探索,以避免消耗过多上下文
渐进式披露与上下文工程
结合少样本提示和其他技术
结合少样本提示和其他技术
渐进式披露从根本上说是一种**上下文工程技术** - 您正在管理哪些信息可供智能体使用以及何时使用。本教程重点介绍加载数据库模式,但相同的原则适用于其他类型的上下文。
结合少样本提示
对于SQL查询用例,您可以扩展渐进式披露以动态加载与用户查询匹配的少样本示例:示例方法:- 用户询问:“查找6个月未下单的客户”
- 智能体加载
sales_analytics模式(如本教程所示) - 智能体还加载2-3个相关示例查询(通过语义搜索或基于标签的查找):
- 查找不活跃客户的查询
- 带有基于日期过滤的查询
- 连接客户和订单表的查询
- 智能体使用模式知识和示例模式编写查询
后续步骤
- 了解中间件以实现更动态的智能体行为
- 探索上下文工程技术以管理智能体上下文
- 探索交接模式用于顺序工作流
- 阅读子智能体模式用于并行任务路由
- 查看多智能体模式了解其他专门智能体方法
- 使用 LangSmith 调试和监控技能加载
将这些文档连接到Claude、VSCode等,通过MCP获取实时答案。

