LangChain 和 Deep Agents 为常见用例提供了预构建中间件。每个中间件都已达到生产就绪状态,并可根据您的特定需求进行配置。
与提供商无关的中间件
以下中间件可与任何 LLM 提供商配合使用:
| 中间件 | 描述 |
|---|
| 摘要 | 在接近令牌限制时自动总结对话历史。 |
| [Human in the Loop](#Human in the Loop) | 暂停执行以等待人工批准工具调用。 |
| 模型调用限制 | 限制模型调用次数以防止成本过高。 |
| 工具调用限制 | 通过限制调用次数来控制工具执行。 |
| 模型回退 | 当主模型失败时自动回退到备用模型。 |
| PII 检测 | 检测和处理个人身份信息 (PII)。 |
| 待办事项列表 | 为智能体配备任务规划和跟踪功能。 |
| LLM 工具选择器 | 在调用主模型之前使用 LLM 选择相关工具。 |
| 工具重试 | 使用指数退避自动重试失败的工具调用。 |
| 模型重试 | 使用指数退避自动重试失败的模型调用。 |
| LLM 工具模拟器 | 使用 LLM 模拟工具执行以用于测试目的。 |
| 上下文编辑 | 通过修剪或清除工具使用来管理对话上下文。 |
| 文件系统 | 为智能体提供用于存储上下文和长期记忆的文件系统。 |
| 子智能体中间件 | 添加生成子智能体的能力。 |
在接近令牌限制时自动总结对话历史,保留最近的消息同时压缩较旧的上下文。摘要对于以下情况很有用:
- 超出上下文窗口的长时间运行对话。
- 具有大量历史记录的多轮对话。
- 保留完整对话上下文很重要的应用程序。
import { createAgent, summarizationMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [weatherTool, calculatorTool],
middleware: [
summarizationMiddleware({
model: "gpt-5.4-mini",
trigger: { tokens: 4000 },
keep: { messages: 20 },
}),
],
});
Human in the Loop
暂停智能体执行,以便在工具调用执行前进行人工批准、编辑或拒绝。Human in the Loop对于以下情况很有用:
- 需要人工批准的高风险操作(例如数据库写入、金融交易)。
- 需要人工监督的合规工作流程。
- 人工反馈指导智能体的长时间运行对话。
Human in the
Loop中间件需要一个检查点来在中断期间维护状态。
import { createAgent, humanInTheLoopMiddleware } from "langchain";
function readEmailTool(emailId: string): string {
/** 模拟通过 ID 读取电子邮件的函数。 */
return `Email content for ID: ${emailId}`;
}
function sendEmailTool(
recipient: string,
subject: string,
body: string,
): string {
/** 模拟发送电子邮件的函数。 */
return `Email sent to ${recipient} with subject '${subject}'`;
}
const agent = createAgent({
model: "gpt-5.4",
tools: [readEmailTool, sendEmailTool],
middleware: [
humanInTheLoopMiddleware({
interruptOn: {
sendEmailTool: {
allowedDecisions: ["approve", "edit", "reject"],
},
readEmailTool: false,
},
}),
],
});
观看此视频指南演示Human in the
Loop中间件的行为。
模型调用限制
限制模型调用次数以防止无限循环或成本过高。模型调用限制对于以下情况很有用:
- 防止失控的智能体进行过多的 API 调用。
- 对生产部署实施成本控制。
- 在特定调用预算内测试智能体行为。
import { createAgent, modelCallLimitMiddleware } from "langchain";
import { MemorySaver } from "@langchain/langgraph";
const agent = createAgent({
model: "gpt-5.4",
checkpointer: new MemorySaver(), // 线程限制所需
tools: [],
middleware: [
modelCallLimitMiddleware({
threadLimit: 10,
runLimit: 5,
exitBehavior: "end",
}),
],
});
达到限制时的行为。选项:'end'(优雅终止)或 'error'(抛出异常)
工具调用限制
通过限制工具调用次数来控制智能体执行,可以全局限制所有工具,也可以针对特定工具。工具调用限制对于以下情况很有用:
- 防止对昂贵的外部 API 进行过多调用。
- 限制网络搜索或数据库查询。
- 对特定工具使用实施速率限制。
- 防止智能体循环失控。
import { createAgent, toolCallLimitMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, databaseTool],
middleware: [
toolCallLimitMiddleware({ threadLimit: 20, runLimit: 10 }),
toolCallLimitMiddleware({
toolName: "search",
threadLimit: 5,
runLimit: 3,
}),
],
});
要限制的特定工具的名称。如果未提供,限制将全局应用于所有工具。
线程(对话)中所有运行的最大工具调用次数。使用相同线程 ID
的多次调用会持续存在。需要检查点来维护状态。undefined 表示无线程限制。
单次调用(一个用户消息 → 响应周期)的最大工具调用次数。每次新用户消息时重置。undefined 表示无运行限制。注意: 必须至少指定 threadLimit 或 runLimit 中的一个。
达到限制时的行为:
'continue'(默认)- 用错误消息阻止超出的工具调用,让其他工具和模型继续。模型根据错误消息决定何时结束。
'error' - 抛出 ToolCallLimitExceededError 异常,立即停止执行
'end' - 立即停止执行,并为超出的工具调用提供 ToolMessage 和 AI 消息。仅在限制单个工具时有效;如果其他工具有待处理的调用,则会抛出错误。
使用以下方式指定限制:
- 线程限制 - 对话中所有运行的最大调用次数(需要检查点)
- 运行限制 - 单次调用的最大调用次数(每轮重置)
退出行为:
'continue'(默认)- 用错误消息阻止超出的调用,智能体继续
'error' - 立即引发异常
'end' - 用 ToolMessage + AI 消息停止(仅限单工具场景)
import { createAgent, toolCallLimitMiddleware } from "langchain";
const globalLimiter = toolCallLimitMiddleware({
threadLimit: 20,
runLimit: 10,
});
const searchLimiter = toolCallLimitMiddleware({
toolName: "search",
threadLimit: 5,
runLimit: 3,
});
const databaseLimiter = toolCallLimitMiddleware({
toolName: "query_database",
threadLimit: 10,
});
const strictLimiter = toolCallLimitMiddleware({
toolName: "scrape_webpage",
runLimit: 2,
exitBehavior: "error",
});
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, databaseTool, scraperTool],
middleware: [globalLimiter, searchLimiter, databaseLimiter, strictLimiter],
});
模型回退
当主模型失败时自动回退到备用模型。模型回退对于以下情况很有用:
- 构建能够处理模型中断的弹性智能体。
- 通过回退到更便宜的模型来优化成本。
- 跨 OpenAI、Anthropic 等的提供商冗余。
import { createAgent, modelFallbackMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
modelFallbackMiddleware("gpt-5.4-mini", "claude-3-5-sonnet-20241022"),
],
});
该中间件接受可变数量的字符串参数,表示按顺序排列的备用模型:一个或多个备用模型字符串,当主模型失败时按顺序尝试modelFallbackMiddleware(
"first-fallback-model",
"second-fallback-model",
// ... 更多模型
);
PII 检测
使用可配置的策略检测和处理对话中的个人身份信息 (PII)。PII 检测对于以下情况很有用:
- 具有合规要求的医疗保健和金融应用程序。
- 需要清理日志的客户服务智能体。
- 任何处理敏感用户数据的应用程序。
import { createAgent, piiMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
piiMiddleware("email", { strategy: "redact", applyToInput: true }),
piiMiddleware("credit_card", { strategy: "mask", applyToInput: true }),
],
});
自定义 PII 类型
您可以通过提供 detector 参数来创建自定义 PII 类型。这允许您检测超出内置类型的、特定于您用例的模式。
创建自定义检测器的三种方式:
-
正则表达式模式字符串 - 简单的模式匹配
-
RegExp 对象 - 对正则表达式标志有更多控制
-
自定义函数 - 带有验证的复杂检测逻辑
import { createAgent, piiMiddleware, type PIIMatch } from "langchain";
// 方法 1:正则表达式模式字符串
const agent1 = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
piiMiddleware("api_key", {
detector: "sk-[a-zA-Z0-9]{32}",
strategy: "block",
}),
],
});
// 方法 2:RegExp 对象
const agent2 = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
piiMiddleware("phone_number", {
detector: /\+?\d{1,3}[\s.-]?\d{3,4}[\s.-]?\d{4}/,
strategy: "mask",
}),
],
});
// 方法 3:自定义检测器函数
function detectSSN(content: string): PIIMatch[] {
const matches: PIIMatch[] = [];
const pattern = /\d{3}-\d{2}-\d{4}/g;
let match: RegExpExecArray | null;
while ((match = pattern.exec(content)) !== null) {
const ssn = match[0];
// 验证:前 3 位数字不应为 000、666 或 900-999
const firstThree = parseInt(ssn.substring(0, 3), 10);
if (
firstThree !== 0 &&
firstThree !== 666 &&
!(firstThree >= 900 && firstThree <= 999)
) {
matches.push({
text: ssn,
start: match.index ?? 0,
end: (match.index ?? 0) + ssn.length,
});
}
}
return matches;
}
const agent3 = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
piiMiddleware("ssn", {
detector: detectSSN,
strategy: "hash",
}),
],
});
自定义检测器函数签名:
检测器函数必须接受一个字符串(内容)并返回匹配项:
返回 PIIMatch 对象数组:
interface PIIMatch {
text: string; // 匹配的文本
start: number; // 内容中的起始索引
end: number; // 内容中的结束索引
}
function detector(content: string): PIIMatch[] {
return [
{ text: "matched_text", start: 0, end: 12 },
// ... 更多匹配项
];
}
对于自定义检测器:
- 对于简单模式使用正则表达式字符串
- 当需要标志(例如不区分大小写的匹配)时使用 RegExp 对象
- 当需要超出模式匹配的验证逻辑时使用自定义函数
- 自定义函数让您完全控制检测逻辑,并可以实现复杂的验证规则
要检测的 PII
类型。可以是内置类型(email、credit_card、ip、mac_address、url)或自定义类型名称。
如何处理检测到的 PII。选项:
'block' - 检测到时抛出错误
'redact' - 替换为 [REDACTED_TYPE]
'mask' - 部分遮盖(例如 ****-****-****-1234)
'hash' - 替换为确定性哈希(例如 <email_hash:a1b2c3d4>)
detector
RegExp | string | function
自定义检测器。可以是:
RegExp - 用于匹配的正则表达式模式
string - 正则表达式模式字符串(例如 "sk-[a-zA-Z0-9]{32}")
function - 自定义检测器函数 (content: string) => PIIMatch[]
如果未提供,则使用该 PII 类型的内置检测器。
待办事项列表
为智能体配备任务规划和跟踪功能,以处理复杂的多步骤任务。待办事项列表对于以下情况很有用:
- 需要跨多个工具协调的复杂多步骤任务。
- 进度可见性很重要的长时间运行操作。
此中间件自动为智能体提供 write_todos 工具和系统提示,以指导有效的任务规划。
import { createAgent, todoListMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [readFile, writeFile, runTests],
middleware: [todoListMiddleware()],
});
无可用配置选项(使用默认值)。
LLM 工具选择器
在调用主模型之前使用 LLM 智能地选择相关工具。LLM 工具选择器对于以下情况很有用:
- 具有许多工具(10+)的智能体,其中大多数与每个查询无关。
- 通过过滤不相关的工具来减少令牌使用量。
- 提高模型的专注度和准确性。
此中间件使用结构化输出来询问 LLM 哪些工具与当前查询最相关。结构化输出模式定义了可用的工具名称和描述。模型提供商通常会在幕后将此结构化输出信息添加到系统提示中。
import { createAgent, llmToolSelectorMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [tool1, tool2, tool3, tool4, tool5, ...],
middleware: [
llmToolSelectorMiddleware({
model: "gpt-5.4-mini",
maxTools: 3,
alwaysInclude: ["search"],
}),
],
});
用于工具选择的模型。可以是模型标识符字符串(例如 'openai:gpt-5.4-mini')或
BaseChatModel 实例。默认为智能体的主模型。
要选择的最大工具数。如果模型选择更多,则仅使用前 maxTools
个。如果未指定,则无限制。
无论选择如何都始终包含的工具名称。这些不计入 maxTools 限制。
工具重试
使用可配置的指数退避自动重试失败的工具调用。工具重试对于以下情况很有用:
- 处理外部 API 调用中的瞬时故障。
- 提高依赖网络的工具的可靠性。
- 构建能够优雅处理临时错误的弹性智能体。
API 参考: toolRetryMiddleware
import { createAgent, toolRetryMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, databaseTool],
middleware: [
toolRetryMiddleware({
maxRetries: 3,
backoffFactor: 2.0,
initialDelayMs: 1000,
}),
],
});
初始调用后的最大重试次数(默认为 3 次总尝试)。必须 >= 0。
tools
(ClientTool | ServerTool | string)[]
可选的工具或工具名称数组,用于应用重试逻辑。可以是 BaseTool
实例列表或工具名称字符串。如果为 undefined,则应用于所有工具。
retryOn
((error: Error) => boolean) | (new (...args: any[]) => Error)[]
default:"() => true"
要重试的错误构造函数数组,或一个函数,该函数接受一个错误并在应重试时返回
true。默认为在所有错误上重试。
onFailure
'error' | 'continue' | ((error: Error) => string)
default:"continue"
所有重试耗尽时的行为。选项:
'continue'(默认)- 返回包含错误详情的 ToolMessage,允许 LLM 处理故障并可能恢复
'error' - 重新引发异常,停止智能体执行
- 自定义函数 - 接受异常并返回
ToolMessage 内容字符串的函数,允许自定义错误格式
已弃用的值: 'raise'(改用 'error')和 'return_message'(改用 'continue')。这些已弃用的值仍然有效,但会显示警告。 指数退避的乘数。每次重试等待 initialDelayMs * (backoffFactor ** retryNumber) 毫秒。设置为 0.0 表示恒定延迟。必须 >= 0。
重试之间的最大延迟(毫秒)(限制指数退避增长)。必须 >= 0。
是否向延迟添加随机抖动 (±25%) 以避免惊群效应
该中间件使用指数退避自动重试失败的工具调用。关键配置:
maxRetries - 重试次数(默认:2)
backoffFactor - 指数退避的乘数(默认:2.0)
initialDelayMs - 起始延迟(毫秒)(默认:1000ms)
maxDelayMs - 延迟增长上限(默认:60000ms)
jitter - 添加随机变化(默认:true)
故障处理:
onFailure: "continue"(默认)- 返回错误消息
onFailure: "error" - 重新引发异常
- 自定义函数 - 返回错误消息的函数
import { createAgent, toolRetryMiddleware } from "langchain";
import { tool } from "@langchain/core/tools";
import { z } from "zod";
// 使用默认设置的基本用法(2 次重试,指数退避)
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, databaseTool],
middleware: [toolRetryMiddleware()],
});
// 仅重试特定异常
const retry = toolRetryMiddleware({
maxRetries: 4,
retryOn: [TimeoutError, NetworkError],
backoffFactor: 1.5,
});
// 自定义异常过滤
function shouldRetry(error: Error): boolean {
// 仅在 5xx 错误上重试
if (error.name === "HTTPError" && "statusCode" in error) {
const statusCode = (error as any).statusCode;
return 500 <= statusCode && statusCode < 600;
}
return false;
}
const retryWithFilter = toolRetryMiddleware({
maxRetries: 3,
retryOn: shouldRetry,
});
// 应用于特定工具并自定义错误处理
const formatError = (error: Error) => "数据库暂时不可用。请稍后重试。";
const retrySpecificTools = toolRetryMiddleware({
maxRetries: 4,
tools: ["search_database"],
onFailure: formatError,
});
// 使用 BaseTool 实例应用于特定工具
const searchDatabase = tool(
async ({ query }) => {
// 搜索实现
return results;
},
{
name: "search_database",
description: "搜索数据库",
schema: z.object({ query: z.string() }),
},
);
const retryWithToolInstance = toolRetryMiddleware({
maxRetries: 4,
tools: [searchDatabase], // 传递 BaseTool 实例
});
// 恒定退避(无指数增长)
const constantBackoff = toolRetryMiddleware({
maxRetries: 5,
backoffFactor: 0.0, // 无指数增长
initialDelayMs: 2000, // 始终等待 2 秒
});
// 失败时引发异常
const strictRetry = toolRetryMiddleware({
maxRetries: 2,
onFailure: "error", // 重新引发异常而不是返回消息
});
模型重试
使用可配置的指数退避自动重试失败的模型调用。模型重试对于以下情况很有用:
- 处理模型 API 调用中的瞬时故障。
- 提高依赖网络的模型请求的可靠性。
- 构建能够优雅处理临时模型错误的弹性智能体。
API 参考: modelRetryMiddleware
import { createAgent, modelRetryMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, databaseTool],
middleware: [
modelRetryMiddleware({
maxRetries: 3,
backoffFactor: 2.0,
initialDelayMs: 1000,
}),
],
});
初始调用后的最大重试次数(默认为 3 次总尝试)。必须 >= 0。
retryOn
((error: Error) => boolean) | (new (...args: any[]) => Error)[]
default:"() => true"
要重试的错误构造函数数组,或一个函数,该函数接受一个错误并在应重试时返回
true。默认为在所有错误上重试。
onFailure
'error' | 'continue' | ((error: Error) => string)
default:"continue"
所有重试耗尽时的行为。选项: - 'continue'(默认)- 返回包含错误详情的
AIMessage,允许智能体可能优雅地处理故障 - 'error' -
重新引发异常,停止智能体执行 - 自定义函数 - 接受异常并返回 AIMessage
内容字符串的函数,允许自定义错误格式
指数退避的乘数。每次重试等待 initialDelayMs * (backoffFactor ** retryNumber) 毫秒。设置为 0.0 表示恒定延迟。必须 >= 0。
重试之间的最大延迟(毫秒)(限制指数退避增长)。必须 >= 0。
是否向延迟添加随机抖动 (±25%) 以避免惊群效应
该中间件使用指数退避自动重试失败的模型调用。import { createAgent, modelRetryMiddleware } from "langchain";
// 使用默认设置的基本用法(2 次重试,指数退避)
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool],
middleware: [modelRetryMiddleware()],
});
class TimeoutError extends Error {
// ...
}
class NetworkError extends Error {
// ...
}
// 仅重试特定异常
const retry = modelRetryMiddleware({
maxRetries: 4,
retryOn: [TimeoutError, NetworkError],
backoffFactor: 1.5,
});
// 自定义异常过滤
function shouldRetry(error: Error): boolean {
// 仅在速率限制错误上重试
if (error.name === "RateLimitError") {
return true;
}
// 或检查特定的 HTTP 状态码
if (error.name === "HTTPError" && "statusCode" in error) {
const statusCode = (error as any).statusCode;
return statusCode === 429 || statusCode === 503;
}
return false;
}
const retryWithFilter = modelRetryMiddleware({
maxRetries: 3,
retryOn: shouldRetry,
});
// 返回错误消息而不是引发异常
const retryContinue = modelRetryMiddleware({
maxRetries: 4,
onFailure: "continue", // 返回包含错误的 AIMessage 而不是抛出异常
});
// 自定义错误消息格式
const formatError = (error: Error) =>
`模型调用失败:${error.message}。请稍后重试。`;
const retryWithFormatter = modelRetryMiddleware({
maxRetries: 4,
onFailure: formatError,
});
// 恒定退避(无指数增长)
const constantBackoff = modelRetryMiddleware({
maxRetries: 5,
backoffFactor: 0.0, // 无指数增长
initialDelayMs: 2000, // 始终等待 2 秒
});
// 失败时引发异常
const strictRetry = modelRetryMiddleware({
maxRetries: 2,
onFailure: "error", // 重新引发异常而不是返回消息
});
LLM 工具模拟器
使用 LLM 模拟工具执行以用于测试目的,用 AI 生成的响应替换实际的工具调用。LLM 工具模拟器对于以下情况很有用:
- 在不执行真实工具的情况下测试智能体行为。
- 在外部工具不可用或昂贵时开发智能体。
- 在实现实际工具之前原型化智能体工作流程。
import { createAgent, toolEmulatorMiddleware } from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [getWeather, searchDatabase, sendEmail],
middleware: [
toolEmulatorMiddleware(), // 模拟所有工具
],
});
tools
(string | ClientTool | ServerTool)[]
要模拟的工具名称(字符串)或工具实例列表。如果为
undefined(默认),则所有工具都将被模拟。如果为空数组
[],则不会模拟任何工具。如果为包含工具名称/实例的数组,则仅模拟这些工具。
用于生成模拟工具响应的模型。可以是模型标识符字符串(例如
'google_genai:gemini-3.1-pro-preview')或 BaseChatModel
实例。如果未指定,则默认为智能体的模型。
该中间件使用 LLM 为工具调用生成合理的响应,而不是执行实际工具。import { createAgent, toolEmulatorMiddleware, tool } from "langchain";
import * as z from "zod";
const getWeather = tool(async ({ location }) => `${location} 的天气`, {
name: "get_weather",
description: "获取某个位置的当前天气",
schema: z.object({ location: z.string() }),
});
const sendEmail = tool(async ({ to, subject, body }) => "邮件已发送", {
name: "send_email",
description: "发送电子邮件",
schema: z.object({
to: z.string(),
subject: z.string(),
body: z.string(),
}),
});
// 模拟所有工具(默认行为)
const agent = createAgent({
model: "gpt-5.4",
tools: [getWeather, sendEmail],
middleware: [toolEmulatorMiddleware()],
});
// 按名称模拟特定工具
const agent2 = createAgent({
model: "gpt-5.4",
tools: [getWeather, sendEmail],
middleware: [
toolEmulatorMiddleware({
tools: ["get_weather"],
}),
],
});
// 通过传递工具实例模拟特定工具
const agent3 = createAgent({
model: "gpt-5.4",
tools: [getWeather, sendEmail],
middleware: [
toolEmulatorMiddleware({
tools: [getWeather],
}),
],
});
// 使用自定义模型进行模拟
const agent5 = createAgent({
model: "gpt-5.4",
tools: [getWeather, sendEmail],
middleware: [
toolEmulatorMiddleware({
model: "claude-sonnet-4-6",
}),
],
});
上下文编辑
通过在达到令牌限制时清除较旧的工具调用输出来管理对话上下文,同时保留最近的结果。这有助于在具有许多工具调用的长对话中保持上下文窗口的可管理性。上下文编辑对于以下情况很有用:
- 具有许多工具调用且超出令牌限制的长对话
- 通过删除不再相关的较旧工具输出来降低令牌成本
- 仅在上下文中保留最近的 N 个工具结果
import {
createAgent,
contextEditingMiddleware,
ClearToolUsesEdit,
} from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [],
middleware: [
contextEditingMiddleware({
edits: [
new ClearToolUsesEdit({
triggerTokens: 100000,
keep: 3,
}),
],
}),
],
});
edits
ContextEdit[]
default:"[new ClearToolUsesEdit()]"
ClearToolUsesEdit 选项:触发编辑的令牌计数。当对话超过此令牌计数时,较旧的工具输出将被清除。
编辑运行时要回收的最小令牌数。如果设置为 0,则清除所需的所有内容。
是否清除 AI 消息上发起的工具调用参数。当为 true
时,工具调用参数将被替换为空对象。
要排除在清除之外的工具名称列表。这些工具的输出将永远不会被清除。
placeholder
string
default:"[cleared]"
为清除的工具输出插入的占位符文本。这将替换原始工具消息内容。
该中间件在达到令牌限制时应用上下文编辑策略。最常见的策略是 ClearToolUsesEdit,它清除较旧的工具结果,同时保留最近的结果。工作原理:
- 监控对话中的令牌计数
- 达到阈值时,清除较旧的工具输出
- 保留最近的 N 个工具结果
- 可选地保留工具调用参数以获取上下文
import {
createAgent,
contextEditingMiddleware,
ClearToolUsesEdit,
} from "langchain";
const agent = createAgent({
model: "gpt-5.4",
tools: [searchTool, calculatorTool, databaseTool],
middleware: [
contextEditingMiddleware({
edits: [
new ClearToolUsesEdit({
triggerTokens: 2000,
keep: 3,
clearToolInputs: false,
excludeTools: [],
placeholder: "[cleared]",
}),
],
}),
],
});
文件系统中间件
上下文工程是构建有效智能体的主要挑战。当使用返回可变长度结果的工具(例如 web_search 和 RAG)时,这尤其困难,因为较长的工具结果会很快填满您的上下文窗口。
来自 Deep Agents 的 FilesystemMiddleware 提供了四个用于与短期和长期记忆交互的工具:
ls:列出文件系统中的文件
read_file:读取整个文件或文件中的特定行数
write_file:将新文件写入文件系统
edit_file:编辑文件系统中的现有文件
import { createAgent } from "langchain";
import { createFilesystemMiddleware } from "deepagents";
// FilesystemMiddleware 在 createDeepAgent 中默认包含
// 如果构建自定义智能体,您可以自定义它
const agent = createAgent({
model: "claude-sonnet-4-6",
middleware: [
createFilesystemMiddleware({
backend: undefined, // 可选:自定义后端(默认为 StateBackend)
systemPrompt: "当...时写入文件系统", // 可选的自定义系统提示覆盖
customToolDescriptions: {
ls: "当...时使用 ls 工具",
read_file: "使用 read_file 工具来...",
}, // 可选:文件系统工具的自定义描述
}),
],
});
短期与长期文件系统
默认情况下,这些工具写入图状态中的本地“文件系统”。要启用跨线程的持久存储,请配置一个 CompositeBackend,将特定路径(如 /memories/)路由到 StoreBackend。
import { createAgent } from "langchain";
import {
createFilesystemMiddleware,
CompositeBackend,
StateBackend,
StoreBackend,
} from "deepagents";
import { InMemoryStore } from "@langchain/langgraph-checkpoint";
const store = new InMemoryStore();
const agent = createAgent({
model: "claude-sonnet-4-6",
store,
middleware: [
createFilesystemMiddleware({
backend: new CompositeBackend(new StateBackend(), {
"/memories/": new StoreBackend(),
}),
systemPrompt: "当...时写入文件系统", // 可选的自定义系统提示覆盖
customToolDescriptions: {
ls: "当...时使用 ls 工具",
read_file: "使用 read_file 工具来...",
}, // 可选:文件系统工具的自定义描述
}),
],
});
当您为 /memories/ 配置带有 StoreBackend 的 CompositeBackend 时,任何以 /memories/ 为前缀的文件都会保存到持久存储中,并在不同线程间保持。没有此前缀的文件保留在临时状态存储中。
子智能体
将任务交给子智能体可以隔离上下文,保持主(主管)智能体的上下文窗口干净,同时仍然深入处理任务。
来自 Deep Agents 的子智能体中间件允许您通过 task 工具提供子智能体。
import { tool } from "langchain";
import { createAgent } from "langchain";
import { createSubAgentMiddleware } from "deepagents";
import { z } from "zod";
const getWeather = tool(
async ({ city }: { city: string }) => {
return `${city} 的天气晴朗。`;
},
{
name: "get_weather",
description: "获取城市的天气。",
schema: z.object({
city: z.string(),
}),
},
);
const agent = createAgent({
model: "claude-sonnet-4-6",
middleware: [
createSubAgentMiddleware({
defaultModel: "claude-sonnet-4-6",
defaultTools: [],
subagents: [
{
name: "weather",
description: "此子智能体可以获取城市的天气。",
systemPrompt: "使用 get_weather 工具获取城市的天气。",
tools: [getWeather],
model: "gpt-5.4",
middleware: [],
},
],
}),
],
});
子智能体通过名称、描述、系统提示和工具来定义。您还可以为子智能体提供自定义模型或额外的中间件。当您想给子智能体一个与主智能体共享的额外状态键时,这可能特别有用。
对于更复杂的用例,您也可以提供自己的预构建 LangGraph 图作为子智能体。
import { tool, createAgent } from "langchain";
import { createSubAgentMiddleware, type SubAgent } from "deepagents";
import { z } from "zod";
const getWeather = tool(
async ({ city }: { city: string }) => {
return `${city} 的天气晴朗。`;
},
{
name: "get_weather",
description: "获取城市的天气。",
schema: z.object({
city: z.string(),
}),
},
);
const weatherSubagent: SubAgent = {
name: "weather",
description: "此子智能体可以获取城市的天气。",
systemPrompt: "使用 get_weather 工具获取城市的天气。",
tools: [getWeather],
model: "gpt-5.4",
middleware: [],
};
const agent = createAgent({
model: "claude-sonnet-4-6",
middleware: [
createSubAgentMiddleware({
defaultModel: "claude-sonnet-4-6",
defaultTools: [],
subagents: [weatherSubagent],
}),
],
});
除了任何用户定义的子智能体外,主智能体始终可以访问一个 general-purpose 子智能体。此子智能体具有与主智能体相同的指令和所有可访问的工具。general-purpose 子智能体的主要目的是上下文隔离——主智能体可以将复杂任务委托给此子智能体,并获得简洁的答案,而不会因中间工具调用而膨胀。
特定于提供商的中间件
这些中间件针对特定的 LLM 提供商进行了优化。有关完整详情和示例,请参阅每个提供商的文档。
Anthropic
用于 Claude 模型的提示缓存、bash 工具、文本编辑器、记忆和文件搜索中间件。
将这些文档通过 MCP 连接到 Claude、VSCode
等,以获取实时答案。