结构化输出允许代理返回类型化、机器可读的数据,而非纯文本。您将获得一个结构化对象,可以将其映射到任何 UI:卡片、表格、图表、逐步分解或特定领域渲染器,而不是渲染单个字符串。
什么是结构化输出?
代理不返回自由格式的文本响应,而是使用工具调用来返回符合预定义模式的结构化对象。这为您提供:
- 类型安全的数据:将响应解析为已知的 TypeScript 类型
- 精确的渲染控制:使用自己的 UI 处理方式渲染每个字段
- 一致的格式:无论底层模型如何,每个响应都遵循相同的结构
代理通过调用一个“结构化输出”工具来实现这一点,该工具的参数包含响应数据。工具本身不执行任何逻辑,纯粹是返回类型化数据的载体。
- 产品比较:功能表、优缺点列表、评分
- 数据分析:包含指标、分解和亮点的摘要
- 逐步指南:有序指令,包含描述和代码片段
- 食谱:成分、步骤、时间和营养信息
- 数学和科学:使用 LaTeX 渲染的公式、逐步推导
- 旅行规划:包含日期、地点和成本估算的行程
定义模式
为代理返回的结构化数据定义一个 TypeScript 类型。此模式的形状决定了您如何渲染 UI。
以下是一个食谱助手的示例:
interface Ingredient {
name: string;
amount: string;
unit: string;
}
interface RecipeStep {
instruction: string;
duration?: string;
}
interface Recipe {
title: string;
description: string;
servings: number;
ingredients: Ingredient[];
steps: RecipeStep[];
totalTime: string;
}
| 字段 | 类型 | 描述 |
|---|
title | string | 食谱名称 |
description | string | 菜肴的简短摘要 |
servings | number | 份数 |
ingredients | Ingredient[] | 包含数量和单位的成分列表 |
steps | RecipeStep[] | 有序的准备步骤 |
totalTime | string | 估计的总准备和烹饪时间 |
您的模式可以是任何内容。无论形状如何,该模式的工作方式都相同。
从消息中提取结构化输出
结构化输出位于最后一个 AIMessage 的 tool_calls 数组中。通过查找 AI 消息并访问第一个工具调用的参数来提取它:
import { AIMessage } from "@langchain/core/messages";
function extractStructuredOutput<T>(messages: any[]): T | null {
const aiMessages = messages.filter(AIMessage.isInstance);
if (aiMessages.length === 0) return null;
const lastAI = aiMessages[aiMessages.length - 1];
const toolCall = lastAI.tool_calls?.[0];
if (!toolCall) return null;
return toolCall.args as T;
}
结构化输出工具调用的 args 可能直到代理完成流式传输才会填充。在流式传输期间,args 可能部分填充或未定义。在渲染之前,请始终检查完整性。
设置 useStream
导入您的代理并将 typeof myAgent 作为类型参数传递给 useStream,以便类型安全地访问状态值:
import type { myAgent } from "./agent";
import { useStream } from "@langchain/react";
import { AIMessage } from "@langchain/core/messages";
function RecipeChat() {
const stream = useStream<typeof myAgent>({
apiUrl: "http://localhost:2024",
assistantId: "recipe_assistant",
});
const recipe = extractStructuredOutput<Recipe>(stream.messages);
return (
<div>
{!recipe && !stream.isLoading && (
<PromptInput onSubmit={(text) =>
stream.submit({ messages: [{ type: "human", content: text }] })
} />
)}
{stream.isLoading && <LoadingIndicator />}
{recipe && <RecipeCard recipe={recipe} />}
</div>
);
}
渲染结构化数据
一旦您获得了一个类型化对象,就可以构建一个组件,将每个字段映射到相应的 UI 元素。这是该模式的核心:将结构化数据转换为专门构建的界面。
function RecipeCard({ recipe }: { recipe: Recipe }) {
return (
<div className="recipe-card">
<div className="recipe-header">
<h3>{recipe.title}</h3>
<p className="recipe-description">{recipe.description}</p>
<div className="recipe-meta">
<span>{recipe.servings} servings</span>
<span>{recipe.totalTime}</span>
</div>
</div>
<div className="recipe-ingredients">
<h4>Ingredients</h4>
<ul>
{recipe.ingredients.map((ing, i) => (
<li key={i}>
<strong>{ing.amount} {ing.unit}</strong> {ing.name}
</li>
))}
</ul>
</div>
<div className="recipe-steps">
<h4>Instructions</h4>
{recipe.steps.map((step, i) => (
<div key={i} className="step">
<div className="step-number">Step {i + 1}</div>
<p className="step-instruction">{step.instruction}</p>
{step.duration && (
<span className="step-duration">{step.duration}</span>
)}
</div>
))}
</div>
</div>
);
}
相同的方法适用于任何领域。将每个字段映射到最能代表它的 UI 元素:
| 数据类型 | 渲染策略 |
|---|
| 纯文本 | 段落、标题、列表项 |
| 数字/指标 | 统计卡片、进度条、徽章 |
| 数组 | 列表、表格、网格 |
| 嵌套对象 | 嵌套卡片、手风琴部分 |
| Markdown | Markdown 渲染器(例如 react-markdown) |
| LaTeX/数学 | KaTeX 或 MathJax |
| 日期/时间 | 格式化的时间戳、相对时间 |
| URL | 链接、嵌入预览 |
处理部分流式数据
在流式传输期间,工具调用参数可能是不完整的 JSON。在您的提取逻辑中防范这种情况:
function extractStructuredOutput<T>(
messages: any[],
requiredFields: string[] = [],
): T | null {
const aiMessages = messages.filter(AIMessage.isInstance);
if (aiMessages.length === 0) return null;
const lastAI = aiMessages[aiMessages.length - 1];
const toolCall = lastAI.tool_calls?.[0];
if (!toolCall?.args) return null;
const args = toolCall.args as Record<string, unknown>;
const hasRequired = requiredFields.every(
(field) => args[field] !== undefined
);
if (requiredFields.length > 0 && !hasRequired) return null;
return args as T;
}
使用 requiredFields 参数等待关键字段填充后再渲染:
const recipe = extractStructuredOutput<Recipe>(stream.messages, [
"title",
"ingredients",
"steps",
]);
在流式传输期间逐步渲染
与其等待完整的结构化输出,不如在字段到达时立即渲染。这为用户提供了即时反馈,同时代理仍在生成:
function ProgressiveRecipeCard({ messages }: { messages: any[] }) {
const partial = extractStructuredOutput<Partial<Recipe>>(messages);
if (!partial) return null;
return (
<div className="recipe-card">
{partial.title && <h3>{partial.title}</h3>}
{partial.description && <p>{partial.description}</p>}
{partial.ingredients && partial.ingredients.length > 0 && (
<div className="recipe-ingredients">
<h4>Ingredients</h4>
<ul>
{partial.ingredients.map((ing, i) => (
<li key={i}>
{ing.amount} {ing.unit} {ing.name}
</li>
))}
</ul>
</div>
)}
{partial.steps && partial.steps.length > 0 && (
<div className="recipe-steps">
<h4>Instructions</h4>
{partial.steps.map((step, i) => (
<div key={i} className="step">
<div className="step-number">Step {i + 1}</div>
<p>{step.instruction}</p>
</div>
))}
</div>
)}
</div>
);
}
当模式具有自然的从上到下顺序时,逐步渲染效果很好:标题,然后是描述,然后是详细信息。代理通常按模式顺序生成字段,因此 UI 会自然填充。
重置并重新提交
要让用户在查看结果后提交新查询,请添加一个按钮来启动新线程:
{recipe && (
<button onClick={() => stream.switchThread(null)}>
Start over
</button>
)}
这将清除当前对话,并允许用户开始新的交互。
最佳实践
- 在渲染前验证:在渲染之前始终检查必需字段是否存在,因为流式传输可能提供部分数据
- 使用通用提取函数:使用类型和必需字段对提取逻辑进行参数化,以便适用于不同的模式
- 逐步渲染:在字段到达时显示它们,而不是等待完整对象,以便用户看到即时反馈
- 提供后备表示:如果字段支持富渲染(LaTeX、Markdown、图表),请在模式中包含纯文本等效项作为后备
- 尽可能保持模式扁平:深度嵌套的模式更难逐步渲染,并且在部分流式传输期间更容易中断
- UI 与数据匹配:选择最能代表每种字段类型的渲染策略(数组使用表格,嵌套对象使用卡片,状态字段使用徽章)