list_runs 方法或 API 中的 /runs/query 端点。LangSmith 以 运行(span)数据格式 中指定的简单格式存储追踪。
本页涵盖:
如果您需要导出大量追踪,我们建议您使用批量数据导出功能,因为它能更好地处理大量数据,并支持自动重试和跨分区并行处理。
使用筛选参数
对于简单查询,您不必依赖我们的查询语法。您可以使用 筛选参数参考 中指定的筛选参数。列出项目中的所有运行
列出过去 24 小时内的 LLM 和聊天运行
列出项目中的根运行
根运行是没有父级的运行。这些运行的is_root 值为 True。您可以使用此值来筛选根运行。
列出没有错误的运行
按运行 ID 列出运行
如果您有一个运行 ID 列表,您可以直接列出它们:通过 ID 获取单个运行
要通过 ID 获取单个运行(追踪),请使用read_run 方法。当您有一个特定的追踪 ID(例如,来自 LangSmith 分享链接,如 https://smith.langchain.com/public/<trace-id>/r)并希望检索其完整数据时,此方法很有用。
使用筛选查询语言
对于更复杂的查询,您可以使用 筛选查询语言参考 中描述的查询语言。列出对话线程中的所有根运行
这是获取对话线程中运行的方法。有关设置线程的更多信息,请参阅我们的设置线程操作指南。 线程通过设置共享的线程 ID 进行分组。LangSmith UI 允许您使用以下三个元数据键中的任何一个:session_id、conversation_id 或 thread_id。会话 ID 也称为追踪项目 ID。以下查询匹配其中任何一个。
列出所有名为 “extractor” 且其追踪根节点被分配了 “user_score” 反馈分数为 1 的运行
列出具有 “star_rating” 键且分数大于 4 的运行
列出完成时间超过 5 秒的运行
列出所有 “error” 不等于 null 的运行
列出所有 start_time 大于特定时间戳的运行
列出所有包含字符串 “substring” 的运行
列出所有标记为 git 哈希值 “2aa1cf4” 的运行
列出所有在特定时间戳之后开始,并且 “error” 不等于 null 或 “Correctness” 反馈分数等于 0 的运行
复杂查询:列出所有标签包含 “experimental” 或 “beta” 且延迟大于 2 秒的运行
通过全文搜索追踪树
您可以使用不带任何特定字段的search() 函数对运行中的所有字符串字段进行全文搜索。这使您可以快速找到与搜索词匹配的追踪。
检查元数据是否存在
如果您想检查元数据是否存在,可以使用eq 运算符,也可以选择使用 and 语句按值匹配。如果您想记录有关运行的更多结构化信息,这很有用。
检查元数据中的环境详细信息
一个常见的模式是通过元数据向追踪添加环境信息。如果您想筛选包含环境元数据的运行,可以使用与上述相同的模式:检查元数据中的会话 ID
另一种关联同一对话中追踪的常见方法是使用共享的会话 ID。如果您想基于会话 ID 以这种方式筛选运行,可以在元数据中搜索该 ID。键值对的否定筛选
您可以对元数据、输入和输出键值对使用否定筛选,以从结果中排除特定运行。以下是一些元数据键值对的示例,但相同的逻辑也适用于输入和输出键值对。组合多个筛选器
如果您想组合多个条件来细化搜索,可以使用and 运算符以及其他筛选函数。以下是如何搜索名为 “ChatOpenAI” 且其元数据中具有特定 conversation_id 的运行:
树筛选器
列出所有名为 “RetrieveDocs” 的运行,其根运行具有 “user_score” 反馈为 1,并且完整追踪中的任何运行名为 “ExpandQuery”。 如果您想提取特定运行,但条件是追踪中达到了各种状态或步骤,这种类型的查询很有用。高级:导出包含子工具使用情况的扁平化追踪视图
以下 Python 示例演示了如何导出追踪的扁平化视图,包括每个追踪中代理使用的工具信息(来自嵌套运行)。 这可用于分析代理在多个追踪中的行为。 此示例查询指定天数内的所有工具运行,并按其父(根)运行 ID 进行分组。然后获取每个根运行的相关信息,例如运行名称、输入、输出,并将这些信息与子运行信息组合。 为了优化查询,该示例:- 在查询工具运行时仅选择必要的字段以减少查询时间。
- 在并发处理工具运行的同时批量获取根运行。
高级:导出具有反馈的追踪的检索器 IO
如果您想根据检索器行为微调嵌入或诊断端到端系统性能问题,此查询很有用。 以下 Python 示例演示了如何导出具有特定反馈分数的追踪中的检索器输入和输出。速率限制
POST /runs/query 端点(Python 中的 list_runs,JavaScript 中的 listRuns)具有每个租户的速率限制,根据查询参数而异:
| 查询类型 | 限制 | 时间窗口 |
|---|---|---|
| 短时间窗口(≤ 7 天) | 10 个请求 | 10 秒 |
| 大时间窗口(> 7 天) | 3 个请求 | 10 秒 |
| 全文搜索,短时间窗口(≤ 7 天) | 3 个请求 | 10 秒 |
| 全文搜索,大时间窗口(> 7 天) | 1 个请求 | 10 秒 |
选择 child_run_ids,短时间窗口(≤ 7 天) | 3 个请求 | 10 秒 |
选择 child_run_ids,大时间窗口(> 7 天) | 1 个请求 | 10 秒 |
end_time - start_time 确定。如果未提供 end_time,LangSmith 将使用当前时间。没有 start_time 的查询被视为大时间窗口查询。
最佳实践
为避免达到速率限制并减少查询时间,特别是对于具有大输入/输出的运行:- 设置
start_time:省略它会触发大时间窗口速率限制层(每 10 秒 3 个请求而不是 10 个)。尽可能使用 7 天或更短的时间窗口。 - 使用
select:默认情况下返回所有字段。仅指定您需要的字段(例如,select=["inputs", "outputs"])可以显著减少响应大小和查询时间,特别是对于具有大输入/输出的运行。 - 设置
limit:如果您不需要分页浏览所有内容,请限制结果数量。 - 避免全文搜索:
filter='search("...")'具有最严格的速率限制;尽可能使用结构化筛选器(例如,eq()、has())。 - 避免选择
child_run_ids:这也会触发更严格的速率限制层。
429 Too Many Requests 响应。有关一般速率限制信息,请参阅管理概览。
将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时答案。

