Skip to main content
数据集 使您能够使用一致的数据,随时间执行可重复的评估。数据集由 示例 组成,这些示例存储输入、输出,以及可选的参考输出。 本页概述了在 UI创建管理 数据集的各种方法。

创建数据集并添加示例

以下部分解释了您可以在 LangSmith 中创建数据集并添加示例的不同方式。根据您的工作流程,您可以手动整理示例、从跟踪中自动捕获它们、导入文件,甚至生成合成数据:

从跟踪项目手动创建

构建数据集的一种常见模式是将应用程序中的重要跟踪转换为数据集示例。此方法要求您已 配置了到 LangSmith 的跟踪
构建数据集的一种技术是筛选最有趣的跟踪,例如被标记为用户反馈不佳的跟踪,并将它们添加到数据集。有关如何筛选跟踪的提示,请参阅 筛选跟踪 指南。
有两种方法可以从跟踪项目手动将数据添加到数据集。导航到 跟踪项目 并选择一个项目。
  1. 从运行表中多选运行。在 运行 选项卡上,多选运行。在页面底部,点击 添加到数据集
  2. 运行 选项卡上,从表中选择一个运行。在单个运行详情页面,选择右上角的 添加到 -> 数据集 当您从运行详情页面选择数据集时,会弹出一个模态框,告知您是否应用了任何 转换 或架构验证是否失败。 然后,您可以在将其添加到数据集之前选择性地编辑该运行。

从跟踪项目自动创建

您可以使用 运行规则 根据某些条件自动将跟踪添加到数据集。例如,您可以添加所有被 标记 为特定用例或具有 低反馈分数 的跟踪。

从标注队列中的示例创建

如果您依赖领域专家来构建有意义的数据集,请使用 标注队列 为审阅者提供简化的视图。人工审阅者可以选择在将跟踪添加到数据集之前修改其输入/输出/参考输出。
您可以选择使用默认数据集配置标注队列,尽管您可以通过使用屏幕底部的数据集切换器将运行添加到任何数据集。选择正确的数据集后,点击 添加到数据集 或按热键 D 将运行添加到其中。 您在标注队列中对运行所做的任何修改都将转移到数据集,并且与该运行关联的所有元数据也将被复制。
您还可以设置规则,使用 自动化规则 将满足特定条件的运行添加到标注队列。

从演练场创建

演练场 页面:
  1. 选择 设置评估
  2. 如果您要开始一个新数据集,请点击 +新建,或从现有数据集中选择。
    不支持在演练场中内联创建具有嵌套键的数据集。要添加/编辑具有嵌套键的示例,您必须 从数据集页面 进行编辑。
  3. 编辑示例:
    • 使用 +行 向数据集添加新示例。
    • 使用表格右侧的 下拉菜单删除示例。
    • 如果您正在创建无参考数据集,请使用列中的 x 按钮删除 参考输出 列。请注意,此操作不可逆。

从 CSV 或 JSONL 文件导入数据集

数据集和实验 页面,点击 +新建数据集,然后从 CSV 或 JSONL 文件 导入 现有数据集。

从数据集和实验页面创建新数据集

  1. 从左侧菜单导航到 数据集和实验 页面。
  2. 点击 + 新建数据集
  3. 新建数据集 页面,选择 从头创建 选项卡。
  4. 为数据集添加名称和描述。
  5. (可选)创建 数据集架构 以验证您的数据集。
  6. 点击 创建,这将创建一个空数据集。
  7. 要内联添加示例,请在数据集页面上,转到 示例 选项卡。点击 + 示例
  8. 以 JSON 格式定义示例,然后点击 提交。有关数据集划分的更多详细信息,请参阅 创建和管理数据集划分

添加由 LLM 创建的合成示例

如果您有现有示例并在数据集上定义了 架构,当您点击 + 示例 时,会有一个选项 添加 AI 生成的示例。这将使用 LLM 创建 合成 示例。 生成示例 中,执行以下操作:
  1. 点击窗格右上角的 API 密钥,将您的 OpenAI API 密钥设置为 工作区密钥。如果您的工作区已经设置了 OpenAI API 密钥,可以跳过此步骤。
  2. 选择 :切换 自动手动 参考示例。您可以从数据集中手动选择这些示例,或使用自动选择选项。
  3. 输入要生成的合成示例数量。
  4. 点击 生成 AI 生成的示例配置窗口。手动和自动的选择以及要生成的示例数量。
  5. 示例将出现在 选择生成的示例 页面上。选择要添加到数据集的示例,并可在最终确定前进行编辑。点击 保存示例
  6. 每个示例将根据您指定的数据集架构进行验证,并在源元数据中标记为 合成 选择生成的示例页面,已选择生成的示例和保存示例按钮。

管理数据集

创建数据集架构

LangSmith 数据集存储任意 JSON 对象。我们建议(但不要求)您为数据集定义架构,以确保它们符合特定的 JSON 架构。数据集架构使用标准 JSON 架构 定义,并添加了一些 预构建类型,使消息和工具等常见原语的类型化更容易。 架构中的某些字段具有 + 转换 选项。转换是预处理步骤,如果启用,会在您将示例添加到数据集时更新它们。例如,转换为 OpenAI 消息 转换会将类似消息的对象(如 LangChain 消息)转换为 OpenAI 消息格式。 有关可用转换的完整列表,请参阅 数据集转换参考
如果您计划从 LangChain ChatModels 或使用 LangSmith OpenAI 包装器 的 OpenAI 调用中收集生产跟踪到数据集,我们提供了一个预构建的 Chat Model 架构,可将消息和工具转换为行业标准的 openai 格式,以便下游与任何模型一起用于测试。您还可以自定义模板设置以匹配您的用例。有关更多信息,请参阅 数据集转换参考

创建和管理数据集划分

有关何时以及为何使用划分的概述,请参阅 数据集组织 要在 UI 中创建和管理划分:
  1. 选择数据集中的示例。
  2. 点击 添加到划分
  3. 从弹出的菜单中,您可以为所选示例选择和取消选择划分,或创建新划分。
添加到划分

编辑示例元数据

要向示例添加元数据:
  1. 点击一个示例,然后点击弹出窗口右上角的 编辑
  2. 在此页面上,更新或删除现有元数据,或添加新元数据。
您可以使用此功能存储有关示例的信息,例如标签或版本信息,然后在分析实验结果时可以 按其分组,或在 SDK 中调用 list_examples按其筛选

筛选示例

您可以按划分、元数据键/值筛选示例,或对示例执行全文搜索。这些筛选选项位于示例表的左上角:
  • 按划分筛选:选择划分 > 选择要筛选的划分。
  • 按元数据筛选:筛选器 > 从下拉菜单中选择 元数据 > 选择要筛选的元数据键和值。
  • 全文搜索:筛选器 > 从下拉菜单中选择 全文 > 输入您的搜索条件。
您可以添加多个筛选器,只有满足所有筛选器的示例才会显示在表中。 应用于示例的筛选器