Skip to main content
LangSmith允许您创建带有文件附件(如图像、音频文件或文档)的数据集示例,并在运行多模态内容评估时,将其用于您的提示词和评估器。 虽然您可以通过base64编码将多模态数据包含在示例中,但这种方法效率低下——编码后的数据比原始二进制文件占用更多空间,导致与LangSmith之间的传输速度变慢。使用附件则提供了两个主要优势:
  • 由于更高效的二进制文件传输,上传和下载速度更快。
  • 在LangSmith UI中增强了不同文件类型的可视化效果。
本指南涵盖如何创建带有附件的示例、构建使用这些附件的多模态提示词和评估器,以及运行多模态内容评估——请选择UISDK选项卡开始。 选择您偏好的方法:

1. 创建带有附件的示例

您可以通过几种不同的方式将带有附件的示例添加到数据集中。

从现有运行中添加

将运行添加到LangSmith数据集时,附件可以从源运行有选择地传播到目标示例。要了解更多信息,请参阅在应用程序中管理数据集将带有附件的跟踪添加到数据集

从头开始创建

您可以直接从LangSmith UI创建带有附件的示例。点击数据集UI中“示例”选项卡的 + Example 按钮。然后使用“上传文件”按钮上传附件:创建带有附件的示例上传后,您可以在LangSmith UI中查看带有附件的示例。每个附件都会显示预览,便于检查。带有示例的附件

2. 创建多模态提示词

LangSmith UI允许您在评估多模态模型时,在提示词中包含附件:首先,点击您想要添加多模态内容的消息中的文件图标。然后,为每个示例中要包含的附件添加模板变量。
  • 如果您想包含特定附件,可以使用建议的变量名,例如 {{attachment.file_name}},这将把附件列表中文件名为 file_name 的文件映射并传递给评估器。
  • 如果您想包含所有附件,请使用 {{attachments}}` 变量。 添加多模态变量

3. 定义自定义评估器

您可以创建使用数据集示例中多模态内容的评估器。由于您的数据集已经包含带有附件的示例(在步骤1中添加),您可以直接在评估器中引用它们。操作如下:
  1. 从数据集页面选择 + Evaluator
  2. 模板变量 编辑器中,添加要包含的附件变量:
    • 如果您想包含特定附件,可以使用建议的变量名,例如 {{attachment.file_name}},这将把附件列表中文件名为 file_name 的文件映射并传递给评估器。
    • 如果您想包含所有附件,请使用 {{attachments}}` 变量。
    创建评估器模态框,已选择一个音频附件作为输出变量。
然后,评估器可以使用这些附件以及模型的输出来判断质量。例如,您可以创建一个评估器来:
  • 检查图像描述是否与实际图像内容匹配。
  • 验证转录是否准确反映了音频。
  • 验证从PDF中提取的文本是否正确。
您也可以创建仅使用文本的评估器,不使用附件,而是评估模型的文本输出:
  • OCR → 文本校正:使用视觉模型从文档中提取文本,然后评估提取输出的准确性。
  • 语音转文本 → 转录质量:使用语音模型将音频转录为文本,然后根据您的参考评估转录结果。
如果您的跟踪在其输入或输出中包含base64编码的多模态内容(例如,如果您遵循了记录多模态跟踪指南),则无需附件即可评估它们。在评估器提示词中使用标准变量映射(如 {{input}}{{output}}),base64内容将被正确传递给LLM评估器进行可视化和评估。
有关定义自定义评估器的更多信息,请参阅LLM作为评判者指南。

4. 更新带有附件的示例

在UI中,附件大小限制为20MB。
在UI中编辑示例时,您可以:
  • 上传新附件
  • 重命名和删除附件
  • 使用快速重置按钮将附件重置为之前的状态
更改在点击提交之前不会保存。附件编辑