Skip to main content
LangSmith 中的评估器是工作区级别的资源。您可以将单个评估器附加到多个追踪项目和数据集中,从而在工作中应用一致的评估逻辑,而无需每次重新创建。

查看评估器

LangSmith UI 中,选择左侧边栏的 Evaluators 以查看工作区中的所有评估器。 评估器表格显示以下列:
描述
名称评估器名称
类型LLM代码复合评分。复合评分评估器仅限于单个追踪项目和数据集,不会在此处显示。
反馈键评估器生成的反馈键
资源此评估器附加到的追踪项目和数据集
创建者创建评估器的工作区成员
更新时间评估器最后修改的时间
创建时间评估器创建的时间

创建评估器

  1. LangSmith UI 中,选择左侧边栏的 Evaluators
  2. 点击 + Evaluator 以打开 Add Evaluator 面板。
  3. 选择以下选项之一:
    • 从头创建:构建新的 LLM-as-a-Judge代码复合 评估器。
    • 附加现有评估器:选择工作区中已有的评估器,以便在其他资源中重复使用。
    • 从模板创建:从现成的评估器(也称为预构建评估器)开始,用于常见的评估模式。模板按以下类别组织:
      类别描述
      安全性检测泄露、注入和对抗性输入
      安全评估内容安全性和审核
      质量衡量输出质量和准确性
      对话评估对话质量和用户体验
      轨迹评估代理工具使用和决策路径
      图像与语音(多模态)评估图像内容质量和安全性,以及语音和音频交互质量
您也可以直接从追踪项目或数据集添加评估器。请参阅设置 LLM-as-a-judge 在线评估器在实验上自动运行评估器

查看评估器详情

点击表格中的任何评估器以打开其详情视图。详情视图有四个标签页:
  • 概览:评估器的反馈配置以及提示或代码定义。
  • 追踪:此评估器在所有附加资源中处理的追踪。
  • 日志:此评估器在所有附加资源中的执行日志。
  • 资源:此评估器附加到的追踪项目和数据集。

编辑评估器

打开评估器并在 概览 标签页中更新其配置。由于评估器是共享的,更改将应用于其附加的所有追踪项目和数据集。

删除评估器

当评估器附加到追踪项目或数据集时,无法删除。要删除评估器,请先通过 资源 标签页将其从所有资源中移除,然后再删除。