Skip to main content
在深入此内容之前,阅读以下内容可能会有所帮助:
反馈是 LangSmith 在特定追踪或中间运行(区间)上存储评估标准和分数的方式。反馈可以通过多种方式产生,例如:
  1. 随追踪一起从 LLM 应用发送
  2. 由用户在应用中内联或在标注队列中生成
  3. 离线评估期间由自动评估器生成
  4. 在线评估器生成
反馈以简单格式存储,包含以下字段:
字段名类型描述
idUUID记录本身的唯一标识符
created_atdatetime记录创建时的时间戳
modified_atdatetime记录最后修改时的时间戳
session_idUUID该运行所属实验或追踪项目的唯一标识符
run_idUUID会话内特定运行的唯一标识符
keystring描述反馈标准的键,例如 'correctness'
scorenumber与反馈键关联的数值分数
valuestring用于存储与分数关联的值。适用于分类反馈。
commentstring与记录关联的任何评论或注释。这可以是对给定分数的说明。
correctionobject用于存储更正详情(如有)的预留字段
feedback_sourceobject包含反馈来源信息的对象
feedback_source.typestring反馈来源的类型,例如 'api''app''evaluator'
feedback_source.metadataobject用于存储额外元数据的预留字段,目前
feedback_source.user_idUUID提供反馈的用户的唯一标识符
以下是上述格式中反馈记录的 JSON 表示示例:
{
  "created_at": "2024-05-05T23:23:11.077838",
  "modified_at": "2024-05-05T23:23:11.232962",
  "session_id": "c919298b-0af2-4517-97a2-0f98ed4a48f8",
  "run_id": "e26174e5-2190-4566-b970-7c3d9a621baa",
  "key": "correctness",
  "score": 1.0,
  "value": null,
  "comment": "我给出这个分数是因为答案是正确的。",
  "correction": null,
  "id": "62104630-c7f5-41dc-8ee2-0acee5c14224",
  "feedback_source": {
    "type": "app",
    "metadata": null,
    "user_id": "ad52b092-1346-42f4-a934-6e5521562fab"
  }
}