前提条件
开始之前,请确保您已具备:- 一个 LangSmith 账户:在 smith.langchain.com 注册或登录。
- 一个 LangSmith API 密钥:按照 创建 API 密钥 指南操作。
- 一个 OpenAI API 密钥:从 OpenAI 控制面板 生成。
- UI
- SDK
1. 设置工作区密钥
在 LangSmith UI 中,确保您的 API 密钥已设置为工作区密钥。- 导航至 设置,然后转到 密钥 选项卡。
- 选择 添加密钥,输入密钥环境变量(例如,
OPENAI_API_KEY或ANTHROPIC_API_KEY)以及您的 API 密钥作为 值。 - 选择 保存密钥。
在 LangSmith UI 中添加工作区密钥时,请确保密钥键名与您的模型提供商期望的环境变量名称相匹配。
2. 创建提示
Playground 使得可以针对不同的提示、新的模型运行评估,或测试不同的模型配置。- 在 LangSmith UI 中,点击侧边栏中的 Playground。
-
在 Prompts 面板下,将 system 提示修改为:
保持 Human 消息不变:
{question}。
3. 创建数据集
- 点击 Set up Evaluation,这将在页面底部打开一个 New Experiment 表格。
-
在 Select or create a new dataset 下拉菜单中,点击 + New 按钮以创建新数据集。

-
将以下示例添加到数据集中:
输入 参考输出 question: Which country is Mount Kilimanjaro located in? output: Mount Kilimanjaro is located in Tanzania. question: What is Earth’s lowest point? output: Earth’s lowest point is The Dead Sea. - 点击 Save 并输入名称以保存您新创建的数据集。
4. 添加评估器
- 点击 + Evaluator 并从 Prebuilt Evaluator 选项中选择 Correctness。
- 在 Correctness 面板中,点击 Save。
5. 运行您的评估
-
选择右上角的 Start 来运行您的评估。这将在 New Experiment 表格中创建一个带有预览的 实验。您可以通过点击实验名称来完整查看。

后续步骤
- 有关评估的更多详细信息,请参阅评估文档。
- 了解如何在 UI 中创建和管理数据集。
- 了解如何从 Playground 运行评估。
将这些文档 通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。





