本页描述如何在 Kubernetes 集群中设置 LangSmith(可观测性、追踪和评估)。您将使用 Helm 来安装 LangSmith 及其依赖项。
完成本页后,您将拥有:
- LangSmith UI 和 API:用于可观测性、追踪和评估。
- 后端服务:(队列、Playground、ACE)。
- 数据存储:(PostgreSQL、Redis、ClickHouse、可选的 Blob 存储)。
- Google Kubernetes Engine (GKE)
- Amazon Elastic Kubernetes Service (EKS):有关架构模式和最佳实践,请参阅 AWS 上的自托管。
- Azure Kubernetes Service (AKS):有关架构模式和最佳实践,请参阅 AKS 上的自托管。
- OpenShift (4.14+)
- Minikube 和 Kind(用于开发目的)
LangChain 提供 Terraform 模块来帮助为 LangSmith 配置基础设施。这些模块可以快速为您的部署设置 Kubernetes 集群、存储和网络。可用模块:查看完整的 Terraform 仓库以获取文档和额外资源。
先决条件
确保您已准备好以下工具/项目。部分项目标记为可选:-
LangSmith 许可证密钥
- 您可以从您的 LangChain 代表处获取。有关更多信息,请联系我们的销售团队。
-
API 密钥盐值
- 这是一个您可以生成的密钥。它应该是一个随机的字符字符串。
- 您可以使用以下命令生成:
-
JWT 密钥(可选,但用于基本认证)
- 这是一个您可以生成的密钥。它应该是一个随机的字符字符串。
- 您可以使用以下命令生成:
数据库
LangSmith 使用 PostgreSQL 数据库、Redis 缓存和 ClickHouse 数据库来存储追踪数据。默认情况下,这些服务安装在您的 Kubernetes 集群内部。但是,我们强烈建议使用外部数据库。对于 PostgreSQL 和 Redis,最佳选择是您的云提供商的托管服务。 有关更多信息,请参阅以下外部服务设置指南:Kubernetes 集群要求
-
您将需要一个可通过
kubectl访问的正常运行的 Kubernetes 集群。您的集群应满足以下最低要求:-
推荐:至少 16 个 vCPU,64GB 可用内存
- 您可能需要根据组织规模/使用情况调整我们所有不同服务的资源请求/限制。您可以在自托管规模指南中找到我们的建议。
- 我们建议使用集群自动扩缩器来处理基于资源使用情况的节点扩缩容。
- 我们建议设置指标服务器,以便可以启用自动扩缩容。
- 如果您在集群内运行 Clickhouse,则必须有一个至少具有 4 个 vCPU 和 16GB 内存可分配的节点,因为 ClickHouse 默认会请求此数量的资源。
-
集群中有效的动态 PV 配置器或可用的 PV(仅在集群内运行数据库时需要)
- 为了启用持久化,我们将尝试为在集群内运行的任何数据库配置卷。
- 如果在集群中使用 PV,我们强烈建议在生产环境中设置备份。
- 我们强烈建议使用由 SSD 支持的存储类以获得更好的性能。我们建议 7000 IOPS 和 1000 MiB/s 吞吐量。
- 在 EKS 上,您可能需要确保已安装并配置了
ebs-csi-driver以进行动态配置。有关更多信息,请参阅 EBS CSI 驱动程序文档。
输出应显示至少一个支持动态配置的存储类。例如:有关存储类的更多信息,请参阅 Kubernetes 文档。我们强烈建议使用支持卷扩展的存储类。这是因为追踪数据可能需要大量磁盘空间,您的卷可能需要随时间调整大小。
-
推荐:至少 16 个 vCPU,64GB 可用内存
-
Helm
- 要安装
helm,请参阅 Helm 文档
- 要安装
-
出站访问
https://beacon.langchain.com(如果未在离线模式下运行)- LangSmith 需要出站访问
https://beacon.langchain.com以进行许可证验证和使用情况报告。这是 LangSmith 正常运行所必需的。您可以在出站部分找到有关出站要求的更多信息。
- LangSmith 需要出站访问
配置您的 Helm charts:
- 创建一个名为
langsmith_config.yaml的新文件,并包含上一步中的配置选项。- 您可以在
langsmith_config.yaml文件中设置多个配置选项。您可以在配置部分找到有关特定配置选项的更多信息。 - 如果您是 Kubernetes 或 Helm 新手,我们建议从 Helm Chart 仓库示例目录中的示例配置开始:LangSmith helm chart 示例。
- 您可以在 Helm Chart 仓库的
values.yaml文件中查看完整的配置选项列表:LangSmith Helm Chart
- 您可以在
-
至少,您需要设置以下配置选项(使用基本认证):
部署到 Kubernetes:
-
验证您可以连接到 Kubernetes 集群(注意:我们强烈建议安装到一个空的命名空间中)
-
运行
kubectl get pods输出应如下所示:
如果您使用的是默认命名空间以外的命名空间,则需要在helm和kubectl命令中使用-n <namespace>标志来指定命名空间。 -
运行
-
确保您已添加 LangChain Helm 仓库。(如果您使用本地 charts,请跳过此步骤)
-
查找 chart 的最新版本。您可以在 Helm Chart 仓库中找到可用版本。
- 我们通常建议使用最新版本。
- 您也可以运行
helm search repo langchain/langsmith --versions来查看可用版本。输出将如下所示:
-
运行
helm upgrade -i langsmith langchain/langsmith --values langsmith_config.yaml --version <version> -n <namespace> --wait --debug- 将
<namespace>替换为您要部署 LangSmith 的命名空间。 - 将
<version>替换为您要从上一步安装的 LangSmith 版本。大多数用户应安装可用的最新版本。
helm install命令运行并成功完成,您应该会看到类似以下的输出:这可能需要几分钟才能完成,因为它将创建多个 Kubernetes 资源并运行多个作业来初始化数据库和其他服务。 - 将
-
运行
kubectl get pods输出现在应如下所示(注意,确切的 pod 名称可能因您使用的版本和配置而异):
验证您的部署:
-
运行
kubectl get services输出应如下所示: -
使用 curl 访问
langsmith-frontend服务的外部 IP:预期输出: -
在浏览器中访问
langsmith-frontend服务的外部 IP 应该可以看到/操作 LangSmith UI
使用 LangSmith
现在 LangSmith 正在运行,您可以开始使用它来追踪您的代码。您可以在自托管使用指南中找到有关如何使用自托管 LangSmith 的更多信息。 您的 LangSmith 实例现在正在运行,但可能尚未完全设置。 如果您使用了基本配置之一,系统将为您创建一个默认的管理员用户帐户。您可以使用在langsmith_config.yaml 文件中指定的电子邮件地址和密码登录。
作为下一步,强烈建议您与基础设施管理员合作:
- 为您的 LangSmith 实例设置 DNS 以实现更便捷的访问
- 配置 SSL 以确保提交到 LangSmith 的追踪数据在传输过程中加密
- 使用单点登录配置 LangSmith 以保护您的 LangSmith 实例
- 将 LangSmith 连接到外部 Postgres 和 Redis 实例
- 设置 Blob 存储以存储大文件
启用 LangSmith 部署、Fleet、Insights 和 Polly
要超越可观测性、追踪和评估,您可以在自托管实例上启用以下功能:- LangSmith 部署:通过 LangSmith UI 部署、扩展和管理代理。
- Fleet:无需编写代码即可创建和管理 AI 代理。
- Insights:获取对您的追踪和应用数据的 AI 驱动分析。
- Polly:嵌入在 LangSmith 各处的 AI 助手,帮助您分析追踪、线程、提示和实验结果。
将这些文档通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。

