云 选项是一种完全托管的模型,由 LangChain 托管和运营所有 LangSmith 基础设施和服务:
完全托管的基础设施 :LangChain 处理所有基础设施、更新、扩展和维护。
从 GitHub 部署 :连接您的仓库,只需点击几下即可部署。
自动化 CI/CD :构建过程由平台自动处理。
LangSmith UI :完全访问可观测性 、评估 、部署管理 和 Studio 。
谁管理 在哪里运行 LangSmith 平台 (UI, APIs, 数据存储) LangChain LangChain 的云 您的 Agent 服务器 LangChain LangChain 的云 您应用的 CI/CD LangChain LangChain 的云
开始使用
要将您的第一个应用部署到云,请参阅云部署快速入门 或参考综合设置指南 。
云架构与可扩展性
LangSmith 部署在 Google Cloud Platform (GCP) 上,用于美国和欧盟 SaaS 区域,部署在 Amazon Web Services (AWS) 上,用于 AWS 托管的美国 SaaS 区域。该平台设计为高度可扩展。许多客户在 LangSmith 上运行生产工作负载,用于 LLM 应用的可观测性、评估和 Agent 部署。
基于美国的 LangSmith 服务(默认 GCP 区域)部署在 GCP 的 us-central1(爱荷华州)区域。
截至 2026 年 4 月,LangSmith SaaS 可在 AWS 的 us-east-2(俄亥俄州)区域使用。
区域存储
此表中的资源和服务存储在与注册 URL 对应的位置(美国 (GCP)、欧盟 (GCP) 或美国 (AWS))。云托管 LangSmith 使用 Supabase 进行身份验证/授权,使用 ClickHouse Cloud 作为数据仓库。
美国 (GCP) 欧盟 (GCP) 美国 (AWS) URL https://smith.langchain.com https://eu.smith.langchain.com https://aws.smith.langchain.com API URL https://api.smith.langchain.com https://eu.api.smith.langchain.com https://aws.api.smith.langchain.com 云 GCP us-central1 (爱荷华州) GCP europe-west4 (荷兰) AWS us-east-2 (俄亥俄州) Supabase AWS us-east-1 (北弗吉尼亚) AWS eu-central-1 (德国) AWS us-east-2 (俄亥俄州) ClickHouse Cloud us-central1 (爱荷华州) europe-west4 (荷兰) us-east-2 (俄亥俄州) LangSmith 部署 GCP us-central1 (爱荷华州); *.us.langgraph.app GCP europe-west4 (荷兰); *.eu.langgraph.app AWS us-east-2 (俄亥俄州); *.aws.us.langgraph.app
更多信息请参阅区域常见问题 。
与区域无关的存储
此处列出的数据仅存储在美国:
通过 Stripe 和 Metronome 处理的支付和账单信息
GCP 服务
以下内容适用于 GCP 上的美国和欧盟 SaaS 区域。
LangSmith 由以下服务组成,全部部署在 Google Kubernetes Engine (GKE) 上:
LangSmith 前端:提供 LangSmith UI 服务。
LangSmith 后端:提供 LangSmith API 服务。
LangSmith 平台后端:处理身份验证和其他高容量任务。(内部服务)
LangSmith Playground:处理将请求转发到各种 LLM 提供商以实现 Playground 功能。
LangSmith 队列:处理异步任务。(内部服务)
LangSmith 使用以下 GCP 存储服务:
Google Cloud Storage (GCS) 用于存储运行输入和输出。
Google Cloud SQL PostgreSQL 用于事务性工作负载。
Google Cloud Memorystore for Redis 用于队列和缓存。
GCP 上的 Clickhouse Cloud 用于跟踪摄取和分析。我们的服务通过私有端点连接到托管在同一 GCP 区域的 Clickhouse Cloud。
我们使用的一些其他 GCP 服务包括:
Google Cloud Load Balancer 用于将流量路由到 LangSmith 服务。
Google Cloud CDN 用于缓存静态资源。
Google Cloud Armor 用于安全和速率限制。有关我们实施的速率限制的更多信息,请参阅速率限制 。
AWS 服务
以下内容适用于 us-east-2(俄亥俄州)中的美国 (AWS) SaaS 区域。相同的逻辑 LangSmith 组件运行在 Amazon EKS 上,而不是 GKE。
LangSmith 由以下服务组成,全部部署在 Amazon EKS 上:
LangSmith 前端:提供 LangSmith UI 服务。
LangSmith 后端:提供 LangSmith API 服务。
LangSmith 平台后端:处理身份验证和其他高容量任务。(内部服务)
LangSmith Playground:处理将请求转发到各种 LLM 提供商以实现 Playground 功能。
LangSmith 队列:处理异步任务。(内部服务)
LangSmith 使用以下 AWS 存储和数据服务:
Amazon S3 用于存储运行输入和输出。
Amazon RDS for PostgreSQL 用于事务性工作负载。
Amazon ElastiCache for Redis 用于队列和缓存。
通过 AWS PrivateLink 在 us-east-2 上的 ClickHouse Cloud 用于跟踪摄取和分析,与上面的区域存储 表一致。
我们使用的一些其他 AWS 服务包括:
Elastic Load Balancing (Network Load Balancers) 和 Istio ingress 用于将流量路由到 LangSmith 服务。文档化的 API 速率限制在 Istio ingress 网关处执行。详情请参阅速率限制 。
Amazon CloudFront 用于缓存静态资源(包括 Web UI 主机名 aws.smith.langchain.com)。
CloudFront 上的 AWS WAF 用于边缘的托管规则组(例如,AWS Managed Rules 通用保护和 Bot 控制)。
IP 地址白名单
从 LangChain SaaS 出站
所有离开 LangSmith 服务的流量都将通过 NAT 网关路由。所有流量都将显示为源自以下 IP 地址:
美国 (GCP) 欧盟 (GCP) 美国 (AWS) 34.59.65.97 34.13.192.67 18.188.147.158 34.67.51.221 34.147.105.64 18.219.86.202 34.46.212.37 34.90.22.166 3.21.57.192 34.132.150.88 34.147.36.213 35.188.222.201 34.32.137.113 34.58.194.127 34.91.238.184 34.59.97.173 35.204.101.241 104.198.162.55 35.204.48.32
如果连接到您自己的 AzureOpenAI 服务或 Playground 或在线评估可能需要的其他端点,将这些 IP 地址加入白名单可能会有所帮助。
进入 LangChain SaaS 的入站流量
LangChain 端点映射到以下静态 IP 地址,用于终止在我们 GCP 负载均衡器 (美国/欧盟)上的流量,或者对于美国 (AWS) ,终止在 us-east-2 中的网络负载均衡器 上的流量(API 和网关主机名):
美国 (GCP) 欧盟 (GCP) 美国 (AWS) 34.8.121.39 34.95.92.214 3.129.27.169 34.107.251.234 34.13.73.122 13.58.107.119 16.59.151.49 16.59.98.147 3.134.146.243 3.150.87.246
您可能需要将这些地址加入白名单,以允许来自您私有网络的流量访问 LangSmith SaaS 端点(api.smith.langchain.com、smith.langchain.com、beacon.langchain.com、eu.api.smith.langchain.com、eu.smith.langchain.com、eu.beacon.langchain.com、aws.api.smith.langchain.com、aws.smith.langchain.com)。
私有连接(企业版)
企业客户可以使用 AWS PrivateLink 或 GCP Private Service Connect (PSC) 连接到 LangSmith,而无需将流量暴露到公共互联网。
AWS PrivateLink
AWS 上的客户可以通过 AWS PrivateLink 连接到 LangSmith,提供从任何 VPC 的私有连接。原生支持跨区域连接。
端点服务名称
区域 服务名称 美国 (us-east-2) com.amazonaws.vpce.us-east-2.vpce-svc-054f37092752bff6b
1. 请求访问权限: 联系您的客户代表或 sales@langchain.dev ,提供您的 AWS 账户 ID。LangChain 会将您的账户添加到端点服务的允许主体列表中。
2. 在您的 AWS 账户中创建接口 VPC 端点。 附加一个安全组,允许来自您的 VPC CIDR(或需要访问 LangSmith 的实例)的 TCP 443 入站 流量:
aws ec2 create-vpc-endpoint \
--vpc-id < YOUR_VPC_I D > \
--service-name < SERVICE_NAME_FROM_TABLE_ABOV E > \
--vpc-endpoint-type Interface \
--subnet-ids < YOUR_SUBNET_ID S > \
--security-group-ids < YOUR_SECURITY_GROUP_I D > \
--region < YOUR_REGIO N >
3. 等待接受。 LangChain 将接受连接。端点状态将从 pendingAcceptance 变为 available。接受后请等待几分钟,让更改完全传播,然后再测试连接。
配置 DNS
配置 DNS,使 aws.api.smith.langchain.com 在您的 VPC 内解析为您的 VPC 端点的私有 DNS 名称。您可以使用任何私有 DNS 解决方案——Route 53 私有托管区域、企业 DNS 解析器或任何可从您的 VPC 访问的 DNS 服务器。
首先,获取您的端点的 DNS 名称:
aws ec2 describe-vpc-endpoints \
--vpc-endpoint-ids < YOUR_ENDPOINT_I D > \
--query 'VpcEndpoints[0].DnsEntries[0].DnsName' \
--output text --region < YOUR_REGIO N >
然后为 aws.api.smith.langchain.com 创建一个指向该 DNS 名称的 CNAME 记录。以下是使用 Route 53 的示例:
aws route53 create-hosted-zone \
--name aws.api.smith.langchain.com \
--vpc VPCRegion= < YOUR_REGIO N > ,VPCId= < YOUR_VPC_I D > \
--caller-reference langsmith-privatelink- $( date +%s ) \
--hosted-zone-config PrivateZone= true
aws route53 change-resource-record-sets \
--hosted-zone-id < HOSTED_ZONE_I D > \
--change-batch '{
"Changes": [{
"Action": "CREATE",
"ResourceRecordSet": {
"Name": "aws.api.smith.langchain.com",
"Type": "CNAME",
"TTL": 300,
"ResourceRecords": [{"Value": "<ENDPOINT_DNS_NAME>"}]
}
}]
}'
验证连接
从您 VPC 中的 EC2 实例或容器:
curl https://aws.api.smith.langchain.com/ok
GCP Private Service Connect
GCP 上的企业客户可以通过 Private Service Connect (PSC) 连接到 LangSmith,提供私有连接,而无需将流量暴露到公共互联网。
服务附件 URI
使用以下服务附件 URI 在您的 VPC 中创建 PSC 端点:
区域 服务附件 URI 美国 (us-central1) projects/langchain-prod/regions/us-central1/serviceAttachments/gateway-psc-publish欧盟 (europe-west4) projects/langchain-prod/regions/europe-west4/serviceAttachments/gateway-psc-publish
PSC 域名
设置完成后,使用以下域名通过您的 PSC 连接访问 LangSmith:
区域 域名 美国 us-central1.p.api.smith.langchain.com欧盟 europe-west4.p.api.smith.langchain.com
请求访问权限: 联系您的客户代表或 sales@langchain.dev ,提供您的 GCP 项目 ID。LangChain 会将您的项目添加到服务附件的允许消费者列表中。
获得访问权限后,使用 gcloud CLI 或 Terraform 创建 PSC 端点并配置 DNS。
创建 PSC 端点
在您的 VPC 中创建一个指向服务附件的转发规则:
# 创建 PSC 端点
gcloud compute forwarding-rules create langsmith-psc-endpoint \
--region= < REGION > \
--network= < YOUR_VPC_NETWORK > \
--subnet= < YOUR_SUBNET > \
--target-service-attachment=projects/langchain-prod/regions/ < REGION > /serviceAttachments/gateway-psc-publish \
--load-balancing-scheme=""
# 获取分配的 IP 地址
gcloud compute forwarding-rules describe langsmith-psc-endpoint \
--region= < REGION > \
--format="value(IPAddress)"
配置 DNS
在您的 VPC 中创建一个私有 DNS 区域,并添加一个指向 PSC 端点 IP 的 A 记录:
# 创建私有 DNS 区域
gcloud dns managed-zones create langsmith-psc \
--dns-name="<REGION>.p.api.smith.langchain.com." \
--visibility=private \
--networks= < YOUR_VPC_NETWORK >
# 添加指向 PSC 端点 IP 的 A 记录
gcloud dns record-sets create "<REGION>.p.api.smith.langchain.com." \
--zone=langsmith-psc \
--type=A \
--rrdatas= < PSC_ENDPOINT_IP >
验证连接
从您 VPC 中的虚拟机:
curl https:// < REGIO N > .p.api.smith.langchain.com/ok
API 速率限制
LangSmith 对 API 端点实施速率限制,以确保服务稳定性和公平使用。下表显示了美国和欧盟区域不同端点的速率限制。请注意:
速率限制表示为 count / interval,其中 count 是在间隔(以秒为单位)内允许的请求数量。例如,2000 / 10 表示每 10 秒 2000 个请求。
当端点列中未指定 HTTP 方法时,速率限制适用于该端点的所有 HTTP 方法。
当列出了特定方法(例如 POST、GET)时,速率限制仅适用于该方法。
匹配 / 端点 (方法) 身份标识键 美国生产限制 欧盟生产限制 类别 OPTIONS, /info, */v1/metadata/submit IP 2000 / 10 2000 / 10 高吞吐量 /authx-api-key2000 / 10 2000 / 10 高吞吐量 /authx-user-id + IP2000 / 10 2000 / 10 高吞吐量 /v1/beaconIP 2000 / 10 2000 / 10 高吞吐量 /reposx-api-key100 / 60 100 / 60 仓库 /reposx-user-id + IP100 / 60 100 / 60 仓库 POST /runs/batchx-api-key2000 / 10 2000 / 10 高吞吐量 POST /otel/v1/tracesx-api-key2000 / 10 2000 / 10 运行摄取 POST 包含 /chartsx-api-key750 / 600 750 / 600 图表 POST 包含 /chartsx-user-id + IP750 / 600 750 / 600 图表 POST /runs/multipartx-api-key6000 / 10 6000 / 10 多部分摄取 POST /runs/queryx-api-key15 / 10 15 / 10 运行查询 (API) POST /runs/queryx-user-id + IP300 / 10 300 / 10 运行查询 (用户) /generatex-api-key30 / 3600 30 / 3600 生成 /generatex-user-id + IP30 / 3600 30 / 3600 生成 /commitsx-api-key10000 / 60 2000 / 60 提交 /commitsx-user-id + IP10000 / 60 2000 / 60 提交 DELETE /sessions 或 */triggerx-api-key10 / 60 10 / 60 删除 DELETE /sessions 或 */triggerx-user-id + IP30 / 60 30 / 60 删除 POST /runs (单个运行摄取)x-api-key2000 / 10 2000 / 10 运行摄取 PATCH 包含 /runsx-api-key2000 / 10 2000 / 10 运行摄取 POST /feedbackx-api-key2000 / 10 2000 / 10 高吞吐量 GET /runs/{uuid} 或 /api/v1/runs/{uuid}x-api-key30 / 60 30 / 60 运行查找 GET 包含 /examplesx-api-key5000 / 60 5000 / 60 示例 任何带有 x-api-key 的请求 x-api-key1000 / 10 1000 / 10 默认 (API 密钥) 任何带有 x-user-id 的请求 x-user-id + IP1000 / 10 1000 / 10 默认 (用户) /public/downloadIP 5000 / 60 5000 / 60 公共下载 /runs/statsx-api-key1 / 10 20 / 10 统计 所有其他 IP (默认) IP 100 / 60 100 / 60 公共 (默认)
速率限制类别
高吞吐量 :用于核心操作(如身份验证、元数据和反馈)的通用高容量端点。
仓库 :仓库和提示管理操作。
运行摄取 :用于可观测性的单个跟踪/运行摄取端点。
图表 :图表生成和可视化端点。
多部分摄取 :通过多部分上传进行批量运行摄取,用于高容量跟踪。
运行查询 (API) :基于 API 密钥的运行查询操作,对复杂查询有更严格的限制。
运行查询 (用户) :基于用户的运行查询操作,为交互式使用提供更高的限制。
生成 :AI 驱动的代码和内容生成端点(限制以防止滥用)。
提交 :提示版本控制和提交操作。
删除 :会话删除和工作流触发操作。
运行查找 :通过 UUID 检索特定运行。
示例 :获取数据集示例用于少样本提示。
默认 (API 密钥) :未匹配特定模式的已认证 API 请求的后备速率限制。
默认 (用户) :未匹配特定模式的已认证用户请求的后备速率限制。
公共下载 :用于共享资源的高容量公共下载端点。
统计 :运行统计和分析端点(适用特定区域限制)。
公共 (默认) :未认证公共访问的默认速率限制。
有关速率限制和其他服务限制的更多信息,请参阅管理概览 。
将这些文档 通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。