本指南向您展示如何在自托管 LangSmith 实例上启用 LangSmith Deployment。这添加了控制平面数据平面,允许您直接通过 LangSmith UI 部署、扩展和管理智能体和应用程序。 完成本指南后,您将可以访问 LangSmith 可观测性评估部署
重要
启用 LangSmith Deployment 需要企业版计划。
此设置页面用于在现有 LangSmith 实例上启用 LangSmith Deployment查看自托管选项以了解:

概述

本指南建立在 Kubernetes 安装指南之上。您必须先完成该指南,然后才能继续。本页介绍启用 LangSmith Deployment 所需的其他设置步骤:
  • 安装 LangGraph 操作器
  • 配置您的入站
  • 连接到控制平面

前提条件

  1. 您正在使用 Kubernetes。
  2. 您有一个正在运行的自托管 LangSmith 实例。
  3. 您的集群上已安装 KEDA
  helm repo add kedacore https://kedacore.github.io/charts
  helm install keda kedacore/keda --namespace keda --create-namespace
  1. 入站配置
    1. 您必须为 LangSmith 实例设置入站、网关或使用 Istio。所有智能体都将部署为此入站后面的 Kubernetes 服务。使用本指南为您的实例设置入站
  2. 您的集群中必须有足够的空间用于多个部署。建议使用 Cluster-Autoscaler 自动配置新节点。
  3. 您的集群上有有效的动态 PV 配置程序或可用的 PV。您可以通过运行以下命令进行验证:
  kubectl get storageclass
  1. 从您的网络到 https://beacon.langchain.com 的出站访问。如果不在空气隔离模式下运行,这是许可证验证和使用情况报告所必需的。有关更多详细信息,请参阅出站文档

设置

  1. 作为配置自托管 LangSmith 实例的一部分,您启用 deployment 选项。这将配置几个关键资源。
    1. listener:这是一个侦听控制平面以查找对部署的更改并创建/更新下游 CRD 的服务。
    2. LangGraphPlatform CRD:用于 LangSmith Deployment 的 CRD。这包含管理 LangSmith 部署实例的规范。
    3. operator:此操作器处理对 LangSmith CRD 的更改。
    4. host-backend:这是控制平面
从 v0.12.0 开始,langgraphPlatform 选项已弃用。对于 v0.12.0 之后的任何版本,使用 config.deployment
  1. chart 将使用两个额外的镜像。使用最新版本中指定的镜像。
  hostBackendImage:
    repository: "docker.io/langchain/hosted-langserve-backend"
    pullPolicy: IfNotPresent
  operatorImage:
    repository: "docker.io/langchain/langgraph-operator"
    pullPolicy: IfNotPresent
  1. 在您的 langsmith 配置文件(通常是 langsmith_config.yaml)中,启用 deployment 选项。请注意,您还必须具有有效的入站设置:
  config:
    deployment:
      enabled: true
    # 从 v0.12.0 开始,此部分已弃用。对于 v0.12.0 之后的任何版本,使用 config.deployment。
    langgraphPlatform:
      enabled: true
      langgraphPlatformLicenseKey: "YOUR_LANGGRAPH_PLATFORM_LICENSE_KEY"
  1. 在您的 values.yaml 文件中,配置 hostBackendImageoperatorImage 选项(如果您需要镜像镜像)
  2. 您还可以通过覆盖此处的基础模板来配置智能体的基础模板。 您的自托管基础架构现在已准备好创建部署。

后续步骤

设置基础架构后,您就可以部署应用程序了。有关构建和部署应用程序的说明,请参阅部署选项卡中的部署指南。
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.