ChatBaseten

本指南提供了开始使用 Baseten 聊天模型的快速概述。有关所有 ChatBaseten 功能、参数和配置的详细列表，请访问 ChatBaseten API 参考。 Baseten 提供专为生产应用程序设计的推理。基于 Baseten Inference Stack 构建，这些 API 为领先的开源或自定义模型提供企业级性能和可靠性：https://www.baseten.co/library/。

概述

详情

Class	Package	Local	Serializable	JS support	Downloads	Version
ChatBaseten	langchain-baseten	❌	beta	❌

功能

Tool calling	Structured output	JSON mode	Image input	Audio input	Video input	Token-level streaming	Native async	Token usage	Logprobs
✅	✅	✅	✅	✅	❌	✅	✅	✅	❌

模型 API 仅支持文本输入，而某些专用部署根据模型支持图像和音频输入。有关详细信息，请查看 Baseten 模型库：https://www.baseten.co/library/

设置

要访问 Baseten 模型，您需要创建 Baseten 帐户、获取 API 密钥并安装 langchain-baseten 集成包。前往此页面创建 Baseten 帐户并生成 API 密钥。完成后，设置 BASETEN_API_KEY 环境变量：

凭证

Set API key

import getpass
import os

if "BASETEN_API_KEY" not in os.environ:
    os.environ["BASETEN_API_KEY"] = getpass.getpass("Enter your Baseten API key: ")

要启用模型调用的自动，请设置您的 LangSmith API 密钥：

Enable tracing

os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")
os.environ["LANGSMITH_TRACING"] = "true"

安装

LangChain Baseten 集成位于 langchain-baseten 包中：

pip install -U langchain-baseten

实例化

Baseten 提供两种访问聊天模型的方式：

模型 API：用于访问最新、最受欢迎的开源模型。
专用 URL：使用具有专用资源的特定模型部署。

两种方法都支持自动端点规范化。

Initialize with model slug

from langchain_baseten import ChatBaseten

# Option 1: Use Model APIs with model slug
model = ChatBaseten(
    model="moonshotai/Kimi-K2-Instruct-0905",  # Choose from available model slugs: https://docs.baseten.co/development/model-apis/overview#supported-models
    api_key="your-api-key",  # Or set BASETEN_API_KEY env var
)

Initialize with model URL

from langchain_baseten import ChatBaseten

# Option 2: Use dedicated deployments with model url
model = ChatBaseten(
    model_url="https://model-<id>.api.baseten.co/environments/production/predict",
    api_key="your-api-key",  # Or set BASETEN_API_KEY env var
)

调用

Basic invocation

# Use the chat model
response = model.invoke("Hello, how are you?")
print(response.content)

content="Hello! I'm doing well, thank you for asking! How about you?" additional_kwargs={} response_metadata={'finish_reason': 'stop'} id='run--908651ec-00d7-4992-a320-864397c14e37-0'

您还可以使用消息对象进行更复杂的对话：

messages = [
    {"role": "system", "content": "You are a poetry expert"},
    {"role": "user", "content": "Write a haiku about spring"},
]
response = model.invoke(messages)
print(response)

content='Buds yawn open wide—  \na robin stitches the hush  \nwith threads of first light.' additional_kwargs={} response_metadata={'finish_reason': 'stop'} id='run--6f7d1db7-daae-4628-a40a-2ab7323e8f15-0'

有关聊天模型调用类型、消息类型和内容块的完整指南。

API 参考

有关所有 ChatBaseten 功能和配置的详细文档，请访问 API 参考。

Edit the source of this page on GitHub.

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.

Popular Providers

Integrations by component

概述

详情

功能

设置

凭证

安装

实例化

调用

API 参考

Popular Providers

Integrations by component

​概述

​详情

​功能

​设置

​凭证

​安装

​实例化

​调用

​API 参考

概述

详情

功能

设置

凭证

安装

实例化

调用

API 参考