LangSmith 评估 - Docs by LangChain

以下部分帮助您创建数据集、运行评估和分析结果：

评估概念

查看核心术语和概念，以了解 LangSmith 中评估的工作原理。

管理数据集

通过 UI 或 SDK 创建和管理用于评估的数据集。

运行评估

使用不同的评估器和技术评估您的应用程序以衡量质量。

分析结果

查看和分析评估结果、比较实验、过滤数据和导出发现。

收集反馈

通过注释队列和输出上的内联注释收集人类反馈。

跟随教程

通过遵循分步教程学习，从简单的聊天机器人到复杂的智能体评估。

Edit the source of this page on GitHub.

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.

评估快速入门

⌘I