以下部分帮助您创建数据集、运行评估和分析结果:

评估概念

查看核心术语和概念,以了解 LangSmith 中评估的工作原理。

管理数据集

通过 UI 或 SDK 创建和管理用于评估的数据集。

运行评估

使用不同的评估器和技术评估您的应用程序以衡量质量。

分析结果

查看和分析评估结果、比较实验、过滤数据和导出发现。

收集反馈

通过注释队列和输出上的内联注释收集人类反馈。

跟随教程

通过遵循分步教程学习,从简单的聊天机器人到复杂的智能体评估。

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.