此功能处于公开测试阶段。它仅适用于付费团队计划。如果您对启用有疑问,请联系 support@langchain.dev。
前提条件
- 您的数据集必须使用 KV 存储数据类型(我们目前不支持聊天模型或 LLM 类型数据集)
- 您必须为数据集定义输入架构。有关详细信息,请参阅我们关于在 UI 中设置架构验证的文档。
- 您必须使用付费团队计划(例如 Plus 计划)
- 您必须使用 LangSmith 云
为少样本搜索索引您的数据集
导航到数据集 UI,并单击新的Few-Shot search 选项卡。点击 Start sync 按钮,这将在您的数据集上创建新索引以使其可搜索。
默认情况下,我们同步到数据集的最新版本。这意味着当新示例添加到您的数据集时,它们将自动添加到您的索引中。此过程每隔几分钟运行一次,因此索引新示例的延迟应该很短。您可以在下一部分屏幕左侧的 Few-shot index 下查看索引是否是最新的。
在少样本游乐场中测试搜索质量
现在您已为数据集启用了索引,您将看到新的少样本游乐场。
您可以输入示例输入,并检查我们的搜索 API 会返回哪些结果。
每个结果都将有一个分数和指向数据集中示例的链接。评分系统的工作原理是 0 是完全随机的结果,分数越高越好。结果将按分数降序排序。
搜索使用类似 BM25 的算法进行基于关键字的相似性评分。随着我们改进搜索算法,实际分数可能会发生变化,因此我们建议不要依赖分数本身,因为它们的含义可能会随时间而变化。它们仅用于在游乐场中进行氛围测试输出的便利性。
将少样本搜索添加到您的应用程序
单击上图中的Get Code Snippet 按钮,您将进入一个屏幕,其中包含来自我们 LangSmith SDK 的不同语言的代码片段。
有关在 LangChain python 应用程序中使用少样本搜索的代码示例,请参阅我们在 LangChain 文档中的操作指南。
代码片段
请确保您使用的 python SDK 版本 >= 1.101 或 typescript SDK 版本 >= 1.43