此功能处于公开测试阶段。它仅适用于付费团队计划。如果您对启用有疑问,请联系 support@langchain.dev
配置您的数据集,以便您可以根据传入请求搜索少样本示例。

前提条件

  1. 您的数据集必须使用 KV 存储数据类型(我们目前不支持聊天模型或 LLM 类型数据集)
  2. 您必须为数据集定义输入架构。有关详细信息,请参阅我们关于在 UI 中设置架构验证的文档。
  3. 您必须使用付费团队计划(例如 Plus 计划)
  4. 您必须使用 LangSmith 云

为少样本搜索索引您的数据集

导航到数据集 UI,并单击新的 Few-Shot search 选项卡。点击 Start sync 按钮,这将在您的数据集上创建新索引以使其可搜索。 默认情况下,我们同步到数据集的最新版本。这意味着当新示例添加到您的数据集时,它们将自动添加到您的索引中。此过程每隔几分钟运行一次,因此索引新示例的延迟应该很短。您可以在下一部分屏幕左侧的 Few-shot index 下查看索引是否是最新的。

在少样本游乐场中测试搜索质量

现在您已为数据集启用了索引,您将看到新的少样本游乐场。 您可以输入示例输入,并检查我们的搜索 API 会返回哪些结果。 每个结果都将有一个分数和指向数据集中示例的链接。评分系统的工作原理是 0 是完全随机的结果,分数越高越好。结果将按分数降序排序。
搜索使用类似 BM25 的算法进行基于关键字的相似性评分。随着我们改进搜索算法,实际分数可能会发生变化,因此我们建议不要依赖分数本身,因为它们的含义可能会随时间而变化。它们仅用于在游乐场中进行氛围测试输出的便利性。

将少样本搜索添加到您的应用程序

单击上图中的 Get Code Snippet 按钮,您将进入一个屏幕,其中包含来自我们 LangSmith SDK 的不同语言的代码片段。 有关在 LangChain python 应用程序中使用少样本搜索的代码示例,请参阅我们在 LangChain 文档中的操作指南

代码片段

请确保您使用的 python SDK 版本 >= 1.101 或 typescript SDK 版本 >= 1.43
为了复制和粘贴的方便,您可以在此处找到与上面屏幕截图中显示的代码片段类似的代码片段:
import langsmith as ls
# Copy this value from LangSmith UI
dataset_id = "1c5e9c95-dfd4-4dc5-a4b8-df7ea921c913"
async with ls.AsyncClient() as client:
  examples = await client.similar_examples(
      {"question": "knock knock"}, dataset_id=dataset_id, limit=1
  )
  print(examples[0].outputs)  # {"output": "Few shots'll do the trick."}

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.