现有实验的评估目前仅在 Python SDK 中受支持。如果您已经运行了实验并希望添加其他评估指标,您可以像以前一样使用 evaluate() / aevaluate() 方法将任何评估器应用于实验。只需传入实验名称/ ID 而不是目标函数:
Copy
from langsmith import evaluatedef always_half(inputs: dict, outputs: dict) -> float: return 0.5experiment_name = "my-experiment:abc" # Replace with an actual experiment name or IDevaluate(experiment_name, evaluators=[always_half])