Skip to main content
本操作指南将引导你了解为多轮对话设置演练场的各种方法,这将允许你针对更长的消息线程测试不同的工具配置和系统提示。 多轮对话示意图

从现有运行中

首先,确保你已正确追踪一个多轮对话,然后导航到你的追踪项目。进入追踪项目后,只需打开该运行,选择LLM调用,并按如下方式在演练场中打开它: 从运行中获取多轮对话 然后,你可以编辑系统提示,调整工具和/或输出模式,并观察多轮对话的输出如何变化。

从数据集中

开始之前,请确保你已设置好数据集。由于你想评估多轮对话,请确保你的输入中有一个包含消息列表的键。 创建数据集后,前往演练场并加载你的数据集进行评估。 然后,向你的提示中添加一个消息列表变量,确保其名称与输入中包含消息列表的键相同: 从数据集中获取多轮对话 当你运行提示时,每个示例中的消息将作为列表添加到“消息列表”变量的位置。

手动创建

有两种方法可以手动创建多轮对话。第一种方法是简单地将消息附加到提示中: 手动创建多轮对话 这对于快速迭代很有帮助,但由于多轮对话是硬编码的,因此比较死板。相反,如果你希望你的提示适用于任何多轮对话,你可以添加一个“消息列表”变量,并在那里添加你的多轮对话: 手动创建多轮对话列表 这允许你只调整系统提示或工具,同时允许任何多轮对话替代消息列表变量,使你可以在各种运行中重复使用此提示。

后续步骤

现在你知道如何为多轮交互设置演练场,你可以手动检查和判断输出,或者你可以添加评估器来对结果进行分类。 你也可以阅读这些操作指南,以了解更多关于如何使用演练场运行评估的信息。