SageMaker 跟踪集成

Amazon SageMaker 是一项完全托管的服务，用于快速轻松地构建、训练和部署机器学习 (ML) 模型。

Amazon SageMaker Experiments 是 Amazon SageMaker 的一项功能，可让您组织、跟踪、比较和评估 ML 实验和模型版本。

本 Notebook 展示了如何使用 LangChain Callback 将 Prompt 和其他 LLM 超参数记录并跟踪到 SageMaker Experiments 中。在这里，我们使用不同的场景来展示该功能：

场景 1：单个 LLM - 使用单个 LLM 模型基于给定 Prompt 生成输出的情况。
场景 2：顺序链 - 使用两个 LLM 模型的顺序链的情况。
场景 3：带工具的 Agent（Chain of Thought） - 除了 LLM 之外还使用多个工具（搜索和数学）的情况。

在本 Notebook 中，我们将创建一个实验来记录每个场景的 Prompt。

安装和设置

pip install -qU  sagemaker
pip install -qU  langchain-openai
pip install -qU  google-search-results

首先，设置所需的 API 密钥

OpenAI: platform.openai.com/account/api-keys (用于 OpenAI LLM 模型)
Google SERP API: serpapi.com/manage-api-key (用于 Google Search 工具)

import os

## 在下方添加您的 API 密钥
os.environ["OPENAI_API_KEY"] = "<ADD-KEY-HERE>"
os.environ["SERPAPI_API_KEY"] = "<ADD-KEY-HERE>"

from langchain_community.callbacks.sagemaker_callback import SageMakerCallbackHandler

from langchain.agents import create_agent, load_tools
from langchain_classic.chains import LLMChain, SimpleSequentialChain
from langchain_core.prompts import PromptTemplate
from langchain_openai import OpenAI
from sagemaker.analytics import ExperimentAnalytics
from sagemaker.experiments.run import Run
from sagemaker.session import Session

LLM Prompt 跟踪

# LLM 超参数
HPARAMS = {
    "temperature": 0.1,
    "model_name": "gpt-3.5-turbo-instruct",
}

# 用于保存 Prompt 日志的存储桶（使用 `None` 来保存默认存储桶，否则请更改）
BUCKET_NAME = None

# 实验名称
EXPERIMENT_NAME = "langchain-sagemaker-tracker"

# 创建带有给定存储桶的 SageMaker Session
session = Session(default_bucket=BUCKET_NAME)

场景 1 - LLM

RUN_NAME = "run-scenario-1"
PROMPT_TEMPLATE = "tell me a joke about {topic}"
INPUT_VARIABLES = {"topic": "fish"}

with Run(
    experiment_name=EXPERIMENT_NAME, run_name=RUN_NAME, sagemaker_session=session
) as run:
    # 创建 SageMaker Callback
    sagemaker_callback = SageMakerCallbackHandler(run)

    # 定义带有回调的 LLM 模型
    llm = OpenAI(callbacks=[sagemaker_callback], **HPARAMS)

    # 创建 Prompt 模板
    prompt = PromptTemplate.from_template(template=PROMPT_TEMPLATE)

    # 创建 LLM 链
    chain = LLMChain(llm=llm, prompt=prompt, callbacks=[sagemaker_callback])

    # 运行链
    chain.run(**INPUT_VARIABLES)

    # 重置回调
    sagemaker_callback.flush_tracker()

场景 2 - 顺序链

RUN_NAME = "run-scenario-2"

PROMPT_TEMPLATE_1 = """You are a playwright. Given the title of play, it is your job to write a synopsis for that title.
Title: {title}
Playwright: This is a synopsis for the above play:"""
PROMPT_TEMPLATE_2 = """You are a play critic from the New York Times. Given the synopsis of play, it is your job to write a review for that play.
Play Synopsis: {synopsis}
Review from a New York Times play critic of the above play:"""

INPUT_VARIABLES = {
    "input": "documentary about good video games that push the boundary of game design"
}

with Run(
    experiment_name=EXPERIMENT_NAME, run_name=RUN_NAME, sagemaker_session=session
) as run:
    # 创建 SageMaker Callback
    sagemaker_callback = SageMakerCallbackHandler(run)

    # 创建链的 Prompt 模板
    prompt_template1 = PromptTemplate.from_template(template=PROMPT_TEMPLATE_1)
    prompt_template2 = PromptTemplate.from_template(template=PROMPT_TEMPLATE_2)

    # 定义带有回调的 LLM 模型
    llm = OpenAI(callbacks=[sagemaker_callback], **HPARAMS)

    # 创建链 1
    chain1 = LLMChain(llm=llm, prompt=prompt_template1, callbacks=[sagemaker_callback])

    # 创建链 2
    chain2 = LLMChain(llm=llm, prompt=prompt_template2, callbacks=[sagemaker_callback])

    # 创建顺序链
    overall_chain = SimpleSequentialChain(
        chains=[chain1, chain2], callbacks=[sagemaker_callback]
    )

    # 运行整体顺序链
    overall_chain.run(**INPUT_VARIABLES)

    # 重置回调
    sagemaker_callback.flush_tracker()

场景 3 - 带工具的 Agent

RUN_NAME = "run-scenario-3"
PROMPT_TEMPLATE = "Who is the oldest person alive? And what is their current age raised to the power of 1.51?"

with Run(
    experiment_name=EXPERIMENT_NAME,
    run_name=RUN_NAME,
    sagemaker_session=session,
) as run:
    # 创建 SageMaker Callback
    sagemaker_callback = SageMakerCallbackHandler(run)

    # 定义带有回调的 LLM 模型
    llm = OpenAI(callbacks=[sagemaker_callback], **HPARAMS)

    # 定义工具
    tools = load_tools(
        ["serpapi", "llm-math"],
        llm=llm,
        callbacks=[sagemaker_callback],
    )

    # 创建 Agent
    agent = create_agent(
        model=llm,
        tools=tools,
        callbacks=[sagemaker_callback],
    )

    # 运行 Agent
    agent.invoke(PROMPT_TEMPLATE)

    # 重置回调
    sagemaker_callback.flush_tracker()

加载日志数据

一旦 Prompt 被记录，我们可以轻松地加载它们并将其转换为 Pandas DataFrame，如下所示。

# 加载
logs = ExperimentAnalytics(experiment_name=EXPERIMENT_NAME)

# 转换为 pandas dataframe
df = logs.dataframe(force_refresh=True)

print(df.shape)
df.head()

如上所示，实验中有三次运行（行）对应每个场景。每次运行都将 Prompt 和相关的 LLM 设置/超参数作为 JSON 记录，并保存在 S3 存储桶中。您可以随时从每个 JSON 路径加载和探索日志数据。

在 GitHub 上编辑此页面或提交问题。

通过 MCP 将这些文档连接到 Claude、VSCode 等，以获取实时答案。

Popular Providers

Integrations by component

安装和设置

LLM Prompt 跟踪

场景 1 - LLM

场景 2 - 顺序链

场景 3 - 带工具的 Agent

加载日志数据

Popular Providers

Integrations by component

​安装和设置

​LLM Prompt 跟踪

​场景 1 - LLM

​场景 2 - 顺序链

​场景 3 - 带工具的 Agent

​加载日志数据

安装和设置

LLM Prompt 跟踪

场景 1 - LLM

场景 2 - 顺序链

场景 3 - 带工具的 Agent

加载日志数据