BasetenEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
概述
Baseten 提供面向生产应用的推理服务。基于 Baseten 推理栈构建,这些 API 为领先的开源或自定义模型提供企业级性能和可靠性:https://www.baseten.co/library/。集成详情
设置
要访问 Baseten 嵌入模型,您需要创建一个 Baseten 账户、获取 API 密钥,并安装langchain-baseten 集成包。
Baseten 嵌入仅作为专用模型提供。 使用此集成之前,您必须从 Baseten 模型库 部署一个嵌入模型。
嵌入功能使用 Baseten 的 Performance Client 以优化性能,该客户端会作为依赖项自动包含。
凭证
前往 https://app.baseten.co 注册 Baseten 并生成 API 密钥。完成后,设置 BASETEN_API_KEY 环境变量:安装
LangChain Baseten 集成位于langchain-baseten 包中:
实例化
现在我们可以使用您已部署模型的 URL 实例化嵌入对象:索引与检索
嵌入模型通常用于检索增强生成(RAG)流程,既用于数据索引,也用于后续检索。更详细的说明请参阅我们的 RAG 教程。 以下展示如何使用上面初始化的embeddings 对象对数据进行索引和检索。本示例将在 InMemoryVectorStore 中索引并检索一个示例文档。
直接使用
在底层,向量存储和检索器实现会分别调用embeddings.embed_documents(...) 和 embeddings.embed_query(...) 来为文本创建嵌入。
您可以直接调用这些方法来满足自己的使用需求。
嵌入单条文本
您可以使用embed_query 嵌入单条文本或文档:
嵌入多条文本
您可以使用embed_documents 嵌入多条文本:
API 参考
有关BasetenEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
通过 MCP 将这些文档连接 到 Claude、VSCode 等,获取实时解答。

