Chroma 向量存储。
Chroma 是一个 AI 原生的开源向量数据库,专注于开发人员的生产力和满意度。Chroma 在 Apache 2.0 许可下授权。请在此页面查看 Chroma 的完整文档,并在此页面找到 LangChain 集成的 API 参考。
Chroma CloudChroma Cloud 提供无服务器向量和全文搜索功能。它速度极快、成本效益高、可扩展且易于使用。只需 30 秒即可创建数据库并使用 5 美元的免费额度进行试用。开始使用 Chroma Cloud
设置
要访问Chroma 向量存储,您需要安装 langchain-chroma 集成包。
凭证
您可以使用Chroma 向量存储而无需任何凭证,只需安装上述包即可!
如果您是 Chroma Cloud 用户,请设置您的 CHROMA_TENANT、CHROMA_DATABASE 和 CHROMA_API_KEY 环境变量。
安装 chromadb 包后,您还可以访问 Chroma CLI,它可以帮助您设置这些变量。首先,通过 CLI 登录,然后使用 connect 命令:
初始化
基本初始化
以下是基本初始化,包括使用目录在本地保存数据。本地运行(内存中)
您可以通过使用集合名称和嵌入提供程序实例化Chroma 实例来在内存中运行 Chroma 服务器:
本地运行(带数据持久化)
您可以提供persist_directory 参数,以便在程序多次运行时保存数据:
连接到 Chroma 服务器
如果您本地运行 Chroma 服务器,或者您自己部署了一个服务器,您可以通过提供host 参数来连接它。
例如,您可以使用 chroma run 启动本地 Chroma 服务器,然后使用 host='localhost' 连接它:
port、ssl 和 headers 参数来自定义连接。
Chroma Cloud
Chroma Cloud 用户也可以使用 LangChain 进行构建。为您的Chroma 实例提供 Chroma Cloud API 密钥、租户和数据库名称:
从客户端初始化
您也可以从Chroma 客户端初始化,如果您想更轻松地访问底层数据库,这特别有用。
本地运行(内存中)
本地运行(带数据持久化)
连接到 Chroma 服务器
例如,如果您正在本地运行 Chroma 服务器(使用chroma run):
Chroma Cloud
设置您的CHROMA_API_KEY、CHROMA_TENANT 和 CHROMA_DATABASE 后,您可以简单地实例化:
访问您的 Chroma 数据库
创建 Chroma 向量存储
管理向量存储
创建向量存储后,我们可以通过添加和删除不同项来与之交互。向向量存储添加项
我们可以使用add_documents 函数向向量存储添加项。
更新向量存储中的项
现在我们已经向向量存储添加了文档,我们可以使用update_documents 函数更新现有文档。
从向量存储中删除项
我们也可以按如下方式从向量存储中删除项:查询向量存储
一旦您的向量存储创建完毕并添加了相关文档,您很可能希望在链或代理运行期间对其进行查询。直接查询
相似性搜索
执行简单的相似性搜索可以按如下方式进行:带分数的相似性搜索
如果您想执行相似性搜索并接收相应的分数,可以运行:按向量搜索
您也可以按向量搜索:其他搜索方法
本笔记本未涵盖多种其他搜索方法,例如 MMR 搜索。有关Chroma 可用搜索能力的完整列表,请查看 API 参考。
通过转换为检索器进行查询
您也可以将向量存储转换为检索器,以便在链中更轻松地使用。有关不同搜索类型和可传递的 kwargs 的更多信息,请访问 Chroma API 参考。用于检索增强生成的用法
有关如何将此向量存储用于检索增强生成 (RAG) 的指南,请参阅以下部分:API 参考
有关所有Chroma 向量存储功能和配置的详细文档,请前往 API 参考
通过 MCP 将这些文档连接到 Claude、VSCode 等 以获取实时答案。

