Chroma 向量存储。
Chroma 是一个 AI 原生的开源向量数据库,专注于开发者的生产力和使用体验。Chroma 采用 Apache 2.0 许可证。在此页面查看 Chroma 的完整文档,并在此页面找到 LangChain 集成的 API 参考。
Chroma CloudChroma Cloud 提供无服务器向量和全文搜索。它速度极快、经济高效、可扩展且易于使用。创建一个数据库并在 30 秒内使用 5 美元的免费额度进行试用。开始使用 Chroma Cloud
设置
要访问Chroma 向量存储,您需要安装 langchain-chroma 集成包。
凭证
您可以使用Chroma 向量存储而无需任何凭证,只需安装上述包即可!
如果您是 Chroma Cloud 用户,请设置您的 CHROMA_TENANT、CHROMA_DATABASE 和 CHROMA_API_KEY 环境变量。
当您安装 chromadb 包时,您还可以访问 Chroma CLI,它可以为您设置这些变量。首先,通过 CLI 登录,然后使用 connect 命令:
初始化
基本初始化
以下是基本初始化,包括使用目录在本地保存数据。本地运行(内存中)
您可以通过简单地实例化一个Chroma 实例(指定集合名称和您的嵌入提供者)来在内存中运行 Chroma 服务器:
本地运行(带数据持久性)
您可以提供persist_directory 参数,以便在程序的多次运行中保存数据:
连接到 Chroma 服务器
如果您在本地运行 Chroma 服务器,或者您自己部署了一个,您可以通过提供host 参数来连接到它。
例如,您可以使用 chroma run 启动一个在本地运行的 Chroma 服务器,然后使用 host='localhost' 连接它:
port、ssl 和 headers 参数来自定义您的连接。
Chroma Cloud
Chroma Cloud 用户也可以使用 LangChain 进行构建。提供您的Chroma 实例,包含您的 Chroma Cloud API 密钥、租户和数据库名称:
从客户端初始化
您也可以从Chroma 客户端初始化,如果您想更轻松地访问底层数据库,这特别有用。
本地运行(内存中)
本地运行(带数据持久性)
连接到 Chroma 服务器
例如,如果您在本地运行 Chroma 服务器(使用chroma run):
Chroma Cloud
设置您的CHROMA_API_KEY、CHROMA_TENANT 和 CHROMA_DATABASE 后,您可以简单地实例化:
访问您的 Chroma 数据库
创建 Chroma 向量存储
管理向量存储
创建向量存储后,我们可以通过添加和删除不同的项目来与之交互。向向量存储添加项目
我们可以使用add_documents 函数向向量存储添加项目。
更新向量存储中的项目
现在我们已经向向量存储添加了文档,我们可以使用update_documents 函数更新现有文档。
从向量存储中删除项目
我们也可以如下从向量存储中删除项目:查询向量存储
一旦您的向量存储已创建并添加了相关文档,您很可能希望在链或代理运行期间对其进行查询。直接查询
相似性搜索
执行简单的相似性搜索可以如下进行:带分数的相似性搜索
如果您想执行相似性搜索并接收相应的分数,您可以运行:按向量搜索
您也可以按向量搜索:其他搜索方法
本笔记本未涵盖多种其他搜索方法,例如 MMR 搜索。有关Chroma 可用的搜索能力的完整列表,请查看 API 参考。
通过转换为检索器进行查询
您也可以将向量存储转换为检索器,以便在您的链中更轻松地使用。有关您可以传递的不同搜索类型和 kwargs 的更多信息,请访问 Chroma API 参考。用于检索增强生成的用法
有关如何使用此向量存储进行检索增强生成 (RAG) 的指南,请参阅以下部分:API 参考
有关所有Chroma 向量存储功能和配置的详细文档,请访问 API 参考
将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时答案。

