设置
要访问 Databricks 模型,您需要创建 Databricks 账号,设置凭证(仅在 Databricks 工作空间外时需要),并安装所需包。凭证(仅在 Databricks 工作空间外时需要)
如果您在 Databricks 内运行 LangChain 应用,可以跳过此步骤。 否则,您需要手动将 Databricks 工作空间主机名和个人访问令牌分别设置到DATABRICKS_HOST 和 DATABRICKS_TOKEN 环境变量中。有关如何获取访问令牌,请参阅认证文档。
安装
LangChain Databricks 集成位于databricks-langchain 包中。
创建向量搜索端点和索引(如果尚未创建)
本节将使用客户端 SDK 创建 Databricks Vector Search 端点和索引。 如果您已有端点和索引,可以跳过本节直接进入”实例化”部分。 首先,实例化 Databricks VectorSearch 客户端:DatabricksVectorSearch 类均支持:
- Delta Sync 索引 自动与源 Delta 表同步,随着 Delta 表中数据的变化自动增量更新索引。
- Direct Vector Access 索引 支持对向量和元数据的直接读写。用户负责通过 REST API 或 Python SDK 更新该表。
实例化
DatabricksVectorSearch 的实例化方式因索引使用 Databricks 托管嵌入还是自托管嵌入(即您选择的 LangChain Embeddings 对象)而略有不同。
如果您使用的是带 Databricks 托管嵌入的 delta-sync 索引:
管理向量存储
向向量存储添加条目
注意:通过add_documents 方法向向量存储添加条目仅支持 direct-access 索引。
从向量存储删除条目
注意:通过delete 方法从向量存储删除条目仅支持 direct-access 索引。
查询向量存储
创建向量存储并添加相关文档后,通常需要在运行链或智能体时对其进行查询。直接查询
执行简单相似度搜索的方法如下:columns 参数传入额外的列名。
转换为检索器进行查询
您还可以将向量存储转换为检索器,以便在链中更方便地使用。用于检索增强生成
有关如何将此向量存储用于检索增强生成(RAG)的指南,请参阅以下章节:API 参考
有关 DatabricksVectorSearch 所有功能和配置的详细文档,请前往 API 参考:api-docs.databricks.com/python/databricks-ai-bridge/latest/databricks_langchain.html#databricks_langchain.DatabricksVectorSearch通过 MCP 将这些文档连接 到 Claude、VSCode 等,获取实时解答。

