Xata 是一个基于 PostgreSQL 的无服务器数据平台。它提供了用于与数据库交互的 Python SDK 以及用于管理数据的 UI。 Xata 拥有原生向量类型,可添加到任何表中,并支持相似性搜索。LangChain 直接将向量插入 Xata,并查询给定向量的最近邻,因此您可以将所有 LangChain Embeddings 集成与 Xata 配合使用。本 notebook 指导您如何将 Xata 用作 VectorStore。
配置
创建用作向量存储的数据库
在 Xata UI 中创建一个新数据库。您可以随意命名,在本 notebook 中我们使用langchain。
创建一个表,同样可以随意命名,但我们将使用 vectors。通过 UI 添加以下列:
content,类型为”Text”。用于存储Document.pageContent的值。embedding,类型为”Vector”。使用您计划使用的模型的维度。在本 notebook 中,我们使用 OpenAI embeddings,其维度为 1536。source,类型为”Text”。本示例将其用作元数据列。- 您希望用作元数据的任何其他列。它们从
Document.metadata对象填充。例如,如果在Document.metadata对象中有title属性,您可以在表中创建title列,它将被自动填充。
https://demo-uni3q8.eu-west-1.xata.sh/db/langchain。
创建 xata 向量存储
导入我们的测试数据集:相似性搜索
带分数(向量距离)的相似性搜索
通过 MCP 将这些文档连接到 Claude、VSCode 等,获取实时答案。

