VLite 集成

VLite 是一个简单且极速的向量数据库，允许您使用嵌入向量进行语义存储和检索。基于 numpy 构建，vlite 是一个轻量级的自带电池数据库，可在您的项目中实现 RAG、相似性搜索和嵌入向量功能。使用本集成需要安装 langchain-community：pip install -qU langchain-community

安装

要在 LangChain 中使用 VLite，需要安装 vlite 包：

!pip install vlite

导入 VLite

from langchain_community.vectorstores import VLite

基本示例

在此基本示例中，我们加载一个文本文档并将其存储在 VLite 向量数据库中。然后，我们执行相似性搜索，根据查询检索相关文档。 VLite 会自动处理文本的分块和嵌入，您可以通过预先分块文本和/或将这些块嵌入到 VLite 数据库中来更改这些参数。

from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter

# 加载文档并将其分割成块
loader = TextLoader("path/to/document.txt")
documents = loader.load()

# 创建 VLite 实例
vlite = VLite(collection="my_collection")

# 将文档添加到 VLite 向量数据库
vlite.add_documents(documents)

# 执行相似性搜索
query = "What is the main topic of the document?"
docs = vlite.similarity_search(query)

# 打印最相关的文档
print(docs[0].page_content)

添加文本和文档

您可以分别使用 add_texts 和 add_documents 方法向 VLite 向量数据库添加文本或文档。

# 向 VLite 向量数据库添加文本
texts = ["This is the first text.", "This is the second text."]
vlite.add_texts(texts)

# 向 VLite 向量数据库添加文档
documents = [Document(page_content="This is a document.", metadata={"source": "example.txt"})]
vlite.add_documents(documents)

相似性搜索

VLite 提供了在存储文档上执行相似性搜索的方法。

# 执行相似性搜索
query = "What is the main topic of the document?"
docs = vlite.similarity_search(query, k=3)

# 执行带分数的相似性搜索
docs_with_scores = vlite.similarity_search_with_score(query, k=3)

最大边际相关性搜索

VLite 还支持最大边际相关性（MMR）搜索，该搜索同时优化与查询的相似性和检索文档之间的多样性。

# 执行 MMR 搜索
docs = vlite.max_marginal_relevance_search(query, k=3)

更新和删除文档

您可以使用 update_document 和 delete 方法在 VLite 向量数据库中更新或删除文档。

# 更新文档
document_id = "doc_id_1"
updated_document = Document(page_content="Updated content", metadata={"source": "updated.txt"})
vlite.update_document(document_id, updated_document)

# 删除文档
document_ids = ["doc_id_1", "doc_id_2"]
vlite.delete(document_ids)

检索文档

您可以使用 get 方法根据 ID 或元数据从 VLite 向量数据库检索文档。

# 按 ID 检索文档
document_ids = ["doc_id_1", "doc_id_2"]
docs = vlite.get(ids=document_ids)

# 按元数据检索文档
metadata_filter = {"source": "example.txt"}
docs = vlite.get(where=metadata_filter)

创建 VLite 实例

您可以通过多种方式创建 VLite 实例：

# 从文本创建 VLite 实例
vlite = VLite.from_texts(texts)

# 从文档创建 VLite 实例
vlite = VLite.from_documents(documents)

# 从现有索引创建 VLite 实例
vlite = VLite.from_existing_index(collection="existing_collection")

附加功能

VLite 提供了用于管理向量数据库的附加功能：

from langchain.vectorstores import VLite
vlite = VLite(collection="my_collection")

# 获取集合中的条目数量
count = vlite.count()

# 保存集合
vlite.save()

# 清空集合
vlite.clear()

# 获取集合信息
vlite.info()

# 导出集合数据
data = vlite.dump()

在 GitHub 上编辑此页面或提交问题。

通过 MCP 将这些文档连接到 Claude、VSCode 等，获取实时答案。

Popular Providers

Integrations by component

安装

导入 VLite

基本示例

添加文本和文档

相似性搜索

最大边际相关性搜索

更新和删除文档

检索文档

创建 VLite 实例

附加功能

Popular Providers

Integrations by component

​安装

​导入 VLite

​基本示例

​添加文本和文档

​相似性搜索

​最大边际相关性搜索

​更新和删除文档

​检索文档

​创建 VLite 实例

​附加功能

安装

导入 VLite

基本示例

添加文本和文档

相似性搜索

最大边际相关性搜索

更新和删除文档

检索文档

创建 VLite 实例

附加功能