Pinecone 是一个功能强大的向量数据库。本 notebook 展示了如何使用与
Pinecone 向量数据库相关的功能。
安装配置
要使用PineconeSparseVectorStore,首先需要安装合作伙伴包以及本 notebook 中使用的其他包。
凭据
创建新的 Pinecone 账户,或登录现有账户,并创建本 notebook 中使用的 API 密钥。初始化
在初始化向量存储之前,先连接到 Pinecone 索引。如果名为 index_name 的索引不存在,将自动创建。pinecone-sparse-english-v0,初始化方式如下:
管理向量存储
创建好向量存储后,可以通过添加和删除不同条目来与其交互。向向量存储添加条目
可以使用add_documents 函数向向量存储添加条目。
从向量存储删除条目
可以使用delete 方法并提供要删除的文档 ID 列表,从向量存储中删除记录。
查询向量存储
将文档加载到向量存储后,通常就可以开始查询了。LangChain 提供了多种查询方法。 首先,我们将看到如何通过similarity_search 方法直接查询 vector_store 来执行简单的向量搜索:
source=="social" 的记录:
"website" 源的不同记录,而在后者带过滤器的查询中则不再出现。
相似性搜索与评分
也可以在搜索时返回(document, score) 元组列表中的相似性评分。其中 document 是包含文本内容和元数据的 LangChain Document 对象。
作为检索器
在链和 agent 中,通常会将向量存储用作VectorStoreRetriever。创建时使用 as_retriever 方法:
invoke 方法查询检索器:
用于检索增强生成
关于如何将此向量存储用于检索增强生成(RAG)的指南,请参阅以下章节:API 参考
所有功能和配置的详细文档,请参阅 API 参考: python.langchain.com/api_reference/pinecone/vectorstores_sparse/langchain_pinecone.vectorstores_sparse.PineconeSparseVectorStore.html#langchain_pinecone.vectorstores_sparse.PineconeSparseVectorStore 稀疏嵌入: python.langchain.com/api_reference/pinecone/embeddings/langchain_pinecone.embeddings.PineconeSparseEmbeddings.html将这些文档连接 到 Claude、VSCode 等,通过 MCP 获取实时答案。

